Micosoft's AI behaalt perfecte Ms Pac-Man-score

Denver Post via Getty Images

Sommige taken zijn gewoon te complex, te genuanceerd om allemaal tegelijk aan te pakken, zoals het verslaan van alle 256 niveaus van mevrouw Pac-Man op de Atari 2600 terwijl je een perfecte score van 999.990 verdient. Daarom heeft Microsoft niet eens geprobeerd zijn AI te trainen om het in één keer aan te pakken. In plaats daarvan splitste het bedrijf, zoals het woensdag aankondigde, deze monumentale uitdaging op in kleinere, chomp-sized stukken en trainde het een bijenkorf van 150 AI's om het als een team te volbrengen.

Het AI-systeem, ontwikkeld door Maluuba, een Canadees AI-bedrijf dat Microsoft onlangs heeft overgenomen, vertrouwt op versterkend leren om zijn strategie te ontwikkelen. Reinforcement learning is een AI-trainingstechniek waarbij het algoritme wordt beloond voor het gebruik van efficiëntere resultaten en wordt ontmoedigd om de minder effectieve te gebruiken op basis van eerder waargenomen resultaten. Het idee is dat het systeem, met genoeg tijd en pogingen, uiteindelijk zelf zal uitvinden wat de beste manier van handelen is. Dit is dezelfde techniek die Google gebruikte om de Go-kampioenen van de wereld te verslaan.



Maar met voldoende complexe taken is een eenvoudig leersysteem voor versterking te traag - denk aan apen op typemachines die de volledige werken van Shakespeare reproduceren. Dus verdeelde het Maluuba-team de taak in kleinere subtaken, zoals het ontwijken van geesten of het bereiken van een specifieke pellet in het doolhof, en gaf elk aan een van de 150 parallelle neurale netwerken om erachter te komen. Het team installeerde vervolgens een master-AI bovenop die reeks netwerken om de acties van de zwerm te sturen en hun gemeenschappelijke doel, het verslaan van het spel, te helpen bereiken.

De master-AI neemt de respons van elke sub-AI in een bepaald scenario, weegt ze en neemt vervolgens een beslissing voor de groep. Dat wil zeggen, zelfs als de helft van de sub-AI's zegt 'Ga naar rechts, pak die pellet', maar een paar zeggen 'Nee, niet doen, er is een geest in die hal', de meester-AI zal de niet-stervende contingent in plaats van de pellet-getters. Het team heeft zijn unieke systeem een ​​Hybrid Reward Architecture genoemd.

De gameplay-resultaten spreken voor zich, maar het bedrijf hoopt dit succes te benutten om toekomstige AI-systemen sneller, betrouwbaarder en zelfvoorzienend te maken. Zoals de Microsoft Blog aangeeft, kan deze techniek door een verkoopteam worden gebruikt om erachter te komen welke klanten hun aandacht het meest nodig hebben op een bepaald moment gedurende de week of zelfs dag. Het kan ook worden gebruikt om systemen voor natuurlijke taalherkenning te verbeteren. Maar laten we eens kijken hoe het Contra verslaat zonder de Konami-code te gebruiken.

Aanbevolen verhalen

Nieuwe Audi A8 gebruikt AI om zichzelf te parkeren

Waarom uw eigen auto parkeren als kunstmatige intelligentie kan uitzoeken hoe dit voor u kan worden gedaan?

NASA's Mars 2020-concept is perfect voor Space Batman

NASA heeft een futuristisch Mars 2020-roverconcept onthuld in het Kennedy Space Center.

Google Home verdient topscores voor doe-het-zelfreparaties

Het slimme apparaat scoorde een bovengemiddelde acht van de tien en versloeg daarmee rivaal Amazon Echo.

Zoeken met Bing in MS Word wijzigen om in plaats daarvan Google te gebruiken

Het contextmenu van Microsoft Word heeft een menu-item dat de meeste mensen waarschijnlijk hebben gezien, maar niet gebruiken: de mogelijkheid om met Bing naar een selectie te zoeken. U kunt deze functie nog nuttiger maken door deze in plaats daarvan te wijzigen in zoeken via Google.