Waarom wetenschappers robots verstoppertje leren spelen

Kunstmatige algemene intelligentie, het idee van een intelligente A.I. Een agent die elke intellectuele taak die mensen kunnen uitvoeren, kan begrijpen en leren, is lange tijd een onderdeel van sciencefiction geweest. Zoals A.I. wordt steeds slimmer – vooral met doorbraken in machine learning-tools die hun eigen processen kunnen herschrijven code om te leren van nieuwe ervaringen – het maakt steeds vaker deel uit van echte gesprekken over kunstmatige intelligentie Goed.

Inhoud

Werelden bouwen
Regels van het spel
Moeilijke dingen zijn makkelijk, makkelijke dingen zijn moeilijk

Maar hoe meten we AGI wanneer deze arriveert? In de loop der jaren hebben onderzoekers een aantal mogelijkheden uiteengezet. De bekendste blijft de Turingtest, waarin een menselijke rechter ongezien interactie heeft met zowel mensen als een machine, en moet proberen te raden welke welke is. Twee anderen, Ben Goertzel’s Robot College Student Test en Nils J. Nilsson’s Employment Test, proberen de capaciteiten van een AI praktisch te testen door te zien of deze een universitair diploma kan behalen of een baan op de werkplek kan uitoefenen. Een andere, die ik persoonlijk graag buiten beschouwing zou willen laten, stelt dat intelligentie kan worden gemeten aan de hand van het succesvolle vermogen om flatpack-meubels in Ikea-stijl zonder problemen in elkaar te zetten.

Aanbevolen video's

Een van de meest interessante AGI-maatregelen werd naar voren gebracht door Apple-medeoprichter Steve Wozniak. Woz, zoals hij bekend staat bij vrienden en bewonderaars, stelt de Koffietest voor. Een algemene intelligentie, zei hij, zou een robot betekenen die in staat is om elk huis ter wereld binnen te gaan, de keuken te lokaliseren, een verse kop koffie te zetten en die vervolgens in een mok te gieten.

Verwant

Analoge AI? Het klinkt gek, maar het zou de toekomst kunnen zijn
Dit is wat een trendanalyserende A.I. denkt dat dit de volgende grote stap in de technologie zal zijn
De toekomst van AI: 4 grote dingen om naar te kijken de komende jaren

Zoals bij elke A.I. intelligentietest kun je discussiëren over hoe breed of smal de parameters zijn. Het idee dat intelligentie gekoppeld moet worden aan het vermogen om door de echte wereld te navigeren, is echter intrigerend. Het is er ook een die een nieuw onderzoeksproject wil testen.

Werelden bouwen

“De afgelopen jaren heeft de A.I. gemeenschap heeft enorme vooruitgang geboekt bij het trainen van A.I. agenten om complexe taken uit te voeren,” Luca Weihs, een onderzoekswetenschapper aan het Allen Institute for AI, een laboratorium voor kunstmatige intelligentie opgericht door wijlen Microsoft-medeoprichter Paul Allen, vertelde Digital Trends.

AI2-Thor-taken — Allen Instituut voor AI

Weihs citeerde DeepMind’s ontwikkeling van A.I. agenten die dat kunnen leren speel klassieke Atari-spellen En versla menselijke spelers bij Go. Weihs merkte echter op dat deze taken ‘vaak losstaan’ van onze wereld. Laat een foto van de echte wereld zien aan een A.I. getraind om Atari-spellen te spelen, en hij zal geen idee hebben waar hij naar kijkt. Het is hier dat de onderzoekers van het Allen Institute denken dat ze iets te bieden hebben.

Het Allen Instituut voor A.I. heeft een soort vastgoedimperium opgebouwd. Maar dit is geen fysiek onroerend goed, maar eerder virtueel onroerend goed. Het heeft honderden virtuele kamers en appartementen ontwikkeld – inclusief keukens, slaapkamers, badkamers en woonkamers – waarin A.I. agenten kunnen communiceren met duizenden objecten. Deze ruimtes beschikken over realistische fysica, ondersteuning voor meerdere agenten en zelfs toestanden zoals warm en koud. Door A.I. Agenten die in deze omgevingen spelen, is het idee dat ze een realistischer beeld van de wereld kunnen opbouwen.

“In [ons nieuwe] werk wilden we begrijpen hoe A.I. Agenten zouden een realistische omgeving kunnen leren kennen door er een interactief spel in te spelen”, aldus Weihs. “Om deze vraag te beantwoorden, hebben we twee agenten getraind om Cache te spelen, een variant van verstoppertje, met behulp van vijandig versterkend leren binnen de high-fidelity-modus. AI2-THOR-omgeving. Door deze gameplay ontdekten we dat onze agenten individuele afbeeldingen leerden weergeven, waarbij ze de prestaties van methoden benaderden waarvoor miljoenen met de hand gelabelde afbeeldingen nodig waren – en begon zelfs een aantal cognitieve primitieven te ontwikkelen die vaak worden bestudeerd door [ontwikkelings] psychologen.”

Regels van het spel

In tegenstelling tot normaal verstoppertje verbergen de bots in Cache om de beurt objecten zoals toiletontstoppers, broden, tomaten en meer, die elk hun eigen individuele geometrieën hebben. De twee agenten – de een een verberger, de ander een zoeker – concurreren vervolgens om te zien of de een het object met succes voor de ander kan verbergen. Dit brengt een aantal uitdagingen met zich mee, waaronder verkennen en in kaart brengen, perspectief begrijpen, verbergen, objectmanipulatie en zoeken. Alles wordt nauwkeurig gesimuleerd, zelfs tot aan de eis dat de verstopper het object in zijn hand moet kunnen manipuleren en niet moet laten vallen.

Met behulp van deep-reforcement learning – een machinaal leerparadigma gebaseerd op het leren actie te ondernemen in een omgeving om de beloning te maximaliseren – de bots worden steeds beter in het verbergen van de objecten, maar ook in het zoeken ze uit.

“Wat dit zo moeilijk maakt voor AI’s is dat ze de wereld niet zien zoals wij dat doen”, zegt Weihs. “Miljarden jaren van evolutie hebben ervoor gezorgd dat onze hersenen, zelfs als baby’s, fotonen efficiënt in concepten vertalen. Aan de andere kant, een A.I. begint helemaal opnieuw en ziet zijn wereld als een enorm raster van getallen dat hij vervolgens moet leren decoderen in betekenis. Bovendien, in tegenstelling tot bij schaken, waar de wereld netjes in 64 vierkanten is opgesloten, geeft elk beeld dat de agent ziet slechts een beeld weer. klein stukje van de omgeving, en dus moet het zijn observaties door de tijd heen integreren om een samenhangend begrip van de omgeving te vormen wereld."

AI Verberg en zoek dynamische experimentresultaten — Allen Instituut voor AI

Voor alle duidelijkheid: dit nieuwste werk gaat niet over het bouwen van een superintelligente A.I. In films als Terminator 2: Dag des Oordeelsbereikt de Skynet-supercomputer op 29 augustus 1997 precies om 2.14 uur Eastern Time zelfbewustzijn. Ondanks de datum, nu bijna een kwart eeuw in onze collectieve achteruitkijkspiegel, lijkt het onwaarschijnlijk dat er zo’n precies omslagpunt zal zijn wanneer reguliere A.I. wordt AGI. In plaats daarvan zullen steeds meer computationele vruchten – laaghangend en hooghangend – worden geplukt totdat we eindelijk iets hebben dat een algemene intelligentie over meerdere domeinen benadert.

Moeilijke dingen zijn makkelijk, makkelijke dingen zijn moeilijk

Onderzoekers zijn van oudsher aangetrokken tot complexe problemen voor AI. op te lossen vanuit het idee dat, als de lastige problemen kunnen worden opgelost, de makkelijke problemen niet te ver achterop mogen raken. Als je de besluitvorming van een volwassene kunt simuleren, kunnen ideeën als objectpermanentie (het idee dat objecten nog steeds bestaan) ook bestaan bestaan als we ze niet kunnen zien) die een kind in de eerste paar maanden van zijn leven leert, bewijzen dat echt moeilijk? Het antwoord is ja – en deze paradox die, als het om AI gaat, de moeilijke dingen zijn vaak gemakkelijk, en de gemakkelijke dingen zijn moeilijk, is wat dit soort werk wil aanpakken.

“Het meest voorkomende paradigma voor het trainen van A.I. Bij agenten gaat het om enorme, handmatig gelabelde datasets die nauw gericht zijn op één enkele taak, bijvoorbeeld het herkennen van objecten”, aldus Weihs. “Hoewel deze aanpak groot succes heeft gehad, denk ik dat het optimistisch is om te geloven dat we handmatig voldoende datasets kunnen creëren om een A.I. agent die intelligent kan handelen in de echte wereld, met mensen kan communiceren en allerlei problemen kan oplossen die hij nog niet eerder is tegengekomen. Om dit te doen, denk ik dat we agenten de fundamentele cognitieve primitieven moeten leren die we als vanzelfsprekend beschouwen, door ze vrijelijk met hun wereld te laten communiceren. Ons werk laat zien dat het gebruik van gameplay om A.I. agenten om met hun wereld om te gaan en deze te verkennen, resulteert erin dat ze beginnen te leren deze primitieven – en laat daarmee zien dat gameplay een veelbelovende richting is, weg van handmatig aangepaste datasets en richting ervaringsgerichte aan het leren."

A document waarin dit werk wordt beschreven zal worden gepresenteerd op de komende Internationale Conferentie over Learning Representations in 2021.

Aanbevelingen van de redactie

Optische illusies kunnen ons helpen de volgende generatie AI te bouwen
De grappige formule: waarom door machines gegenereerde humor de heilige graal is van A.I.
Lees het griezelig mooie ‘synthetische geschrift’ van een A.I. die denkt dat het God is
Algoritmische architectuur: moeten we A.I. gebouwen voor ons ontwerpen?
Emotiegevoelige A.I. is hier, en het zou in je volgende sollicitatiegesprek kunnen zijn