Google Robot leert zichzelf in slechts twee uur lopen

Herinner je je die scène uit Walt Disney’s nog? Bambi waar het titulaire reekalf op eigen kracht leert opstaan en lopen? Het is een charmant vignet in de film, dat een vaardigheid laat zien die veel babydieren – van varkens tot giraffen en, ja, herten – binnen enkele minuten na hun geboorte leren. Gedurende de eerste paar uur van hun leven verfijnen deze dieren snel hun motorische vaardigheden totdat ze volledige controle hebben over hun eigen voortbeweging. Mensen, die rond de zeven maanden leren om dingen vast te houden en die met vijftien maanden beginnen te lopen, zijn in vergelijking hopeloos traag.

Inhoud

Positieve bekrachtiging
Betere robots bouwen

Raad eens wat de nieuwste taak is waarbij robots ons hebben verslagen? In een nieuwe studie uitgevoerd door onderzoekers van Googlehebben ingenieurs een viervoetige Minitaur-robot geleerd om langs te lopen, nou ja, ze hoeven hem eigenlijk helemaal niet veel te leren. In plaats daarvan hebben ze een soort doelgerichte kunstmatige intelligentie gebruikt om een vierpotige robot te maken

leer vooruit lopen, achteruit, en geheel zelfstandig naar links en rechts draaien. Hij kon zichzelf dit met succes leren op drie verschillende terreinen, waaronder een vlakke ondergrond, een zachte matras en een deurmat met spleten.

Aanbevolen video's

“Pootrobots kunnen een grote mobiliteit hebben, omdat benen essentieel zijn om over onverharde wegen en plaatsen te navigeren die voor mensen zijn ontworpen,” Jie Tan, hoofdonderzoeker van het project en hoofd van de voortbewegingsinspanningen van Google, vertelde Digital Trends. “We zijn geïnteresseerd in het mogelijk maken van potenrobots om door onze diverse en complexe echte wereldomgevingen te navigeren, maar het is moeilijk om handmatig robotcontrollers te ontwikkelen die met een dergelijke diversiteit overweg kunnen complexiteit. Daarom is het belangrijk dat robots zelf kunnen leren. Dit werk is spannend omdat dit een vroege demonstratie is dat een robot op poten met ons systeem met succes zelfstandig kan leren lopen.”

Positieve bekrachtiging

Leren lopen in de echte wereld met minimale menselijke inspanning

De technologie die aan de basis ligt van dit specifieke project is iets dat 'diep versterkend leren' wordt genoemd specifieke benadering van deep learning die is geïnspireerd door de behavioristische psychologie en vallen en opstaan aan het leren. Opgedragen om een bepaalde beloning te maximaliseren, leren softwareagenten acties te ondernemen in een omgeving die deze resultaten op de meest precieze, efficiënte manier mogelijk zal bereiken. De kracht van versterkend leren was beroemd gedemonstreerd in 2013 toen Google’s DeepMind een artikel uitbracht waarin werd aangetoond hoe het een A.I. om klassieke Atari-videogames te spelen. Dit werd bereikt zonder andere instructies dan de score op het scherm en de ongeveer 30.000 pixels waaruit elk frame bestond van de videogames die het speelde.

Videogames, of in ieder geval simulaties, worden ook vaak gebruikt door robotica-onderzoekers. Een simulatie is in theorie volkomen logisch, omdat robotici hierdoor hun machine in een virtuele wereld kunnen trainen voordat ze naar de echte wereld gaan. Dat behoedt robots voor de onvermijdelijke valkuilen en slijtage die ze zouden ondergaan als ze leren een specifieke taak uit te voeren. Stel je ter analogie voor dat al je rijlessen zouden worden gegeven met behulp van een rijsimulator. Het argument zou kunnen worden aangevoerd dat je sneller zou leren omdat je niet zo voorzichtig hoeft te zijn als je je fysieke veiligheid in gevaar brengt of je auto (of die van iemand anders) beschadigt. U kunt ook sneller trainen zonder dat u hoeft te wachten op toegewezen lessen of totdat een chauffeur met een licentie bereid is u mee te nemen.

Het probleem hiermee is dat, zoals iedereen die ooit een racegame heeft gespeeld, zal weten, het behoorlijk moeilijk is om de echte wereld te modelleren op een manier die aanvoelt als, nou ja, de echte wereld. In plaats daarvan begonnen de onderzoekers van Google verbeterde algoritmen te ontwikkelen waarmee hun robot sneller kan leren, met minder tests. Voortbouwend op een eerder onderzoek van Google gepubliceerd in 2018kon hun robot tijdens deze laatste demonstratie in slechts een paar uur leren lopen.

Het is ook in staat dit te doen en tegelijkertijd de nadruk te leggen op een voorzichtigere, veiligere benadering van leren, waarbij minder vallen nodig zijn. Als resultaat hiervan minimaliseert het het aantal menselijke tussenkomsten dat nodig is om de robot op te pakken en af te stoffen telkens wanneer hij valt.

Betere robots bouwen

Leren lopen in twee uur is misschien niet bepaald een hoog niveau van efficiëntie bij het leren lopen, maar het staat ver verwijderd van het feit dat ingenieurs expliciet moeten programmeren hoe een robot gewoonlijk wordt geleerd te manoeuvreren. (En, zoals opgemerkt, het is een stuk beter dan menselijke baby’s in zo’n tijdsbestek kunnen doen!)

“Hoewel er veel algoritmen voor ongecontroleerd leren of versterkend leren zijn gedemonstreerd, simulatie, het toepassen ervan op echte, potende robots blijkt ongelooflijk moeilijk te zijn”, zegt Tan uitgelegd. “Ten eerste vergt versterkend leren veel data en is het verzamelen van robotdata duur. Ons eerdere werk heeft deze uitdaging aangepakt. Ten tweede vereist training dat iemand veel tijd besteedt aan het toezicht houden op de robot. Als we iemand nodig hebben die de robot in de gaten houdt en hem elke keer dat hij struikelt – honderden of duizenden keren – handmatig opnieuw instelt, zal het veel moeite en heel veel tijd kosten om de robot te trainen. Hoe langer het duurt, hoe moeilijker het is om het leren op te schalen naar veel robots in veel verschillende omgevingen.”

Op een dag zou dit onderzoek kunnen bijdragen aan het creëren van wendbaardere robots die zich sneller kunnen aanpassen aan verschillende terreinen. “De potentiële toepassingen zijn talrijk,” zei Tan. Tan benadrukte echter dat dit “nog in de kinderschoenen staat, en dat er nog veel uitdagingen zijn die we moeten overwinnen.”

In overeenstemming met het thema van versterkend leren is het echter zeker een beloning die de moeite waard is om te maximaliseren!

Aanbevelingen van de redactie

AI heeft Breaking Bad in een anime veranderd – en het is angstaanjagend
Waarom AI nooit de wereld zal regeren
Hoe weten we wanneer een AI daadwerkelijk bewust wordt?
De grappige formule: waarom door machines gegenereerde humor de heilige graal is van A.I.
Lees het griezelig mooie ‘synthetische geschrift’ van een A.I. die denkt dat het God is

Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.

Google Robot leert zichzelf in slechts twee uur lopen

Positieve bekrachtiging

Betere robots bouwen

Aanbevelingen van de redactie

Categorieën

Recente

Een pc- en consolegamer debatteert een jaar later over het Steam Deck

De Spawnies geven een nieuwe invulling aan de prijsuitreiking voor videogames

Hoe Nike's Vaporfly hardlopen opnieuw definieerde, ten goede of ten kwade