Google Robot lär sig att gå på bara två timmar

Kommer du ihåg den där scenen i Walt Disneys Bambi där den titulära fawn lär sig att stå upp och gå av sin egen kraft? Det är en charmig vinjett i filmen, som visar upp en färdighet som många djurungar – från grisar till giraffer till, ja, rådjur – tar på sig inom några minuter efter födseln. Under de första timmarna av livet förfinar dessa djur snabbt sina motoriska färdigheter tills de har full kontroll över sin egen rörelse. Människor, som lär sig att stå och hålla i saker vid cirka sju månader och som börjar gå vid 15 månader, är hopplöst tröga i jämförelse.

Innehåll

  • Positiv förstärkning
  • Bygger bättre robotar

Gissa vad den senaste uppgiften som robotar har slagit oss på? I en ny studie utförs av forskare på Google, ingenjörer har lärt en fyrfotad Minitaur-robot att gå förbi, ja, egentligen behöver den inte lära den mycket alls. Snarare har de använt en typ av målinriktad artificiell intelligens för att göra en fyrbent robot lär dig att gå framåt, bakåt och sväng vänster och höger helt på egen hand. Den kunde framgångsrikt lära sig att göra detta i tre olika terränger, inklusive plan mark, en mjuk madrass och en dörrmatta med springor.

Rekommenderade videor

"Robotar med ben kan ha stor rörlighet eftersom ben är viktiga för att navigera på oasfalterade vägar och platser designade för människor," Jie Tan, principiell utredare för projektet och Googles chef för förflyttningsinsatser, berättade för Digital Trends. "Vi är intresserade av att låta robotar med ben att navigera i våra olika och komplexa verkliga miljöer, men det är svårt att manuellt konstruera robotstyrningar som kan hantera sådan mångfald och komplexitet. Därför är det viktigt att robotar kan lära sig själva. Det här arbetet är spännande eftersom detta är en tidig demonstration av att med vårt system kan en benbensrobot framgångsrikt lära sig att gå på egen hand.”

Positiv förstärkning

Lär dig gå i den verkliga världen med minimal mänsklig ansträngning

Tekniken som ligger till grund för detta specifika projekt är något som kallas djup förstärkningsinlärning, en specifik inställning till djupinlärning som är inspirerad av beteendepsykologi och försök och misstag inlärning. Ombedd att maximera en viss belöning, lär sig programvaruagenter att vidta åtgärder i en miljö som kommer att uppnå dessa resultat på det mest exakta och effektiva sättet som möjligt. Kraften i förstärkningsinlärning var känd demonstrerad 2013 när Googles DeepMind släppte ett papper som visade hur det hade tränat en A.I. att spela klassiska Atari-videospel. Detta uppnåddes utan någon annan instruktion än poängen på skärmen och de cirka 30 000 pixlarna som utgjorde varje bildruta i videospelen den spelade.

Videospel, eller åtminstone simuleringar, används ofta av robotforskare också. En simulering är helt vettig i teorin, eftersom den tillåter robotiker att träna sin maskin i en virtuell värld innan de går ut i den riktiga. Det räddar robotar från de oundvikliga pratfall och slitage som den skulle genomgå när den lär sig att utföra en specifik uppgift. Som en analogi, föreställ dig om alla dina körlektioner genomfördes med en körsimulator. Argumentet kan framföras att du skulle lära dig snabbare eftersom du inte skulle behöva vara så försiktig med att riskera din fysiska säkerhet eller skada din bil (eller någon annans). Du kan också träna snabbare utan att behöva vänta på tilldelade lektioner eller på att en licensierad förare är villig att ta dig ut.

Problemet med detta är att, som alla som någonsin har spelat ett körande videospel vet, det är ganska svårt att modellera den verkliga världen på ett sätt som känns som, ja, den verkliga världen. Istället började Googles forskare utveckla förbättrade algoritmer som gör att deras robot kan lära sig snabbare med färre försök inblandade. Bygger på en tidigare del av Google-forskning publicerades 2018, deras robot kunde lära sig att gå på bara ett par timmar i den här senaste demonstrationen.

Den kan också göra detta samtidigt som den betonar ett mer försiktigt, säkrare förhållningssätt till inlärning, med färre fall. Som ett resultat minimerar det antalet mänskliga ingrepp som måste göras för att plocka upp roboten och damma av den varje gång den faller.

Bygger bättre robotar

Att lära sig att gå på två timmar är kanske inte riktigt hjortnivåer för att lära sig att gå effektivitet, men det är långt ifrån att ingenjörer måste explicit programmera hur en robot vanligtvis lärs manövrera. (Och, som nämnts, det är mycket bättre än mänskliga spädbarn kan klara av i den typen av tidsram!)

"Även om många oövervakade inlärnings- eller förstärkningsalgoritmer har visats i simulering, att applicera dem på riktiga robotar med ben visar sig vara otroligt svårt, säger Tan förklarade. "För det första är förstärkningsinlärning datahungrig, och att samla in robotdata är dyrt. Vårt tidigare arbete har tagit itu med denna utmaning. För det andra kräver träning att någon lägger mycket tid på att övervaka roboten. Om vi ​​behöver en person som övervakar roboten och manuellt återställer den varje gång den snubblar - hundratals eller tusentals gånger - kommer det att ta mycket ansträngning och mycket lång tid att träna roboten. Ju längre tid det tar, desto svårare är det att skala upp inlärningen till många robotar i många olika miljöer.”

En dag kan denna forskning hjälpa till att skapa smidigare robotar som snabbare kan anpassa sig till en mängd olika terränger. "De potentiella tillämpningarna är många," sa Tan. Tan betonade dock att detta är "fortfarande tidiga dagar, och det finns många utmaningar som vi fortfarande behöver övervinna."

I enlighet med temat för förstärkningsinlärning är det verkligen en belöning som är värd att maximera!

Redaktörens rekommendationer

  • AI gjorde Breaking Bad till en anime - och det är skrämmande
  • Varför AI aldrig kommer att styra världen
  • Hur ska vi veta när en AI faktiskt blir kännande?
  • Den roliga formeln: Varför maskingenererad humor är A.I.s heliga gral.
  • Läs den kusligt vackra "syntetiska skriften" av en A.I. som tror att det är Gud

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.