Googlov robot se nauči hoditi v samo dveh urah

Se spomnite tistega prizora v Walt Disneyju Bambi kjer se naslovni srnjak nauči vstati in hoditi s svojo močjo? To je očarljiva vinjeta v filmu, ki prikazuje spretnost, ki jo številni živalski mladiči – od prašičev do žiraf do, da, jelenov – pridobijo v nekaj minutah po rojstvu. V prvih nekaj urah življenja te živali hitro izpopolnjujejo svoje motorične sposobnosti, dokler nimajo popolnega nadzora nad lastnim gibanjem. Ljudje, ki se naučijo stati in se držati za stvari pri približno sedmih mesecih in začnejo hoditi pri 15 mesecih, so v primerjavi s tem brezupno počasni.

Vsebina

  • Pozitivna okrepitev
  • Izdelava boljših robotov

Uganete, katera zadnja naloga, pri kateri so nas roboti premagali? V novi študiji izvedli Googlovi raziskovalci, so inženirji naučili štirinožnega robota Minitaur hoditi mimo, no, pravzaprav ga sploh ni bilo treba veliko učiti. Namesto tega so uporabili vrsto ciljno usmerjene umetne inteligence, da bi naredili štirinožnega robota naučite se hoditi naprej, nazaj in popolnoma sam zavija levo in desno. To se je lahko uspešno naučilo na treh različnih terenih, vključno z ravnimi tlemi, mehko vzmetnico in predpražnikom z režami.

Priporočeni videoposnetki

"Roboti z nogami imajo lahko veliko mobilnost, saj so noge bistvenega pomena za navigacijo po neasfaltiranih cestah in mestih, namenjenih ljudem," Jie Tan, glavni raziskovalec pri projektu in Googlov vodja prizadevanj za premikanje, je povedal za Digital Trends. »Zanima nas, da robotom z nogami omogočimo krmarjenje po naših raznolikih in zapletenih okoljih resničnega sveta, vendar je težko ročno izdelati robotske krmilnike, ki lahko obvladajo takšno raznolikost in kompleksnost. Zato je pomembno, da se roboti lahko učijo sami. To delo je vznemirljivo, ker je to zgodnja predstavitev, da se lahko z našim sistemom robot z nogami uspešno nauči hoditi sam.«

Pozitivna okrepitev

Naučiti se hoditi v resničnem svetu z minimalnim človeškim naporom

Tehnologija, ki je osnova tega posebnega projekta, je nekaj, kar se imenuje globoko okrepljeno učenje, a poseben pristop k globokemu učenju, ki se zgleduje po bihevioristični psihologiji ter poskusih in napakah učenje. Agenti programske opreme, ki jim je rečeno, naj čim bolj povečajo določeno nagrado, se naučijo ukrepati v okolju, ki bo doseglo te rezultate na najbolj natančen in učinkovit način. Moč učenja s krepitvijo je bila slavno dokazano leta 2013 ko je Googlov DeepMind izdal dokument, ki prikazuje, kako je usposobil A.I. za igranje klasičnih video iger Atari. To je bilo doseženo brez navodil, razen z rezultatom na zaslonu in približno 30.000 slikovnimi pikami, ki so sestavljale vsak okvir video iger, ki jih je igral.

Video igre ali vsaj simulacije pogosto uporabljajo tudi robotski raziskovalci. Simulacija je v teoriji popolnoma smiselna, saj omogoča robotikom, da usposobijo svoj stroj v virtualnem svetu, preden gredo v resničnega. To prihrani robote pred neizogibnimi padci in obrabo, ki bi jim bili podvrženi, ko bi se naučili izvajati določeno nalogo. Kot analogijo si predstavljajte, da bi vse vaše učne ure vožnje izvajali z uporabo simulatorja vožnje. Lahko bi trdili, da bi se učili hitreje, ker vam ne bi bilo treba biti tako previdni glede tveganja za svojo fizično varnost ali poškodovanja vašega avtomobila (ali nekoga drugega). Usposabljate lahko tudi hitreje, ne da bi morali čakati na dodeljene lekcije ali na voznika z licenco, ki bi vas bil pripravljen odpeljati ven.

Težava pri tem je v tem, da je, kot ve vsakdo, ki je kdaj igral video igro vožnje, precej težko modelirati resnični svet na način, ki se zdi kot, no, resnični svet. Namesto tega so Googlovi raziskovalci začeli razvijati izboljšane algoritme, ki njihovemu robotu omogočajo hitrejše učenje z manj poskusi. Na podlagi prejšnje Googlove raziskave objavljeno leta 2018, se je njihov robot v tej zadnji predstavitvi lahko naučil hoditi v samo nekaj urah.

To lahko stori tudi ob poudarjanju previdnejšega in varnejšega pristopa k učenju, ki vključuje manj padcev. Posledično zmanjša število človeških posegov, ki so potrebni, da poberejo robota in z njega obrišejo prah vsakič, ko ta pade.

Izdelava boljših robotov

Naučiti se hoditi v dveh urah morda ne bo ravno visoka stopnja učinkovitosti učenja hoje, vendar je daleč od tega, da bi morali inženirji izrecno programirati, kako se robot običajno uči manevrirati. (In, kot že omenjeno, je veliko bolje, kot zmorejo človeški dojenčki v takšnem časovnem okviru!)

»Čeprav je bilo v simulacije, se je izkazalo, da je njihova uporaba na pravih robotih z nogami izjemno težka,« Tan pojasnil. »Prvič, okrepljeno učenje je lačno podatkov, zbiranje podatkov o robotih pa je drago. Naše prejšnje delo je obravnavalo ta izziv. Drugič, usposabljanje zahteva, da nekdo porabi veliko časa za nadzorovanje robota. Če potrebujemo osebo, ki bo nadzorovala robota in ga ročno ponastavila vsakič, ko se spotakne - na stotine ali tisočkrat -, bo potrebno veliko truda in zelo dolgo časa za usposabljanje robota. Dlje ko traja, težje je razširiti učenje na številne robote v številnih različnih okoljih.«

Nekega dne bi lahko ta raziskava pripomogla k ustvarjanju okretnejših robotov, ki bi se lahko hitreje prilagajali različnim terenom. "Možnosti uporabe so številne," je dejal Tan. Vendar pa je Tan poudaril, da je to "še zgodaj in obstaja veliko izzivov, ki jih moramo še premagati."

V skladu s temo okrepljenega učenja je to zagotovo nagrada, ki jo je vredno povečati!

Priporočila urednikov

  • Umetna inteligenca je Breaking Bad spremenila v anime - in to je grozljivo
  • Zakaj AI nikoli ne bo zavladal svetu
  • Kako bomo vedeli, kdaj umetna inteligenca dejansko postane čuteča?
  • Smešna formula: Zakaj je strojno ustvarjen humor sveti gral A.I.
  • Preberite srhljivo lepe "sintetične spise" A.I. ki misli, da je Bog

Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.