Googleov robot uči sam hodati za samo dva sata

Sjećate li se one scene u Walt Disneyju Bambi gdje titularni lane uči ustati i hodati vlastitim snagama? To je šarmantna vinjeta u filmu, koja prikazuje vještinu koju mnoštvo mladunaca životinja - od svinja preko žirafe do, da, jelena - pokupi u roku od nekoliko minuta nakon rođenja. Tijekom prvih nekoliko sati života, ove životinje brzo usavršavaju svoje motoričke vještine sve dok ne steknu potpunu kontrolu nad vlastitim kretanjem. Ljudi, koji nauče stajati držeći se za stvari oko sedam mjeseci i koji počnu hodati sa 15 mjeseci, u usporedbi su beznadno tromi.

Sadržaj

  • Pozitivno pojačanje
  • Izrada boljih robota

Pogodite koji je najnoviji zadatak u kojem su nas roboti pobijedili? U novoj studiji proveli istraživači iz Googlea, inženjeri su naučili četveronožnog robota Minitaura da hoda, pa, zapravo ga ne moraju puno učiti. Umjesto toga, upotrijebili su neku vrstu ciljano orijentirane umjetne inteligencije za izradu četveronožnog robota naučiti kako hodati naprijed, unatrag, i skreće lijevo i desno posve samostalno. Uspješno se naučio to učiniti na tri različita terena, uključujući ravno tlo, mekani madrac i otirač s pukotinama.

Preporučeni videozapisi

"Roboti s nogama mogu imati veliku pokretljivost jer su noge ključne za kretanje neasfaltiranim cestama i mjestima dizajniranim za ljude," Jie Tan, glavni istraživač na projektu i Googleov voditelj lokomotivnih napora, rekao je za Digital Trends. "Zainteresirani smo za omogućavanje nožnim robotima da se kreću našim raznolikim i složenim okruženjima stvarnog svijeta, ali je teško ručno konstruirati robotske kontrolere koji se mogu nositi s takvom raznolikošću i složenost. Stoga je važno da roboti mogu učiti sami. Ovaj rad je uzbudljiv jer je ovo rana demonstracija da, s našim sustavom, robot s nogama može uspješno naučiti hodati sam."

Pozitivno pojačanje

Naučiti hodati u stvarnom svijetu uz minimalan ljudski napor

Tehnologija u korijenu ovog konkretnog projekta je nešto što se zove duboko potkrepljeno učenje, a specifičan pristup dubokom učenju koji je inspiriran biheviorističkom psihologijom te pokušajima i pogreškama učenje. Rečeno im je da maksimiziraju određenu nagradu, softverski agenti uče poduzimati radnje u okruženju koje će postići te rezultate na najprecizniji, najučinkovitiji mogući način. Moć učenja s potkrepljenjem bila je slavno prikazano 2013 kada je Googleov DeepMind objavio rad koji pokazuje kako je istrenirao A.I. za igranje klasičnih Atari videoigara. To je postignuto bez ikakvih uputa osim rezultata na zaslonu i približno 30.000 piksela koji su činili svaki okvir videoigara koje je igrao.

Video igre, ili barem simulacije, također često koriste istraživači robotike. Simulacija ima savršenog smisla u teoriji, jer omogućuje robotičarima da treniraju svoj stroj u virtualnom svijetu prije nego što odu u stvarni svijet. To spašava robote od neizbježnih padova i habanja kojima bi bili podvrgnuti dok bi naučili izvršavati određeni zadatak. Kao analogiju, zamislite da se sve vaše lekcije vožnje izvode pomoću simulatora vožnje. Moglo bi se iznijeti argument da biste brže učili jer ne biste morali biti toliko oprezni u pogledu riskiranja svoje fizičke sigurnosti ili oštećenja vašeg automobila (ili nečijeg drugog). Također možete trenirati brže, a da ne morate čekati dodijeljene lekcije ili da vas licencirani vozač bude spreman odvesti.

Problem s ovim je taj što je, kao što zna svatko tko je ikada igrao videoigru vožnje, prilično teško modelirati stvarni svijet na način da se čini kao, pa, stvarni svijet. Umjesto toga, Googleovi istraživači počeli su razvijati poboljšane algoritme koji njihovom robotu omogućuju brže učenje uz manje pokušaja. Nadovezujući se na prethodno Googleovo istraživanje objavljeno 2018, njihov je robot uspio naučiti hodati u samo nekoliko sati u ovoj posljednjoj demonstraciji.

Također je u stanju to učiniti dok naglašava oprezniji, sigurniji pristup učenju, koji uključuje manje padova. Kao rezultat toga, smanjuje se broj ljudskih intervencija koje su potrebne da se podigne robot i ukloni s njega prašinu svaki put kad se prevrne.

Izrada boljih robota

Naučiti hodati u dva sata možda i nije vrlo visoka razina učinkovitosti učenja hodanja, ali daleko je od toga da inženjeri moraju eksplicitno programirati kako se robota obično uči manevrirati. (I, kao što je navedeno, puno je bolje nego što to ljudska dojenčad može podnijeti u tom vremenskom okviru!)

“Iako su mnogi algoritmi za učenje bez nadzora ili učenje s potkrepljenjem demonstrirani u simulacije, njihova primjena na pravim robotima s nogama pokazala se nevjerojatno teškom," Tan objasnio. “Prvo, učenje s potkrepljenjem traži podatke, a prikupljanje podataka robota je skupo. Naš prethodni rad bavio se ovim izazovom. Drugo, obuka zahtijeva da netko provede puno vremena nadgledajući robota. Ako nam je potrebna osoba koja će nadzirati robota i ručno ga resetirati svaki put kad posrne - stotine ili tisuće puta - trebat će puno truda i jako dugo vremena za treniranje robota. Što dulje traje, to je teže proširiti učenje na mnoge robote u mnogim različitim okruženjima.”

Jednog bi dana ovo istraživanje moglo pomoći u stvaranju agilnijih robota koji se brže mogu prilagoditi različitim terenima. "Potencijalne primjene su brojne", rekao je Tan. Međutim, Tan je naglasio da je ovo "još rano i da postoje mnogi izazovi koje još moramo prevladati."

U skladu s temom učenja za potkrepljivanje, to je svakako nagrada koju vrijedi maksimizirati!

Preporuke urednika

  • AI je Breaking Bad pretvorio u anime - i to je zastrašujuće
  • Zašto AI nikada neće vladati svijetom
  • Kako ćemo znati kada umjetna inteligencija stvarno postane osjećajna?
  • Smiješna formula: zašto je strojno generirani humor sveti gral AI-ja
  • Pročitajte jezivo lijepe 'sintetičke spise' umjetne inteligencije. koji misli da je Bog

Nadogradite svoj životni stilDigitalni trendovi pomažu čitateljima da prate brzi svijet tehnologije sa svim najnovijim vijestima, zabavnim recenzijama proizvoda, pronicljivim uvodnicima i jedinstvenim brzim pregledima.