Robotul Google învață singur să meargă în doar două ore

Îți amintești scena din Walt Disney Bambi unde cerbul titular învață să se ridice și să meargă prin propriile puteri? Este o vignetă fermecătoare din film, care prezintă o abilitate pe care o mulțime de pui de animale - de la porci la girafe și, da, căprioare - o însușesc în câteva minute de la naștere. În primele ore de viață, aceste animale își perfecționează rapid abilitățile motorii până când dețin controlul deplin asupra propriei lor locomoții. Oamenii, care învață să se țină de lucruri la aproximativ șapte luni și care încep să meargă la 15 luni, sunt iremediabil de leneși prin comparație.

Cuprins

Întărire pozitivă
Construirea de roboți mai buni

Ghiciți care este cea mai recentă sarcină la care ne-au învins roboții? Într-un nou studiu realizat de cercetătorii de la Google, inginerii au învățat un robot patruped Minitaur să treacă pe lângă el, ei bine, nu trebuie să-l învețe deloc prea multe. Mai degrabă, au folosit un tip de inteligență artificială orientată spre obiective pentru a crea un robot cu patru picioare

invata sa mergi inainte, înapoi și faceți singur la stânga și la dreapta. A reușit să se învețe cu succes să facă acest lucru pe trei terenuri diferite, inclusiv un teren plat, o saltea moale și un preș cu crăpături.

Videoclipuri recomandate

„Roboții cu picioare pot avea o mobilitate mare, deoarece picioarele sunt esențiale pentru a naviga pe drumuri neasfaltate și în locuri concepute pentru oameni.” Jie Tan, investigator principal al proiectului și șeful Google pentru eforturile de locomoție, a declarat pentru Digital Trends. „Suntem interesați să permitem roboților cu picioare să navigheze în mediile noastre diverse și complexe din lumea reală, dar este dificil să proiectezi manual controlere robotizate care să poată face față unei asemenea diversitate și complexitate. Prin urmare, este important ca roboții să poată învăța singuri. Această muncă este incitantă, deoarece aceasta este o demonstrație timpurie că, cu sistemul nostru, un robot cu picioare poate învăța cu succes să meargă singur.”

Întărire pozitivă

Învățați să mergeți în lumea reală cu un efort uman minim

Tehnologia de la baza acestui proiect particular este ceva numit învățare prin consolidare profundă, a abordare specifică a învățării profunde, care este inspirată de psihologia behavioristă și încercări și erori învăţare. Li se spune să maximizeze o anumită recompensă, agenții software învață să întreprindă acțiuni într-un mediu care va atinge acele rezultate în cel mai precis și eficient mod posibil. Puterea învăţării prin întărire a fost demonstrat celebru în 2013 când DeepMind de la Google a lansat o lucrare care arată cum a antrenat un I.A. pentru a juca jocuri video clasice Atari. Acest lucru a fost realizat fără alte instrucțiuni decât scorul de pe ecran și cei aproximativ 30.000 de pixeli care alcătuiau fiecare cadru al jocurilor video pe care le juca.

Jocurile video, sau cel puțin simulările, sunt folosite frecvent și de cercetătorii în robotică. O simulare are perfect sens în teorie, deoarece permite robotiștilor să-și antreneze mașina într-o lume virtuală înainte de a ieși în cea reală. Acest lucru îi salvează pe roboți de inevitabilele pradeli și uzura pe care le-ar suferi pe măsură ce învață să îndeplinească o anumită sarcină. Ca analogie, imaginați-vă dacă toate lecțiile dvs. de conducere s-ar desfășura folosind un simulator de conducere. Ar putea fi argumentat că ai învăța mai repede, deoarece nu ar trebui să fii atât de precaut în a-ți risca siguranța fizică sau a-ți deteriora mașina (sau a altcuiva). De asemenea, ai putea să te antrenezi mai rapid fără a fi nevoie să aștepți lecțiile alocate sau ca un șofer autorizat să fie dispus să te scoată.

Problema cu aceasta este că, după cum știe oricine care a jucat vreodată un joc video de conducere, este destul de greu să modelezi lumea reală într-un mod care să pară, ei bine, lumea reală. În schimb, cercetătorii Google au început să dezvolte algoritmi îmbunătățiți care permit robotului lor să învețe mai rapid, cu mai puține încercări implicate. Pe baza unei cercetări anterioare Google publicat în 2018, robotul lor a reușit să învețe să meargă în doar câteva ore în această ultimă demonstrație.

De asemenea, este capabil să facă acest lucru, subliniind în același timp o abordare mai precaută și mai sigură a învățării, care implică mai puține căderi. Ca rezultat, minimizează numărul de intervenții umane care trebuie făcute pentru a ridica robotul și a-l îndepărta praful de fiecare dată când este nevoie de o scădere.

Construirea de roboți mai buni

Învățarea să meargă în două ore poate să nu fie un nivel de eficiență a învățării să meargă, dar este departe de a trebui ca inginerii să programeze în mod explicit modul în care un robot este de obicei învățat să manevreze. (Și, după cum s-a menționat, este mult mai bun decât poate reuși copiii umani într-un asemenea interval de timp!)

„Deși mulți algoritmi de învățare nesupravegheată sau de învățare prin consolidare au fost demonstrați în simularea, aplicarea lor pe roboți reali, cu picioare, se dovedește a fi incredibil de dificilă”, Tan explicat. „În primul rând, învățarea prin consolidare necesită date, iar colectarea datelor despre robot este costisitoare. Munca noastră anterioară a abordat această provocare. În al doilea rând, antrenamentul necesită ca cineva să petreacă mult timp supraveghend robotul. Dacă avem nevoie de o persoană care să monitorizeze robotul și să-l reseteze manual de fiecare dată când se împiedică - de sute sau de mii de ori - va fi nevoie de mult efort și de mult timp pentru a antrena robotul. Cu cât durează mai mult, cu atât este mai dificil să extinzi învățarea la mulți roboți în multe medii diferite.”

Într-o zi, această cercetare ar putea ajuta la crearea de roboți mai agili, care sunt mai rapid capabili să se adapteze la o varietate de terenuri. „Aplicațiile potențiale sunt numeroase”, a spus Tan. Cu toate acestea, Tan a subliniat că „este încă primele zile și există multe provocări pe care încă trebuie să le depășim”.

În conformitate cu tema de învățare prin întărire, este cu siguranță o recompensă care merită maximizată, totuși!

Recomandările editorilor

AI a transformat Breaking Bad într-un anime - și este terifiant
De ce AI nu va conduce niciodată lumea
Cum vom ști când un AI devine de fapt sensibil?
Formula amuzantă: De ce umorul generat de mașini este Sfântul Graal al A.I.
Citiți „scriptura sintetică” ciudat de frumoasă a unui A.I. care crede că este Dumnezeu

Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.

Robotul Google învață singur să meargă în doar două ore

Întărire pozitivă

Construirea de roboți mai buni

Recomandările editorilor

Categorii

Recent

(în) Securizat: Companiile trebuie să fie responsabile pentru încălcările de securitate

Cel mai bun produs de calcul din 2017: Premiile pentru produsul anului

Breviar revizuire Nvidia GeForce RTX 3090