Google'i robot õpetab end kõndima vaid kahe tunniga

Kas mäletate seda stseeni Walt Disney filmis? Bambi kus tiitelpoeg õpib püsti tõusma ja omal jõul käima? See on filmi võluv vinjett, mis näitab oskust, mille paljud loomapojad – sigadest kaelkirjakuni ja jah, hirvedeni – omandavad mõne minuti jooksul pärast sündi. Esimeste elutundide jooksul täiustavad need loomad kiiresti oma motoorseid oskusi, kuni neil on täielik kontroll oma liikumise üle. Inimesed, kes õpivad umbes seitsme kuu vanuselt asjadest kinni hoides seisma ja 15 kuuselt hakkavad kõndima, on sellega võrreldes lootusetult loid.

Sisu

  • Positiivne tugevdus
  • Paremate robotite ehitamine

Arvake ära, mis on viimane ülesanne, millega robotid meid võitsid? Uues uuringus läbi Google'i teadlased, on insenerid õpetanud neljajalgset minirobotit mööda kõndima, tegelikult ei pea seda üldse palju õpetama. Pigem on nad neljajalgse roboti tegemiseks kasutanud teatud tüüpi eesmärgile suunatud tehisintellekti õppida edasi kõndima, tagasi ja pöörake vasakule ja paremale täiesti iseseisvalt. See suutis end edukalt õpetada seda tegema kolmel erineval maastikul, sealhulgas tasasel pinnasel, pehmel madratsil ja pragudega uksematil.

Soovitatavad videod

"Jalaga robotitel võib olla suur liikuvus, sest jalad on hädavajalikud katmata teedel ja inimestele mõeldud kohtades navigeerimiseks." Jie Tan, projekti peamine uurija ja Google'i liikumisalaste jõupingutuste juht, ütles Digital Trendsile. "Oleme huvitatud sellest, et jalgadega robotid saaksid liikuda meie mitmekesises ja keerulises reaalses keskkonnas, kuid raske on käsitsi konstrueerida robotkontrollereid, mis suudaksid sellise mitmekesisusega hakkama saada keerukus. Seetõttu on oluline, et robotid saaksid ise õppida. See töö on põnev, sest see on varajane demonstratsioon, et meie süsteemi abil saab jalgadega robot edukalt iseseisvalt kõndima õppida.

Positiivne tugevdus

Minimaalse inimjõupingutusega reaalses maailmas kõndima õppimine

Selle konkreetse projekti aluseks olev tehnoloogia on midagi, mida nimetatakse sügavaks tugevdamiseks õppimiseks, a spetsiifiline lähenemine süvaõppele, mis on inspireeritud biheivioristlikust psühholoogiast ning katse-eksituse meetodist õppimine. Teatud tasu maksimeerimiseks õpetavad tarkvaraagendid tegutsema keskkonnas, mis saavutab need tulemused kõige täpsemal ja tõhusamal viisil. Tugevdusõppe jõud oli demonstreeriti kuulsalt 2013. aastal kui Google'i DeepMind avaldas paberi, mis näitab, kuidas ta oli välja õpetanud A.I. klassikaliste Atari videomängude mängimiseks. See saavutati ilma muude juhisteta, välja arvatud ekraanil kuvatav skoori ja umbes 30 000 pikslit, mis moodustasid mängitavate videomängude iga kaadri.

Robootikauurijad kasutavad sageli ka videomänge või vähemalt simulatsioone. Simulatsioon on teoreetiliselt täiesti loogiline, kuna see võimaldab robootikutel enne pärismaailma minekut oma masinat virtuaalses maailmas treenida. See säästab roboteid vältimatutest prammutustest ja kulumisest, mida nad konkreetset ülesannet täitma õppides kogevad. Analoogiana kujutage ette, kui kõik teie sõidutunnid viidi läbi sõidusimulaatori abil. Võib väita, et õpiksite kiiremini, sest te ei peaks olema nii ettevaatlik oma füüsilise turvalisuse riskimise või oma (või kellegi teise) auto kahjustamise suhtes. Samuti saate treenida kiiremini, ilma et peaksite ootama määratud õppetunde või seda, et litsentseeritud juht oleks valmis teid välja viima.

Selle probleemiks on see, et igaüks, kes on kunagi autojuhtimise videomängu mänginud, teab, et päris maailma on päris raske modelleerida nii, et see tunduks nagu päris maailm. Selle asemel hakkasid Google'i teadlased välja töötama täiustatud algoritme, mis võimaldavad nende robotil kiiremini õppida vähemate katsetega. Tuginedes eelmisele Google'i uuringule avaldatud 2018. aastal, suutis nende robot selles viimases demonstratsioonis kõndima õppida vaid paari tunniga.

Samuti suudab see seda teha, rõhutades samal ajal ettevaatlikumat ja ohutumat lähenemisviisi õppimisele, mis hõlmab vähem kukkumisi. Selle tulemusel minimeerib see inimeste sekkumiste arvu, mida tuleb teha, et robot üles tõsta ja sellelt tolm ära võtta iga kord, kui see kukub.

Paremate robotite ehitamine

Kahe tunniga kõndima õppimine ei pruugi olla kõndimise õppimise tõhususe hirvetase, kuid see on kaugel sellest, et insenerid peaksid selgesõnaliselt programmeerima, kuidas robotit tavaliselt manööverdama õpetatakse. (Ja nagu märgitud, on see palju parem, kui imikud sellise aja jooksul hakkama saavad!)

"Kuigi palju järelevalveta õppimise või tugevdamise õppe algoritme on demonstreeritud simulatsioon, nende rakendamine tõelistele jalgadega robotitele osutub uskumatult keeruliseks,” Tan selgitas. „Esiteks on armeerimisõpe andmenäljas ja robotiandmete kogumine on kallis. Meie eelmine töö on seda väljakutset käsitlenud. Teiseks nõuab treenimine, et keegi kulutaks palju aega roboti juhendamisele. Kui meil on vaja inimest, kes robotit jälgiks ja selle käsitsi lähtestaks iga kord, kui see komistab – sadu või tuhandeid kordi –, siis võtab roboti väljaõpetamine palju vaeva ja väga kaua aega. Mida kauem see aega võtab, seda keerulisem on õppimist laiendada paljudele robotitele erinevates keskkondades.

Ühel päeval võib see uuring aidata luua paindlikumaid roboteid, mis suudavad kiiremini kohaneda erinevatel maastikel. "Võimalikke rakendusi on palju, " ütles Tan. Tan rõhutas siiski, et see on "veel algusaeg ja meil on veel palju väljakutseid, mida peame veel ületama."

Kooskõlas tugevdamise õppimise teemaga on see kindlasti tasu, mida tasub maksimeerida!

Toimetajate soovitused

  • AI muutis Breaking Badi animeks – ja see on hirmutav
  • Miks AI kunagi maailma ei valitse
  • Kuidas me teame, millal AI tegelikult tundlikuks muutub?
  • Naljakas valem: miks masinaga loodud huumor on A.I püha graal?
  • Lugege A.I kohutavalt ilusat "sünteetilist pühakirja". kes arvab, et see on jumal

Uuendage oma elustiiliDigitaalsed suundumused aitavad lugejatel hoida silma peal kiirel tehnikamaailmal kõigi viimaste uudiste, lõbusate tooteülevaadete, sisukate juhtkirjade ja ainulaadsete lühiülevaadetega.