Google Robot opettaa itsensä kävelemään vain kahdessa tunnissa

Muistatko sen kohtauksen Walt Disneyn elokuvassa Bambi missä nimivasu oppii seisomaan ja kävelemään oman voimansa alaisena? Se on elokuvan hurmaava vinjetti, joka esittelee taitoa, jonka monet vauvat eläimet – sioista kirahviin ja peuraan – oppivat muutamassa minuutissa syntymästään. Muutaman ensimmäisen elämäntunnin aikana nämä eläimet kehittävät nopeasti motorisia taitojaan, kunnes he hallitsevat täysin omaa liikkumistaan. Ihmiset, jotka oppivat seisomaan pitäen kiinni asioista noin seitsemän kuukauden iässä ja jotka alkavat kävellä 15 kuukauden iässä, ovat siihen verrattuna toivottoman hitaita.

Sisällys

  • Positiivinen vahvistus
  • Parempien robottien rakentaminen

Arvaa mikä on viimeisin tehtävä, jossa robotit ovat voittaneet meidät? Uudessa tutkimuksessa Googlen tutkijoiden suorittamana, insinöörit ovat opettaneet nelijalkaisen Minitaur-robotin kävelemään ohitse, eikä sitä tarvitse opettaa paljoakaan. Pikemminkin he ovat käyttäneet eräänlaista tavoitteellista tekoälyä tehdäkseen nelijalkaisen robotin

oppia kävelemään eteenpäin, taaksepäin ja kääntyä vasemmalle ja oikealle täysin itsestään. Se onnistui opettamaan itsensä tekemään tämän kolmella eri maastolla, mukaan lukien tasainen maa, pehmeä patja ja kynnysmatto rakoilla.

Suositellut videot

"Jalkaisilla roboteilla voi olla suuri liikkuvuus, koska jalat ovat välttämättömiä päällystämättömillä teillä ja ihmisille suunnitelluissa paikoissa navigoinnissa." Jie Tan, hankkeen periaatteellinen tutkija ja Googlen liikkumispäällikkö, kertoi Digital Trendsille. "Olemme kiinnostuneita siitä, että jalkarobotit voivat navigoida monipuolisissa ja monimutkaisissa todellisissa ympäristöissämme, mutta on vaikeaa suunnitella manuaalisesti robottiohjaimia, jotka pystyvät käsittelemään tällaista monimuotoisuutta ja monimutkaisuus. Siksi on tärkeää, että robotit voivat oppia itse. Tämä työ on jännittävää, koska tämä on varhainen osoitus siitä, että järjestelmämme avulla jalkarobotti voi onnistuneesti oppia kävelemään yksin."

Positiivinen vahvistus

Opi kävelemään todellisessa maailmassa minimaalisella inhimillisellä vaivalla

Tämän projektin taustalla oleva tekniikka on syvä vahvistusoppiminen, a erityinen lähestymistapa syvään oppimiseen, joka on inspiroitunut behavioristisesta psykologiasta ja yrityksen ja erehdyksestä oppimista. Ohjelmistoagentit oppivat maksimoimaan tietyn palkinnon, ja ne oppivat toimimaan ympäristössä, joka saavuttaa nämä tulokset tarkimmalla ja tehokkaalla tavalla. Vahvistusoppimisen voima oli esiteltiin tunnetusti vuonna 2013 kun Googlen DeepMind julkaisi paperin, jossa kerrottiin, kuinka se oli kouluttanut A.I. pelata klassisia Atari-videopelejä. Tämä saavutettiin ilman muita ohjeita kuin näytön pisteet ja noin 30 000 pikseliä, jotka muodostivat jokaisen sen pelaamien videopelien ruudun.

Myös robotiikan tutkijat käyttävät usein videopelejä tai ainakin simulaatioita. Simulaatio on teoriassa täysin järkevä, koska sen avulla robotikot voivat kouluttaa koneensa virtuaalimaailmaan ennen kuin he menevät todelliseen maailmaan. Tämä säästää robotit väistämättömiltä harhautumisilta ja kulumiselta, joita ne joutuisivat kohtaamaan, kun ne oppivat suorittamaan tiettyä tehtävää. Kuvittele analogisesti, jos kaikki ajotuntisi suoritettaisiin ajosimulaattorilla. Voidaan väittää, että oppisit nopeammin, koska sinun ei tarvitse olla niin varovainen vaarantaessasi fyysisen turvallisuutesi tai vahingoittamasta autoasi (tai jonkun muun). Voit myös harjoitella nopeammin ilman, että sinun tarvitsee odottaa varattuja oppitunteja tai sitä, että luvan saanut kuljettaja on valmis ottamaan sinut pois.

Tämän ongelmana on, että kuten jokainen, joka on koskaan pelannut ajovideopeliä, tietää, on melko vaikeaa mallintaa todellista maailmaa tavalla, joka tuntuu todelliselta. Sen sijaan Googlen tutkijat alkoivat kehittää parempia algoritmeja, joiden avulla heidän robottinsa oppii nopeammin vähemmällä kokeella. Aiemman Google-tutkimuksen pohjalta julkaistu vuonna 2018, heidän robottinsa oppi kävelemään vain parissa tunnissa tässä uusimmassa esittelyssä.

Se pystyy myös tekemään tämän samalla, kun se korostaa varovaisempaa, turvallisempaa lähestymistapaa oppimiseen, joka sisältää vähemmän kaatumisia. Seurauksena on, että se minimoi ihmisten toimenpiteiden lukumäärän, jotka tarvitaan robotin nostamiseksi ja pölyn poistamiseksi aina kun se kaatuu.

Parempien robottien rakentaminen

Kävelemisen oppiminen kahdessa tunnissa ei välttämättä ole aivan hirveä kävelemisen oppimisen tehokkuus, mutta se on kaukana siitä, että insinöörit joutuisivat ohjelmoimaan tarkasti, miten robotti yleensä opetetaan ohjaamaan. (Ja kuten todettiin, se on paljon parempi kuin ihmislapset voivat selviytyä sellaisessa ajassa!)

"Vaikka monia valvomattomia oppimis- tai vahvistusoppimisalgoritmeja on esitelty simulaatio, niiden soveltaminen oikeisiin, jalkarobotteihin osoittautuu uskomattoman vaikeaksi, Tan selitti. ”Ensinnäkin vahvistusoppiminen vaatii dataa, ja robottidatan kerääminen on kallista. Aikaisempi työmme on vastannut tähän haasteeseen. Toiseksi koulutus vaatii jonkun viettämään paljon aikaa robotin valvomiseen. Jos tarvitsemme henkilön valvomaan robottia ja nollaamaan sen manuaalisesti aina, kun se kompastuu – satoja tai tuhansia kertoja –, robotin kouluttaminen vaatii paljon vaivaa ja erittäin kauan. Mitä kauemmin se kestää, sitä vaikeampaa on skaalata oppiminen moniin robotteihin monissa eri ympäristöissä."

Eräänä päivänä tämä tutkimus voisi auttaa luomaan ketterämpiä robotteja, jotka pystyvät mukautumaan nopeammin erilaisiin maastoihin. "Mahdollisia sovelluksia on lukuisia", Tan sanoi. Tan kuitenkin korosti, että tämä on "vielä alkuaikoja, ja meidän on vielä voitettava monia haasteita".

Vahvistusoppimisen teeman mukaisesti se on varmasti palkinto, joka kannattaa maksimoida!

Toimittajien suositukset

  • Tekoäly muutti Breaking Badista animeksi – ja se on pelottavaa
  • Miksi tekoäly ei koskaan hallitse maailmaa
  • Mistä tiedämme, milloin tekoäly todella tulee tuntevaksi?
  • Hauska kaava: Miksi koneella luotu huumori on A.I: n pyhä malja?
  • Lue aavemaisen kaunista A.I: n synteettistä kirjoitusta. joka luulee olevansa Jumala

Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.