A Google Robot mindössze két óra alatt megtanítja magát járni

Emlékszel arra a jelenetre a Walt Disney-ben? Bambi ahol a címzetes őzike megtanul saját erejéből felállni és járni? Ez egy elbűvölő matrica a filmben, amely egy olyan képességet mutat be, amelyet számos állatbébi – a disznóktól a zsiráfokon át egészen a szarvasig – a születésük után perceken belül felvesz. Életük első néhány órájában ezek az állatok gyorsan finomítják motoros készségeiket, amíg teljesen kontrollálják saját mozgásukat. Az emberek, akik körülbelül hét hónapos korukban megtanulnak kapaszkodni, és 15 hónaposan kezdenek járni, ehhez képest reménytelenül lomhák.

Tartalom

  • Pozitív megerősítés
  • Jobb robotok építése

Találd ki, mi volt a legújabb feladat, amiben a robotok legyőztek minket? Egy új tanulmányban a Google kutatói, a mérnökök megtanítottak egy négylábú Minitaur robotot arra, hogy elmenjen mellette, igazából egyáltalán nem kell sokat tanítani. Inkább egyfajta célorientált mesterséges intelligenciát használtak egy négylábú robot elkészítéséhez tanulj meg előre menni, hátra, és teljesen önállóan forduljon balra és jobbra. Ezt három különböző terepen tudta sikeresen megtanítani, beleértve a sík terepet, a puha matracot és a résekkel ellátott lábtörlőt.

Ajánlott videók

„A lábon járó robotok nagy mobilitásúak lehetnek, mert a lábak elengedhetetlenek a burkolatlan utakon és az emberek számára kialakított helyeken való navigáláshoz” Jie Tan, a projekt elvi kutatója és a Google helymeghatározási erőfeszítéseinek vezetője – mondta a Digital Trendsnek. „Érdekeltek bennünket, hogy lehetővé tegyük a lábon járó robotok számára, hogy eligazodjanak változatos és összetett valós környezeteinkben, de nehéz manuálisan megtervezni olyan robotvezérlőket, amelyek képesek kezelni az ilyen sokféleséget és bonyolultság. Ezért fontos, hogy a robotok képesek legyenek önállóan tanulni. Ez a munka azért izgalmas, mert ez egy korai bemutató, hogy a mi rendszerünkkel egy lábú robot sikeresen megtanul önállóan járni.”

Pozitív megerősítés

Tanulj meg járni a való világban minimális emberi erőfeszítéssel

A projekt alapját képező technológia az úgynevezett mély megerősítő tanulás, a specifikus megközelítés a mély tanuláshoz, amelyet a behaviorista pszichológia és a próba és hiba inspirált tanulás. Egy bizonyos jutalom maximalizálása érdekében a szoftverügynökök megtanulják, hogy olyan környezetben tegyenek lépéseket, amelyek a lehető legpontosabb és leghatékonyabb módon érik el ezeket az eredményeket. A megerősítő tanulás ereje az volt híresen bemutatták 2013-ban amikor a Google DeepMindje kiadott egy tanulmányt arról, hogyan képezte ki az A.I. klasszikus Atari videojátékokkal játszani. Ezt a képernyőn megjelenő pontszámon és a körülbelül 30 000 pixelen kívül más utasítások nélkül érte el, amelyek a játszott videojátékok minden egyes képkockáját alkották.

A videojátékokat, vagy legalábbis a szimulációkat gyakran használják a robotika kutatói is. A szimuláció elméletileg teljesen logikus, mivel lehetővé teszi a robotikusok számára, hogy egy virtuális világban képezzék ki gépüket, mielőtt belemennének a valódiba. Ez megkíméli a robotokat az elkerülhetetlen esésektől és elhasználódásoktól, amelyeken egy adott feladat elvégzése során szembesülnének. Hasonlatként képzelje el, ha az összes vezetési leckét egy vezetési szimulátor segítségével végezné. Azt az érvet lehetne felhozni, hogy gyorsabban tanulsz, mert nem kell annyira óvatosnak lenned a testi épséged kockáztatásával vagy az autód (vagy valaki másé) sérülésével kapcsolatban. Gyorsabban is edzhet anélkül, hogy meg kellene várnia a kiosztott órákra vagy arra, hogy egy engedéllyel rendelkező sofőr hajlandó legyen kivenni.

Ezzel az a probléma, hogy mindenki tudja, aki valaha is játszott autós videojátékkal, nagyon nehéz a valós világot úgy modellezni, mint a való világot. Ehelyett a Google kutatói olyan továbbfejlesztett algoritmusokat kezdtek fejleszteni, amelyek lehetővé teszik, hogy robotjuk gyorsabban tanuljon, kevesebb kísérlettel. Egy korábbi Google-kutatásra építve 2018-ban jelent meg, ezen a legújabb bemutatón a robotjuk néhány óra alatt megtanult járni.

Arra is képes, hogy a tanulás óvatosabb, biztonságosabb megközelítését hangsúlyozza, kevesebb eséssel. Ennek eredményeként minimálisra csökkenti azoknak az emberi beavatkozásoknak a számát, amelyek a robot felemeléséhez és leporolásához szükségesek, valahányszor összeesik.

Jobb robotok építése

Lehet, hogy két óra alatt megtanulni járni nem egészen a járástanulás hatékonyságának szarvas szintjét jelenti, de messze van attól, hogy a mérnököknek kifejezetten be kellene programozniuk, hogyan tanítják meg általában a robotot a manőverezésre. (És, mint már említettük, ez sokkal jobb, mint amennyit az emberi csecsemők képesek ilyen időkeretben kezelni!)

„Bár sok felügyelet nélküli tanulási vagy megerősítő tanulási algoritmust bemutattak a szimuláció, a valódi, lábú robotokon való alkalmazása hihetetlenül nehéznek bizonyul.” Tan magyarázta. „Először is, a megerősítő tanulás adatéhes, a robotadatok gyűjtése pedig drága. Korábbi munkánk ezzel a kihívással foglalkozott. Másodszor, az edzéshez valakinek sok időt kell töltenie a robot felügyeletével. Ha szükségünk van egy személyre, aki felügyeli a robotot, és manuálisan alaphelyzetbe állítja minden alkalommal, amikor megbotlik – több száz vagy ezer alkalommal –, akkor sok erőfeszítést és nagyon hosszú időt vesz igénybe a robot betanítása. Minél tovább tart, annál nehezebb a tanulást sok robotra kiterjeszteni, sokféle környezetben.”

Egy napon ez a kutatás segíthet olyan agilisabb robotok létrehozásában, amelyek gyorsabban képesek alkalmazkodni a különféle terepekhez. „Számos a lehetséges alkalmazás” – mondta Tan. Tan azonban hangsúlyozta, hogy ez „még korai idők, és sok kihívást kell még leküzdenünk”.

A megerősítő tanulás témájának megfelelően ez minden bizonnyal olyan jutalom, amelyet érdemes maximalizálni!

Szerkesztői ajánlások

  • Az AI animévé változtatta a Breaking Bad-et – és ez ijesztő
  • Miért nem fogja soha az AI uralni a világot?
  • Honnan fogjuk tudni, hogy egy mesterséges intelligencia valójában mikor válik érzővé?
  • A vicces képlet: Miért a gép által generált humor az A.I. szent grálja?
  • Olvassa el egy A.I. kísértetiesen szép „szintetikus szentírását”. aki azt hiszi, hogy Isten

Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.