Ar prisimeni tą sceną Volto Disnėjaus filme Bambi kur tituluotas jauniklis išmoksta atsistoti ir vaikščioti savo jėgomis? Tai žavinga filmo vinjetė, parodanti įgūdį, kurį per kelias minutes po gimimo įgyja daugybė gyvūnų jauniklių – nuo kiaulių iki žirafos iki, taip, elnių. Per pirmąsias kelias gyvenimo valandas šie gyvūnai greitai tobulina savo motorinius įgūdžius, kol visiškai kontroliuoja savo judėjimą. Žmonės, kurie išmoksta stovėti laikydami daiktus maždaug septynių mėnesių ir kurie pradeda vaikščioti 15 mėnesių, yra beviltiškai vangūs.
Turinys
- Teigiamas stiprinimas
- Kurti geresnius robotus
Spėkite, kokia paskutinė užduotis, kurią robotai įveikė? Naujame tyrime atliko „Google“ mokslininkai, inžinieriai išmokė vaikščioti pro keturkojį robotą Minitaurą, na, iš tikrųjų to nereikia daug mokyti. Atvirkščiai, jie panaudojo tam tikrą į tikslą orientuotą dirbtinį intelektą, kad sukurtų keturkojį robotą išmokti eiti į priekį, atgal ir visiškai savarankiškai pasukite į kairę ir į dešinę. Jis sugebėjo sėkmingai išmokti tai padaryti trijose skirtingose vietose, įskaitant plokščią žemę, minkštą čiužinį ir durų kilimėlį su įtrūkimais.
Rekomenduojami vaizdo įrašai
„Robotai su kojomis gali būti labai mobilūs, nes kojos yra būtinos norint važiuoti neasfaltuotais keliais ir žmonėms skirtomis vietomis. Jie Tan, pagrindinis projekto tyrėjas ir „Google“ judėjimo vadovas, sakė „Digital Trends“. „Esame suinteresuoti, kad robotai kojomis galėtų naršyti mūsų įvairiapusėje ir sudėtingoje realaus pasaulio aplinkoje, tačiau sunku rankiniu būdu sukurti robotų valdiklius, kurie galėtų valdyti tokią įvairovę ir sudėtingumo. Todėl svarbu, kad robotai galėtų mokytis patys. Šis darbas yra įdomus, nes tai yra ankstyvas demonstravimas, kad naudojant mūsų sistemą kojos robotas gali sėkmingai išmokti vaikščioti pats.
Teigiamas stiprinimas
Mokymasis vaikščioti realiame pasaulyje su minimaliomis žmogaus pastangomis
Technologija, kuri yra šio konkretaus projekto pagrindas, yra vadinamasis gilaus sustiprinimo mokymasis, a specifinis požiūris į gilų mokymąsi, įkvėptas bihevioristinės psichologijos ir bandymų bei klaidų mokymasis. Programinės įrangos agentai, kuriems liepta maksimaliai padidinti tam tikrą atlygį, išmoksta imtis veiksmų aplinkoje, kurioje tie rezultatai bus pasiekti tiksliausiu ir efektyviausiu būdu. Pastiprinimo mokymosi galia buvo garsiai pademonstruotas 2013 m kai „Google“ DeepMind išleido dokumentą, kuriame parodyta, kaip ji mokė A.I. žaisti klasikinius „Atari“ vaizdo žaidimus. Tai buvo pasiekta be jokių nurodymų, išskyrus ekrane rodomą rezultatą ir maždaug 30 000 pikselių, sudarančių kiekvieną žaidžiamų vaizdo žaidimų kadrą.
Vaizdo žaidimus ar bent jau modeliavimą dažnai naudoja ir robotikos tyrinėtojai. Modeliavimas teoriškai yra visiškai prasmingas, nes leidžia robotikams išmokyti savo mašiną virtualiame pasaulyje prieš išeinant į tikrąjį. Tai išgelbės robotus nuo neišvengiamų pratybų ir nusidėvėjimo, kurį jie patirtų mokantis atlikti konkrečią užduotį. Kaip analogiją įsivaizduokite, ar visos jūsų vairavimo pamokos buvo atliekamos naudojant vairavimo treniruoklį. Galima būtų argumentuoti, kad išmoksite greičiau, nes nereikės taip atsargiai rizikuoti savo fiziniu saugumu ar sugadinti savo (ar kažkieno) automobilį. Taip pat galite treniruotis greičiau, nelaukdami, kol bus paskirtos pamokos arba kol licencijuotas vairuotojas norės jus išvežti.
Problema ta, kad, kaip žino kiekvienas, kada nors žaidęs vairavimo vaizdo žaidimą, gana sunku sumodeliuoti tikrąjį pasaulį taip, kad jis atrodytų kaip tikrasis pasaulis. Vietoj to, „Google“ mokslininkai pradėjo kurti patobulintus algoritmus, leidžiančius jų robotui greičiau mokytis ir atliekant mažiau bandymų. Remiantis ankstesniu „Google“ tyrimu paskelbta 2018 m, jų robotas šioje naujausioje demonstracijoje sugebėjo išmokti vaikščioti vos per porą valandų.
Jis taip pat gali tai padaryti, akcentuodamas atsargesnį, saugesnį požiūrį į mokymąsi ir mažiau kritimų. Dėl to jis sumažina žmogaus įsikišimo skaičių, kad robotas paimtų ir nuvalytų nuo jo dulkes kiekvieną kartą, kai jis nukrenta.
Kurti geresnius robotus
Mokymasis vaikščioti per dvi valandas gali būti ne itin efektyvus mokymosi vaikščioti lygis, tačiau tai toli gražu ne inžinieriai, kurie turi aiškiai užprogramuoti, kaip robotas paprastai mokomas manevruoti. (Ir, kaip minėta, tai yra daug geriau, nei kūdikiai gali susitvarkyti per tokį laikotarpį!)
„Nors daugelis neprižiūrimų mokymosi ar sustiprinimo mokymosi algoritmų buvo pademonstruoti simuliacija, pritaikyti juos tikriems, kojoms robotams, pasirodo, yra neįtikėtinai sunku“, – sakė Tan paaiškino. „Pirma, mokymasis pastiprinimui reikalauja duomenų, o roboto duomenų rinkimas yra brangus. Mūsų ankstesniame darbe šis iššūkis buvo išspręstas. Antra, mokymas reikalauja, kad kas nors praleistų daug laiko prižiūrėdamas robotą. Jei mums reikia žmogaus, kuris stebėtų robotą ir rankiniu būdu jį nustatytų iš naujo kiekvieną kartą, kai jis suklumpa – šimtus ar tūkstančius kartų – tai užtruks daug pastangų ir labai ilgai apmokyti robotą. Kuo ilgiau tai užtrunka, tuo sunkiau bus pritaikyti mokymąsi daugeliui robotų įvairiose aplinkose.
Vieną dieną šis tyrimas galėtų padėti sukurti judresnius robotus, kurie galėtų greičiau prisitaikyti prie įvairių reljefų. „Galimų programų yra daug“, - sakė Tanas. Tačiau Tanas pabrėžė, kad tai „dar ankstyvos dienos ir yra daug iššūkių, kuriuos dar turime įveikti“.
Vis dėlto, atsižvelgiant į sustiprinimo mokymosi temą, tai tikrai yra atlygis, kurį verta maksimaliai padidinti!
Redaktorių rekomendacijos
- AI pavertė „Breaking Bad“ anime – ir tai kelia siaubą
- Kodėl AI niekada nevaldys pasaulio
- Kaip mes žinosime, kada AI iš tikrųjų tampa jautrus?
- Juokinga formulė: kodėl mašinų sukurtas humoras yra šventasis A.I.
- Perskaitykite siaubingai gražų A.I. „sintetinį raštą“. kad mano, kad tai Dievas
Atnaujinkite savo gyvenimo būdąSkaitmeninės tendencijos padeda skaitytojams stebėti sparčiai besivystantį technologijų pasaulį – pateikiamos visos naujausios naujienos, smagios produktų apžvalgos, įžvalgūs vedamieji leidiniai ir unikalūs žvilgsniai.