Pamätáte si tú scénu vo filme Walta Disneyho Bambi kde sa titulný kolouch učí vstať a kráčať vlastnou silou? Je to očarujúca vineta vo filme, ktorá predvádza zručnosť, ktorú mnohé mláďatá zvierat – od prasiat cez žirafy až po, áno, jelene – získajú v priebehu niekoľkých minút od svojho narodenia. Počas prvých niekoľkých hodín života tieto zvieratá rýchlo zdokonaľujú svoje motorické schopnosti, až kým nebudú mať plnú kontrolu nad vlastným pohybom. Ľudia, ktorí sa naučia držať sa vecí okolo siedmich mesiacov a ktorí začnú chodiť v 15 mesiacoch, sú v porovnaní s tým beznádejne pomalí.
Obsah
- Pozitívne posilnenie
- Budovanie lepších robotov
Hádajte, v akej najnovšej úlohe nás roboti porazili? V novej štúdii uskutočnené výskumníkmi v spoločnosti GoogleInžinieri naučili štvornohého robota Minitaura chodiť okolo, no, v skutočnosti ho nemusia veľa učiť. Skôr použili typ umelej inteligencie zameranej na cieľ na vytvorenie štvornohého robota naučiť sa kráčať vpred, dozadu a otočte sa doľava a doprava úplne samostatne. Dokázalo sa to úspešne naučiť na troch rôznych terénoch, vrátane rovnej zeme, mäkkého matraca a rohožky so štrbinami.
Odporúčané videá
„Roboty s nohami môžu mať veľkú mobilitu, pretože nohy sú nevyhnutné na navigáciu po nespevnených cestách a miestach určených pre ľudí,“ Jie Tan, hlavný riešiteľ projektu a vedúci lokomočného úsilia spoločnosti Google, povedal pre Digital Trends. „Máme záujem umožniť robotom s nohami pohybovať sa v našich rozmanitých a zložitých prostrediach skutočného sveta, ale je ťažké manuálne skonštruovať robotické ovládače, ktoré dokážu zvládnuť takú rozmanitosť a zložitosť. Preto je dôležité, aby sa roboti dokázali učiť sami. Táto práca je vzrušujúca, pretože ide o prvú ukážku toho, že s naším systémom sa robot s nohami môže úspešne naučiť chodiť sám.“
Pozitívne posilnenie
Naučte sa chodiť v reálnom svete s minimálnym ľudským úsilím
Technológia, ktorá je základom tohto konkrétneho projektu, je niečo, čo sa nazýva hlboké učenie sa, a špecifický prístup k hlbokému učeniu, ktorý je inšpirovaný behavioristickou psychológiou a pokusmi a omylmi učenie. Softvéroví agenti, ktorých cieľom je maximalizovať určitú odmenu, sa učia konať v prostredí, ktoré dosiahne tieto výsledky čo najpresnejším a najefektívnejším spôsobom. Sila posilňovacieho učenia bola slávne demonštrované v roku 2013 keď DeepMind spoločnosti Google zverejnil dokument o tom, ako vycvičil A.I. hrať klasické videohry Atari. Dosiahlo sa to bez inštrukcií okrem skóre na obrazovke a približne 30 000 pixelov, ktoré tvorili každý snímok videohier, ktoré hral.
Videohry alebo aspoň simulácie často využívajú aj výskumníci v oblasti robotiky. Simulácia má teoreticky dokonalý zmysel, pretože umožňuje robotikom trénovať svoj stroj vo virtuálnom svete predtým, ako sa vydá do toho skutočného. To šetrí roboty pred nevyhnutnými trápeniami a opotrebovaním, ktoré by museli podstúpiť, keď sa naučili vykonávať špecifickú úlohu. Ako analógiu si predstavte, že by všetky vaše vodičské hodiny prebiehali na simulátore jazdy. Dalo by sa argumentovať tým, že by ste sa učili rýchlejšie, pretože by ste nemuseli byť tak opatrní, aby ste riskovali svoju fyzickú bezpečnosť alebo poškodili svoje auto (alebo niekoho iného). Môžete tiež trénovať rýchlejšie bez toho, aby ste museli čakať na pridelené hodiny alebo na licencovaného vodiča, ktorý vás bude ochotný vziať von.
Problém je v tom, že ako každý, kto niekedy hral videohru so šoférovaním, vie, že je dosť ťažké modelovať skutočný svet tak, aby to vyzeralo ako skutočný svet. Namiesto toho výskumníci spoločnosti Google začali vyvíjať vylepšené algoritmy, ktoré umožňujú ich robotom učiť sa rýchlejšie s menším počtom pokusov. Vychádzame z predchádzajúceho prieskumu Google uverejnené v roku 2018, ich robot sa v tejto najnovšej ukážke dokázal naučiť chodiť len za pár hodín.
Dokáže to urobiť, pričom kladie dôraz na opatrnejší a bezpečnejší prístup k učeniu, ktorý zahŕňa menej pádov. Výsledkom je, že minimalizuje počet ľudských zásahov, ktoré je potrebné vykonať na zdvihnutie robota a oprášenie pri každom páde.
Budovanie lepších robotov
Naučiť sa chodiť za dve hodiny nemusí byť úplne senzačná úroveň efektívnosti učenia sa chôdze, ale je to ďaleko od toho, aby inžinieri museli explicitne naprogramovať, ako sa robot zvyčajne učí manévrovať. (A ako už bolo poznamenané, je to oveľa lepšie, ako ľudské deti dokážu zvládnuť v takom časovom rámci!)
„Aj keď bolo predvedených mnoho algoritmov učenia alebo posilňovania učenia bez dozoru simulácia, ich použitie na skutočných robotoch s nohami sa ukazuje ako neuveriteľne ťažké,“ Tan vysvetlil. „Po prvé, posilňovacie učenie je náročné na údaje a zhromažďovanie údajov o robotoch je drahé. Naša predchádzajúca práca riešila túto výzvu. Po druhé, školenie vyžaduje, aby niekto trávil veľa času dozorom nad robotom. Ak potrebujeme osobu, ktorá monitoruje robota a ručne ho resetuje vždy, keď zakopne – stovky alebo tisíckrát –, bude to vyžadovať veľa úsilia a veľmi dlho, kým sa robot naučí. Čím dlhšie to trvá, tým ťažšie je rozšíriť učenie na mnoho robotov v mnohých rôznych prostrediach.“
Jedného dňa by tento výskum mohol pomôcť vytvoriť agilnejšie roboty, ktoré sa dokážu rýchlejšie prispôsobiť rôznym terénom. "Potenciálne aplikácie sú početné," povedal Tan. Tan však zdôraznil, že toto je „ešte len začiatok a je tu veľa výziev, ktoré musíme ešte prekonať“.
V súlade s témou učenia posilňovania je to určite odmena, ktorú sa však oplatí maximalizovať!
Odporúčania redaktorov
- AI premenila Breaking Bad na anime – a je to desivé
- Prečo AI nikdy neovládne svet
- Ako budeme vedieť, kedy sa AI skutočne stane vnímavou?
- Vtipná formulka: Prečo je strojovo generovaný humor svätým grálom A.I.
- Prečítajte si strašidelne krásne „syntetické písmo“ od A.I. ktorý si myslí, že je to Boh
Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.