DeepMind muutub uue, kiiresti õppiva AI-agendi abil ebareaalseks

DeepMind – õppimine järelevalveta abiülesannetega

Google'i DeepMind avaldas sel nädalal paberi nimega Tugevdusõpe koos juhendamata abiülesannetega, mis kirjeldab meetodit tehisintellekti õppimiskiiruse ja agentide ehk robotite lõpliku jõudluse suurendamiseks. See meetod hõlmab kahe peamise lisaülesande lisamist, mida tehisintellekti treenimise ajal täita, ja see põhineb standardsel sügavusel tugevdamise õppimise sihtasutus, mis on põhimõtteliselt katse-eksituse meetodil premeerimis-/karistusmeetod, mille puhul tehisintellekt õpib vead.

Esimene lisatud ülesanne AI õppimise kiirendamiseks on võime mõista, kuidas ekraanil piksleid juhtida. DeepMindi sõnul sarnaneb see meetod sellega, kuidas laps õpib oma käsi kontrollima neid liigutades ja neid liigutusi jälgides. AI puhul mõistaks bot visuaalset sisendit pikslite juhtimise kaudu, mis toob kaasa paremad tulemused.

Soovitatavad videod

"Mõelge lapsele, kes õpib maksimeerima punase kumulatiivset kogust, mida ta jälgib. Optimaalse väärtuse õigeks ennustamiseks peab laps mõistma, kuidas "punetust" suurendada erinevate vahenditega, sealhulgas manipuleerimisega (punase eseme silmadele lähemale toomine); liikumine (liikumine punase objekti ees); ja suhtlemine (nutmine, kuni vanemad toovad punase eseme),” seisab DeepMindi paberil. "Need käitumised korduvad tõenäoliselt paljude muude eesmärkide puhul, millega laps võib hiljem kokku puutuda."

Seotud

See robot hävitab teid Pictionarys. See on ka suur verstapost A.I.
Google'i DeepMind koolitab Waymo isejuhtivaid autosid, nagu StarCraft II robotid
Google on leidnud viisi, kuidas kasutada A.I. suurendada tuuleenergia kasulikkust

Teist lisatud ülesannet kasutatakse tehisintellekti koolitamiseks, et ennustada, millised on vahetud auhinnad, tuginedes eelnevate tegevuste lühikesele ajaloole. Selle võimaldamiseks esitas meeskond võrdses koguses varasemaid tasuvat ja mittetasuvat ajalugu. Lõpptulemus on see, et tehisintellekt suudab avastada visuaalseid funktsioone, mis toovad tõenäoliselt kasu kiiremini kui varem.

"Tõhusamaks õppimiseks kasutavad meie agendid kogemuste taasesitamise mehhanismi, et pakkuda kriitikutele täiendavaid värskendusi. Nii nagu loomad unistavad sagedamini positiivselt või negatiivselt tasuvatest sündmustest, taasestavad meie agendid eelistatavalt tasuvaid sündmusi sisaldavaid jadasid,“ lisab leht.

Kui need kaks abiülesannet on lisatud eelmisele A3C agendile, põhineb tulemuseks olev uus agent/bot sellel, mida meeskond nimetab Unreal (järelevalveta tugevdamine ja abiõpe). Meeskond istus selle roboti ees praktiliselt 57 Atari mängu ja eraldi Wolfenstein- nagu labürindimäng, mis koosneb 13 tasemest. Kõigis stsenaariumides anti robotile töötlemata RGB-väljundpilt, mis pakkus sellele 100-protsendilise täpsusega otsest juurdepääsu pikslitele. Unreal robotit premeeriti selliste ülesannete eest nagu tulnukate allatulistamine Space Invaders õunte haaramiseks 3D-labürindis.

Kuna Unreal bot suudab juhtida piksleid ja ennustada, kas tegevused toovad kasu, on see võimeline õppima 10 korda kiiremini kui DeepMindi eelmine parim agent (A3C). Veelgi enam, see annab parema jõudluse kui ka eelmine meister.

"Me suudame nüüd saavutada 87 protsenti asjatundlikust inimtegevusest, mis on meie poolt vaadeldud labürindi tasemete keskmine, kusjuures mitmel neist on üliinimlik jõudlus," teatas ettevõte. "Ataris saavutab agent nüüd keskmiselt 9 korda inimese jõudluse."

DeepMind on lootusrikas et Unreali robotiga tehtud töö võimaldab meeskonnal laiendada kõiki oma agente/boteid, et tulla toime veelgi keerulisemate keskkondadega lähitulevikus. Kuni selle ajani vaadake ülalolevat videot, mis näitab, kuidas tehisintellekt liigub läbi labürintide ja haarab iseseisvalt õunu ilma inimese sekkumiseta.

Toimetajate soovitused

Male. Oht. Mine. Miks me kasutame mänge A.I etalonina?
A.I tõusu uuesti läbivaatamine: kui kaugele on tehisintellekt alates 2010. aastast jõudnud?
Google'i DeepMind A.I. võidab inimvastaseid mängus Quake III Capture the Flag

Uuenda oma elustiiliDigitaalsed suundumused aitavad lugejatel hoida silma peal kiirel tehnikamaailmal kõigi viimaste uudiste, lõbusate tooteülevaadete, sisukate juhtkirjade ja ainulaadsete lühiülevaadetega.

DeepMind muutub uue, kiiresti õppiva AI-agendi abil ebareaalseks

Toimetajate soovitused

Kategooriad

Viimased

Microsoft soovib manustada Windows Phone'i igasse Android-seadmesse

Uus algoritm võib teie säutsudest välja võtta teie eluloo

Mängud Windows Live'ile suletakse väidetavalt 1. juulil 2014