Ez a Pictionary-Playing Bot óriási mérföldkő az A.I.

Mint az új Alexa Skills az Amazon Echo-n, az elmúlt néhány évtizedben az A.I. fokozatosan elsajátíthatja az emberiesség legjobbjait egyre több szeretett játékunkban: Sakk Deep Blue-val 1997-ben, Veszély az IBM Watsonnal 2011-ben, Atari játékok DeepMinddel 2013-ban, Megy az AlphaGo-val 2016-ban, stb. A nagyközönség számára legalábbis minden egyes eset látványsportgá változtatja a számítástechnikai haladás absztrakt útját. A Skynet egyre okosabb. Honnan tudjuk? Mert nézze meg az egyre növekvő számú időtöltést, amiben meggyőzően legyőzhet minket.

Tartalom

  • Pictionary mester építése
  • Több, mint amilyennek látszik

Ilyen háttér mellett nem túl sokkoló hallani, hogy A.I. most lenyűgözően jól teljesíthet Képtár, a charádes ihlette szókitaláló játék, amelyhez egy embernek meg kell rajzolnia egy képet, másoknak pedig a lehető leggyorsabban meg kell próbálniuk kitalálni, hogy mit vázoltak.

Ajánlott videók

Ezt hajtották végre az Egyesült Királyság Surrey-i Egyetem kutatói a közelmúltban a Pixelor megalkotásával, amely egy „versenyképes vázlatkészítő A.I. ügynök." Adott egy látvány A koncepció szerint a Pixelor olyan vázlatot tud rajzolni, amely (emberek és gépek által is) felismerhető tárgyaként olyan gyorsan – vagy még gyorsabban –, mint egy ember versenyző.

Összefüggő

  • Hogyan használhatná a Nintendo az A.I. hogy 4K-s játékokat vigyen át a Switch Pro-ba
  • A Yakuza igazgatója úgy gondolja, hogy a PS5 evolúciója az A.I. és a gépi tanulás

„A mi A.I. Az ügynök a semmiből képes vázlatot készíteni" Yi-Zhe Song, a Computer Vision and Machine Learning olvasója a Surrey-i Egyetem Vision Speech and Signal Processing Centerében – mondta a Digital Trendsnek. „Adj neki egy olyan szót, mint „arc”, és tudni fogja, mit kell rajzolnia. … Minden egyes alkalommal más macskát, más kutyát, más arcot fog rajzolni. De mindig annak tudatában, hogyan lehet megnyerni a Pictionary játékot.”

Pictionary mester építése

Az, hogy egy összetett valós képet vázlattá redukálhatunk, önmagában is lenyűgöző. Bizonyos szintű absztrakcióra van szükség ahhoz, hogy egy emberi arcot oválisnak lássunk, amelyben két kisebb ovális a szem, egy vonal az orr, és egy félkör a száj. A gyerekeknél a kép ilyen módon történő érzékelésének képessége többek között a fogalmak növekvő kognitív megértését mutatja.

Mindazonáltal, mint az A.I. sok vonatkozása esetében, gyakran így foglalják össze Moravec paradoxona hogy a „nehéz problémák könnyűek és a könnyű problémák nehézek”, ez jelentős kihívás a gép számára intelligencia - annak ellenére, hogy a kétévesek többsége számára ez egy alapvető, figyelemre méltó képesség gyermekek.

SketchX Lab

Ez azonban nem megoldhatatlan kihívás. 2016-ban, írtunk Song munkájáról a Sketch nevű eszközzel, egy mély tanulási neurális hálózattal, amely képes volt felismerni a kézzel rajzolt vázlatokat, és felhasználni valós termékek keresésére. Az adott hálózatot egy mintegy 30 000 vázlat-fotó összehasonlításból álló adatkészlet segítségével képezték ki, lehetővé téve, hogy képes legyen felismerni, hogyan jelennek meg a valós objektumok a kézi rajzban. A Pixelor valami hasonlót csinál, de saját rajzokat is képes generálni, nem csak másokét.

De ez nem elég a győzelemhez Képtár. Képtár egy olyan időhiányos játék, ahol nem csak az a cél, hogy mondjuk egy macskát rajzoljunk, hanem az, hogy minél kevesebb mozdulattal lerajzoljunk egy macskát. Lehetsz a világ legnagyobb művésze, de ha 12 órát vesz igénybe egy tökéletes macska megrajzolása, akkor szörnyű vagy Képtár játékos.

Ez azt jelentette, hogy egy A.I. amelyek tanulmányozhatják az embereket, hogy megtudják, milyen stratégiákat használnak a Pictionary játékhoz. Ahogy Song mondta: „Melyek a legfontosabb darabok, amelyeket le kell rajzolni, hogy más emberi bírók kitalálhassák? Azt akarjuk, hogy a rajzunkat a lehető legkorábban kitalálják.”

Ehhez a kutatók a QuickDraw-t, ​​az eddig elérhető legnagyobb emberi vázlatadatkészletet vették igénybe. Ezután felépítettek egy neurális rendezési algoritmust, amely prioritást ad a művésznek végrehajtandó vonások sorrendjének; a lehető legkevesebb sorban megadva egy tárgy sejthető ábrázolását. Ez azt jelenti, hogy a vázlatokat körvonalakra kell bontani, majd megkeverni a vonások sorrendjét, és addig tesztelni az eredményeket, amíg meg nem állapítják a pontos sorrendet, amelyben papírra kell fektetni őket.

Például egy művész elkezdhet rajzolni egy macskát úgy, hogy körkörös körvonalat rajzol a fejére. De egy kör bármennyi dolog lehet, még akkor is, ha tudod, hogy egy fejet kell ábrázolnia. Rajzoljon azonban két hegyes fület vagy két bajuszkészletet, és a rajzolható tárgyak száma nagyon-nagyon gyorsan csökken. Ezt az információt azután a vázlatkészítő utasítására használják fel.

Song azt mondta, hogy a csapat kiadhat ennek nyilvános verzióját Képtár-játszóbot, hogy az emberi játékosok maguk győzhessenek le egy vázlatos A.I. fő. (Ki tudja? Ha egy szakértővel játszol, még a sajátodat is javíthatod Képtár játszma, meccs.)

Több, mint amilyennek látszik

A Pixelor azonban nem csak egy triviális játékbot. Csakúgy, mint egy számítógépes rendszernek van felületi szintű interfésze, amellyel kommunikálunk, és a motorháztető alatti háttérkód, ugyanúgy minden jelentős A.I. a játék mérföldköveinek hátsó szándéka van. Hacsak nem kifejezetten számítógépes játékokat készítenek, a kutatólaboratóriumok nem töltenek számtalan munkaórát az építkezéssel játék A.I. ügynökök csak azért, hogy újabb bejegyzést adjunk azon dolgok nagy listájához, amelyekről az emberek már nem a legjobbak nál nél. A cél mindig az A.I. valamely alapvető részének előmozdítása. problémamegoldás.

A Pixelor esetében a rejtett cél az, hogy olyan gépeket készítsenek, amelyek jobban képesek kitalálni, mi a fontos az ember számára egy adott jelenetben. Ha ránézünk egy képre, azonnal meg tudjuk állapítani, melyek a legszembetűnőbb részletek.

Tegyük fel, hogy autóval megy haza a munkából. Míg az út szélén szegélyező fák festőiek, és egy új film óriásplakátja érdekes lehet, egyik sem olyan fontos, mint annak a személynek az arca és testbeszéde, aki vagy nem készül kimenni elé te. Mielőtt még tudatosan feldolgozta volna az információt, az agya kiemelte a legfontosabb részleteket. Hogyan tanítsd meg a számítógépet, hogy képes legyen erre? Nos, kiderült, hogy ennek egyik nagyszerű módja annak megfigyelése, hogy az emberek miként helyezik előtérbe a kép kiemelkedő, felismerhető részleteit, amikor vázlatokat készítenek.

„Nincs [egyedül] fényképekbe ágyazva emberi tudás” – mondta Song. "Emberi adatokat akarunk, amelyek jelzéseket adhatnak nekünk arról, hogy az emberek hogyan értenek meg egy tárgyat."

Mint említettem, jó Képtár A játékos, mint egy jó bokszoló, tudni fogja, hogy egy bizonyos cél eléréséhez mennyit kell tennie. Makró értelemben ez az, ami Yi-Zhe Songnak és kollégáinak fontos. Ez nem olyan triviális dolog, mint egy számítógépet rávenni egy játékra; ez az, hogy egy számítógép megértse, mi a fontos bizonyos jeleneteknél – és remélhetőleg jobban általánosítani is tud.

Mint minden attól önvezető autók A munkahelyi robotok egyre gyakoribbá válnak, ennek megoldása elengedhetetlen feladat.

A munkát leíró tanulmányt a SIGGRAPH Asia 2020 kiállításon mutatják be novemberben.

Szerkesztői ajánlások

  • A Voyage egy A.I. játékparadicsom, ahol a botok írják a szabályokat
  • Sakk. Veszély. Megy. Miért használunk játékokat az A.I. mércéjeként?
  • Egy A.I. retro videojátékokat tervez – és meglepően jók