Denne Pictionary-spillende bot er en kæmpe milepæl for A.I.

Som nye Alexa Skills på dit Amazon Echo, har A.I. gradvist opnå evnen til at opnå den bedste menneskelighed ved flere og flere af vores elskede spil: Skak med Deep Blue i 1997, Fare med IBM Watson i 2011, Atari-spil med DeepMind i 2013, med AlphaGo i 2016, og så videre. I det mindste for den brede offentlighed gør hvert enkelt tilfælde den abstrakte vej for beregningsmæssige fremskridt til en tilskuersport. Skynet bliver klogere. Hvordan ved vi det? Fordi tjek det voksende antal af tidsfordriv, det overbevisende kan slå os på.

Indhold

  • Opbygning af en Pictionary-mester
  • Mere end man kan se

Med den baggrund er det ikke for meget af et chokerende at høre, at A.I. kan nu præstere overbevisende godt kl Billedbog, det charades-inspirerede ordgættespil, der kræver, at én person tegner et billede, og at andre forsøger at finde ud af, hvad de har skitseret så hurtigt som muligt.

Anbefalede videoer

Det er, hvad forskere fra U.K.'s University of Surrey for nylig udførte med skabelsen af ​​Pixelor, en "konkurrencedygtig skitse A.I. agent." Givet et visuelt Konceptet er Pixelor i stand til at tegne en skitse, der er genkendelig (både af mennesker og maskiner) som sit tilsigtede emne lige så hurtigt - eller endda hurtigere - end et menneske konkurrent.

Relaterede

  • Hvordan Nintendo kunne bruge A.I. at bringe 4K-spil til Switch Pro
  • Yakuza-direktøren mener, at PS5s udvikling vil fokusere på A.I. og maskinlæring

"Vores A.I. agent er i stand til at gengive en skitse fra bunden, Yi-Zhe sang, læser af Computer Vision og Machine Learning ved Center for Vision Speech and Signal Processing ved University of Surrey, fortalte Digital Trends. "Giv det et ord som 'ansigt', og det vil vide, hvad det skal tegne.... Det vil tegne en anden kat, en anden hund, et andet ansigt, hver eneste gang. Men altid med viden om, hvordan man vinder Pictionary-spillet."

Opbygning af en Pictionary-mester

At være i stand til at reducere et komplekst billede fra den virkelige verden til en skitse er i sig selv ret imponerende. Det kræver et abstraktionsniveau at se på et menneskeligt ansigt og se det som en oval med to mindre ovaler til øjne, en streg til en næse og en halvcirkel til en mund. Hos børn viser evnen til at opfatte et billede på denne måde blandt andet en spirende kognitiv forståelse af begreber.

Men som med mange aspekter af A.I., ofte opsummeret som Moravecs paradoks at de "hårde problemer er lette og de lette problemer er svære", det er en væsentlig udfordring for maskinen intelligens - på trods af at det er en grundlæggende, umærkelig færdighed for størstedelen af ​​to-årige børn.

SketchX Lab

Det er dog ikke en uløselig udfordring. I 2016, skrev vi om Songs arbejde med et værktøj kaldet Sketch, et dybt-lærende neuralt netværk, der var i stand til at genkende håndtegnede skitser og bruge dem til at søge efter virkelige produkter. Det særlige netværk blev trænet ved hjælp af et datasæt bestående af omkring 30.000 skitse-foto sammenligninger, hvilket gør det muligt for det at være i stand til at genkende den måde, virkelige objekter præsenteres på i håndtegninger. Pixelor gør noget lignende, men kan også generere sine egne tegninger i stedet for blot at genkende andres.

Men det er ikke nok til at vinde Billedbog. Billedbog er et tidsudfordret spil, hvor målet ikke bare er at tegne for eksempel en kat, men at tegne en kat i så få slag som muligt. Du kan være verdens største kunstner, men hvis det tager dig 12 timer at tegne en billedskøn kat, er du en forfærdelig Billedbog spiller.

Dette betød at bygge en A.I. der kunne studere mennesker for at se, hvilke strategier de bruger til at spille Pictionary godt. Som Song sagde: "Hvad er de vigtigste ting at tegne for at gøre det muligt for andre menneskelige dommere at være i stand til at gætte? Vi ønsker, at vores tegning skal gættes så tidligt som muligt."

For at gøre dette tog forskerne QuickDraw, det største menneskelige skitsedatasæt, der er tilgængeligt til dato. De byggede derefter en neural sorteringsalgoritme, der prioriterer rækkefølgen af ​​streger, en kunstner skal lave; giver en gættelig repræsentation af et objekt i så få linjer som muligt. Det betyder at opdele skitser i streger, derefter blande rækkefølgen af ​​disse streger og teste resultaterne, indtil de fastlægger den præcise rækkefølge, som de skal lægges ned på papiret.

For eksempel kan en kunstner begynde at tegne en kat ved at skitsere en cirkulær kontur til dens hoved. Men en cirkel kan være et hvilket som helst antal ting, selvom du ved, at den skal repræsentere et hoved. Tegn dog to spidse ører eller to sæt knurhår, og antallet af potentielle ting, du kunne tegne, reduceres meget, meget hurtigt. Disse oplysninger bruges derefter til at instruere skitseringsagenten.

Song sagde, at holdet kunne frigive en offentlig-vendt version af dette Billedbog- at spille bot, så menneskelige spillere kan have deres egen chance for at slå en skitserende A.I. mestre. (Hvem ved? At spille en ekspert kan endda hjælpe med at forbedre din egen Billedbog spil.)

Mere end man kan se

Der er dog mere til Pixelor end blot en anden triviel spil-bot. Ligesom et computersystem både har en grænseflade på overfladeniveau, som vi interagerer med, og backend-kode under motorhjelmen, så gør alle større A.I. spil-milepæl har en bagtanke. Medmindre de udtrykkeligt laver computerspil, bruger forskningslaboratorier ikke utallige persontimer på at bygge spil-spiller A.I. agenter bare for at tilføje endnu en post på den store liste over ting, som mennesker ikke længere er de bedste på. Formålet er altid at fremme en grundlæggende del af A.I. problemløsning.

I tilfældet med Pixelor er det skjulte mål at lave maskiner, der er bedre i stand til at finde ud af, hvad der er vigtigt for et menneske i en bestemt scene. Når vi ser på et billede, er vi straks i stand til at fortælle, hvad de mest markante detaljer er.

Lad os sige, at du kører hjem fra arbejde. Mens træerne langs siden af ​​vejen kan være maleriske, og reklametavlen til en ny film kunne være interessant, hverken er lige så vigtigt som ansigtet og kropssproget hos den person, som måske eller måske ikke er ved at gå ud foran du. Inden du overhovedet har behandlet informationen bevidst, har din hjerne udpeget de vigtigste detaljer. Hvordan lærer man en computer at kunne gøre dette? Nå, det viser sig, at en fantastisk måde at gøre det på er at se, hvordan mennesker prioriterer de fremtrædende genkendelige detaljer i et billede, når de tegner det.

"Der er ingen menneskelig viden indlejret i billeder [alene]," sagde Song. "Det, vi ønsker, er menneskelige data, som kan give os signaler om, hvordan mennesker forstår et objekt."

Som nævnt en god Billedbog spiller, som en god bokser, kender det absolutte minimum, de skal gøre for at nå et bestemt mål. Dette er i makromæssig forstand, hvad Yi-Zhe Song og hans kolleger bekymrer sig om. Det er ikke noget så trivielt som at få en computer til at spille et spil; det er at få en computer til at forstå, hvad der er vigtigt ved visse scener - og forhåbentlig bedre at kunne generalisere.

Som alt fra selvkørende biler at robotter på arbejdspladsen bliver mere og mere almindeligt, er dette en væsentlig opgave at løse.

Et papir, der beskriver arbejdet, vil blive præsenteret på SIGGRAPH Asia 2020 i november.

Redaktørens anbefalinger

  • Voyage er en A.I. spilleparadis hvor bots skriver reglerne
  • Skak. Fare. Gå. Hvorfor bruger vi spil som benchmark for A.I.?
  • En A.I. designer retro videospil - og de er overraskende gode