Denne Pictionary-spillende boten er en stor milepæl for A.I.

Som nye Alexa Skills på Amazon Echo, har de siste par tiårene sett A.I. gradvis få evnen til å best mulig menneskelighet på flere og flere av våre elskede spill: Sjakk med Deep Blue i 1997, Fare med IBM Watson i 2011, Atari-spill med DeepMind i 2013, med AlphaGo i 2016, og så videre. For allmennheten, i det minste, gjør hvert tilfelle den abstrakte veien for beregningsmessig fremgang til en tilskuersport. Skynet blir smartere. Hvordan vet vi? Fordi sjekk ut det økende antallet tidsfordriv det kan overbevisende slå oss på.

Innhold

  • Bygge en Pictionary-mester
  • Mer enn hva øyet kan se

Med den bakgrunnen er det ikke for mye av et sjokk å høre at A.I. kan nå prestere overbevisende godt kl Pictionary, det charades-inspirerte ordgjettespillet som krever at én person tegner et bilde og andre prøver å finne ut hva de har skissert så raskt som mulig.

Anbefalte videoer

Det er det forskere fra U.K.s University of Surrey nylig utførte med opprettelsen av Pixelor, en "konkurransedyktig skisse A.I. middel." Gitt en visuell konseptet, er Pixelor i stand til å tegne en skisse som er gjenkjennelig (både av mennesker og maskiner) som det tiltenkte motivet like raskt - eller enda raskere - enn et menneske konkurrent.

I slekt

  • Hvordan Nintendo kunne bruke A.I. for å bringe 4K-spill til Switch Pro
  • Yakuza-direktøren tror PS5s utvikling vil fokusere på A.I. og maskinlæring

«Vår A.I. agent er i stand til å gjengi en skisse fra bunnen av» Yi-Zhe sang, leser av Computer Vision and Machine Learning ved Center for Vision Speech and Signal Processing ved University of Surrey, fortalte Digital Trends. "Gi det et ord som "ansikt", og det vil vite hva det skal tegne. … Den vil tegne en annen katt, en annen hund, et annet ansikt, hver eneste gang. Men alltid med kunnskap om hvordan man kan vinne Pictionary-spillet.»

Bygge en Pictionary-mester

Å kunne redusere et komplekst bilde fra den virkelige verden til en skisse er i seg selv ganske imponerende. Det krever et abstraksjonsnivå for å se på et menneskeansikt og se det som en oval med to mindre ovaler for øynene, en linje for en nese og en halvsirkel for en munn. Hos barn viser evnen til å oppfatte et bilde på denne måten blant annet en spirende kognitiv forståelse av begreper.

Imidlertid, som med mange aspekter av A.I., ofte oppsummert som Moravecs paradoks at de "harde problemene er enkle og de enkle problemene er vanskelige", er det en betydelig utfordring for maskinen intelligens - til tross for at det er en grunnleggende, umerkelig ferdighet for de fleste toåringer barn.

SketchX Lab

Det er imidlertid ikke en uløselig utfordring. I 2016, skrev vi om Songs arbeid med et verktøy kalt Sketch, et dypt-lærende nevralt nettverk som var i stand til å gjenkjenne håndtegnede skisser og bruke dem til å søke etter virkelige produkter. Det bestemte nettverket ble trent ved hjelp av et datasett bestående av rundt 30 000 skisse-foto-sammenligninger, slik at det kan gjenkjenne måten virkelige objekter presenteres på i håndtegninger. Pixelor gjør noe lignende, men kan også generere sine egne tegninger, i stedet for bare å gjenkjenne andres.

Men det er ikke nok til å vinne Pictionary. Pictionary er et tidsutfordret spill hvor målet ikke bare er å tegne for eksempel en katt, men å tegne en katt med så få slag som mulig. Du kan være verdens største kunstner, men hvis det tar deg 12 timer å tegne en perfekt katt, er du en forferdelig Pictionary spiller.

Dette innebar å bygge en A.I. som kan studere mennesker for å se hvilke strategier de bruker for å spille Pictionary godt. Som Song sa, "Hva er de viktigste bitene å tegne for å gjøre andre menneskelige dommere i stand til å gjette? Vi vil at tegningen vår skal gjettes så tidlig som mulig.»

For å gjøre dette tok forskerne QuickDraw, det største menneskelige skissedatasettet som er tilgjengelig til dags dato. De bygde deretter en nevral sorteringsalgoritme som prioriterer rekkefølgen på slag en kunstner trenger å gjøre; gi en gjetbar representasjon av et objekt i så få linjer som mulig. Dette betyr å dele skisser ned i streker, deretter blande rekkefølgen på disse strekene og teste resultatene til de fastslår den nøyaktige rekkefølgen de må legges ned på papir.

For eksempel kan en kunstner begynne å tegne en katt ved å skissere en sirkulær kontur for hodet. Men en sirkel kan være en rekke ting, selv om du vet at den skal representere et hode. Tegn imidlertid to spisse ører eller to sett med værhår, og antallet potensielle ting du kan tegne reduseres veldig, veldig raskt. Denne informasjonen brukes deretter til å instruere skisseagenten.

Song sa at teamet kunne gi ut en offentlig-vendt versjon av dette Pictionary-spille bot slik at menneskelige spillere kan ha sin egen sjanse til å slå en skisserende A.I. herre. (Hvem vet? Å spille en ekspert kan til og med bidra til å forbedre din egen Pictionary spill.)

Mer enn hva øyet kan se

Det er mer med Pixelor enn bare en annen triviell spillrobot. Akkurat som et datasystem har både et grensesnitt på overflatenivå som vi samhandler med og backend-kode under panseret, så har også alle større A.I. spillmilepæl har en baktanke. Med mindre de eksplisitt lager dataspill, bruker ikke forskningslaboratorier utallige arbeidstimer på å bygge spillende A.I. agenter bare for å legge til en ny oppføring på den store listen over ting mennesker ikke lenger er best på. Hensikten er alltid å fremme en grunnleggende del av A.I. problemløsning.

Når det gjelder Pixelor, er det skjulte målet å lage maskiner som er bedre i stand til å finne ut hva som er viktig for et menneske i en bestemt scene. Når vi ser på et bilde, er vi umiddelbart i stand til å fortelle hva de mest fremtredende detaljene er.

La oss si at du kjører hjem fra jobb. Mens trærne langs siden av veien kan være pittoreske og reklametavlen for en ny film kan være interessant, verken er like viktig som ansiktet og kroppsspråket til personen som kanskje eller ikke er i ferd med å gå ut foran du. Før du i det hele tatt har behandlet informasjonen bevisst, har hjernen din skilt ut de viktigste detaljene. Hvordan lærer du en datamaskin å kunne gjøre dette? Vel, det viser seg at en flott måte å gjøre det på er å se hvordan mennesker prioriterer de fremtredende gjenkjennelige detaljene i et bilde når de skisserer det.

«Det er ingen menneskelig kunnskap innebygd i bilder [alene],» sa Song. "Det vi ønsker er menneskelige data som kan gi oss signaler om hvordan mennesker forstår et objekt."

Som nevnt, en god Pictionary spiller, som en god bokser, vil vite det absolutte minimum de trenger å gjøre for å oppnå et bestemt mål. Dette, i makroforstand, er det Yi-Zhe Song og hans kolleger bryr seg om. Det er ikke noe så trivielt som å få en datamaskin til å spille et spill; det er å få en datamaskin til å forstå hva som er viktig med visse scener – og forhåpentligvis å kunne generalisere bedre.

Som alt fra selvkjørende biler for roboter på arbeidsplassen blir stadig mer vanlig, er dette en viktig oppgave å løse.

Et papir som beskriver arbeidet vil bli presentert på SIGGRAPH Asia 2020 i november.

Redaktørenes anbefalinger

  • Voyage er en A.I. spillparadis hvor roboter skriver reglene
  • Sjakk. Fare. Gå. Hvorfor bruker vi spill som målestokk for A.I.?
  • En A.I. designer retro videospill - og de er overraskende gode