Denna Pictionary-spelande bot är en enorm milstolpe för A.I.

Som nya Alexa Skills på ditt Amazon Echo, har de senaste decennierna sett A.I. gradvis skaffa sig förmågan till bästa mänsklighet vid fler och fler av våra älskade spel: Schack med Deep Blue 1997, Jeopardy med IBM Watson 2011, Atari-spel med DeepMind 2013, med AlphaGo 2016, och så vidare. Åtminstone för allmänheten förvandlar varje tillfälle den abstrakta vägen för beräkningsframsteg till en åskådarsport. Skynet blir smartare. Hur vet vi? För kolla in det växande antalet fritidssysselsättningar som det på ett övertygande sätt kan slå oss på.

Innehåll

  • Att bygga en Pictionary-mästare
  • Mer än vad som möter ögat

Med den bakgrunden är det inte särskilt chockerande att höra att A.I. kan nu prestera övertygande bra kl Bildbok, det charadinspirerade ordgissningsspelet som kräver att en person ritar en bild och andra försöker ta reda på vad de har skissat så snabbt som möjligt.

Rekommenderade videor

Det är vad forskare från Storbritanniens University of Surrey nyligen genomförde med skapandet av Pixelor, en "konkurrensmässig skiss A.I. ombud." Givet en visuell Konceptet kan Pixelor rita en skiss som är igenkännbar (både av människor och maskiner) som sitt avsedda motiv lika snabbt - eller till och med snabbare - än en människa konkurrent.

Relaterad

  • Hur Nintendo kunde använda A.I. för att få 4K-spel till Switch Pro
  • Yakuza-regissören tror att PS5:s utveckling kommer att fokusera på A.I. och maskininlärning

"Vår A.I. agenten kan göra en skiss från grunden." Yi-Zhe Song, läsare av Computer Vision and Machine Learning vid Center for Vision Speech and Signal Processing vid University of Surrey, berättade för Digital Trends. "Ge den ett ord som "ansikte" så vet den vad den ska rita.... Den kommer att rita en annan katt, en annan hund, ett annat ansikte, varje gång. Men alltid med kunskapen om hur man vinner Pictionary-spelet.”

Att bygga en Pictionary-mästare

Att kunna reducera en komplex verklig bild till en skiss är i sig ganska imponerande. Det krävs en abstraktionsnivå för att se på ett mänskligt ansikte och se det som en oval med två mindre ovaler för ögonen, en linje för en näsa och en halvcirkel för en mun. Hos barn visar förmågan att uppfatta en bild på detta sätt bland annat en växande kognitiv förståelse av begrepp.

Men som med många aspekter av A.I., ofta sammanfattat som Moravecs paradox att de "svåra problemen är lätta och de enkla problemen är svåra", det är en betydande utmaning för maskinen intelligens - trots att det är en grundläggande, omärklig färdighet för majoriteten av tvååringar barn.

SketchX Lab

Det är dock ingen olöslig utmaning. År 2016, skrev vi om Songs arbete med ett verktyg som heter Sketch, ett djupt lärande neuralt nätverk som kunde känna igen handritade skisser och använda dem för att söka efter verkliga produkter. Det specifika nätverket tränades med hjälp av en datauppsättning bestående av cirka 30 000 skiss-foto-jämförelser, vilket gör att det kan känna igen hur verkliga objekt presenteras i handritning. Pixelor gör något liknande, men kan också skapa sina egna teckningar, snarare än att bara känna igen andras.

Men det räcker inte för att vinna Bildbok. Bildbok är ett tidsutmanat spel där målet inte bara är att rita, säg, en katt, utan att rita en katt i så få slag som möjligt. Du kan vara världens största konstnär, men om det tar dig 12 timmar att rita en perfekt katt är du en fruktansvärd Bildbok spelare.

Detta innebar att bygga en A.I. som skulle kunna studera människor för att se vilka strategier de använder för att spela Pictionary bra. Som Song sa: "Vilka är de viktigaste bitarna att rita för att andra mänskliga domare ska kunna gissa? Vi vill att vår ritning ska gissas så tidigt som möjligt.”

För att göra detta tog forskarna QuickDraw, den största mänskliga skissdatauppsättningen som finns tillgänglig hittills. De byggde sedan en neural sorteringsalgoritm som prioriterar ordningen på slag som en konstnär behöver göra; ger en gissbar representation av ett objekt i så få rader som möjligt. Detta innebär att dela upp skisser i streck, sedan blanda ordningen på dessa streck och testa resultaten tills de fastställer den exakta ordningen i vilken de behöver läggas ner på papper.

Till exempel kan en konstnär börja rita en katt genom att skissa en cirkulär kontur för dess huvud. Men en cirkel kan vara hur många saker som helst, även om du vet att den ska representera ett huvud. Rita dock två spetsiga öron eller två uppsättningar morrhår och antalet potentiella saker som du kan rita minskar mycket, mycket snabbt. Denna information används sedan för att instruera skissagenten.

Song sa att teamet skulle kunna släppa en offentlig version av detta Bildbok-spela bot så att mänskliga spelare kan ha sin egen chans att slå en skissande A.I. bemästra. (Vem vet? Att spela en expert kan till och med hjälpa dig att förbättra din egen Bildbok spel.)

Mer än vad som möter ögat

Det finns mer med Pixelor än bara en annan trivial spelrobot. Precis som ett datorsystem har både ett gränssnitt på ytan som vi interagerar med och backend-kod under huven, så har alla större A.I. spelande milstolpe har en baktanke. Såvida de inte uttryckligen tillverkar datorspel, spenderar inte forskningslabb otaliga arbetstimmar på att bygga spelande A.I. agenter bara för att lägga till ytterligare en post på den stora listan över saker som människor inte längre är bäst på. Syftet är alltid att främja någon grundläggande del av A.I. problemlösning.

När det gäller Pixelor är det dolda målet att göra maskiner som bättre kan ta reda på vad som är viktigt för en människa i en viss scen. När vi tittar på en bild kan vi omedelbart avgöra vilka de mest framträdande detaljerna är.

Låt oss säga att du kör hem från jobbet. Medan träden som kantar sidan av vägen kan vara pittoreska och skylten för en ny film kan vara intressant, varken är lika viktig som ansiktet och kroppsspråket för den person som kanske eller inte är på väg att gå ut framför du. Innan du ens medvetet har bearbetat informationen har din hjärna pekat ut de viktigaste detaljerna. Hur lär man en dator att kunna göra detta? Tja, det visar sig att ett bra sätt att göra det är att se hur människor prioriterar de framträdande igenkännliga detaljerna i en bild när de skissar den.

"Det finns ingen mänsklig kunskap inbäddad i foton [enbart]," sa Song. "Vad vi vill ha är mänskliga data som kan ge oss signaler om hur människor förstår ett objekt."

Som nämnts, en bra Bildbok spelare, som en bra boxare, kommer att veta det absoluta minimum de behöver göra för att uppnå ett visst mål. Detta, i makrobemärkelse, är vad Yi-Zhe Song och hans kollegor bryr sig om. Det är inte något så trivialt som att få en dator att spela ett spel; det får en dator att förstå vad som är viktigt med vissa scener – och förhoppningsvis att kunna generalisera bättre.

Som allt från självkörande bilar för robotar på arbetsplatsen blir allt vanligare, detta är en viktig uppgift att lösa.

Ett dokument som beskriver arbetet kommer att presenteras på SIGGRAPH Asia 2020 i november.

Redaktörens rekommendationer

  • Voyage är en A.I. spelparadis där bots skriver reglerna
  • Schack. Jeopardy. Gå. Varför använder vi spel som ett riktmärke för A.I.?
  • En A.I. designar retrovideospel – och de är förvånansvärt bra