Deze Pictionary-spelende bot is een enorme mijlpaal voor A.I.

Net als nieuwe Alexa Skills op je Amazon Echo, hebben we de afgelopen decennia A.I. geleidelijk het vermogen verwerven om de mensheid te verslaan in steeds meer van onze geliefde spellen: Schaken met Deep Blue in 1997, Gevaar met IBM Watson in 2011, Atari-spellen met DeepMind in 2013, Gaan met AlphaGo in 2016, enzovoort. Voor het grote publiek verandert elk exemplaar het abstracte pad van computationele vooruitgang in een kijksport. Skynet wordt slimmer. Hoe weten we? Want kijk eens naar het groeiende aantal bezigheden waarin het ons op overtuigende wijze kan verslaan.

Inhoud

  • Een Pictionary-meester bouwen
  • Meer dan het oog kan zien

Met die achtergrond is het niet zo’n schok om te horen dat A.I. kan nu overtuigend goed presteren Pictionair, het op charades geïnspireerde woordraadspel waarbij één persoon een afbeelding moet tekenen en anderen zo snel mogelijk moeten proberen te achterhalen wat ze hebben geschetst.

Aanbevolen video's

Dat is wat onderzoekers van de Britse Universiteit van Surrey onlangs hebben uitgevoerd met de creatie van Pixelor, een ‘competitieve schets-A.I. tussenpersoon." Gegeven een visueel beeld concept kan Pixelor een schets maken die (zowel door mensen als door machines) herkenbaar is als het beoogde onderwerp, net zo snel – of zelfs sneller – dan een mens concurrent.

Verwant

  • Hoe Nintendo AI zou kunnen gebruiken om 4K-gaming naar de Switch Pro te brengen
  • Yakuza-regisseur denkt dat de evolutie van PS5 zich zal concentreren op AI. en machinaal leren

“Onze A.I. agent kan een schets helemaal opnieuw maken”, Yi-Zhe-lied, lezer van Computer Vision and Machine Learning bij het Center for Vision Speech and Signal Processing aan de Universiteit van Surrey, aan Digital Trends. “Geef het een woord als ‘gezicht’ en hij weet wat hij moet tekenen. … Het zal elke keer een andere kat, een andere hond, een ander gezicht tekenen. Maar altijd met de kennis hoe je het Pictionary-spel kunt winnen.”

Een Pictionary-meester bouwen

Het is op zichzelf behoorlijk indrukwekkend om een ​​complex beeld uit de echte wereld tot een schets te kunnen reduceren. Er is een niveau van abstractie voor nodig om naar een menselijk gezicht te kijken en het te zien als een ovaal met twee kleinere ovalen als ogen, een lijn als neus en een halve cirkel als mond. Bij kinderen getuigt het vermogen om een ​​beeld op deze manier waar te nemen onder andere van een groeiend cognitief begrip van concepten.

Echter, zoals met veel aspecten van AI, vaak samengevat als Moravecs paradox dat de ‘harde problemen gemakkelijk zijn en de gemakkelijke problemen moeilijk’, het is een aanzienlijke uitdaging voor de machine intelligentie – ondanks het feit dat het voor de meerderheid van de tweejarigen een fundamentele, onopvallende vaardigheid is kinderen.

SketchX-lab

Het is echter geen onoplosbare uitdaging. In 2016schreven we over het werk van Song met een tool genaamd Sketch, een diepgaand lerend neuraal netwerk dat handgetekende schetsen kon herkennen en deze kon gebruiken om naar echte producten te zoeken. Dat specifieke netwerk werd getraind met behulp van een dataset bestaande uit zo'n 30.000 schets-fotovergelijkingen, waardoor het in staat was de manier te herkennen waarop echte objecten in handtekeningen worden gepresenteerd. Pixelor doet iets soortgelijks, maar kan ook zijn eigen tekeningen genereren, in plaats van alleen die van anderen te herkennen.

Maar dat is niet genoeg om te winnen Pictionair. Pictionair is een tijdgebonden spel waarbij het doel niet alleen is om bijvoorbeeld een kat te tekenen, maar om een ​​kat in zo min mogelijk slagen te tekenen. Je zou de grootste kunstenaar ter wereld kunnen zijn, maar als het je twaalf uur kost om een ​​perfecte kat te tekenen, ben je een verschrikkelijke. Pictionair speler.

Dit betekende het bouwen van een A.I. dat mensen zou kunnen bestuderen om te zien welke strategieën ze gebruiken om Pictionary goed te spelen. Zoals Song zei: “Wat zijn de belangrijkste stukjes om te tekenen zodat andere menselijke juryleden kunnen raden? We willen dat onze tekening zo vroeg mogelijk geraden wordt.”

Om dit te doen, gebruikten de onderzoekers QuickDraw, de grootste menselijke schetsdataset die tot nu toe beschikbaar is. Vervolgens bouwden ze een neuraal sorteeralgoritme dat prioriteit geeft aan de volgorde van de slagen die een kunstenaar moet maken; het geven van een raadbare weergave van een object in zo min mogelijk regels. Dit houdt in dat je de schetsen in streken opsplitst, vervolgens de volgorde van deze streken door elkaar gooit en de resultaten test totdat de precieze volgorde is vastgesteld waarin ze op papier moeten worden gezet.

Een kunstenaar zou bijvoorbeeld kunnen beginnen met het tekenen van een kat door een cirkelvormige omtrek van zijn kop te schetsen. Maar een cirkel kan van alles zijn, zelfs als je weet dat het een hoofd moet voorstellen. Teken echter twee puntige oren of twee paar snorharen en het aantal potentiële dingen dat je zou kunnen tekenen, neemt heel, heel snel af. Deze informatie wordt vervolgens gebruikt om de schetsagent te instrueren.

Song zei dat het team hiervan een openbare versie zou kunnen uitbrengen Pictionair-bot spelen, zodat menselijke spelers hun eigen weg kunnen gaan in het verslaan van een schetsende A.I. meester. (Wie weet? Het spelen van een expert kan je zelfs helpen om die van jezelf te verbeteren Pictionair spel.)

Meer dan het oog kan zien

Pixelor heeft echter meer te bieden dan alleen maar een triviale gameplay-bot. Net zoals een computersysteem zowel een interface op oppervlakteniveau heeft waarmee we communiceren als een back-endcode onder de motorkap, zo heeft ook elke grote AI-omgeving een interface. gameplay-mijlpaal hebben een bijbedoeling. Tenzij ze expliciet computerspellen maken, besteden onderzoekslaboratoria geen talloze manuren aan het bouwen game-playing A.I. agenten gewoon om nog een vermelding toe te voegen aan de grote lijst van dingen die mensen niet langer de beste zijn bij. Het doel is altijd om een ​​fundamenteel onderdeel van AI te bevorderen. probleemoplossing.

In het geval van Pixelor is het verborgen doel om machines te maken die beter in staat zijn om erachter te komen wat belangrijk is voor een mens in een bepaalde scène. Als we naar een afbeelding kijken, kunnen we meteen zien wat de meest opvallende details zijn.

Stel dat u van uw werk naar huis rijdt. Hoewel de bomen langs de kant van de weg schilderachtig kunnen zijn en het reclamebord voor een nieuwe film interessant kan zijn, geen van beide is zo belangrijk als het gezicht en de lichaamstaal van de persoon die wel of niet op het punt staat voor je uit te lopen Jij. Voordat je de informatie zelfs maar bewust hebt verwerkt, hebben je hersenen de belangrijkste details eruit gehaald. Hoe leer je een computer dit te kunnen? Welnu, het blijkt dat een geweldige manier om dit te doen is om te zien hoe mensen prioriteit geven aan de opvallende, herkenbare details in een afbeelding wanneer ze deze schetsen.

“Er zit geen menselijke kennis inherent ingebed in foto’s”, zegt Song. “Wat we willen zijn menselijke gegevens die ons signalen kunnen geven over hoe mensen een object begrijpen.”

Zoals opgemerkt, een goede Pictionair De speler zal, net als een goede bokser, weten wat het absolute minimum is dat hij moet doen om een ​​bepaald doel te bereiken. Dit is, in macro-economische zin, waar Yi-Zhe Song en zijn collega's om geven. Het is niet zo triviaal als een computer een spel laten spelen; het zorgt ervoor dat een computer begrijpt wat belangrijk is aan bepaalde scènes – en hopelijk beter kan generaliseren.

Zoals alles van zelfrijdende auto's Omdat robots op de werkplek steeds gebruikelijker worden, is dit een essentiële taak om op te lossen.

Een paper waarin het werk wordt beschreven, zal in november worden gepresenteerd op SIGGRAPH Asia 2020.

Aanbevelingen van de redactie

  • Voyage is een A.I. gameparadijs waar bots de regels schrijven
  • Schaken. Gevaar. Gaan. Waarom gebruiken we games als maatstaf voor AI?
  • Een A.I. ontwerpt retro-videogames – en ze zijn verrassend goed