Tämä Pictionary-Playing Bot on valtava virstanpylväs A.I.

Kuten Amazon Echon uudet Alexa Skills -taidot, viimeisten parin vuosikymmenen aikana A.I. hanki vähitellen kyky parantaa ihmisyyttä yhä useammassa rakastetuissa peleissämme: Shakki Deep Bluella vuonna 1997, Vaara IBM Watsonin kanssa vuonna 2011, Atari-pelejä DeepMindin kanssa vuonna 2013, Mennä AlphaGon kanssa vuonna 2016, ja niin edelleen. Ainakin suurelle yleisölle jokainen tapaus muuttaa laskennallisen kehityksen abstraktin polun katsojaurheiluksi. Skynet on tulossa älykkäämmäksi. Mistä tiedämme? Koska tutustu kasvavaan harrastukseen, jossa se voi voittaa meidät vakuuttavasti.

Sisällys

  • Pictionary-mestarin rakentaminen
  • Enemmän kuin mitä silmä näkee

Tällä taustalla ei ole kovin järkyttävää kuulla, että A.I. voi nyt suoriutua vakuuttavan hyvin Pictionary, charades-vaikutteinen sanaarvauspeli, jossa yksi henkilö piirtää kuvan ja muut yrittävät selvittää piirtämänsä mahdollisimman nopeasti.

Suositellut videot

Näin Yhdistyneen kuningaskunnan Surreyn yliopiston tutkijat tekivät äskettäin luodessaan Pixelorin, "kilpailevan luonnostelun A.I. agentti." Annettu visuaalinen Pixelor pystyy piirtämään luonnoksen, jonka (sekä ihmiset että koneet) tunnistavat aiotuksi aiheeksi yhtä nopeasti – tai jopa nopeammin – kuin ihminen kilpailija.

Liittyvät

  • Kuinka Nintendo voisi käyttää A.I. tuodaksesi 4K-pelaamisen Switch Prohon
  • Yakuzan johtaja uskoo, että PS5:n kehitys keskittyy A.I. ja koneoppimista

"A.I. agentti pystyy tekemään luonnoksen tyhjästä" Yi-Zhe Song, Surreyn yliopiston Vision Speech and Signal Processing -keskuksen Computer Vision and Machine Learningin lukija kertoi Digital Trendsille. "Anna sille sana kuten "kasvot", niin se tietää mitä piirtää. … Se piirtää eri kissan, erilaisen koiran, eri kasvot joka ikinen kerta. Mutta aina tietäen, kuinka Pictionary-peli voitetaan."

Pictionary-mestarin rakentaminen

Mahdollisuus pienentää monimutkainen tosielämän kuva luonnokseksi on sinänsä melko vaikuttavaa. Vaatii abstraktiotasoa katsoaksesi ihmisen kasvoja ja nähdä ne soikeana, jossa on kaksi pienempää soikiota silmille, viiva nenälle ja puoliympyrä suulle. Lapsilla kyky havaita kuva tällä tavalla osoittaa muun muassa orastavaa kognitiivista käsitteiden ymmärtämistä.

Kuitenkin, kuten monet A.I: n näkökohdat, jotka usein tiivistetään nimellä Moravecin paradoksi että "kovat ongelmat ovat helppoja ja helpot ongelmat ovat vaikeita", se on merkittävä haaste koneelle älykkyys - huolimatta siitä, että se on perustaito, joka on huomioimaton suurimmalle osalle kaksivuotiaista lapset.

SketchX Lab

Se ei kuitenkaan ole ratkaisematon haaste. Vuonna 2016, kirjoitimme Songin työstä työkalulla nimeltä Sketch, syväoppiva neuroverkko, joka pystyi tunnistamaan käsin piirretyt luonnokset ja käyttämään niitä tosielämän tuotteiden etsimiseen. Kyseistä verkkoa koulutettiin käyttämällä tietojoukkoa, joka koostui noin 30 000 luonnos-valokuvavertailusta, minkä ansiosta se pystyi tunnistamaan tavan, jolla todelliset esineet esitetään käsin piirustuksissa. Pixelor tekee jotain vastaavaa, mutta voi myös luoda omia piirroksiaan sen sijaan, että tunnistaisi muiden ihmisten piirustuksia.

Mutta se ei riitä voittoon Pictionary. Pictionary on aika haastava peli, jossa tavoitteena ei ole vain piirtää vaikka kissa, vaan piirtää kissa mahdollisimman harvoilla vedoilla. Saatat olla maailman suurin taiteilija, mutta jos sinulla menee 12 tuntia täydellisen kissan piirtämiseen, olet kauhea Pictionary pelaaja.

Tämä tarkoitti A.I: n rakentamista. jotka voisivat tutkia ihmisiä nähdäkseen, mitä strategioita he käyttävät pelatakseen Pictionaryä hyvin. Kuten Song sanoi: "Mitkä ovat tärkeimmät palaset piirrettäväksi, jotta muut ihmistuomarit voivat arvata? Haluamme, että piirustuksemme arvataan mahdollisimman aikaisin."

Tätä varten tutkijat käyttivät QuickDraw'ta, suurinta tähän mennessä saatavilla olevaa ihmisen luonnostietoaineistoa. Sitten he rakensivat hermolajittelualgoritmin, joka priorisoi taiteilijan tekemien vetojen järjestyksen; antaa arvattavan esityksen esineestä mahdollisimman harvoilla riveillä. Tämä tarkoittaa luonnosten jakamista vedoiksi, sitten näiden vetojen järjestyksen sekoittamista ja tulosten testaamista, kunnes ne määrittävät tarkan järjestyksen, jossa ne on asetettava paperille.

Taiteilija voisi esimerkiksi aloittaa kissan piirtämisen piirtämällä sen pään pyöreän ääriviivan. Mutta ympyrä voi olla mikä tahansa määrä asioita, vaikka tietäisit, että sen oletetaan edustavan päätä. Piirrä kuitenkin kaksi terävää korvaa tai kaksi viiksisarjaa, ja mahdollisten piirtämiesi esineiden määrä vähenee hyvin, hyvin nopeasti. Näitä tietoja käytetään sitten opastamaan luonnosteluagenttia.

Song sanoi, että tiimi voisi julkaista tästä julkisen version Pictionary-pelibotti, jotta ihmispelaajat voivat kukistaa luonnostelevan A.I: n. hallita. (Kuka tietää? Asiantuntijan pelaaminen voi jopa auttaa parantamaan omaasi Pictionary peli.)

Enemmän kuin mitä silmä näkee

Pixelorissa on kuitenkin muutakin kuin pelkkä triviaali pelibotti. Aivan kuten tietokonejärjestelmässä on sekä pintatason käyttöliittymä, jonka kanssa olemme vuorovaikutuksessa, että konepellin alla oleva taustakoodi, myös jokainen merkittävä A.I. pelaamisen virstanpylväillä on taka-ajatuksena. Elleivät he nimenomaisesti tee tietokonepelejä, tutkimuslaboratoriot eivät käytä lukemattomia henkilötunteja rakentamiseen pelaava A.I. agentteja vain lisätäkseen uuden merkinnän suureen luetteloon asioista, jotka ihmiset eivät ole enää parhaita klo. Tarkoituksena on aina edistää jotakin A.I: n perusosaa. ongelmanratkaisu.

Pixelorin tapauksessa piilotettu tavoite on tehdä koneita, jotka pystyvät paremmin selvittämään, mikä on ihmiselle tärkeää tietyssä kohtauksessa. Kun katsomme kuvaa, voimme heti kertoa, mitkä ovat tärkeimmät yksityiskohdat.

Oletetaan, että ajat töistä kotiin. Vaikka tien reunaa reunustavat puut voivat olla maalauksellisia ja uuden elokuvan mainostaulu voi olla mielenkiintoinen, kumpikaan ei ole yhtä tärkeä kuin sen henkilön kasvot ja kehonkieli, joka saattaa olla kävelemässä tai ei sinä. Ennen kuin olet edes tietoisesti käsitellyt tietoja, aivosi ovat yksilöineet tärkeimmät yksityiskohdat. Miten tietokone opetetaan pystymään tähän? Osoittautuu, että yksi loistava tapa tehdä niin on nähdä, kuinka ihmiset priorisoivat kuvan keskeiset tunnistettavat yksityiskohdat, kun he luonnostelevat sitä.

"Ei ole ihmistietoa, joka on luonnostaan ​​upotettu valokuviin [pelkästään]", Song sanoi. "Haluamme ihmistietoja, jotka voivat antaa meille signaaleja siitä, kuinka ihmiset ymmärtävät kohteen."

Kuten todettu, hyvä Pictionary pelaaja, kuten hyvä nyrkkeilijä, tietää ehdottoman vähimmäismäärän, joka heidän on tehtävä saavuttaakseen tietyn tavoitteen. Tämä on makrossa Yi-Zhe Song ja hänen kollegansa välittävät. Se ei ole mitään niin triviaalia kuin saada tietokone pelaamaan peliä. se on saada tietokone ymmärtämään, mikä on tärkeää tietyissä kohtauksissa – ja toivottavasti pystyä yleistämään paremmin.

Kuten kaikki alkaen itse ajavia autoja Koska robotit työpaikoilla yleistyvät, tämä on olennainen tehtävä ratkaistavaksi.

Työtä kuvaava paperi esitellään SIGGRAPH Asia 2020 -tapahtumassa marraskuussa.

Toimittajien suositukset

  • Voyage on A.I. peliparatiisi, jossa robotit kirjoittavat säännöt
  • Shakki. Vaara. Mennä. Miksi käytämme pelejä A.I: n vertailukohtana?
  • A.I. suunnittelee retrovideopelejä – ja ne ovat yllättävän hyviä