Jos ihmettelet, yllä oleva kuva on "monimutkainen piirros ikuisuudesta". Mutta se ei ole ihmistaiteilijan työ; se on BigSleepin luominen, uusin hämmästyttävä esimerkki generatiivisuudesta tekoäly (A.I.) toiminnassa.
Sisällys
- Kuinka BigSleep toimii
- Kuvaa luova A.I.
Vähän kuin visuaalinen versio tekstiä luova A.I. malli GPT-3, BigSleep pystyy ottamaan minkä tahansa tekstikehotteen ja visualisoimaan kuvan sopimaan sanoihin. Se voi olla jotain esoteerista, kuten ikuisuus, tai se voi olla kulho kirsikoita tai kaunis talo (jälkimmäinen joka näkyy alla.) Ajattele sitä kuin Google-kuvahakua – vain kuville, joita ei ole koskaan aiemmin tehty olemassa.
Suositellut videot
Kuinka BigSleep toimii
"Korkealla tasolla BigSleep toimii yhdistämällä kaksi hermoverkkoa: BigGAN ja CLIP," Ryan Murdock, BigSleepin 23-vuotias luoja, Utahin yliopistossa kognitiivista neurotieteitä opiskeleva opiskelija, kertoi Digital Trendsille.
Ensimmäinen näistä, BigGAN, on Googlen luoma järjestelmä, joka vastaanottaa satunnaista kohinaa ja tulostaa kuvia. BigGAN on generatiivinen kontradiktorinen verkko: kaksintaisteluhermoverkkojen pari, jotka suorittavat mitä Murdock kutsuu "kiistalliseksi köydenvetoksi" mielikuvia luovan verkoston ja syrjinnän välillä verkkoon. Ajan myötä generaattorin ja erottelijan välinen vuorovaikutus johtaa parannuksiin molempiin hermoverkkoihin.
CLIP, on OpenAI: n valmistama hermoverkko, joka on opetettu yhdistämään kuvia ja kuvauksia. Anna CLIP-tekstiä ja kuvia, niin se yrittää selvittää, kuinka hyvin ne sopivat yhteen ja antaa niille pisteet vastaavasti.
Yhdistämällä nämä kaksi Murdock selitti, että BigSleep etsii BigGANin tulosteista kuvia, jotka maksimoivat CLIPin pisteytyksen. Sitten se säätää hitaasti BigGANin generaattorin kohinatuloa, kunnes CLIP sanoo, että tuotetut kuvat vastaavat kuvausta. Kehotteen mukaisen kuvan luominen kestää yhteensä noin kolme minuuttia.
"BigSleep on tärkeä, koska se voi tuottaa laajan valikoiman käsitteitä ja objekteja melko hyvin 512 x 512 pikselin resoluutiolla", Murdock sanoi. "Aiemmat työt ovat tuottaneet vaikuttavia tuloksia, mutta tietääkseni suuri osa siitä on rajoittunut pienempiresoluutioisiin kuviin ja arkipäiväisempiin esineisiin."
Kuvaa luova A.I.
BigSleep ei ole ensimmäinen kerta, kun A.I. on käytetty kuvien luomiseen. Sen nimi muistuttaa DeepDream, A.I. Google-insinööri Alex Mordvintsev luo psykedeelisiä kuvia luokittelumallien avulla. Luomiseen käytettiin myös GAN-pohjaista järjestelmää A.I. maalaus myyty huutokaupassa vuonna 2018 valtavalla 432 500 dollarilla. Se on kuitenkin varmasti kiehtova askel eteenpäin.
Jos haluat kokeilla BigSleepia itse, Murdock ehdotti tutustumista omaansa Google Colab -muistikirja hankkeen suhteen. Colab GUI: n ja muutaman muun vaiheen käyttöön liittyy hieman oppimiskäyrää, mutta se on ilmaista. Myös muita tapoja testata sitä avautuu tulevina viikkoina. Jos olet kiinnostunut, voit myös käydä r/MediaSynthesis, jossa käyttäjät julkaisevat parhaita kuvia, jotka he ovat luoneet järjestelmällä tähän mennessä.
Toimittajien suositukset
- Voiko A.I. päihittää ihmisinsinöörit mikrosirujen suunnittelussa? Google ajattelee niin
- Älykäs uusi A.I. järjestelmä lupaa kouluttaa koirasi, kun olet poissa kotoa
- A.I: n seuraava suuri haaste? Gon kvanttiversion pelaaminen
- Proteesit, jotka eivät vaadi harjoittelua: Sisällä uusin bioniikan läpimurto
- A.I. käännöstyökalu valaisee hiirten salaista kieltä
Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.