Inside The Coder Art v Kultúrnom inštitúte Google

Strojové učenie a umenie – Google I/O 2016

Môže byť stroj kreatívny? Google si to myslí a má celý tím, ktorý sa venuje výučbe strojov, ako vidieť svet trochu viac ako my, emocionálni ľudia.

Premýšľajte o počítačoch, ako keby to boli deti, a je jednoduché pochopiť, ako ich môžu kóderi naučiť učiť sa. Umelá inteligencia je na začiatku veľmi jednoduchá a jednoduchá. Ľudskí moderátori inštruujú počítače, ukazujú im, ako majú myslieť, a tak sa učia. Keď im kóderi dajú základy, môžu tieto znalosti rýchlo rozšíriť.

"Čo môžete robiť so 7 miliónmi digitálnych artefaktov?"

Na Google Cultural Institute v Paríži vo Francúzsku vyhľadávací gigant učí stroje, ako kategorizovať 7 miliónov obrázkov ľudských umeleckých úspechov v priebehu storočí. Inštitút má dokonca webovú stránku, ako aj aplikácie pre iOS a Android kde môžete prehľadávať umelecké diela z rôznych múzeí po celom svete. Na vytvorenie katalógu umenia museli kódoví umelci v ústave naučiť počítače prezerajte si obrázky spôsobom, akým by ľudia vytvorili presný digitálny archív umenia v celej histórii ľudstva.

História katalogizácie je dobrá a dobrá, ale niektoré zručnosti, ktoré sa počítače učia pri triedení a ukladaní, ich v skutočnosti robia kreatívnejšími. Umelci v rezidencii teraz experimentujú s počítačmi, aby vytvorili nové umelecké diela pomocou strojovej inteligencie a katalógu 7 miliónov obrázkov, ktoré poskladali. Počas konferencie Google I/O 2016 Cyril Diagne a Mario Klingemann vysvetlili, ako naučili stroje vidieť umenie ako ľudia a ako trénovali stroje, aby boli kreatívni.

Výučba počítačov ich ABC

Jednou z prvých vecí, ktoré učíte dieťa, je jazyk. V západnej kultúre to znamená naučiť sa svoje ABC. Mario Klingemann, samooznačený kódový umelec z Nemecka, začal učiť stroje identifikovať štylizované písmená zo starých textov, aby zistil, či dokáže naučiť počítač rozpoznávať tisíce rôzne vyzerajúcich As, B, C atď. na. Bol to rýchlokurz výučby strojov, ako kategorizovať obrázky tak, ako by to robili ľudia.

Zatiaľ čo počítač sa môže pozrieť na štylizované písmeno B pokryté viničom a kvetmi a vidieť nejakú rastlinu, dokonca aj 5-ročné dieťa dokáže okamžite identifikovať obrázok ako písmeno B – nie rastlinu. Aby naučil svoj počítač rozpoznávať jeho ABC, Klingemann ho nakŕmil tisíckami obrázkov štylizovaných písmen. Vytvoril rozhranie podobné Tinderu s potiahnutím prstom doprava alebo doľava, aby svojim strojom povedal, či uhádli písmeno správne alebo nesprávne.

Ukázalo sa, že stroje sa veľmi rýchlo naučia svoje ABC; začali vo všetkom vidieť písmená. Rovnako ako ľudia vidia tváre v oblakoch a obrázky v abstraktných umeleckých dielach, jeho počítače videli písmená v úplne nesúvisiacich obrázkoch. Klingemann ukázal svojmu počítaču kresbu alebo lept zničenej budovy a namiesto toho videli písmeno B.

Klingemann vysvetlil, že keď trénujete počítač iba s jednou sadou obrázkov, začne vo všetkom vidieť iba tento druh obrazu. Preto jeho stroje videli list v ruinách.

Učíme počítače kategorizovať 7 miliónov obrázkov

Keď umelec digitálnej interakcie Cyril Diagne nastúpil do Kultúrneho inštitútu, Google mu položil dosť skľučujúcu otázku: „Čo môžete urobiť so 7 miliónmi digitálnych artefaktov?“

Diagne bol touto otázkou ohromený, a tak zmapoval každý obrázok v nádherne masívnom sínusoida, ktoré môžete vidieť nižšie. Táto vlna sa neskôr stala krásnou reprezentáciou všetkého, čo projekt dúfa, že dosiahne pomocou strojového učenia. Sínusoida Diagne je v skutočnosti vyhľadávateľná, takže môžete surfovať po mori všetkých obrázkov v digitálnom archíve, ktorý vytvoril Kultúrny inštitút Google. Obrázky sú zoskupené do kategórií a z vtáčej perspektívy vidíte len more bodiek. Keď sa nasťahujete, môžete vidieť konkrétne obrázky, všetky so spoločnou témou, či už sú to šteniatka, farmy alebo ľudia.

1 z 3

Môžete v ňom tiež prehľadávať a nájsť obrázky, ktoré chcete. Ak sa poriadne pozriete, možno narazíte aj na to, čo Diagne nazýva Pobrežie portrétov. To je miesto, kde sú všetky obrázky tvárí ľudí zoskupené.

Aby bolo možné vyhľadať mapu každého obrázka v archíve, Diagne a jeho tím museli vytvoriť kategóriu pre všetko, aby naučili stroj, čo je čo.

Kategorizácia 7 miliónov artefaktov, z ktorých mnohé môžu mať viacero kategórií, nie je ľahká úloha. Tím musel vymyslieť nejaké, ktoré boli mimo. Nestačí len kategorizovať veci podľa toho, aké sú. Museli tiež vytvoriť kategórie pre emócie, ktoré obrázky vyvolávajú.

Naučiť stroje ľudské emócie je dôležitým krokom k tomu, aby boli kreatívnejšie.

Týmto spôsobom môžete vyhľadať obrázok „pokoja“ a počítač vám zobrazí obrázky, ktoré vyvolávajú pocit pokoja, ako sú západy slnka, pokojné jazerá atď. Je úžasné, že stroje sa naučili identifikovať ľudské emócie s takou zručnosťou, že sa dokážu vžiť do našej kože, aby zvážili, ako by sa určitý obraz cítil v človeku.

Naučiť stroje ľudské emócie je dôležitým krokom k tomu, aby boli kreatívnejšie. Koniec koncov, veľká časť moderného umenia je vizuálnym znázornením ľudských emócií.

Ale môže byť stroj kreatívny?

Kreativita a umenie sú dve veci, ktoré my ľudia radi považujeme za svoje. Zvieratá nerobia umenie, ani stroje... zatiaľ. Projekt Deep Dream spoločnosti Google sa pokúsil obrátiť názor, že stroje nemôžu vytvárať umenie. Vyhľadávací gigant vycvičil počítače na manipuláciu s obrázkami, aby vytvorili bizarné, psychedelické umelecké diela. Obrázky vytvorené spoločnosťou Google Motor Deep Dream nemusia byť pekné, ale určite sú jedinečné a divoko kreatívne. Strojové výtvory obsahujú psychedelické farby, slimáky, zvláštne oči a zvieratá bez tela víriace v nedefinovaných priestoroch.

Niektorí môžu namietať, že nie je umenie, ak stroje len kombinujú existujúce obrázky, krútia ich a namáčajú do extrémnych farieb; Google by sa prosil, aby sa líšil, rovnako ako kódový umelec Klingemann.

„Ľudia nie sú schopní originálnych nápadov,“ vysvetlil.

1 z 8

Dokonca aj slávne obrazy obsahujú prvky predchádzajúcich umeleckých diel, poznamenal. Picassovo majstrovské dielo z roku 1907 Les Demoiselles d'Avignon, má vplyv napr africké umenie a predchodcovia kubistov ako Paul Cezanne. Okrem toho sú koláže, ktoré kombinujú existujúce obrázky umeleckým spôsobom, ďalšou dobre zavedenou formou umenia. Picasso, Andy Warhol, Man Ray a ďalší sú známi svojimi výstrednými kolážami, tak prečo by koláže vyrobené strojmi nemohli obstáť aj ako umenie?

Klingemann chcel posunúť hranice digitálneho umenia a zistiť, ako môžu kreatívne stroje fungovať už dávno predtým, ako začal svoju rezidenciu v Kultúrnom inštitúte Google. Pomocou vlastných menej výkonných strojov sa Klingemann začal hrať s internetovými archívmi a Google TensorFlow softvér strojového učenia na vytváranie digitálnych koláží.

Vytvoril nástroj strojového učenia s názvom Ernst, pomenovaný po surrealistovi a kolážistovi Max Ernst. Klingemann identifikoval sériu predmetov z Ernstovej práce a povedal svojmu počítaču, aby vytvoril rôzne koláže s rovnakými prvkami. Výsledky boli často neskutočné, niekedy vtipné a inokedy úplne hrozné.

"Ľudia nie sú schopní originálnych nápadov."

Klingemann chcel mať väčšiu kontrolu nad chaotickými obrázkami, ktoré jeho stroje vytvárali, a tak ich začal učiť nové veci. Spýtal sa sám seba: „Čo je zaujímavé pre ľudí? Klingemann vedel, že musí trénovať systém, čo má hľadať, naučiť ho, ako sa na všetky tieto prvky pozerať ako na človeka.

Výsledné umelecké dielo je nádherné a úplne jedinečné. Aj keď Klingemann očividne použil na vytvorenie svojich diel staré obrázky, sú zobrazené v novom kontexte, a to robí celý rozdiel.

V súčasnosti sa počítačová kreativita obmedzuje na zaujímavé koláže a pochopenie toho, ktoré obrázky sa k sebe hodia. Stroje ešte nevytvárajú svoje vlastné umenie, ale umelci kódu, ktorí ich poháňajú, sa počas procesu stávajú viac kurátormi ako tvorcami.

Zostáva zistiť, ako ďaleko môže človek rozšíriť kreatívne myslenie strojov, ale rozhodne je fascinujúce to sledovať.

Odporúčania redaktorov

Google Bard teraz môže hovoriť, ale dokáže prehlušiť ChatGPT?
Teraz si môžete vyskúšať Bard od Google, súpera ChatGPT
Nová umelá inteligencia Bard od Googlu môže byť dostatočne výkonná na to, aby znepokojovala ChatGPT – a už je tu
Google Meet alebo Zoom? Čoskoro na tom nezáleží
Bizarná nová klávesnica Google Japan môže tiež zachytiť (doslovné) chyby