Strojové učení a umění – Google I/O 2016
Přemýšlejte o počítačích, jako by to byly děti, a je snadné pochopit, jak je kodéři mohou naučit učit se. Umělá inteligence je na začátku velmi jednoduchá a jednoduchá. Lidští moderátoři instruují počítače, ukazují jim, jak myslet, a tak se sami učit. Jakmile jim kodéři dají základy, mohou tyto znalosti rychle rozšířit.
"Co můžete dělat se 7 miliony digitálních artefaktů?"
Na Google Cultural Institute v Paříži, Francie, vyhledávací gigant učí stroje, jak kategorizovat 7 milionů obrázků lidských uměleckých úspěchů v průběhu staletí. Institut má dokonce webové stránky a aplikace pro iOS a Android kde můžete prohledávat umělecká díla z různých muzeí po celém světě. Aby vytvořili svůj katalog umění, museli kódoví umělci v Institutu učit počítače prohlížejte obrazy tak, jak by lidé vytvořili přesný digitální archiv umění v celé historii lidstva.
Historie katalogizace je dobrá a dobrá, ale některé dovednosti, které se počítače učí při třídění a ukládání, je ve skutečnosti činí kreativnějšími. Umělci v rezidenci nyní experimentují s počítači, aby vytvořili nová umělecká díla pomocí strojové inteligence a katalogu 7 milionů obrázků, které poskládali dohromady. Během Google I/O 2016 Cyril Diagne a Mario Klingemann vysvětlili, jak naučili stroje vidět umění jako lidé a jak vycvičili stroje, aby byly kreativní.
Výuka počítačů jejich ABC
Jednou z prvních věcí, které dítě učíte, je jazyk. V západní kultuře to znamená naučit se své ABC. Mario Klingemann, sebezvaný kódový umělec z Německa, začal učit stroje identifikovat stylizovaná písmena ze starých textů, aby zjistil, zda by dokázal naučit počítač rozpoznávat tisíce různě vypadajících As, B, C atd. na. Byl to rychlokurz výuky strojů, jak kategorizovat obrázky tak, jak by to dělali lidé.
Zatímco počítač se může podívat na stylizované písmeno B pokryté vinnou révou a květinami a vidět nějakou rostlinu, dokonce i 5leté dítě dokáže okamžitě identifikovat obrázek jako písmeno B – nikoli rostlinu. Aby Klingemann naučil svůj počítač rozpoznávat jeho ABC, nakrmil jej tisíci obrázky stylizovaných písmen. Vytvořil rozhraní podobné Tinderu, kdy přejel prstem doprava nebo doleva, aby svým strojům řekl, zda uhodl písmeno správně nebo špatně.
![Stroj na dopisy](/f/fe1b95c3bad8eb1a894b47563536be4e.png)
Ukázalo se, že stroje se učí své ABC docela rychle; začali ve všem vidět písmena. Stejně jako lidé vidí tváře v oblacích a obrazy v abstraktních uměleckých dílech, jeho počítače viděly písmena na zcela nesouvisejících obrázcích. Klingemann ukázal svému počítači kresbu nebo lept zničené budovy a místo toho viděli písmeno B.
Klingemann vysvětlil, že když trénujete počítač pouze s jednou sadou obrázků, začne ve všem vidět pouze tento druh obrazu. Proto jeho stroje viděly dopis v ruinách.
Učí počítače kategorizovat 7 milionů obrázků
Když se umělec digitální interakce Cyril Diagne připojil ke kulturnímu institutu, Google mu položil poměrně skličující otázku: „Co můžete dělat se 7 miliony digitálních artefaktů?“
Diagne byl touto otázkou ohromen, a tak zmapoval každý obrázek v nádherně masivu sinusoida, kterou můžete vidět níže. Tato vlna se později stala krásnou reprezentací všeho, co projekt doufá dosáhnout pomocí strojového učení. Sinusovka Diagne je ve skutečnosti prohledávatelná, takže můžete procházet mořem všech obrázků v digitálním archivu vytvořeném Kulturním institutem Google. Obrázky jsou seskupeny do kategorií a z ptačí perspektivy vidíte jen moře teček. Když se nastěhujete, můžete vidět konkrétní obrázky, všechny se společným tématem, ať už jde o štěňata, farmy nebo lidi.
1 z 3
Můžete v něm také prohledávat a najít obrázky, které chcete. Pokud se podíváte dostatečně důkladně, můžete dokonce narazit na to, co Diagne nazývá Shore of Portraits. To je místo, kde se shromažďují všechny obrazy tváří lidí.
Aby bylo možné prohledávat mapu každého obrázku v archivu, Diagne a jeho tým museli vytvořit kategorii pro všechno, aby stroj naučili, co je co.
Kategorizace 7 milionů artefaktů, z nichž mnohé mohou mít více kategorií, není snadný úkol. Tým musel vymyslet nějaké, které byly mimo rámec. Nestačí pouze kategorizovat věci podle toho, co jsou. Museli také vytvořit kategorie pro emoce, které obrázky vyvolávají.
Naučit stroje lidské emoce je důležitým krokem k tomu, aby byly kreativnější.
Tímto způsobem můžete vyhledat obrázek „klidu“ a počítač vám zobrazí obrázky, které navozují pocit klidu, jako jsou západy slunce, klidná jezera a tak dále. Překvapivě se stroje naučily identifikovat lidské emoce s takovou dovedností, že se dokážou vžít do naší kůže a zvážit, jak by se člověk cítil z určitého obrazu.
Naučit stroje lidské emoce je důležitým krokem k tomu, aby byly kreativnější. Koneckonců, velká část moderního umění jsou vizuální reprezentace lidských emocí.
Ale může být stroj kreativní?
Kreativita a umění jsou dvě věci, které my lidé rádi považujeme za naše samotné. Zvířata nedělají umění, stejně jako stroje… zatím. Projekt Deep Dream společnosti Google se pokusil postavit na hlavu názor, že stroje nedokážou vytvořit umění. Vyhledávací gigant vycvičil počítače k manipulaci s obrázky, aby vytvořil bizarní, psychedelická umělecká díla. Obrázky vytvořené společností Google Motor Deep Dream nemusí být hezké, ale rozhodně jsou jedinečné a divoce kreativní. Strojové výtvory obsahují psychedelické barvy, slimáky, podivné oči a zvířata bez těla vířící v nedefinovaných prostorech.
Někdo může namítnout, že to není umění, když stroje jen kombinují existující obrázky, překrucují je a namáčejí do extrémních barev; Google by si přál, aby se lišil, stejně jako kódový umělec Klingemann.
"Lidé nejsou schopni originálních nápadů," vysvětlil.
1 z 8
Dokonce i slavné obrazy obsahují prvky předchozích uměleckých děl, poznamenal. Picassovo mistrovské dílo z roku 1907 Les Demoiselles d'Avignon, má například vlivy z africké umění a předchůdci kubistů jako Paul Cezanne. Ostatně koláže, které kombinují existující obrazy uměleckým způsobem, jsou další dobře zavedenou uměleckou formou. Picasso, Andy Warhol, Man Ray a další jsou známí svými výstředními kolážemi, tak proč by koláže vyrobené stroji nemohly obstát také jako umění?
Klingemann chtěl posunout hranice digitálního umění a podívat se, jak mohou kreativní stroje fungovat, dlouho předtím, než zahájil svou rezidenci v Google Cultural Institute. Pomocí svých vlastních méně výkonných strojů si Klingemann začal hrát s internetovými archivy a Google TensorFlow software pro strojové učení pro vytváření digitálních koláží.
Vytvořil nástroj pro strojové učení nazvaný Ernst, pojmenovaný po surrealistovi a kolážistovi Max Ernst. Klingemann identifikoval řadu objektů z Ernstovy práce a řekl svému počítači, aby vytvořil různé koláže se stejnými prvky. Výsledky byly často surrealistické, někdy vtipné a jindy naprosto hrozné.
"Lidé nejsou schopni originálních nápadů."
Klingemann chtěl mít větší kontrolu nad chaotickými obrazy, které jeho stroje produkovaly, a tak je začal učit nové věci. Ptal se sám sebe: "Co je pro lidi zajímavé?" Klingemann věděl, že musí systém natrénovat, co má hledat, naučit ho, jak na všechny ty prvky nahlížet jako lidský umělec.
Výsledné umělecké dílo je nádherné a zcela jedinečné. I když Klingemann zjevně použil k vytvoření svých děl staré obrázky, jsou zobrazeny v novém kontextu, a to je ten rozdíl.
Právě teď se počítačová kreativita omezuje na zajímavé koláže a pochopení, které obrázky se k sobě hodí. Stroje zatím nevytvářejí vlastní umění, ale tvůrci kódu, kteří je pohánějí, se během procesu stávají spíše kurátory než tvůrci.
Zbývá zjistit, kam až může člověk rozšířit tvůrčí mysl strojů, ale rozhodně je fascinující to sledovat.
Doporučení redakce
- Google Bard nyní umí mluvit, ale dokáže přehlušit ChatGPT?
- Nyní můžete vyzkoušet Google's Bard, soupeře ChatGPT
- Nová umělá inteligence Bard od Googlu může být dostatečně výkonná, aby dělala ChatGPT starosti – a už je tady
- Google Meet nebo Zoom? Brzy to bude jedno
- Bizarní nová klávesnice Google Japan může také zachytit (doslovné) chyby