A kódoló művészet belsejében a Google Kulturális Intézetében

Gépi tanulás és művészet – Google I/O 2016

Lehet-e kreatív egy gép? A Google így gondolja, és egy egész csapata arra törekszik, hogy megtanítsa a gépeket, hogyan tekintsék a világot egy kicsit úgy, mint mi, érzelmes emberek.

Gondoljon a számítógépekre úgy, mintha gyerekek lennének, és egyszerűen megértheti, hogyan taníthatják meg őket a kódolók a tanulásra. A mesterséges intelligencia kezdetben nagyon alapvető és egyszerű. Az emberi moderátorok oktatják a számítógépeket, megmutatva nekik, hogyan kell gondolkodni, és így tanítani magukat. Ha azonban a kódolók megadják nekik az alapokat, gyorsan bővíthetik tudásukat.

„Mit lehet kezdeni 7 millió digitális műalkotással?”

A Google Kulturális Intézet Párizsban (Franciaország) a keresőóriás megtanítja a gépeket, hogyan kell kategorizálni 7 millió képet az emberi művészeti teljesítményről az évszázadok során. Az intézetnek még egy weboldala is van, valamint alkalmazások is vannak a számára iOS és Android ahol a világ különböző múzeumaiból származó műalkotások között kereshet. Művészeti katalógusának elkészítéséhez az intézetben tartózkodó kódművészeknek számítógépet kellett tanítaniuk úgy nézze meg a képeket, ahogyan az emberek tennék, hogy pontos digitális archívumot hozhassanak létre az emberiség történelme során.

A történelem katalógusba foglalása jó és jó, de a számítógépek által a válogatás és iktatás során elsajátított készségek egy része kreatívabbá teszi őket. A rezidens művészek most számítógépekkel kísérleteznek, hogy új műalkotásokat hozzanak létre a gépi intelligencia és az általuk összeállított 7 millió képből álló katalógus segítségével. A Google I/O 2016 során Cyril Diagne és Mario Klingemann elmagyarázták, hogyan tanították meg a gépeket, hogy úgy lássák a művészetet, mint az embereket, és hogyan nevelték a gépeket kreatívra.

Számítógépek ABC-k oktatása

Az egyik első dolog, amit megtanítasz a gyereknek, az a nyelv. A nyugati kultúrában ez azt jelenti, hogy megtanulod az ABC-t. Mario Klingemann, egy németországi kódművész, aki saját magát írta le, elkezdte tanítani a gépeket azonosítani stilizált betűket régi szövegekből, hogy megtudja, meg tudná-e tanítani a számítógépet több ezer különböző kinézetű As, B, C stb. felismerésére. tovább. Ez egy gyorstanfolyam volt a gépeknek, hogy hogyan kategorizálják a képeket úgy, ahogyan azt az emberek tennék.

Míg a számítógép ránéz egy stilizált, szőlővel és virágokkal borított B betűre, és láthat valamilyen növényt, egy 5 éves gyerek is azonnal B betűként azonosíthatja a képet, nem pedig növényként. Klingemann, hogy megtanítsa számítógépét az ABC-k felismerésére, stilizált betűk ezreit táplálta be. Létrehozott egy Tinder-szerű interfészt, amelyben jobbra vagy balra csúsztatva jelezheti gépeinek, hogy jól vagy rosszul tippelték-e ki a betűt.

Kiderült, hogy a gépek elég gyorsan megtanulják az ABC-t; betűket kezdtek látni mindenben. Ahogyan az emberek arcokat látnak a felhőkben és képeket az absztrakt grafikákban, az ő számítógépei betűket láttak teljesen független képeken. Klingemann egy romos épület rajzát vagy rézkarcát mutatta a számítógépének, és helyette egy B betűt láttak.

Klingemann elmagyarázta, hogy amikor egy számítógépet csak egy képkészlettel tanítasz, akkor mindenben csak ezt a fajta képet kezdi látni. Ezért láttak a gépei egy levelet romokban.

A számítógépek megtanítása 7 millió kép kategorizálására

Amikor a digitális interakciós művész, Cyril Diagne csatlakozott a Cultural Institute-hoz, a Google egy meglehetősen ijesztő kérdést tett fel neki: „Mit lehet kezdeni 7 millió digitális műalkotással?”

Diagne-t lenyűgözte a kérdés, így minden képet pompásan masszívan ábrázolt szinuszos hullám, amelyet alább láthat. Ez a hullám később szép reprezentációja lett mindannak, amit a projekt a gépi tanulással elérni kíván. Diagne szinuszhulláma valójában kereshető, így a Google Cultural Institute által készített digitális archívumban található összes kép tengerében böngészhet. A képek kategóriákba vannak csoportosítva, madártávlatból pedig csak a pontok tengerét látod. Ahogy beköltözik, konkrét képeket láthat, amelyek mindegyike közös témájú, legyen szó kölykökről, farmokról vagy emberekről.

1 nak,-nek 3

Kereshet is rajta, és megtalálhatja a kívánt képeket. Ha elég alaposan megnézed, akár bele is futhatsz abba, amit Diagne a Portrék partjának nevez. Ez az a hely, ahol az emberek arcáról készült összes kép csoportosul.

Az archívumban lévő összes kép kereshető térképének elkészítéséhez Diagne-nek és csapatának mindenhez létre kellett hoznia egy kategóriát, hogy megtanítsa a gépnek, hogy mi az.

7 millió műtárgy kategorizálása, amelyek közül sok több kategória is lehet, nem könnyű feladat. A csapatnak ki kellett találnia néhányat, amelyek kívül esnek a dobozon. Nem elég csak az alapján kategorizálni a dolgokat, hogy mik is azok. A képek által kiváltott érzelmekhez kategóriákat is kellett alkotniuk.

Az emberi érzelmek betanítása fontos lépés a kreatívabbá tételük felé.

Így rákereshet a „nyugalom” képére, és a számítógép olyan képeket mutat, amelyek a nyugalom érzetét keltik, például naplementéket, nyugodt tavakat stb. Csodálatos módon a gépek megtanulták, hogyan kell azonosítani az emberi érzelmeket olyan készséggel, hogy a mi helyünkbe tudták magukat gondolni, hogy egy bizonyos kép milyen érzéseket kelt az emberben.

Az emberi érzelmek betanítása fontos lépés a kreatívabbá tételük felé. Végül is a modern művészet nagy része az emberi érzelmek vizuális megjelenítése.

De lehet-e kreatív egy gép?

A kreativitás és a művészi készség két olyan dolog, amelyre mi, emberek szeretünk úgy gondolni, mint a miénk. Az állatok nem alkotnak művészetet, és még a gépek sem… A Google Deep Dream projektje megpróbálta a feje tetejére állítani azt az elképzelést, hogy a gépek nem tudnak művészetet létrehozni. A keresőóriás kiképezte a számítógépeket a képek manipulálására, hogy bizarr, pszichedelikus műalkotásokat hozzanak létre. A Google által készített képek Deep Dream motor Lehet, hogy nem szépek, de mindenképpen egyediek és vadul kreatívak. A gépi alkotások pszichedelikus színeket, csigákat, furcsa szemeket és meghatározatlan terekben kavargó testetlen állatokat tartalmaznak.

Egyesek azzal érvelhetnek, hogy az nem igazán művészet, ha a gépek csak kombinálják a meglévő képeket, csavarják azokat, és extrém színekbe mártják; A Google mást tenne, és a kódművész Klingemann is.

„Az emberek képtelenek eredeti ötletekre” – magyarázta.

1 nak,-nek 8

Még a híres festmények is tartalmaznak korábbi műalkotások elemeit – jegyezte meg. Picasso 1907-es remekműve Les Demoiselles d’Avignon, például felől van hatása afrikai művészet és előfutárai a kubistáknak, mint Paul Cezanne. Ami azt illeti, a meglévő képeket művészi módon egyesítő kollázsok egy másik jól bevált művészeti forma. Picasso, Andy Warhol, Man Ray és mások különc kollázsaikról ismertek, miért ne állhatnának művészetként a gépekkel készített kollázsok is?

Klingemann már jóval azelőtt szerette volna feszegetni a digitális művészet határait, és látni akarta, hogyan válhatnak a kreatív gépek, mielőtt elkezdte volna rezidenciáját a Google Cultural Institute-ban. Klingemann saját, kevésbé erős gépeit használva elkezdett játszani az Internet Archívumokkal és a Google-lel TensorFlow gépi tanulási szoftver digitális kollázsok készítéséhez.

Megalkotta az Ernst nevű gépi tanulási eszközt, amelyet a szürrealista és kollázsművészről neveztek el Max Ernst. Klingemann azonosított egy sor tárgyat Ernst munkáiból, és azt mondta a számítógépének, hogy készítsen különböző kollázsokat ugyanazokkal az elemekkel. Az eredmények gyakran szürreálisak voltak, néha viccesek, máskor pedig teljesen szörnyűek.

"Az emberek képtelenek eredeti ötletekre."

Klingemann jobban akarta irányítani a gépei által készített kaotikus képeket, ezért új dolgokat kezdett tanítani nekik. Feltette magának a kérdést: "Mi az érdekes az emberek számára?" Klingemann tudta, hogy meg kell tanítania a rendszert arra, hogy mit keressen, és meg kell tanítania, hogyan tekintse meg ezeket az elemeket úgy, mint egy emberi művész.

Az így létrejött műalkotás gyönyörű és teljesen egyedi. Bár Klingemann nyilvánvalóan régi képeket használt fel munkái elkészítéséhez, ezek új kontextusban jelennek meg, és ez minden változást jelent.

Jelenleg a számítógépes kreativitás az érdekes kollázsokra és annak megértésére korlátozódik, hogy mely képek állnak jól egymás mellett. A gépek még nem készítik saját művészetüket, de az őket működtető kódművészek a folyamat során inkább kurátorokká, mint alkotókká válnak.

Meg kell még látni, hogy az ember meddig tudja kiterjeszteni a gépek kreatív elméjét, de mindenképpen lenyűgöző nézni.

Szerkesztői ajánlások

A Google Bard már beszélni tud, de ki tudja-e fojtani a ChatGPT-t?
Most kipróbálhatja a Google Bardját, a ChatGPT riválisát
A Google új Bard AI-ja elég erős lehet ahhoz, hogy a ChatGPT aggodalomra ad okot – és máris megérkezett
Google Meet vagy Zoom? Hamarosan ez nem számít
A Google Japan bizarr új billentyűzete (szó szerint) hibákat is elkaphat