Inside The Coder Art På Googles Cultural Institute

Maskininlärning och konst – Google I/O 2016

Kan en maskin vara kreativ? Google tycker det, och det har ett helt team dedikerat till att lära maskiner hur man ser på världen lite mer som oss känslomänniskor.

Tänk på datorer som om de vore barn och det är enkelt att förstå hur kodare kan lära dem att lära sig. Artificiell intelligens är till en början väldigt grundläggande och enkel. Mänskliga moderatorer instruerar datorer, visar dem hur de ska tänka och på så sätt lära sig själva. Men när kodarna ger dem grunderna kan de utöka den kunskapen snabbt.

"Vad kan du göra med 7 miljoner digitala artefakter?"

Vid Google Cultural Institute i Paris, Frankrike, lär sökjätten maskiner hur man kategoriserar 7 miljoner bilder av mänskliga konstnärliga prestationer genom århundradena. Institutet har till och med en webbplats, samt appar för iOS och Android där du kan söka bland konstverk från olika museer runt om i världen. För att skapa sin konstkatalog var kodkonstnärerna i residens vid institutet tvungna att lära datorer att se bilder på det sätt som människor skulle göra för att skapa ett korrekt digitalt arkiv av konst genom mänsklighetens historia.

Att katalogisera historia är bra, men några av de färdigheter som datorer lär sig genom att sortera och arkivera gör dem faktiskt mer kreativa. Konstnärerna i residenset experimenterar nu med datorer för att skapa nya konstverk med hjälp av maskinintelligens och katalogen med 7 miljoner bilder som de har satt ihop. Under Google I/O 2016, Cyril Diagne och Mario Klingemann förklarade hur de har lärt maskiner att se konst som människor och hur de har tränat maskiner att vara kreativa.

Lär datorer deras ABC

En av de första sakerna man lär ett barn är språk. I västerländsk kultur betyder det att man lär sig sina ABC. Mario Klingemann, en självskriven kodkonstnär från Tyskland, började lära maskiner att identifiera stiliserade bokstäver från gamla texter för att ta reda på om han kunde lära en dator att känna igen tusentals olika As, Bs, Cs och så på. Det var en snabbkurs i att lära maskiner hur man kategoriserar bilder på det sätt som människor skulle göra.

Medan en dator kan titta på en stiliserad bokstav B täckt av vinstockar och blommor och se en växt av något slag, kan även ett 5-årigt barn omedelbart identifiera bilden som en bokstav B - inte en växt. För att lära sin dator att känna igen dess ABC, matade Klingemann den med tusentals bilder av stiliserade bokstäver. Han skapade ett Tinder-liknande gränssnitt för att svepa åt höger eller vänster för att tala om för sina maskiner om de gissade bokstaven rätt eller fel.

Det visar sig att maskiner lär sig sina ABC ganska snabbt; de började se bokstäver i allt. Precis som människor ser ansikten i moln och bilder i abstrakta konstverk, såg hans datorer bokstäver i helt orelaterade bilder. Klingemann visade sin dator en ritning eller etsning av en förstörd byggnad och de såg en bokstav B istället.

Klingemann förklarade att när du tränar en dator med bara en uppsättning bilder, börjar den bara se den typen av bilder i allt. Det var därför hans maskiner såg ett brev i en ruin.

Lär datorer att kategorisera 7 miljoner bilder

När Digital Interaction Artist Cyril Diagne gick med i Cultural Institute ställde Google en ganska skrämmande fråga till honom: "Vad kan du göra med 7 miljoner digitala artefakter?"

Diagne blev överväldigad av frågan, så han kartlade varje bild i en strålande massiv sinusvåg, som du kan se nedan. Den vågen slutade senare med att bli en vacker representation av allt projektet hoppas kunna åstadkomma med maskininlärning. Diagnes sinusvåg är faktiskt sökbar, så du kan surfa på ett hav av alla bilder i det digitala arkivet som gjorts av Google Cultural Institute. Bilder är grupperade i kategorier, och från fågelperspektiv ser du bara ett hav av prickar. När du flyttar in kan du se specifika bilder, alla med ett gemensamt tema, oavsett om det är valpar, gårdar eller människor.

1 av 3

Du kan också söka igenom den och hitta de bilder du vill ha. Om du tittar tillräckligt hårt kan du till och med stöta på det som Diagne kallar porträttens strand. Det är där alla bilder av människors ansikten är samlade.

För att göra den sökbara kartan över varje bild i arkivet var Diagne och hans team tvungna att skapa en kategori för allt för att lära maskinen vad som var vad.

Att kategorisera 7 miljoner artefakter, varav många kan ha flera kategorier, är ingen lätt uppgift. Laget fick komma på några som var utanför ramarna. Det räcker inte att bara kategorisera saker utifrån vad de är. De fick också skapa kategorier för de känslor som bilder väcker.

Att lära maskiner mänskliga känslor är ett viktigt steg mot att göra dem mer kreativa.

På så sätt kan du söka efter en bild av "lugn", och datorn kommer att visa dig bilder som framkallar en känsla av lugn, som solnedgångar, fridfulla sjöar och så vidare. Otroligt nog lärde sig maskinerna hur man identifierar mänskliga känslor med sådan skicklighet att de kan sätta sig i våra skor för att överväga hur en viss bild skulle få en människa att kännas.

Att lära maskiner mänskliga känslor är ett viktigt steg mot att göra dem mer kreativa. När allt kommer omkring är mycket av modern konst visuella representationer av mänskliga känslor.

Men kan en maskin vara kreativ?

Kreativitet och konstnärskap är två saker som vi människor gärna tänker på som enbart våra. Djur gör inte konst, inte heller maskiner … än. Googles Deep Dream-projekt försökte vända tanken att maskiner inte kan skapa konst på huvudet. Sökjätten tränade datorer att manipulera bilder för att skapa bisarra, psykedeliska konstverk. Bilderna skapade av Googles Deep Dream-motor kanske inte är vackra, men de är verkligen unika och väldigt kreativa. Maskinskapelser innehåller psykedeliska färger, sniglar, konstiga ögon och kroppslösa djur som virvlar i odefinierade utrymmen.

Vissa kanske hävdar att det egentligen inte är konst om maskiner bara kombinerar befintliga bilder, vrider dem och doppar dem i extrema färger; Google skulle tigga att skilja sig, och det skulle även kodkonstnären Klingemann.

"Människor är oförmögna till ursprungliga idéer," förklarade han.

1 av 8

Även berömda målningar innehåller inslag av tidigare konstverk, noterade han. Picassos mästerverk från 1907 Les Demoiselles d'Avignon, har exempelvis influenser från Afrikansk konst och föregångare till kubister som Paul Cezanne. För den delen är collage, som kombinerar befintliga bilder på ett konstnärligt sätt, en annan väletablerad konstform. Picasso, Andy Warhol, Man Ray och fler är kända för sina excentriska collage, så varför kan inte collage gjorda av maskiner också stå som konst?

Klingemann ville tänja på gränserna för digital konst och se hur kreativa maskiner kunde bli långt innan han började sitt residens på Google Cultural Institute. Med sina egna mindre kraftfulla maskiner började Klingemann leka med Internet Archives och Googles TensorFlow maskininlärningsprogram för att göra digitala collage.

Han skapade ett maskininlärningsverktyg kallat Ernst, uppkallat efter surrealisten och collagekonstnären Max Ernst. Klingemann identifierade en serie föremål från Ernsts arbete och sa till sin dator att göra olika collage med samma element. Resultaten var ofta overkliga, ibland roliga och ibland helt fruktansvärda.

"Människor är oförmögna till ursprungliga idéer."

Klingemann ville ha mer kontroll över de kaotiska bilder som hans maskiner producerade, så han började lära dem nya saker. Han frågade sig själv: "Vad är intressant för människor?" Klingemann visste att han var tvungen att träna systemet vad det skulle leta efter, för att lära det hur det skulle se alla dessa element som en mänsklig konstnär skulle göra.

Det resulterande konstverket är underbart och helt unikt. Även om Klingemann uppenbarligen använde gamla bilder för att skapa sitt verk, visas de i ett nytt sammanhang, och det gör hela skillnaden.

Just nu är datorkreativiteten begränsad till intressanta collage och förståelse för vilka bilder som passar bra ihop. Maskiner gör inte sin egen konst ännu, men kodkonstnärerna som driver dem blir mer curator än skapare under processen.

Det återstår att se hur långt människan kan expandera maskinernas kreativa sinnen, men det är verkligen fascinerande att se.

Redaktörens rekommendationer

Google Bard kan nu tala, men kan det överrösta ChatGPT?
Du kan nu prova Googles Bard, konkurrenten till ChatGPT
Googles nya Bard AI kan vara tillräckligt kraftfull för att få ChatGPT att oroa sig – och den är redan här
Google Meet eller Zoom? Snart spelar det ingen roll
Google Japans bisarra nya tangentbord kan också fånga (bokstavliga) buggar