Por dentro da arte do Coder no Instituto Cultural do Google

Aprendizado de máquina e arte - Google I/O 2016

Uma máquina pode ser criativa? O Google pensa assim e tem uma equipe inteira dedicada a ensinar às máquinas como ver o mundo um pouco mais como nós, humanos emocionais.

Pense nos computadores como se fossem crianças e é simples entender como os programadores podem ensiná-los a aprender. A inteligência artificial é, no início, muito básica e simples. Moderadores humanos instruem os computadores, mostrando-lhes como pensar e, assim, ensinar a si mesmos. Porém, uma vez que os programadores lhes forneçam o básico, eles poderão expandir esse conhecimento rapidamente.

“O que você pode fazer com 7 milhões de artefatos digitais?”

No Instituto Cultural Google em Paris, França, o gigante das pesquisas está a ensinar às máquinas como categorizar 7 milhões de imagens de realizações artísticas humanas ao longo dos séculos. O Instituto ainda possui um site, além de aplicativos para iOS e Android onde você pode pesquisar obras de arte de diferentes museus ao redor do mundo. Para criar seu catálogo de arte, os artistas de código residentes no Instituto tiveram que ensinar computadores a veja imagens da mesma forma que os humanos fariam para criar um arquivo digital preciso de arte ao longo da história humana.

Catalogar a história é muito bom, mas algumas das habilidades que os computadores estão aprendendo com a classificação e arquivamento estão, na verdade, tornando-os mais criativos. Os artistas residentes estão agora a fazer experiências com computadores para criar novas obras de arte utilizando a inteligência da máquina e o catálogo de 7 milhões de imagens que reuniram. Durante o Google I/O 2016, Cirilo Diagne e Mário Klingemann explicaram como eles ensinaram as máquinas a ver a arte como os humanos e como treinaram as máquinas para serem criativas.

Ensinando aos computadores seu ABC

Uma das primeiras coisas que você ensina a uma criança é a linguagem. Na cultura ocidental, isso significa aprender o ABC. Mario Klingemann, um autodenominado artista de código da Alemanha, começou a ensinar máquinas a identificar letras estilizadas de textos antigos para descobrir se ele poderia ensinar um computador a reconhecer milhares de As, Bs, Cs de aparência diferente e assim por diante sobre. Foi um curso intensivo para ensinar às máquinas como categorizar imagens da mesma forma que os humanos fariam.

Embora um computador possa olhar para uma letra B estilizada coberta de vinhas e flores e ver algum tipo de planta, até mesmo uma criança de 5 anos pode identificar imediatamente a imagem como uma letra B - não uma planta. Para ensinar seu computador a reconhecer o ABC, Klingemann alimentou-o com milhares de imagens de letras estilizadas. Ele criou uma interface semelhante ao Tinder, deslizando para a direita ou para a esquerda para informar às suas máquinas se elas adivinharam a letra certa ou errada.

Máquina de letras

Acontece que as máquinas aprendem o ABC muito rapidamente; eles começaram a ver letras em tudo. Assim como os humanos veem rostos nas nuvens e imagens em obras de arte abstratas, seus computadores viam letras em imagens completamente não relacionadas. Klingemann mostrou ao seu computador um desenho ou gravura de um edifício em ruínas e, em vez disso, eles viram a letra B.

Klingemann explicou que quando você treina um computador com apenas um conjunto de imagens, ele passa a ver apenas esse tipo de imagem em tudo. É por isso que suas máquinas viram uma carta em ruínas.

Ensinando computadores a categorizar 7 milhões de imagens

Quando o artista de interação digital Cyril Diagne ingressou no Instituto Cultural, o Google fez uma pergunta bastante assustadora: “O que você pode fazer com 7 milhões de artefatos digitais?”

Diagne ficou impressionado com a pergunta, então ele mapeou cada imagem em um formato gloriosamente massivo. onda senoidal, que você pode ver abaixo. Essa onda acabou se tornando mais tarde uma bela representação de tudo o que o projeto espera realizar com o aprendizado de máquina. A onda senoidal de Diagne é realmente pesquisável, então você pode navegar por um mar de todas as imagens do arquivo digital feito pelo Google Cultural Institute. As imagens são agrupadas em categorias e, do ponto de vista de um pássaro, você vê apenas um mar de pontos. À medida que você avança, você pode ver imagens específicas, todas com um tema comum, sejam cachorrinhos, fazendas ou pessoas.

1 de 3

Você também pode pesquisá-lo e encontrar as imagens desejadas. Se você olhar bem, poderá até encontrar o que Diagne chama de Costa dos Retratos. É onde todas as imagens dos rostos das pessoas estão agrupadas.

Para fazer o mapa pesquisável de cada imagem do arquivo, Diagne e sua equipe tiveram que criar uma categoria para tudo para ensinar à máquina o que era o quê.

Categorizar 7 milhões de artefatos, muitos dos quais podem ter múltiplas categorias, não é tarefa fácil. A equipe teve que pensar em alguns que estivessem fora da área. Não basta apenas categorizar as coisas com base no que são. Eles também tiveram que criar categorias para as emoções que as imagens evocam.

Ensinar emoções humanas às máquinas é um passo importante para torná-las mais criativas.

Dessa forma, você pode procurar uma imagem de “calma” e o computador mostrará imagens que evocam uma sensação de calma, como pôr do sol, lagos serenos e assim por diante. Surpreendentemente, as máquinas aprenderam a identificar as emoções humanas com tal habilidade que podem se colocar no nosso lugar para considerar como uma determinada imagem faria um ser humano se sentir.

Ensinar emoções humanas às máquinas é um passo importante para torná-las mais criativas. Afinal, grande parte da arte moderna consiste em representações visuais de emoções humanas.

Mas pode uma máquina ser criativa?

Criatividade e talento artístico são duas coisas que nós, humanos, gostamos de considerar apenas nossas. Os animais não fazem arte, nem as máquinas… ainda. Projeto Deep Dream do Google tentou virar de cabeça para baixo a noção de que as máquinas não podem criar arte. A gigante das buscas treinou computadores para manipular imagens e criar obras de arte bizarras e psicodélicas. As imagens criadas pelo Google Motor Deep Dream podem não ser bonitos, mas certamente são únicos e extremamente criativos. As criações das máquinas contêm cores psicodélicas, lesmas, olhos estranhos e animais desencarnados girando em espaços indefinidos.

Alguns podem argumentar que não é realmente arte se as máquinas apenas combinam imagens existentes, distorcendo-as e mergulhando-as em cores extremas; O Google discordaria, assim como o artista de código Klingemann.

“Os humanos são incapazes de ter ideias originais”, explicou ele.

1 de 8

Mesmo pinturas famosas contêm elementos de obras de arte anteriores, observou ele. A obra-prima de Picasso de 1907 Les Demoiselles d'Avignon, por exemplo, tem influências de Arte africana e precursores de cubistas como Paulo Cézanne. Aliás, as colagens, que combinam imagens existentes de forma artística, são outra forma de arte bem estabelecida. Picasso, Andy Warhol, Man Ray e outros são conhecidos pelas suas colagens excêntricas, então porque é que as colagens feitas por máquinas não podem também ser consideradas arte?

Klingemann queria ultrapassar os limites da arte digital e ver como as máquinas poderiam ser criativas muito antes de iniciar sua residência no Google Cultural Institute. Usando suas próprias máquinas menos potentes, Klingemann começou a brincar com os Arquivos da Internet e com o Google. TensorFlow software de aprendizado de máquina para fazer colagens digitais.

Ele criou uma ferramenta de aprendizado de máquina chamada Ernst, em homenagem ao surrealista e artista de colagem Max Ernesto. Klingemann identificou uma série de objetos do trabalho de Ernst e disse ao seu computador para fazer diferentes colagens com os mesmos elementos. Os resultados eram muitas vezes surreais, às vezes engraçados e, outras vezes, absolutamente terríveis.

“Os humanos são incapazes de ter ideias originais.”

Klingemann queria mais controle sobre as imagens caóticas que suas máquinas produziam, então começou a ensinar-lhes coisas novas. Ele se perguntou: “O que é interessante para os humanos?” Klingemann sabia que precisava treinar o sistema sobre o que procurar, ensiná-lo a ver todos esses elementos como um artista humano faria.

A arte resultante é linda e totalmente única. Embora Klingemann obviamente tenha usado imagens antigas para criar seu trabalho, elas são exibidas em um novo contexto, e isso faz toda a diferença.

No momento, a criatividade computacional está limitada a colagens interessantes e à compreensão de quais imagens combinam bem. As máquinas ainda não estão fazendo sua própria arte, mas os artistas de código que as alimentam estão se tornando mais curadores do que criadores durante o processo.

Resta saber até que ponto o homem pode expandir as mentes criativas das máquinas, mas é certamente fascinante observar.

Recomendações dos Editores

  • O Google Bard agora pode falar, mas será que pode abafar o ChatGPT?
  • Agora você pode experimentar o Bard do Google, o rival do ChatGPT
  • O novo Bard AI do Google pode ser poderoso o suficiente para preocupar o ChatGPT – e já está aqui
  • Google Meet ou Zoom? Em breve, isso não importará
  • O novo teclado bizarro do Google Japão também pode capturar bugs (literais)