Esta IA é como a pesquisa de imagens do Google para imagens imaginárias

Eternidade
Grande sono

Caso você esteja se perguntando, a imagem acima é “um intrincado desenho da eternidade”. Mas não é o trabalho de um artista humano; é a criação do BigSleep, o mais recente exemplo incrível de capacidade generativa inteligência artificial (IA) em ação.

Conteúdo

  • Como funciona o BigSleep
  • IA geradora de imagens

Um pouco como uma versão visual de IA de geração de texto modelo GPT-3, BigSleep é capaz de pegar qualquer prompt de texto e visualizar uma imagem que se ajuste às palavras. Isso poderia ser algo esotérico como a eternidade, ou poderia ser uma tigela de cerejas, ou uma bela casa (esta última das que pode ser visto abaixo.) Pense nisso como uma pesquisa no Imagens do Google - apenas para fotos que nunca foram existia.

Vídeos recomendados

Como funciona o BigSleep

“Em alto nível, BigSleep funciona combinando duas redes neurais: BigGAN e CLIP,” Ryan Murdock, disse o criador do BigSleep, de 23 anos, um estudante que estuda neurociência cognitiva na Universidade de Utah, ao Digital Trends.

O primeiro deles, BigGAN, é um sistema criado pelo Google que capta ruídos aleatórios e gera imagens. BigGAN é uma rede adversária generativa: um par de redes neurais em duelo que realizam o que Murdock chama um “cabo de guerra adversário” entre uma rede geradora de imagens e um discriminador rede. Com o tempo, a interação entre o gerador e o discriminador resulta em melhorias em ambas as redes neurais.

Linda casa
Uma ‘bela casa’, de acordo com BigSleep. Quero dizer, não está errado.Grande sono

GRAMPOEnquanto isso, é uma rede neural feita pela OpenAI que foi ensinada a combinar imagens e descrições. Forneça texto e imagens ao CLIP e ele tentará descobrir até que ponto eles combinam e atribuir-lhes uma pontuação adequada.

Ao combinar os dois, Murdock explicou que o BigSleep pesquisa nas saídas do BigGAN imagens que maximizam a pontuação do CLIP. Em seguida, ele ajusta lentamente a entrada de ruído no gerador do BigGAN até que o CLIP diga que as imagens produzidas correspondem à descrição. A geração de uma imagem que corresponda a um prompt leva cerca de três minutos no total.

“BigSleep é significativo porque pode gerar bastante bem uma ampla variedade de conceitos e objetos com resolução de 512 x 512 pixels”, disse Murdock. “Trabalho anterior produziu resultados impressionantes, mas, pelo que sei, grande parte dele foi restrito a imagens de baixa resolução e mais objetos cotidianos.”

IA geradora de imagens

BigSleep não é a primeira vez que A.I. foi usado para gerar imagens. Seu nome lembra DeepDream, uma IA criado pelo engenheiro do Google Alex Mordvintsev que cria imagens psicodélicas usando modelos de classificação. Um sistema baseado em GAN também foi usado para criar o IA quadro vendido em leilão em 2018 por enormes $ 432.500. No entanto, é certamente um passo fascinante.

Para experimentar o BigSleep você mesmo, Murdock sugeriu verificar seu Caderno do Google Colab em relação ao projeto. Há uma certa curva de aprendizado envolvendo o uso da GUI do Colab e algumas outras etapas, mas é grátis para dar uma volta. Outras formas de testá-lo provavelmente também serão abertas nas próximas semanas. Se você estiver interessado, você também pode visitar r/MediaSíntese, onde os usuários postam algumas das melhores imagens que geraram com o sistema até agora.

Recomendações dos Editores

  • A IA pode vencer os engenheiros humanos no projeto de microchips? Google pensa assim
  • Nova IA inteligente sistema promete treinar seu cachorro enquanto você estiver fora de casa
  • O próximo grande desafio da IA? Jogando uma versão quântica do Go
  • Próteses que não exigem prática: por dentro da mais recente inovação em biônica
  • IA ferramenta de tradução lança luz sobre a linguagem secreta dos ratos

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.