Esta IA es como la búsqueda de imágenes de Google para imágenes imaginarias

Eternidad
gran sueño

En caso de que se lo pregunte, la imagen de arriba es "un intrincado dibujo de la eternidad". Pero no es obra de un artista humano; es la creación de BigSleep, el último ejemplo sorprendente de generativo inteligencia artificial (IA) en acción.

Contenido

  • Cómo funciona BigSleep
  • A.I. generadora de imágenes

Un poco como una versión visual de A.I. generadora de texto modelo GPT-3, BigSleep es capaz de tomar cualquier mensaje de texto y visualizar una imagen que se ajuste a las palabras. Eso podría ser algo esotérico como la eternidad, o podría ser un cuenco de cerezas, o una hermosa casa (la última de ellas). que se puede ver a continuación.) Piense en ello como una búsqueda en Google Imágenes: solo para imágenes que nunca antes existió.

Vídeos recomendados

Cómo funciona BigSleep

"A un alto nivel, BigSleep funciona combinando dos redes neuronales: BigGAN y CLIP". ryan murdock, dijo a Digital Trends el creador de BigSleep, de 23 años, un estudiante de neurociencia cognitiva en la Universidad de Utah.

El primero de ellos, GranGAN, es un sistema creado por Google que capta ruido aleatorio y genera imágenes. BigGAN es una red generativa adversaria: un par de redes neuronales en duelo que llevan a cabo lo que Murdock llama a un “tira y afloja antagónico” entre una red generadora de imágenes y un discriminador red. Con el tiempo, la interacción entre el generador y el discriminador da como resultado mejoras en ambas redes neuronales.

Bonita casa
Una "hermosa casa", según BigSleep. Quiero decir, no está mal.gran sueño

ACORTARMientras tanto, es una red neuronal creada por OpenAI a la que se le ha enseñado a unir imágenes y descripciones. Proporcione texto e imágenes a CLIP, e intentará determinar qué tan bien coinciden y otorgarles una puntuación correspondiente.

Al combinar los dos, Murdock explicó que BigSleep busca en las salidas de BigGAN imágenes que maximicen la puntuación de CLIP. Luego modifica lentamente la entrada de ruido en el generador de BigGAN hasta que CLIP dice que las imágenes producidas coinciden con la descripción. Generar una imagen que coincida con un mensaje lleva unos tres minutos en total.

"BigSleep es importante porque puede generar una amplia variedad de conceptos y objetos bastante bien con una resolución de 512 x 512 píxeles", dijo Murdock. "El trabajo anterior ha producido resultados impresionantes, pero, hasta donde yo sé, gran parte de él se ha restringido a imágenes de menor resolución y objetos más cotidianos".

A.I. generadora de imágenes

BigSleep no es la primera vez que A.I. Se ha utilizado para generar imágenes. Su nombre recuerda sueño profundo, una IA. creado por el ingeniero de Google Alex Mordvintsev que crea imágenes psicodélicas utilizando modelos de clasificación. También se utilizó un sistema basado en GAN para crear el AI. cuadro vendido en subasta en 2018 por la enorme cantidad de $ 432,500. Sin embargo, es sin duda un fascinante paso adelante.

Para probar BigSleep usted mismo, Murdock sugirió consultar su Cuaderno de Google Colab respecto al proyecto. Hay una pequeña curva de aprendizaje que implica el uso de la GUI de Colab y algunos otros pasos, pero es gratis probarlo. Es probable que en las próximas semanas también se abran otras formas de probarlo. Si estás interesado también puedes visitar r/MediaSíntesis, donde los usuarios publican algunas de las mejores imágenes que han generado con el sistema hasta ahora.

Recomendaciones de los editores

  • ¿Puede la IA? ¿Vencer a los ingenieros humanos en el diseño de microchips? Google cree que sí
  • Nueva e inteligente IA. El sistema promete entrenar a tu perro mientras estás fuera de casa.
  • ¿El próximo gran desafío de la IA? Jugar una versión cuántica de Go
  • Prótesis que no requieren práctica: el último avance en biónica
  • AI. Una herramienta de traducción arroja luz sobre el lenguaje secreto de los ratones.

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.