Prepárese: los GIF generados por IA podrían llegar pronto

Con chatbots y generadores de texto a imagen Tomando Internet por asalto, la próxima frontera de la IA podrían ser los generadores de texto a video.

Nvidia publicó recientemente un artículo de investigación titulado "Síntesis de vídeo de alta resolución con modelos de difusión latente" sobre sus experimentos. en su Laboratorio de IA de Toronto que detalla cómo utiliza Stable Diffusion para crear una herramienta que puede generar arte en movimiento a partir de indicaciones de texto.

Vídeos recomendados

La empresa de tecnología mostró demostraciones de los modelos de difusión latente (LDM), que utilizan texto para generar videoclips sin grandes cantidades de procesamiento informático. TecnologíaRadar anotado.

La herramienta es capaz de generar imágenes en movimiento estilo GIF que son videos de aproximadamente 4,7 segundos de duración con una resolución de 1280 x 2048. También es capaz de crear vídeos más largos con una resolución más baja de 512 x 1024, según el artículo de investigación.

Después de ver una demostración de la tecnología, TechRadar dijo que la herramienta probablemente sea ideal como generador de texto a GIF en este momento. La publicación señaló que podría manejar fácilmente indicaciones simples como

un soldado de asalto pasando la aspiradora en la playa o osito de peluche toca la guitarra eléctrica, alta definición, 4k. Aun así, el resultado aún produjo artefactos aleatorios y manchas en los GIF, como son comunes en otras herramientas de inteligencia artificial utilizadas habitualmente, como A mitad del viaje.

La publicación cree que los vídeos más largos aún necesitan un poco más de desarrollo antes de que lleguen al horario de máxima audiencia, pero cree que Nvidia trabajará rápidamente para preparar la tecnología. Podrían funcionar bien para bibliotecas de valores y propósitos similares.

Hay otras empresas que están experimentando con generadores de texto a vídeo con IA. Google hizo una demostración de su generador Phenaki, que permite mensajes más largos que producen clips de 20 segundos. Otra startup llamada Runway anunció el mes pasado su modelo de vídeo de segunda generación, que también se basa en Stable Diffusion. Su demostración del aviso. El sol de la tarde asomándose por la ventana de un loft de la ciudad de Nueva York. muestra cómo agregar ligeros efectos de movimiento a imágenes fijas.

Los usuarios también se beneficiarán de la incorporación de IA en otros programas, como Adobe Firefly y Adobe Premiere Rush, según TechRadar.

Algunas otras empresas, como Narakeet y Lume5, se promocionan como generadores de texto a video. Sin embargo, muchas de estas herramientas funcionan más como presentaciones de PowerPoint, reuniendo texto, audio, imágenes y tal vez algunos clips de vídeo ya producidos con indicaciones, en lugar de generar una imagen única. trabajar.

Recomendaciones de los editores

  • Los avances en IA podrían llegar a través del cerebro de las abejas, dicen los científicos
  • Nvidia está llevando la IA estilo ChatGPT a los videojuegos y ya estoy preocupado
  • Cómo la IA generativa creará juegos con “mundos más amplios, más grandes y más profundos”
  • Deje de usar herramientas de inteligencia artificial generativa como ChatGPT, Samsung ordena al personal
  • La nueva aplicación Designer de Microsoft simplifica la IA generativa

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.