Meta creó DALL-E para video, y es a la vez espeluznante y sorprendente.

Meta presentó un loco modelo de inteligencia artificial que permite a los usuarios convertir sus descripciones escritas en video. El sistema se llama Hacer un vídeo y es lo último en una tendencia de contenido generado por IA en la web.

El sistema acepta descripciones breves como “un robot surfeando una ola en el océano” o “pez payaso nadando a través del arrecife de coral” y genera dinámicamente un GIF corto de la descripción. Incluso hay tres estilos diferentes de vídeos para elegir: surrealista, realista y estilizado.

El pincel de un artista pintando sobre un lienzo de cerca

De acuerdo a un publicación de Facebook Según el CEO de Meta, Mark Zuckerberg, traducir texto escrito a video es mucho más difícil debido a que el video requiere movimiento:

Vídeos recomendados

“Es mucho más difícil generar videos que fotos porque, más allá de generar correctamente cada píxel, el sistema también tiene que predecir cómo cambiarán con el tiempo. Make-A-Video resuelve esto agregando una capa de aprendizaje no supervisado que permite al sistema comprender el movimiento en el mundo físico y aplicarlo a la generación tradicional de texto a imagen".

Una pareja joven caminando bajo una fuerte lluvia

El equipo de investigación de IA de Meta escribió un papel que describe cómo funciona el sistema y en qué se diferencia de los métodos actuales de conversión de texto a imagen (T2I). A diferencia de otros modelos de lenguaje de máquina, el método Texto a vídeo (T2V) de Meta no utiliza pares texto-vídeo predefinidos. Por ejemplo, no combina "hombre caminando" con un vídeo de un hombre real caminando.

Si esto se parece mucho a DALL-E, la popular aplicación T2I, no estaría muy lejos. Se han implementado otras aplicaciones T2I desde que DALL-E ganó popularidad. TikTok lanzó un filtro en agosto llamado AI Greenscreen que genera imágenes de estilo de pintura basadas en las palabras que escribes.

Un bebé perezoso esponjoso con un gorro de punto naranja tratando de descifrar una computadora portátil cerca de una pantalla de iluminación de estudio muy detallada que se refleja en su ojo

El contenido generado por IA se ha vuelto muy comentado en los últimos años. Tecnología falsa, técnica de aprendizaje automático para reemplazar el rostro de una persona por otra, incluso es utilizada por estudios de efectos visuales para programas de gran presupuesto como El mandaloriano.

En julio, The Times informó erróneamente sobre una mujer ucraniana en medio de la guerra entre Rusia y Ucrania. El problema es ella no era real.

La amenaza de la IA probablemente no es una amenaza real, pero proyectos como DALL-E y Make-A-Video son exploraciones divertidas de algunas de las posibilidades interesantes.

Recomendaciones de los editores

  • El rival ChatGPT de Apple puede escribir código automáticamente por usted
  • Bing Image Creator lleva imágenes generadas por DALL-E AI a su navegador
  • He visto el futuro (lejano) de la búsqueda web con IA: aquí es donde es sorprendente y donde tiene problemas
  • La IA Dall-E generadora de imágenes ahora es gratuita para que cualquiera pueda jugar
  • Le presenté mi ridícula idea de inicio a un robot VC

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.