Meta a créé DALL-E pour la vidéo, et c'est à la fois effrayant et incroyable

Meta a dévoilé un modèle d'intelligence artificielle fou qui permet aux utilisateurs de transformer leurs descriptions saisies en vidéo. Le système s'appelle Faire une vidéo et constitue la dernière tendance en matière de contenu généré par l'IA sur le Web.

Le système accepte de courtes descriptions comme « un robot surfant sur une vague dans l'océan » ou « un poisson clown nageant à travers le récif de corail » et génère dynamiquement un court GIF de la description. Il existe même trois styles de vidéos différents parmi lesquels choisir: surréaliste, réaliste et stylisée.

Peinture au pinceau d'un artiste sur une toile en gros plan

Selon un Publication Facebook Selon Mark Zuckerberg, PDG de Meta, traduire un texte écrit en vidéo est beaucoup plus difficile en raison de la façon dont la vidéo nécessite du mouvement :

Vidéos recommandées

« Il est beaucoup plus difficile de générer une vidéo que des photos car, au-delà de la génération correcte de chaque pixel, le système doit également prédire leur évolution au fil du temps. Make-A-Video résout ce problème en ajoutant une couche d'apprentissage non supervisé qui permet au système de comprendre le mouvement dans le monde physique et de l'appliquer à la génération traditionnelle de texte en image.

Un jeune couple marchant sous une forte pluie

L’équipe de recherche sur l’IA de Meta a rédigé un papier décrivant le fonctionnement du système et en quoi il diffère des méthodes actuelles de conversion texte-image (T2I). Contrairement à d’autres modèles de langage machine, la méthode Text-to-Video (T2V) de Meta n’utilise pas de paires texte-vidéo prédéfinies. Par exemple, il n’associe pas « un homme qui marche » à une vidéo d’un véritable homme qui marche.

Si cela ressemble beaucoup à DALL-E, la populaire application T2I, vous n’en seriez pas loin. D'autres applications T2I ont été déployées depuis que DALL-E a gagné en popularité. TikTok a publié un filtre en août, appelé AI Greenscreen qui génère des images de style peinture en fonction des mots que vous tapez.

Un bébé paresseux moelleux avec un bonnet tricoté orange essayant de comprendre un ordinateur portable en gros plan sur un écran d'éclairage de studio très détaillé se reflétant dans ses yeux

Le contenu généré par l’IA est devenu très intéressant au cours des dernières années. Technologie de contrefaçon profonde, techniques d’apprentissage automatique permettant de remplacer le visage d’une personne par un autre, est même utilisée par les studios d’effets visuels pour des émissions à gros budget comme Le Mandalorien.

En juillet, le Times a fait un reportage erroné sur une Ukrainienne en pleine guerre entre la Russie et l’Ukraine. Le problème est elle n'était pas réelle.

La menace de l’IA probablement n'est pas une réelle menace, mais des projets comme DALL-E et Make-A-Video sont des explorations amusantes de certaines des possibilités intéressantes.

Recommandations des rédacteurs

  • Le rival ChatGPT d'Apple peut écrire automatiquement du code pour vous
  • Bing Image Creator apporte les images générées par DALL-E AI à votre navigateur
  • J'ai vu l'avenir (lointain) de la recherche Web par l'IA: voici où elle est incroyable et où elle peine
  • L'IA génératrice d'images Dall-E est désormais gratuite pour tous
  • J'ai présenté mon idée de startup ridicule à un robot VC

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.