Meta hat DALL-E für Videos gemacht und es ist gruselig und erstaunlich zugleich

Meta hat ein verrücktes Modell der künstlichen Intelligenz vorgestellt, das es Benutzern ermöglicht, ihre eingegebenen Beschreibungen in Videos umzuwandeln. Das System heißt Mach ein Video und ist der neueste Trend zu KI-generierten Inhalten im Web.

Das System akzeptiert kurze Beschreibungen wie „ein Roboter, der auf einer Welle im Meer surft“ oder „Clownfisch, der durch das Korallenriff schwimmt“ und generiert dynamisch ein kurzes GIF der Beschreibung. Es stehen sogar drei verschiedene Videostile zur Auswahl: surreal, realistisch und stilisiert.

Die Pinselmalerei eines Künstlers auf einer Leinwand aus nächster Nähe

Laut a Facebook-Post Laut Mark Zuckerberg, CEO von Meta, ist die Übersetzung von geschriebenem Text in Videos viel schwieriger, da Videos Bewegung erfordern:

Empfohlene Videos

„Es ist viel schwieriger, Videos zu erstellen als Fotos, da das System nicht nur jedes Pixel korrekt generieren muss, sondern auch vorhersagen muss, wie sich diese im Laufe der Zeit verändern werden. Make-A-Video löst dieses Problem, indem es eine Ebene des unbeaufsichtigten Lernens hinzufügt, die es dem System ermöglicht, Bewegungen in der physischen Welt zu verstehen und sie auf die herkömmliche Text-zu-Bild-Generierung anzuwenden.“

Ein junges Paar geht bei starkem Regen spazieren

Das KI-Forschungsteam von Meta hat einen geschrieben Papier Beschreibung der Funktionsweise des Systems und der Unterschiede zu aktuellen Text-to-Image-Methoden (T2I). Im Gegensatz zu anderen Maschinensprachenmodellen verwendet die Text-to-Video-Methode (T2V) von Meta keine vordefinierten Text-Video-Paare. Beispielsweise wird „Gehender Mann“ nicht mit einem Video verknüpft, in dem ein tatsächlich gehender Mann zu sehen ist.

Wenn das sehr nach DALL-E, der beliebten T2I-Anwendung, klingt, sind Sie hier genau richtig. Seit der Popularität von DALL-E wurden weitere T2I-Anwendungen eingeführt. TikTok hat einen Filter veröffentlicht im August namens AI Greenscreen, das Bilder im Malstil basierend auf den von Ihnen eingegebenen Wörtern generiert.

Ein flauschiges Faultierbaby mit einer orangefarbenen Strickmütze, das versucht, einen Laptop zu erkennen, Nahaufnahme eines hochdetaillierten Studiobeleuchtungsbildschirms, der sich in seinem Auge spiegelt

KI-generierte Inhalte haben in den letzten Jahren große Aufmerksamkeit erregt. Deepfake-Technologie, maschinelle Lerntechniken, um das Gesicht einer Person durch ein anderes zu ersetzen, wird sogar von Studios für visuelle Effekte für Shows mit großem Budget wie verwendet Der Mandalorianer.

Im Juli berichtete die Times fälschlicherweise über eine ukrainische Frau inmitten des russisch-ukrainischen Krieges. Das Problem ist sie war nicht real.

Die Bedrohung durch KI wahrscheinlich ist keine wirkliche Bedrohung, aber Projekte wie DALL-E und Make-A-Video sind unterhaltsame Erkundungen einiger der interessanten Möglichkeiten.

Empfehlungen der Redaktion

  • Der ChatGPT-Konkurrent von Apple schreibt möglicherweise automatisch Code für Sie
  • Bing Image Creator bringt von DALL-E AI generierte Bilder in Ihren Browser
  • Ich habe die (ferne) Zukunft der KI-Websuche gesehen – hier ist sie erstaunlich und wo sie schwierig ist
  • Die bildgenerierende KI Dall-E ist jetzt für jedermann zum Spielen kostenlos
  • Ich habe meine lächerliche Startup-Idee einem Roboter-VC vorgestellt

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.