Meta lavede DALL-E til video, og det er både uhyggeligt og fantastisk

Meta afslørede en skør kunstig intelligens-model, der giver brugerne mulighed for at omdanne deres indtastede beskrivelser til video. Systemet kaldes Lav en video og er det seneste i en trend med AI-genereret indhold på nettet.

Systemet accepterer korte beskrivelser som "en robot, der surfer på en bølge i havet" eller "klovnefisk, der svømmer gennem koralrevet" og genererer dynamisk en kort GIF af beskrivelsen. Der er endda tre forskellige stilarter af videoer at vælge imellem: surrealistisk, realistisk og stiliseret.

En kunstners penselmaleri på et lærred tæt på

Ifølge en Facebook opslag af Meta CEO, Mark Zuckerberg, er det meget sværere at oversætte skrevet tekst til video på grund af, hvordan video kræver bevægelse:

Anbefalede videoer

"Det er meget sværere at generere video end billeder, fordi systemet udover at generere hver pixel korrekt skal forudsige, hvordan de vil ændre sig over tid. Make-A-Video løser dette ved at tilføje et lag af uovervåget læring, der gør systemet i stand til at forstå bevægelse i den fysiske verden og anvende det til traditionel tekst-til-billede generering."

Et ungt par går i kraftig regn

Metas AI Research-team skrev en papir beskriver hvordan systemet fungerer, og hvordan det adskiller sig fra nuværende tekst-til-billede (T2I) metoder. I modsætning til andre maskinsprogsmodeller bruger Metas tekst-til-video-metode (T2V) ikke foruddefinerede tekst-video-par. For eksempel parrer det ikke "mand, der går" med en video af en faktisk mand, der går.

Hvis dette lyder meget som DALL-E, den populære T2I-applikation, ville du ikke være langt væk. Andre T2I-applikationer er rullet ud, siden DALL-E vandt popularitet. TikTok har frigivet et filter i august kaldet AI Greenscreen, der genererer maleristilbilleder baseret på de ord, du skriver.

En fluffy baby dovendyr med en orange strikhue, der forsøger at finde ud af en bærbar computer tæt på meget detaljeret studiebelysningsskærm, der reflekterer i øjet

AI-genereret indhold er blevet ret buzzworthy inden for de sidste par år. Deepfake teknologi, maskinlæringsteknikker til at erstatte en persons ansigt med et andet, bruges endda af visuelle effektstudier til store budgetprogrammer som f.eks. Mandalorianeren.

I juli rapporterede The Times fejlagtigt om en ukrainsk kvinde midt i krigen mellem Rusland og Ukraine. Problemet er hun var ikke ægte.

Truslen fra AI sandsynligvis ikke er en reel trussel, men projekter som DALL-E og Make-A-Video er sjove udforskninger af nogle af de interessante muligheder.

Redaktørernes anbefalinger

  • Apples ChatGPT-rival skriver muligvis automatisk kode til dig
  • Bing Image Creator bringer DALL-E AI-genererede billeder til din browser
  • Jeg har set den (fjerne) fremtid for AI-websøgning - her er det fantastisk, og hvor det kæmper
  • Billedgenererende AI Dall-E er nu gratis for alle at lege med
  • Jeg pitchede min latterlige opstartside til en robot-VC

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.