Meta avslöjade en galen artificiell intelligensmodell som låter användare omvandla sina maskinskrivna beskrivningar till video. Systemet kallas Göra en video och är den senaste i en trend med AI-genererat innehåll på webben.
Systemet accepterar korta beskrivningar som "en robot som surfar på en våg i havet" eller "clownfisk som simmar genom korallrevet" och genererar dynamiskt en kort GIF av beskrivningen. Det finns till och med tre olika stilar av videor att välja mellan: surrealistiskt, realistiskt och stiliserat.
Enligt a Facebook-inlägg av Metas VD, Mark Zuckerberg, att översätta skriven text till video är mycket svårare på grund av hur video kräver rörelse:
Rekommenderade videor
"Det är mycket svårare att generera video än foton, för förutom att korrekt generera varje pixel måste systemet också förutsäga hur de kommer att förändras över tiden. Make-A-Video löser detta genom att lägga till ett lager av oövervakad inlärning som gör det möjligt för systemet att förstå rörelse i den fysiska världen och tillämpa den på traditionell text-till-bild-generering."
Metas AI Research-team skrev en papper beskriver hur systemet fungerar och hur det skiljer sig från nuvarande text-till-bild (T2I) metoder. Till skillnad från andra maskinspråksmodeller använder Metas text-till-video-metod (T2V) inte fördefinierade text-video-par. Till exempel parar den inte "man som går" med en video av en verklig man som går.
Om detta låter mycket som DALL-E, den populära T2I-applikationen, skulle du inte vara långt borta. Andra T2I-applikationer har rullat ut sedan DALL-E blev populärt. TikTok släppte ett filter i augusti kallad AI Greenscreen som genererar målarstilsbilder baserat på orden du skriver.
AI-genererat innehåll har blivit ganska buzzworthy under de senaste åren. Deepfake-teknik, maskininlärningstekniker för att ersätta en persons ansikte med en annan, används till och med av visuella effektstudior för stora budgetprogram som Mandalorian.
I juli rapporterade The Times av misstag om en ukrainsk kvinna mitt under kriget mellan Ryssland och Ukraina. Problemet är hon var inte äkta.
Hotet från AI förmodligen är inte ett verkligt hot, men projekt som DALL-E och Make-A-Video är roliga utforskningar av några av de intressanta möjligheterna.
Redaktörens rekommendationer
- Apples ChatGPT-konkurrent kan automatiskt skriva kod åt dig
- Bing Image Creator ger DALL-E AI-genererade bilder till din webbläsare
- Jag har sett den (avlägsna) framtiden för AI-webbsökning – här är det fantastiskt och där det kämpar
- Bildgenererande AI Dall-E är nu gratis för alla att leka med
- Jag presenterade min löjliga startidé för en robot-VC
Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.