Gör dig redo: AI-genererade GIF-filer kan komma snart

Med chatbots och text-till-bild-generatorer tar internet med storm, kan nästa gräns för AI vara text-till-video-generatorer.

Nvidia publicerade nyligen en forskningsartikel som heter "High-Resolution Video Synthesis with Latent Diffusion Models" om sina experiment på Toronto AI Lab som beskriver hur den använder Stable Diffusion för att skapa ett verktyg som kan skapa rörliga konstresultat från textuppmaningar.

Rekommenderade videor

Teknikföretaget visade upp demos av Latent Diffusion Models (LDMs), som använder text för att generera videoklipp utan stora mängder datorbearbetning, TechRadar noterade.

Verktyget kan generera rörliga bilder i GIF-stil som är cirka 4,7 sekunder långa videor med en upplösning på 1 280 x 2 048. Det är också kapabelt att skapa längre videor med en lägre upplösning på 512 x 1024, enligt forskningsrapporten.

Efter att ha sett en demo av tekniken sa TechRadar att verktyget troligen är idealiskt som en text-till-GIF-generator vid denna tidpunkt. Publikationen noterade att den lätt kunde hantera enkla uppmaningar som t.ex

en stormtrooper dammsuger på stranden eller nallebjörnen spelar elgitarr, högupplöst, 4K. Trots det producerade resultatet fortfarande slumpmässiga artefakter och fläckar i GIF: erna, vilket är vanligt på andra regelbundet använda AI-verktyg som t.ex. Midjourney.

Publikationen tror att längre videor fortfarande behöver lite mer utveckling innan de når bästa sändningstid, men anser att Nvidia kommer att arbeta snabbt för att få tekniken klar. De kan fungera bra för lagerbibliotek och liknande ändamål.

Det finns andra företag som experimenterar med AI-text-till-video-generatorer. Google demonstrerade sin Phenaki-generator, som tillåter längre uppmaningar som producerar 20-sekunders klipp. En annan startup som heter Runway tillkännagav sin andra generationens videomodell förra månaden, som också är baserad på Stable Diffusion. Dess demo av prompten den sena eftermiddagssolen tittade genom fönstret på ett loft i New York City visar hur du kan lägga till små rörliga effekter till stillbilder.

Användare kan också dra nytta av tillägget av AI i andra program, som Adobe Firefly och Adobe Premiere Rush, enligt TechRadar.

Vissa andra företag, som t.ex Narakeet och Lume5, marknadsföra sig som att ha text-till-video-generatorer. Men många av dessa verktyg fungerar mer som PowerPoint-presentationer, att sätta ihop text, ljud, bilder, och kanske några redan producerade videoklipp med uppmaningar, i motsats till att skapa en unik arbete.

Redaktörens rekommendationer

AI-genombrott kan komma via binas hjärnor, säger forskare
Nvidia tar med ChatGPT-stil AI till videospel, och jag är redan orolig
Hur generativ AI kommer att skapa spel med "bredare, större och djupare världar"
Sluta använda generativa AI-verktyg som ChatGPT, Samsung beställer personal
Microsofts nya Designer-app gör generativ AI helt enkel

Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.

Gör dig redo: AI-genererade GIF-filer kan komma snart

Redaktörens rekommendationer

Kategorier

Nyligen

FitStar uppdaterar träningspass i Jane Fonda-stil för appåldern med NFL-superstjärnan Tony Gonzalez

Detta nya Photoshop-verktyg kan ge AI-magi till dina bilder

OpenAI hotar med stämning av student GPT-4-projekt