Med chatbots och text-till-bild-generatorer tar internet med storm, kan nästa gräns för AI vara text-till-video-generatorer.
Nvidia publicerade nyligen en forskningsartikel som heter "High-Resolution Video Synthesis with Latent Diffusion Models" om sina experiment på Toronto AI Lab som beskriver hur den använder Stable Diffusion för att skapa ett verktyg som kan skapa rörliga konstresultat från textuppmaningar.
Rekommenderade videor
Teknikföretaget visade upp demos av Latent Diffusion Models (LDMs), som använder text för att generera videoklipp utan stora mängder datorbearbetning, TechRadar noterade.
Verktyget kan generera rörliga bilder i GIF-stil som är cirka 4,7 sekunder långa videor med en upplösning på 1 280 x 2 048. Det är också kapabelt att skapa längre videor med en lägre upplösning på 512 x 1024, enligt forskningsrapporten.
Efter att ha sett en demo av tekniken sa TechRadar att verktyget troligen är idealiskt som en text-till-GIF-generator vid denna tidpunkt. Publikationen noterade att den lätt kunde hantera enkla uppmaningar som t.ex
en stormtrooper dammsuger på stranden eller nallebjörnen spelar elgitarr, högupplöst, 4K. Trots det producerade resultatet fortfarande slumpmässiga artefakter och fläckar i GIF: erna, vilket är vanligt på andra regelbundet använda AI-verktyg som t.ex. Midjourney.Publikationen tror att längre videor fortfarande behöver lite mer utveckling innan de når bästa sändningstid, men anser att Nvidia kommer att arbeta snabbt för att få tekniken klar. De kan fungera bra för lagerbibliotek och liknande ändamål.
Det finns andra företag som experimenterar med AI-text-till-video-generatorer. Google demonstrerade sin Phenaki-generator, som tillåter längre uppmaningar som producerar 20-sekunders klipp. En annan startup som heter Runway tillkännagav sin andra generationens videomodell förra månaden, som också är baserad på Stable Diffusion. Dess demo av prompten den sena eftermiddagssolen tittade genom fönstret på ett loft i New York City visar hur du kan lägga till små rörliga effekter till stillbilder.
Användare kan också dra nytta av tillägget av AI i andra program, som Adobe Firefly och Adobe Premiere Rush, enligt TechRadar.
Vissa andra företag, som t.ex Narakeet och Lume5, marknadsföra sig som att ha text-till-video-generatorer. Men många av dessa verktyg fungerar mer som PowerPoint-presentationer, att sätta ihop text, ljud, bilder, och kanske några redan producerade videoklipp med uppmaningar, i motsats till att skapa en unik arbete.
Redaktörens rekommendationer
- AI-genombrott kan komma via binas hjärnor, säger forskare
- Nvidia tar med ChatGPT-stil AI till videospel, och jag är redan orolig
- Hur generativ AI kommer att skapa spel med "bredare, större och djupare världar"
- Sluta använda generativa AI-verktyg som ChatGPT, Samsung beställer personal
- Microsofts nya Designer-app gör generativ AI helt enkel
Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.