Med chatbots og tekst-til-billede generatorer tager internettet med storm, kan den næste grænse for AI være tekst-til-video-generatorer.
Nvidia har for nylig offentliggjort et forskningspapir kaldet "Højopløsningsvideosyntese med latente diffusionsmodeller" om sine eksperimenter på dets Toronto AI Lab, der beskriver, hvordan det bruger stabil diffusion til at skabe et værktøj, der kan skabe bevægelige kunstresultater fra tekstprompter.
Anbefalede videoer
Teknologivirksomheden fremviste demoer af Latent Diffusion Models (LDM'er), som bruger tekst til at generere videoklip uden store mængder computerbehandling, TechRadar bemærket.
Værktøjet er i stand til at generere levende billeder i GIF-stil, der er cirka 4,7 sekunder lange videoer med en opløsning på 1.280 x 2.048. Det er også i stand til at skabe længere videoer med en lavere opløsning på 512 x 1024, ifølge forskningspapiret.
Efter at have set en demo af teknologien sagde TechRadar, at værktøjet sandsynligvis er ideelt som en tekst-til-GIF-generator på dette tidspunkt. Publikationen bemærkede, at den nemt kunne håndtere simple opfordringer som f.eks
en stormtrooper, der støvsuger på stranden eller bamse spiller elektrisk guitar, high definition, 4K. Alligevel producerede resultatet stadig tilfældige artefakter og udtværinger i GIF'erne, som det er almindeligt på andre regelmæssigt brugte AI-værktøjer som f.eks. Midjourney.Publikationen mener, at længere videoer stadig har brug for lidt mere udvikling, før de rammer bedste sendetid, men føler, at Nvidia vil arbejde hurtigt for at gøre teknologien klar. De kan fungere godt til lagerbiblioteker og lignende formål.
Der er andre virksomheder, der eksperimenterer med AI tekst-til-video-generatorer. Google demonstrerede sin Phenaki-generator, som tillader længere prompter, der producerer 20-sekunders klip. En anden startup kaldet Runway annoncerede sin anden generations videomodel i sidste måned, som også er baseret på Stable Diffusion. Dens demo af prompten den sene eftermiddagssol titter ind gennem vinduet på et loft i New York City viser, hvordan du kan tilføje små bevægelige effekter til stillbilleder.
Brugere kan også drage fordel af tilføjelsen af AI i andre programmer, såsom Adobe Firefly og Adobe Premiere Rush, ifølge TechRadar.
Nogle andre virksomheder, som f.eks Narakeet og Lume5, markedsføre sig som havende tekst-til-video-generatorer. Men mange af disse værktøjer fungerer mere som PowerPoint-præsentationer, sammensætning af tekst, lyd, billeder, og måske nogle allerede producerede videoklip med prompter, i modsætning til at generere en unik arbejde.
Redaktørens anbefalinger
- AI-gennembrud kan komme via biernes hjerner, siger videnskabsmænd
- Nvidia bringer ChatGPT-stil AI til videospil, og jeg er allerede bekymret
- Hvordan generativ AI vil skabe spil med 'bredere, større og dybere verdener'
- Stop med at bruge generative AI-værktøjer såsom ChatGPT, Samsung bestiller personale
- Microsofts nye Designer-app gør generativ AI død simpel
Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.