Met chatbots En tekst-naar-afbeelding-generatoren die het internet stormenderhand veroveren, zou de volgende grens van AI tekst-naar-video-generatoren kunnen zijn.
Nvidia heeft onlangs een onderzoekspaper gepubliceerd met de titel “High-Resolution Video Synthesis with Latent Diffusion Models” over zijn experimenten in het Toronto AI Lab waarin wordt beschreven hoe het Stable Diffusion gebruikt om een tool te creëren die bewegende kunstresultaten kan maken op basis van tekstprompts.
Aanbevolen video's
Het technologiebedrijf toonde demo's van de Latent Diffusion Models (LDM's), die tekst gebruiken om videoclips te genereren zonder grote hoeveelheden computerverwerking. TechRadar dat is genoteerd.
De tool kan bewegende beelden in GIF-stijl genereren die bestaan uit video's van ongeveer 4,7 seconden met een resolutie van 1.280 x 2.048. Volgens het onderzoeksartikel is het ook in staat langere video's te maken met een lagere resolutie van 512 x 1024.
Na een demo van de technologie te hebben bekeken, zei TechRadar dat de tool op dit moment waarschijnlijk ideaal is als tekst-naar-GIF-generator. De publicatie merkte op dat het gemakkelijk eenvoudige aanwijzingen kon verwerken, zoals
een stormtrooper die aan het stofzuigen is op het strand of teddybeer speelt de elektrische gitaar, hoge definitie, 4K. Toch produceerde het resultaat nog steeds willekeurige artefacten en vlekken in de GIF's, zoals gebruikelijk is bij andere regelmatig gebruikte AI-tools zoals Halverwege de reis.De publicatie is van mening dat langere video's nog wat meer ontwikkeling nodig hebben voordat ze op prime time verschijnen, maar is van mening dat Nvidia snel zal werken om de technologie gereed te maken. Ze kunnen goed werken voor voorraadbibliotheken en soortgelijke doeleinden.
Er zijn andere bedrijven die experimenteren met AI-tekst-naar-video-generatoren. Google demonstreerde zijn Phenaki-generator, die langere prompts mogelijk maakt die clips van 20 seconden produceren. Een andere startup genaamd Runway kondigde vorige maand zijn tweede generatie videomodel aan, dat ook gebaseerd is op Stable Diffusion. De demo van de prompt de late middagzon die door het raam van een loft in New York City gluurt laat zien hoe u lichte bewegende effecten aan stilstaande beelden kunt toevoegen.
Gebruikers kunnen volgens TechRadar ook profiteren van de toevoeging van AI in andere programma's, zoals Adobe Firefly en Adobe Premiere Rush.
Enkele andere bedrijven, zoals Narakeet en Lume5, brengen zichzelf op de markt met tekst-naar-video-generatoren. Veel van deze tools werken echter meer als PowerPoint-presentaties, waarbij tekst, audio, afbeeldingen, en misschien hebben sommigen al videofragmenten gemaakt met aanwijzingen, in plaats van een uniek exemplaar te genereren werk.
Aanbevelingen van de redactie
- Doorbraken op het gebied van AI zouden via de hersenen van bijen kunnen komen, zeggen wetenschappers
- Nvidia brengt AI in ChatGPT-stijl naar videogames, en ik maak me nu al zorgen
- Hoe generatieve AI games zal creëren met ‘bredere, grotere en diepere werelden’
- Stop met het gebruik van generatieve AI-tools zoals ChatGPT, Samsung-bestellingenpersoneel
- De nieuwe Designer-app van Microsoft maakt generatieve AI doodeenvoudig
Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.