z chatboti in generatorji besedila v sliko ki prevzame internet, bi lahko bila naslednja meja AI generatorji besedila v video.
Nvidia je nedavno objavila raziskovalni članek z naslovom »High-Resolution Video Synthesis with Latent Diffusion Models« o svojih poskusih v laboratoriju za umetno inteligenco v Torontu, ki podrobno opisuje, kako uporablja stabilno difuzijo za ustvarjanje orodja, ki lahko iz besedilnih pozivov ustvari rezultate premikajoče se umetnosti.
Priporočeni videoposnetki
Tehnološko podjetje je predstavilo predstavitve modelov latentne difuzije (LDM), ki uporabljajo besedilo za ustvarjanje video posnetkov brez velike količine računalniške obdelave, TechRadar opozoriti.
Orodje lahko ustvari gibljive slike v slogu GIF, ki so približno 4,7 sekunde dolgi videoposnetki v ločljivosti 1280 x 2048. Prav tako je sposoben ustvarjati daljše videoposnetke pri nižji ločljivosti 512 x 1024, glede na raziskovalni dokument.
Po ogledu predstavitve tehnologije je TechRadar dejal, da je orodje na tej točki verjetno idealno kot generator besedila v GIF. Publikacija je zapisala, da lahko zlahka obravnava preproste pozive, kot je npr
stormtrooper, ki sesa na plaži oz medvedek igra električno kitaro, visoka ločljivost, 4K. Kljub temu je rezultat še vedno povzročil naključne artefakte in madeže v GIF-ih, kot je običajno pri drugih orodjih AI, ki se redno uporabljajo, kot je npr. Midjourney.Publikacija verjame, da je daljši videoposnetek še vedno potreben malo več razvoja, preden dosežejo najboljšo uvrstitev, vendar meni, da bo Nvidia hitro pripravila tehnologijo. Lahko se dobro obnesejo za knjižnice zalog in podobne namene.
Obstajajo tudi druga podjetja, ki eksperimentirajo z AI generatorji besedila v video. Google je predstavil svoj generator Phenaki, ki omogoča daljše pozive, ki ustvarjajo 20-sekundne posnetke. Drugo zagonsko podjetje, imenovano Runway, je prejšnji mesec objavilo svojo drugo generacijo video modela, ki prav tako temelji na Stable Diffusion. Njegov demo poziva pozno popoldansko sonce, ki kuka skozi okno podstrešja v New Yorku prikazuje, kako lahko fotografijam dodate rahle gibljive učinke.
Uporabniki imajo prav tako koristi od dodajanja AI v drugih programih, kot sta Adobe Firefly in Adobe Premiere Rush, glede na TechRadar.
Nekatera druga podjetja, kot npr Narakeet in Lume5, se tržijo kot generatorji besedila v video. Vendar mnoga od teh orodij delujejo bolj kot PowerPointove predstavitve, saj sestavljajo besedilo, zvok, slike in morda nekaj že ustvarjenih videoposnetkov s pozivi, v nasprotju z ustvarjanjem edinstvenega delo.
Priporočila urednikov
- Preboji umetne inteligence bi lahko prišli prek možganov čebel, pravijo znanstveniki
- Nvidia prinaša AI v slogu ChatGPT v video igre in že sem zaskrbljen
- Kako bo generativni AI ustvaril igre s "širšimi, večjimi in globljimi svetovi"
- Nehajte uporabljati orodja generativne umetne inteligence, kot je ChatGPT, Samsung naroča osebje
- Microsoftova nova aplikacija Designer naredi generativno umetno inteligenco povsem preprosto
Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.