Val vel chatbotok és szöveg-kép generátorok Az internetet viharba véve az AI következő határát a szöveg-videó generátorok jelenthetik.
Az Nvidia a közelmúltban publikált egy kutatási tanulmányt „High-Resolution Video Synthesis with latent Diffusion Models” címmel a kísérleteiről. a torontói mesterségesintelligencia-laboratóriumban bemutatja, hogyan használja a Stable Diffusion-t egy olyan eszköz létrehozására, amely szöveges felszólításokból mozgó művészeti eredményeket tud készíteni.
Ajánlott videók
A technológiai vállalat bemutatta a Latent Diffusion Models (LDM) demóit, amelyek szöveget használnak videoklipek generálására nagy mennyiségű számítógépes feldolgozás nélkül. TechRadar neves.
Az eszköz képes GIF-stílusú mozgóképeket generálni, amelyek körülbelül 4,7 másodperces videók 1280 x 2048-as felbontásban. A kutatás szerint hosszabb videók készítésére is alkalmas, alacsonyabb, 512 x 1024-es felbontásban.
A technológia bemutatójának megtekintése után a TechRadar azt mondta, hogy az eszköz jelenleg ideális szöveg-GIF-generátorként. A kiadvány megjegyezte, hogy könnyen kezeli az olyan egyszerű felszólításokat, mint pl
a parton porszívózó rohamosztagos vagy mackó elektromos gitáron játszik, nagy felbontásban, 4K. Ennek ellenére az eredmény továbbra is véletlenszerű műtermékeket és szennyeződéseket eredményezett a GIF-ekben, ahogy az más, rendszeresen használt mesterséges intelligencia-eszközökön is előfordul, mint pl. Midjourney.A kiadvány úgy véli, hogy a hosszabb videókat még tovább kell fejleszteni, mielőtt a főműsoridőben megjelennének, de úgy érzi, az Nvidia gyorsan fog dolgozni a technológia előkészítésén. Jól működhetnek állományi könyvtárakban és hasonló célokra.
Más cégek is kísérleteznek AI szöveg-videó generátorokkal. A Google bemutatta Phanaki generátorát, amely hosszabb promptokat tesz lehetővé, amelyek 20 másodperces klipeket készítenek. A Runway nevű másik startup a múlt hónapban jelentette be második generációs videómodelljét, amely szintén a Stable Diffusion-ra épül. A prompt bemutatója a késő délutáni nap egy New York-i loft ablakán bekukucskál bemutatja, hogyan adhat enyhe mozgó hatásokat az állóképekhez.
A TechRadar szerint a felhasználók is profitálhatnak abból, ha más programokban – például az Adobe Firefly-ben és az Adobe Premiere Rush-ban – hozzáadják az AI-t.
Néhány más cég, mint pl Narakeet és Lume5, úgy hirdetik magukat, mint akiknek szöveg-videó generátorai vannak. Azonban ezen eszközök közül sok inkább PowerPoint prezentációként működik, szöveget, hangot, képeket, és talán néhány már készített videó klipet promptokkal, szemben az egyedi generálással munka.
Szerkesztői ajánlások
- A mesterséges intelligencia áttörései a méhek agyán keresztül jöhetnek létre a tudósok szerint
- Az Nvidia a ChatGPT-stílusú AI-t hozza a videojátékokba, és már most aggódom
- Hogyan hoz létre a generatív AI játékokat „tágabb, nagyobb és mélyebb világokkal”
- Ne használjon generatív mesterséges intelligencia eszközöket, például a ChatGPT-t, a Samsung megrendelői személyzetet
- A Microsoft új Designer alkalmazása végtelenül egyszerűvé teszi a generatív AI-t
Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.