Készülj fel: hamarosan megjelenhetnek a mesterséges intelligencia által generált GIF-ek

Val vel chatbotok és szöveg-kép generátorok Az internetet viharba véve az AI következő határát a szöveg-videó generátorok jelenthetik.

Az Nvidia a közelmúltban publikált egy kutatási tanulmányt „High-Resolution Video Synthesis with latent Diffusion Models” címmel a kísérleteiről. a torontói mesterségesintelligencia-laboratóriumban bemutatja, hogyan használja a Stable Diffusion-t egy olyan eszköz létrehozására, amely szöveges felszólításokból mozgó művészeti eredményeket tud készíteni.

Ajánlott videók

A technológiai vállalat bemutatta a Latent Diffusion Models (LDM) demóit, amelyek szöveget használnak videoklipek generálására nagy mennyiségű számítógépes feldolgozás nélkül. TechRadar neves.

Az eszköz képes GIF-stílusú mozgóképeket generálni, amelyek körülbelül 4,7 másodperces videók 1280 x 2048-as felbontásban. A kutatás szerint hosszabb videók készítésére is alkalmas, alacsonyabb, 512 x 1024-es felbontásban.

A technológia bemutatójának megtekintése után a TechRadar azt mondta, hogy az eszköz jelenleg ideális szöveg-GIF-generátorként. A kiadvány megjegyezte, hogy könnyen kezeli az olyan egyszerű felszólításokat, mint pl

a parton porszívózó rohamosztagos vagy mackó elektromos gitáron játszik, nagy felbontásban, 4K. Ennek ellenére az eredmény továbbra is véletlenszerű műtermékeket és szennyeződéseket eredményezett a GIF-ekben, ahogy az más, rendszeresen használt mesterséges intelligencia-eszközökön is előfordul, mint pl. Midjourney.

A kiadvány úgy véli, hogy a hosszabb videókat még tovább kell fejleszteni, mielőtt a főműsoridőben megjelennének, de úgy érzi, az Nvidia gyorsan fog dolgozni a technológia előkészítésén. Jól működhetnek állományi könyvtárakban és hasonló célokra.

Más cégek is kísérleteznek AI szöveg-videó generátorokkal. A Google bemutatta Phanaki generátorát, amely hosszabb promptokat tesz lehetővé, amelyek 20 másodperces klipeket készítenek. A Runway nevű másik startup a múlt hónapban jelentette be második generációs videómodelljét, amely szintén a Stable Diffusion-ra épül. A prompt bemutatója a késő délutáni nap egy New York-i loft ablakán bekukucskál bemutatja, hogyan adhat enyhe mozgó hatásokat az állóképekhez.

A TechRadar szerint a felhasználók is profitálhatnak abból, ha más programokban – például az Adobe Firefly-ben és az Adobe Premiere Rush-ban – hozzáadják az AI-t.

Néhány más cég, mint pl Narakeet és Lume5, úgy hirdetik magukat, mint akiknek szöveg-videó generátorai vannak. Azonban ezen eszközök közül sok inkább PowerPoint prezentációként működik, szöveget, hangot, képeket, és talán néhány már készített videó klipet promptokkal, szemben az egyedi generálással munka.

Szerkesztői ajánlások

  • A mesterséges intelligencia áttörései a méhek agyán keresztül jöhetnek létre a tudósok szerint
  • Az Nvidia a ChatGPT-stílusú AI-t hozza a videojátékokba, és már most aggódom
  • Hogyan hoz létre a generatív AI játékokat „tágabb, nagyobb és mélyebb világokkal”
  • Ne használjon generatív mesterséges intelligencia eszközöket, például a ChatGPT-t, a Samsung megrendelői személyzetet
  • A Microsoft új Designer alkalmazása végtelenül egyszerűvé teszi a generatív AI-t

Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.