A Meta megalkotta a DALL-E-t videóhoz, és ez egyszerre hátborzongató és lenyűgöző

A Meta bemutatott egy őrült mesterséges intelligencia modellt, amely lehetővé teszi a felhasználók számára, hogy a gépelt leírásaikat videóvá alakítsák. A rendszer ún Csinálj egy videót és az AI által generált tartalom legújabb trendje az interneten.

A rendszer elfogadja az olyan rövid leírásokat, mint „egy robot szörfözik egy hullámon az óceánban” vagy „bohóchal úszik át a korallzátonyon”, és dinamikusan generál egy rövid GIF-et a leírásból. Még három különböző stílusú videók közül is választhatsz: szürreális, valósághű és stilizált.

Egy művész ecsetfestménye vászonra közelről

szerint a Facebook bejegyzés Mark Zuckerberg, a Meta vezérigazgatója szerint az írott szöveget videóvá fordítani sokkal nehezebb, mert a videó mozgást igényel:

Ajánlott videók

„Sokkal nehezebb videót generálni, mint fotókat, mert az egyes pixelek helyes generálásán túl a rendszernek azt is meg kell jósolnia, hogy azok hogyan változnak az idő múlásával. A Make-A-Video ezt úgy oldja meg, hogy hozzáad egy olyan felügyelet nélküli tanulási réteget, amely lehetővé teszi a rendszer számára, hogy megértse a mozgást a fizikai világban, és alkalmazza azt a hagyományos szöveg-kép létrehozására.”

Egy fiatal pár sétál egy heves esőben

A Meta mesterséges intelligenciakutató csapata írt a papír leírja, hogyan működik a rendszer, és miben tér el a jelenlegi szöveg-kép (T2I) módszerektől. Más gépi nyelvi modellekkel ellentétben a Meta Text-to-Video (T2V) metódusa nem használ előre meghatározott szöveg-videó párokat. Például nem párosítja a „sétáló ember” szót egy tényleges ember sétáló videójával.

Ha ez nagyon úgy hangzik, mint a DALL-E, a népszerű T2I alkalmazás, akkor nem lennél messze. A DALL-E népszerűsége óta más T2I alkalmazások is megjelentek. A TikTok kiadott egy szűrőt augusztusban az AI Greenscreen nevet kapta, amely a beírt szavak alapján festészeti stílusú képeket generál.

Egy bolyhos lajhár baba narancssárga kötött sapkával, aki megpróbál kitalálni egy laptopot közelről, nagyon részletes stúdióvilágítási képernyő, amely a szemében tükröződik

A mesterséges intelligencia által generált tartalom az elmúlt néhány évben nagyon felkapott lett. Deepfake technológia, gépi tanulási technikák az ember arcának másikra cserélésére, még a vizuális effektus-stúdiók is használják nagy költségvetésű műsorokhoz, mint pl. A mandalori.

Júliusban a The Times tévedésből beszámolt egy ukrán nőről az orosz-ukrán háború kellős közepén. Az a baj nem volt igazi.

Valószínűleg az AI veszélye nem valós fenyegetés, de az olyan projektek, mint a DALL-E és a Make-A-Video, szórakoztató felfedezések néhány érdekes lehetőség felé.

Szerkesztői ajánlások

  • Az Apple ChatGPT riválisa automatikusan kódot írhat helyetted
  • A Bing Image Creator DALL-E mesterséges intelligencia által generált képeket helyez el a böngészőjébe
  • Láttam a mesterséges intelligencia internetes keresésének (távoli) jövőjét – itt van az, ahol csodálatos, és ahol küzd
  • A képgeneráló AI Dall-E mostantól bárki számára ingyenesen játszható
  • Nevetséges indítási ötletemet egy robot-VC-nek adtam le

Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.