Meta je naredila DALL-E za video in je hkrati grozljiv in neverjeten

click fraud protection

Meta je predstavila nor model umetne inteligence, ki uporabnikom omogoča, da svoje vtipkane opise spremenijo v video. Sistem se imenuje Make-A-Video in je najnovejši v trendu vsebin, ustvarjenih z umetno inteligenco, na spletu.

Sistem sprejme kratke opise, kot je "robot, ki deska na valovih v oceanu" ali "riba klovn, ki plava skozi koralni greben", in dinamično ustvari kratek GIF opisa. Na izbiro so celo trije različni slogi videoposnetkov: nadrealistični, realistični in stilizirani.

Umetnikovo slikanje s čopičem na platnu od blizu

Po mnenju a Facebook objava izvršnega direktorja Mete, Marka Zuckerberga, je prevajanje napisanega besedila v video veliko težje, ker video zahteva gibanje:

Priporočeni videoposnetki

»Veliko težje je ustvariti video kot fotografije, ker mora sistem poleg pravilnega ustvarjanja vsake slikovne pike predvideti tudi, kako se bodo sčasoma spremenile. Make-A-Video to rešuje tako, da doda plast nenadzorovanega učenja, ki sistemu omogoči razumevanje gibanja v fizičnem svetu in njegovo uporabo pri tradicionalnem ustvarjanju besedila v sliko.«

Mlad par na sprehodu v močnem dežju

Metina raziskovalna skupina za AI je napisala papir opisuje, kako sistem deluje in kako se razlikuje od trenutnih metod besedila v sliko (T2I). Za razliko od drugih modelov strojnega jezika Meta's Text-to-Video (T2V) metoda ne uporablja vnaprej določenih parov besedilo-video. Na primer, ne združi »moškega, ki hodi« z videoposnetkom dejanskega moškega, ki hodi.

Če to zveni zelo podobno DALL-E, priljubljeni aplikaciji T2I, ne bi bili daleč. Druge aplikacije T2I so se pojavile, odkar je DALL-E postal priljubljen. TikTok je izdal filter avgusta imenovan AI Greenscreen, ki ustvarja slike v slogu slikanja na podlagi besed, ki jih vnesete.

Puhasti dojenček lenivec z oranžno pleteno kapo poskuša ugotoviti prenosni računalnik od blizu, zelo podroben studijski svetlobni zaslon, ki odseva v njegovem očesu

Vsebina, ustvarjena z umetno inteligenco, je v zadnjih nekaj letih postala zelo priljubljena. Tehnologija Deepfake, tehnike strojnega učenja za zamenjavo obraza osebe z drugim, uporabljajo celo studii za vizualne učinke za visokoproračunske predstave, kot je Mandalorec.

Julija je The Times pomotoma poročal o Ukrajinki sredi rusko-ukrajinske vojne. Problem je ni bila resnična.

Verjetno grožnja AI ni resnična grožnja, vendar so projekti, kot sta DALL-E in Make-A-Video, zabavna raziskovanja nekaterih zanimivih možnosti.

Priporočila urednikov

  • Appleov tekmec ChatGPT lahko samodejno napiše kodo za vas
  • Bing Image Creator prinaša slike, ustvarjene z umetno inteligenco DALL-E, v vaš brskalnik
  • Videl sem (oddaljeno) prihodnost spletnega iskanja z umetno inteligenco – tukaj je neverjetno in kje ima težave
  • AI Dall-E za ustvarjanje slik je zdaj brezplačen za vsakogar
  • Svojo smešno zagonsko idejo sem predstavil robotu VC

Nadgradite svoj življenjski slogDigitalni trendi pomagajo bralcem slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.