Meta vytvořila DALL-E pro video a je to děsivé i úžasné

Meta odhalila bláznivý model umělé inteligence, který uživatelům umožňuje přeměnit jejich napsané popisy na video. Systém se nazývá Make-A-Video a je nejnovější v trendu obsahu generovaného umělou inteligencí na webu.

Systém přijímá krátké popisy jako „robot surfující na vlně v oceánu“ nebo „klaunská ryba proplouvající korálovým útesem“ a dynamicky generuje krátký GIF s popisem. Na výběr jsou dokonce tři různé styly videí: surrealistické, realistické a stylizované.

Umělcova malba štětcem na plátně zblízka

Podle a příspěvek na Facebooku od generálního ředitele společnosti Meta Marka Zuckerberga je převod psaného textu do videa mnohem těžší, protože video vyžaduje pohyb:

Doporučená videa

„Je mnohem těžší generovat video než fotografie, protože kromě správného generování každého pixelu musí systém také předvídat, jak se budou v průběhu času měnit. Make-A-Video to řeší přidáním vrstvy učení bez dozoru, které umožňuje systému porozumět pohybu ve fyzickém světě a aplikovat jej na tradiční generování textu na obrázek.“

Mladý pár v hustém dešti

Tým Meta's AI Research napsal a papír popisující, jak systém funguje a jak se liší od současných metod převodu textu na obrázek (T2I). Na rozdíl od jiných modelů strojového jazyka metoda Text-to-Video (T2V) Meta nepoužívá předdefinované páry text-video. Například nespáruje „chůze muže“ s videem, na kterém je skutečný muž v chůzi.

Pokud to zní hodně jako DALL-E, populární aplikace T2I, nebyli byste daleko. Od doby, kdy DALL-E získal popularitu, byly spuštěny další aplikace T2I. TikTok uvolnil filtr v srpnu s názvem AI Greenscreen, který generuje obrázky ve stylu malby na základě zadaných slov.

Načechraný malý lenochod s oranžovou pletenou čepicí se snaží přijít na to, jak se notebook zblízka odráží v oku vysoce detailní studiové osvětlení

Obsah generovaný umělou inteligencí se v posledních několika letech stal docela rušným. Technologie Deepfake, techniky strojového učení k nahrazení lidské tváře jinou, dokonce používají studia vizuálních efektů pro velkorozpočtové show, jako je Mandalorian.

V červenci The Times omylem informovaly o Ukrajince uprostřed rusko-ukrajinské války. Problém je nebyla skutečná.

Pravděpodobně hrozba AI není skutečnou hrozbou, ale projekty jako DALL-E a Make-A-Video jsou zábavným průzkumem některých zajímavých možností.

Doporučení redakce

  • Konkurent společnosti Apple ChatGPT za vás může automaticky napsat kód
  • Bing Image Creator přináší obrázky generované DALL-E AI do vašeho prohlížeče
  • Viděl jsem (vzdálenou) budoucnost webového vyhledávání pomocí umělé inteligence – tady je to úžasné a kde se potýká
  • Umělá inteligence AI Dall-E pro generování obrázků je nyní zdarma, aby si s ní mohl hrát kdokoli
  • Svůj směšný nápad na spuštění jsem předal robotickému VC

Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.