Meta odhalila bláznivý model umělé inteligence, který uživatelům umožňuje přeměnit jejich napsané popisy na video. Systém se nazývá Make-A-Video a je nejnovější v trendu obsahu generovaného umělou inteligencí na webu.
Systém přijímá krátké popisy jako „robot surfující na vlně v oceánu“ nebo „klaunská ryba proplouvající korálovým útesem“ a dynamicky generuje krátký GIF s popisem. Na výběr jsou dokonce tři různé styly videí: surrealistické, realistické a stylizované.
Podle a příspěvek na Facebooku od generálního ředitele společnosti Meta Marka Zuckerberga je převod psaného textu do videa mnohem těžší, protože video vyžaduje pohyb:
Doporučená videa
„Je mnohem těžší generovat video než fotografie, protože kromě správného generování každého pixelu musí systém také předvídat, jak se budou v průběhu času měnit. Make-A-Video to řeší přidáním vrstvy učení bez dozoru, které umožňuje systému porozumět pohybu ve fyzickém světě a aplikovat jej na tradiční generování textu na obrázek.“
Tým Meta's AI Research napsal a papír popisující, jak systém funguje a jak se liší od současných metod převodu textu na obrázek (T2I). Na rozdíl od jiných modelů strojového jazyka metoda Text-to-Video (T2V) Meta nepoužívá předdefinované páry text-video. Například nespáruje „chůze muže“ s videem, na kterém je skutečný muž v chůzi.
Pokud to zní hodně jako DALL-E, populární aplikace T2I, nebyli byste daleko. Od doby, kdy DALL-E získal popularitu, byly spuštěny další aplikace T2I. TikTok uvolnil filtr v srpnu s názvem AI Greenscreen, který generuje obrázky ve stylu malby na základě zadaných slov.
Obsah generovaný umělou inteligencí se v posledních několika letech stal docela rušným. Technologie Deepfake, techniky strojového učení k nahrazení lidské tváře jinou, dokonce používají studia vizuálních efektů pro velkorozpočtové show, jako je Mandalorian.
V červenci The Times omylem informovaly o Ukrajince uprostřed rusko-ukrajinské války. Problém je nebyla skutečná.
Pravděpodobně hrozba AI není skutečnou hrozbou, ale projekty jako DALL-E a Make-A-Video jsou zábavným průzkumem některých zajímavých možností.
Doporučení redakce
- Konkurent společnosti Apple ChatGPT za vás může automaticky napsat kód
- Bing Image Creator přináší obrázky generované DALL-E AI do vašeho prohlížeče
- Viděl jsem (vzdálenou) budoucnost webového vyhledávání pomocí umělé inteligence – tady je to úžasné a kde se potýká
- Umělá inteligence AI Dall-E pro generování obrázků je nyní zdarma, aby si s ní mohl hrát kdokoli
- Svůj směšný nápad na spuštění jsem předal robotickému VC
Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.