Meta odhalila bláznivý model umelej inteligencie, ktorý používateľom umožňuje premeniť ich napísané popisy na video. Systém je tzv Make-A-Video a je najnovším trendom obsahu generovaného AI na webe.
Systém akceptuje krátke popisy ako „robot surfujúci na vlne v oceáne“ alebo „klaunská ryba plávajúca cez koralový útes“ a dynamicky generuje krátky GIF s popisom. Na výber sú dokonca tri rôzne štýly videí: surrealistické, realistické a štylizované.
Podľa a príspevok na Facebooku od generálneho riaditeľa spoločnosti Meta, Marka Zuckerberga, je preklad písaného textu do videa oveľa ťažší, pretože video vyžaduje pohyb:
Odporúčané videá
„Je oveľa ťažšie generovať video ako fotografie, pretože okrem správneho generovania každého pixelu musí systém tiež predpovedať, ako sa budú časom meniť. Make-A-Video to rieši pridaním vrstvy učenia bez dozoru, ktorá umožňuje systému pochopiť pohyb vo fyzickom svete a aplikovať ho na tradičné generovanie textu na obrázok.“
Tím Meta's AI Research napísal a papier popisujúce, ako systém funguje a ako sa líši od súčasných metód prevodu textu na obrázok (T2I). Na rozdiel od iných modelov strojového jazyka metóda Text-to-Video (T2V) Meta nepoužíva preddefinované páry text-video. Napríklad nespáruje „muž kráčajúci“ s videom skutočného kráčajúceho muža.
Ak to znie ako DALL-E, populárna aplikácia T2I, neboli by ste ďaleko. Odkedy si DALL-E získal popularitu, spustili sa ďalšie aplikácie T2I. TikTok uvoľnil filter v auguste s názvom AI Greenscreen, ktorý generuje obrázky v štýle maľby na základe zadaných slov.
Obsah generovaný AI sa za posledných pár rokov stal celkom rušným. Technológia Deepfake, techniky strojového učenia na nahradenie ľudskej tváre inou, dokonca používajú štúdiá vizuálnych efektov na predstavenia s veľkým rozpočtom, ako napr. Mandalorian.
V júli The Times omylom informovali o Ukrajinke uprostred rusko-ukrajinskej vojny. Problém je nebola skutočná.
Pravdepodobne hrozba AI nie je skutočnou hrozbou, ale projekty ako DALL-E a Make-A-Video sú zábavným skúmaním niektorých zaujímavých možností.
Odporúčania redaktorov
- Konkurent spoločnosti Apple ChatGPT môže automaticky napísať kód za vás
- Bing Image Creator prináša do vášho prehliadača obrázky generované AI DALL-E
- Videl som (vzdialenú) budúcnosť umelej inteligencie na webe – tu je to úžasné a kde má problémy
- Umelá inteligencia Dall-E na generovanie obrázkov je teraz zadarmo, s ktorou si môže hrať ktokoľvek
- Predložil som svoj smiešny nápad na spustenie robotovi VC
Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.