Meta направи DALL-E за видео и това е едновременно страховито и невероятно

Meta разкри луд модел с изкуствен интелект, който позволява на потребителите да превръщат въведените от тях описания във видео. Системата се нарича Създаване на видео и е най-новата тенденция в генерираното от AI съдържание в мрежата.

Системата приема кратки описания като „робот, който сърфира по вълна в океана“ или „риба клоун, плуваща през кораловия риф“ и динамично генерира кратък GIF на описанието. Има дори три различни стила видеоклипове, от които да избирате: сюрреалистични, реалистични и стилизирани.

Художник рисува с четка върху платно отблизо

Според а Публикация във Фейсбук от главния изпълнителен директор на Meta, Марк Зукърбърг, превеждането на писмен текст във видео е много по-трудно поради това как видеото изисква движение:

Препоръчани видеоклипове

„Много по-трудно е да се генерира видео, отколкото снимки, защото освен правилното генериране на всеки пиксел, системата също трябва да предвиди как те ще се променят с времето. Make-A-Video разрешава това, като добавя слой за обучение без надзор, който позволява на системата да разбира движението във физическия свят и да го прилага към традиционното генериране на текст към изображение.

Млада двойка се разхожда в проливен дъжд

Изследователският екип на Meta написа a хартия описващ как работи системата и как се различава от настоящите методи за текст към изображение (T2I). За разлика от други модели на машинен език, методът Text-to-Video (T2V) на Meta не използва предварително дефинирани двойки текст-видео. Например, той не съчетава „ходящ човек“ с видеоклип на действителен ходещ мъж.

Ако това звучи много като DALL-E, популярното T2I приложение, няма да сте далеч. Други T2I приложения се появиха, след като DALL-E придоби популярност. TikTok пусна филтър през август, наречен AI Greenscreen, който генерира изображения в стил на рисуване въз основа на думите, които въвеждате.

Пухкаво бебе ленивец с оранжева плетена шапка, опитващо се да разгадае лаптоп в близък план с изключително детайлно студийно осветление, отразяващо се в окото му

Съдържанието, генерирано от AI, стана доста привлекателно през последните няколко години. Deepfake технология, техники за машинно обучение за замяна на лицето на човек с друго, се използва дори от студия за визуални ефекти за шоута с голям бюджет като Мандалорецът.

През юли The Times погрешно съобщи за украинка в разгара на руско-украинската война. Проблемът е че тя не беше истинска.

Заплахата от AI вероятно не е реална заплаха, но проекти като DALL-E и Make-A-Video са забавни изследвания на някои от интересните възможности.

Препоръки на редакторите

  • Съперникът на Apple ChatGPT може автоматично да напише код вместо вас
  • Bing Image Creator пренася изображения, генерирани от DALL-E AI, във вашия браузър
  • Видях (далечното) бъдеще на AI търсенето в мрежата – ето къде е невероятно и къде се бори
  • Генериращият изображения AI Dall-E вече е безплатен за всеки, който може да играе с него
  • Представих нелепата си идея за стартиране на робот VC

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.