Meta направи DALL-E за видео и това е едновременно страховито и невероятно

Meta разкри луд модел с изкуствен интелект, който позволява на потребителите да превръщат въведените от тях описания във видео. Системата се нарича Създаване на видео и е най-новата тенденция в генерираното от AI съдържание в мрежата.

Системата приема кратки описания като „робот, който сърфира по вълна в океана“ или „риба клоун, плуваща през кораловия риф“ и динамично генерира кратък GIF на описанието. Има дори три различни стила видеоклипове, от които да избирате: сюрреалистични, реалистични и стилизирани.

Художник рисува с четка върху платно отблизо

Според а Публикация във Фейсбук от главния изпълнителен директор на Meta, Марк Зукърбърг, превеждането на писмен текст във видео е много по-трудно поради това как видеото изисква движение:

Препоръчани видеоклипове

„Много по-трудно е да се генерира видео, отколкото снимки, защото освен правилното генериране на всеки пиксел, системата също трябва да предвиди как те ще се променят с времето. Make-A-Video разрешава това, като добавя слой за обучение без надзор, който позволява на системата да разбира движението във физическия свят и да го прилага към традиционното генериране на текст към изображение.

Млада двойка се разхожда в проливен дъжд

Изследователският екип на Meta написа a хартия описващ как работи системата и как се различава от настоящите методи за текст към изображение (T2I). За разлика от други модели на машинен език, методът Text-to-Video (T2V) на Meta не използва предварително дефинирани двойки текст-видео. Например, той не съчетава „ходящ човек“ с видеоклип на действителен ходещ мъж.

Ако това звучи много като DALL-E, популярното T2I приложение, няма да сте далеч. Други T2I приложения се появиха, след като DALL-E придоби популярност. TikTok пусна филтър през август, наречен AI Greenscreen, който генерира изображения в стил на рисуване въз основа на думите, които въвеждате.

Пухкаво бебе ленивец с оранжева плетена шапка, опитващо се да разгадае лаптоп в близък план с изключително детайлно студийно осветление, отразяващо се в окото му

Съдържанието, генерирано от AI, стана доста привлекателно през последните няколко години. Deepfake технология, техники за машинно обучение за замяна на лицето на човек с друго, се използва дори от студия за визуални ефекти за шоута с голям бюджет като Мандалорецът.

През юли The Times погрешно съобщи за украинка в разгара на руско-украинската война. Проблемът е че тя не беше истинска.

Заплахата от AI вероятно не е реална заплаха, но проекти като DALL-E и Make-A-Video са забавни изследвания на някои от интересните възможности.

Препоръки на редакторите

Съперникът на Apple ChatGPT може автоматично да напише код вместо вас
Bing Image Creator пренася изображения, генерирани от DALL-E AI, във вашия браузър
Видях (далечното) бъдеще на AI търсенето в мрежата – ето къде е невероятно и къде се бори
Генериращият изображения AI Dall-E вече е безплатен за всеки, който може да играе с него
Представих нелепата си идея за стартиране на робот VC

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.

Meta направи DALL-E за видео и това е едновременно страховито и невероятно

Препоръки на редакторите

Категории

Скорошни

Aston Martin DB11 Volante стартира през пролетта на 2018 г

GameStop пуска отдел за издаване на видеоигри

Warner Bros. Пуска нов трейлър за Midnight Special