Meta представила божевільну модель штучного інтелекту, яка дозволяє користувачам перетворювати введені ними описи у відео. Система називається Зробіть відео і є останньою тенденцією контенту, створеного ШІ в Інтернеті.
Система приймає короткі описи, як-от «робот, що пливе по хвилі в океані» або «риба-клоун, що пливе крізь кораловий риф», і динамічно генерує короткий GIF опису. Є навіть три різні стилі відео на вибір: сюрреалістичний, реалістичний і стилізований.
За словами а Пост у Facebook Марк Цукерберг, генеральний директор Meta, перекладає письмовий текст у відео набагато важче через те, що відео вимагає руху:
Рекомендовані відео
«Згенерувати відео набагато важче, ніж фотографії, тому що крім правильного створення кожного пікселя, система також має передбачити, як вони зміняться з часом. Make-A-Video вирішує цю проблему, додаючи рівень неконтрольованого навчання, який дозволяє системі розуміти рух у фізичному світі та застосовувати його до традиційного генерування тексту в зображення».
Команда дослідження штучного інтелекту Meta написала папір з описом того, як працює система та чим вона відрізняється від поточних методів перетворення тексту в зображення (T2I). На відміну від інших моделей машинної мови, метод Meta Text-to-Video (T2V) не використовує попередньо визначені пари текст-відео. Наприклад, він не поєднує «чоловіка, що йде» з відео реального чоловіка, який йде.
Якщо це звучить дуже схоже на DALL-E, популярну програму T2I, ви не за горами. Після набуття популярності DALL-E з’явилися інші програми T2I. TikTok випустив фільтр у серпні називається AI Greenscreen, який створює зображення в стилі малювання на основі слів, які ви вводите.
За останні кілька років контент, створений штучним інтелектом, став досить популярним. Технологія Deepfake, техніка машинного навчання для заміни обличчя людини на інше, навіть використовується студіями візуальних ефектів для таких великобюджетних шоу, як Мандалорець.
У липні The Times помилково повідомила про українку в розпал російсько-української війни. Проблема в тому вона не була справжньою.
Ймовірна загроза ШІ не є реальною загрозою, але проекти на кшталт DALL-E та Make-A-Video — це веселе дослідження деяких цікавих можливостей.
Рекомендації редакції
- Конкурент Apple ChatGPT може автоматично написати код для вас
- Bing Image Creator переносить зображення, згенеровані DALL-E штучним інтелектом, у ваш браузер
- Я бачив (віддалене) майбутнє веб-пошуку штучного інтелекту – ось де це дивовижно, а де важко
- Штучний інтелект Dall-E, що генерує зображення, тепер безкоштовний для будь-кого
- Я представив свою смішну ідею стартапу роботові венчурному капіталісту
Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.