Если вам интересно, то картинка выше представляет собой «замысловатый рисунок вечности». Но это не работа художника-человека; это создание BigSleep, новейшего удивительного примера генеративного искусственный интеллект (ИИ) в действии.
Содержание
- Как работает BigSleep
- Генерирующий изображения искусственный интеллект
Немного похоже на визуальную версию текстогенерирующий ИИ модель ГПТ-3, BigSleep способен воспринимать любую текстовую подсказку и визуализировать изображение, соответствующее словам. Это может быть что-то эзотерическое, например вечность, или ваза с вишней, или красивый дом (последнее из который можно увидеть ниже.) Думайте об этом как о поиске изображений в Google — только для изображений, которые никогда ранее не использовались. существовал.
Рекомендуемые видео
Как работает BigSleep
«На высоком уровне BigSleep работает путем объединения двух нейронных сетей: BigGAN и CLIP», Райан Мердок, — рассказал Digital Trends 23-летний создатель BigSleep, студент, изучающий когнитивную нейробиологию в Университете Юты.
Первый из них, БигГАН, — это система, созданная Google, которая улавливает случайный шум и выводит изображения. BigGAN — это генеративно-состязательная сеть: пара конкурирующих нейронных сетей, которые выполняют то, что Мердок называет «соперническим перетягиванием каната» между сетью, генерирующей изображения, и дискриминатором сеть. Со временем взаимодействие между генератором и дискриминатором приводит к улучшению обеих нейронных сетей.
КЛИПМежду тем, это нейронная сеть, созданная OpenAI, которая обучена сопоставлять изображения и описания. Предоставьте CLIP текст и изображения, и он попытается выяснить, насколько хорошо они совпадают, и соответственно присвоит им оценку.
Объединив их, Мердок объяснил, что BigSleep ищет в выходных данных BigGAN изображения, которые максимизируют оценку CLIP. Затем он медленно настраивает входной шум в генераторе BigGAN до тех пор, пока CLIP не сообщит, что полученные изображения соответствуют описанию. Создание изображения, соответствующего подсказке, занимает в общей сложности около трех минут.
«BigSleep важен, потому что он может достаточно хорошо генерировать широкий спектр концепций и объектов с разрешением 512 x 512 пикселей», — сказал Мердок. «Предыдущая работа дала впечатляющие результаты, но, насколько мне известно, большая ее часть ограничивалась изображениями с более низким разрешением и более повседневными объектами».
Генерирующий изображения искусственный интеллект
BigSleep — это не первый раз, когда ИИ. использовался для создания изображений. Его название напоминает ДипДрим, ИИ. созданный инженером Google Алексом Мордвинцевым, который создает психоделические образы с использованием моделей классификации. Система на базе GAN также использовалась для создания А.И. картина продана на аукционе в 2018 году за огромные 432 500 долларов. Тем не менее, это, безусловно, впечатляющий шаг вперед.
Чтобы опробовать BigSleep самостоятельно, Мердок предложил проверить его Блокнот Google Colab относительно проекта. Требуется некоторое время обучения, связанное с использованием графического интерфейса Colab и несколькими другими шагами, но его можно попробовать бесплатно. Другие способы тестирования, вероятно, также откроются в ближайшие недели. Если вам интересно, вы также можете посетить р/МедиаСинтез, где пользователи публикуют одни из лучших изображений, созданных ими с помощью системы.
Рекомендации редакции
- Может ли А.И. превзойти инженеров-людей в разработке микрочипов? Гугл так думает
- Умный новый ИИ. система обещает дрессировать вашу собаку, пока вы находитесь вдали от дома
- Следующий большой вызов ИИ? Игра в квантовую версию Го
- Протезирование, не требующее практики: внутри последнего прорыва в бионике
- А.И. Инструмент перевода проливает свет на секретный язык мышей
Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.