Этот А.И. это похоже на поиск изображений Google для воображаемых картинок.

Если вам интересно, то картинка выше представляет собой «замысловатый рисунок вечности». Но это не работа художника-человека; это создание BigSleep, новейшего удивительного примера генеративного искусственный интеллект (ИИ) в действии.

Содержание

Как работает BigSleep
Генерирующий изображения искусственный интеллект

Немного похоже на визуальную версию текстогенерирующий ИИ модель ГПТ-3, BigSleep способен воспринимать любую текстовую подсказку и визуализировать изображение, соответствующее словам. Это может быть что-то эзотерическое, например вечность, или ваза с вишней, или красивый дом (последнее из который можно увидеть ниже.) Думайте об этом как о поиске изображений в Google — только для изображений, которые никогда ранее не использовались. существовал.

Рекомендуемые видео

Как работает BigSleep

«На высоком уровне BigSleep работает путем объединения двух нейронных сетей: BigGAN и CLIP», Райан Мердок, — рассказал Digital Trends 23-летний создатель BigSleep, студент, изучающий когнитивную нейробиологию в Университете Юты.

Первый из них, БигГАН, — это система, созданная Google, которая улавливает случайный шум и выводит изображения. BigGAN — это генеративно-состязательная сеть: пара конкурирующих нейронных сетей, которые выполняют то, что Мердок называет «соперническим перетягиванием каната» между сетью, генерирующей изображения, и дискриминатором сеть. Со временем взаимодействие между генератором и дискриминатором приводит к улучшению обеих нейронных сетей.

Красивый дом — По словам BigSleep, «красивый дом». Я имею в виду, это не неправильно.BigSleep

КЛИПМежду тем, это нейронная сеть, созданная OpenAI, которая обучена сопоставлять изображения и описания. Предоставьте CLIP текст и изображения, и он попытается выяснить, насколько хорошо они совпадают, и соответственно присвоит им оценку.

Объединив их, Мердок объяснил, что BigSleep ищет в выходных данных BigGAN изображения, которые максимизируют оценку CLIP. Затем он медленно настраивает входной шум в генераторе BigGAN до тех пор, пока CLIP не сообщит, что полученные изображения соответствуют описанию. Создание изображения, соответствующего подсказке, занимает в общей сложности около трех минут.

«BigSleep важен, потому что он может достаточно хорошо генерировать широкий спектр концепций и объектов с разрешением 512 x 512 пикселей», — сказал Мердок. «Предыдущая работа дала впечатляющие результаты, но, насколько мне известно, большая ее часть ограничивалась изображениями с более низким разрешением и более повседневными объектами».

Генерирующий изображения искусственный интеллект

BigSleep — это не первый раз, когда ИИ. использовался для создания изображений. Его название напоминает ДипДрим, ИИ. созданный инженером Google Алексом Мордвинцевым, который создает психоделические образы с использованием моделей классификации. Система на базе GAN также использовалась для создания А.И. картина продана на аукционе в 2018 году за огромные 432 500 долларов. Тем не менее, это, безусловно, впечатляющий шаг вперед.

Чтобы опробовать BigSleep самостоятельно, Мердок предложил проверить его Блокнот Google Colab относительно проекта. Требуется некоторое время обучения, связанное с использованием графического интерфейса Colab и несколькими другими шагами, но его можно попробовать бесплатно. Другие способы тестирования, вероятно, также откроются в ближайшие недели. Если вам интересно, вы также можете посетить р/МедиаСинтез, где пользователи публикуют одни из лучших изображений, созданных ими с помощью системы.

Этот А.И. это похоже на поиск изображений Google для воображаемых картинок.

Как работает BigSleep

Генерирующий изображения искусственный интеллект

Рекомендации редакции

Категории

Недавний

Ауди РС 6 Авант Плюс 2015 года

Jaguar XE 2016 показывает, что у него под кожей, благодаря прозрачному кузову

Pico обеспечивает удобство крафта пива, подобное Keurig