Цей А.І. це як Google Image Search для уявних картинок

Якщо вам цікаво, зображення вище — це «складний малюнок вічності». Але це не робота людини-митця; це створення BigSleep, останнього дивовижного прикладу generative штучний інтелект (A.I.) в дії.

Зміст

Як працює BigSleep
Образ-генератор А.І.

Трохи нагадує візуальну версію текстоутворюючий А.І. модель ГПТ-3, BigSleep здатний приймати будь-які текстові підказки та візуалізувати зображення відповідно до слів. Це може бути щось езотеричне, як-от вічність, або це може бути миска з вишнями чи гарний будинок (останнє з який можна побачити нижче.) Подумайте про це як про пошук зображень Google — лише для зображень, які ніколи раніше не використовувалися існувала.

Рекомендовані відео

Як працює BigSleep

«На високому рівні BigSleep працює, поєднуючи дві нейронні мережі: BigGAN і CLIP», Раян Мердок23-річний творець BigSleep, студент, який вивчає когнітивну нейронауку в Університеті Юти, розповів Digital Trends.

Перший з них, BigGAN, – це система, створена Google, яка вловлює випадковий шум і виводить зображення. BigGAN — це генеративна змагальна мережа: пара дуельних нейронних мереж, які виконують те, що Мердок називає «змагальним перетягуванням каната» між мережею, що генерує зображення, і дискримінатором мережі. З часом взаємодія між генератором і дискримінатором призводить до вдосконалення обох нейронних мереж.

«Гарний будинок», за словами BigSleep. Я маю на увазі, що це не так.BigSleep

CLIP, тим часом, це нейронна мережа, створена OpenAI, яку навчили відповідати зображенням і описам. Надайте CLIP текст і зображення, і він спробує з’ясувати, наскільки добре вони збігаються, і відповідно оцінити їх.

Об’єднавши обидва, Мердок пояснив, що BigSleep шукає в результатах BigGAN зображення, які максимізують оцінку CLIP. Потім він повільно налаштовує вхідний шум у генераторі BigGAN, доки CLIP не скаже, що отримані зображення відповідають опису. Створення зображення відповідно до підказки займає близько трьох хвилин.

«BigSleep важливий, оскільки він може досить добре генерувати різноманітні концепції та об’єкти з роздільною здатністю 512 x 512 пікселів», — сказав Мердок. «Попередня робота дала вражаючі результати, але, наскільки мені відомо, більша частина її була обмежена зображеннями з нижчою роздільною здатністю та більшою кількістю повсякденних об’єктів».

Образ-генератор А.І.

BigSleep не вперше використовує штучний інтелект. використовувався для створення зображень. Його назва нагадує про DeepDream, А.І. створений інженером Google Алексом Мордвінцевим, який створює психоделічні зображення за допомогою моделей класифікації. Для створення також використовувалася система на основі GAN А.І. картина продана на аукціоні у 2018 році за колосальні 432 500 доларів США. Однак це, безперечно, захоплюючий крок вперед.

Щоб спробувати BigSleep на собі, Мердок запропонував перевірити його Блокнот Google Colab щодо проекту. Користування графічним інтерфейсом користувача Colab і кілька інших кроків потребують деякого навчання, але це можна зробити безкоштовно. Найімовірніше, найближчими тижнями з’являться інші способи тестування. Якщо вам цікаво, ви також можете відвідати р/МедіаСинтез, де користувачі публікують одні з найкращих зображень, створених ними за допомогою системи.

Цей А.І. це як Google Image Search для уявних картинок

Як працює BigSleep

Образ-генератор А.І.

Рекомендації редакції

Категорії

Останні

Веб-сайт створює віртуальну бібліотеку для видачі книг Kindle

Легкий, гострий Hyundai i30 N Project C стане найгарячішим хетчем у Кореї

Вибух у Тяньцзіні знищив понад 8000 автомобілів