Този ИИ е като Google Търсене на изображения за въображаеми снимки

Вечност
BigSleep

В случай, че се чудите, снимката по-горе е „сложна рисунка на вечността“. Но това не е дело на човешки художник; това е създаването на BigSleep, последният невероятен пример за generative изкуствен интелект (AI) в действие.

Съдържание

  • Как работи BigSleep
  • ИИ за генериране на изображения

Малко като визуална версия на ИИ за генериране на текст модел GPT-3, BigSleep е в състояние да приеме всяка текстова подкана и да визуализира изображение, за да пасне на думите. Това може да е нещо езотерично като вечността, или може да е купа с череши или красива къща (последното от което може да се види по-долу.) Мислете за това като за търсене в Google Изображения — само за снимки, които никога преди това не са били съществуваше.

Препоръчани видеоклипове

Как работи BigSleep

„На високо ниво BigSleep работи чрез комбиниране на две невронни мрежи: BigGAN и CLIP,“ Райън Мърдок, 23-годишният създател на BigSleep, студент, изучаващ когнитивна неврология в Университета на Юта, каза пред Digital Trends.

Първият от тях,

BigGAN, е система, създадена от Google, която приема произволен шум и извежда изображения. BigGAN е генеративна състезателна мрежа: двойка дуелиращи се невронни мрежи, които извършват това, което Мърдок нарича „съперничено дърпане на въже“ между мрежа за генериране на изображения и дискриминатор мрежа. С течение на времето взаимодействието между генератора и дискриминатора води до подобрения и в двете невронни мрежи.

Красива къща
„Красива къща“, според BigSleep. Искам да кажа, че не е грешно.BigSleep

КЛИП, междувременно, е невронна мрежа, създадена от OpenAI, която е научена да съпоставя изображения и описания. Дайте на CLIP текст и изображения и той ще се опита да разбере колко добре съвпадат и съответно ще им даде оценка.

Чрез комбинирането на двете, Мърдок обясни, че BigSleep търси в резултатите на BigGAN за изображения, които максимизират точкуването на CLIP. След това бавно настройва входния шум в генератора на BigGAN, докато CLIP каже, че произведените изображения отговарят на описанието. Генерирането на изображение, което да съответства на подкана, отнема общо около три минути.

„BigSleep е важен, защото може да генерира голямо разнообразие от концепции и обекти сравнително добре при резолюция 512 x 512 пиксела“, каза Мърдок. „Предишната работа доведе до впечатляващи резултати, но доколкото ми е известно, голяма част от нея е била ограничена до изображения с по-ниска разделителна способност и повече ежедневни предмети.“

ИИ за генериране на изображения

BigSleep не е първият път, когато A.I. е използван за генериране на изображения. Името му напомня за DeepDream, ИИ създаден от инженера на Google Алекс Мордвинцев, който създава психеделични изображения, използвайки класификационни модели. Система, базирана на GAN, също беше използвана за създаването на ИИ картина, продадена на търг през 2018 г. за огромните $432 500. Въпреки това, това със сигурност е очарователна стъпка напред.

За да изпробвате BigSleep сами, Мърдок предложи да проверите неговия Бележник на Google Colab относно проекта. Използването на графичния интерфейс на Colab и няколко други стъпки включва известна крива на учене, но е безплатно за въртене. Други начини за тестването му вероятно също ще се отворят през следващите седмици. Ако се интересувате, можете също да посетите r/MediaSynthesis, където потребителите публикуват някои от най-добрите изображения, които са генерирали със системата досега.

Препоръки на редакторите

  • Може ли A.I. победи човешките инженери при проектирането на микрочипове? Google смята така
  • Умен нов A.I. системата обещава да обучи вашето куче, докато сте далеч от дома
  • Следващото голямо предизвикателство на AI? Възпроизвеждане на квантова версия на Go
  • Протези, които не изискват практика: в най-новия пробив в биониката
  • ИИ инструмент за превод хвърля светлина върху тайния език на мишките

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.