Машинне навчання та мистецтво – Google I/O 2016
Подумайте про комп’ютери, як про дітей, і легко зрозуміти, як кодери можуть навчити їх вчитися. Штучний інтелект спочатку дуже простий і простий. Модератори-люди інструктують комп’ютери, показуючи їм, як думати і, таким чином, навчати себе. Щойно кодери нададуть їм основи, вони зможуть швидко розширити ці знання.
«Що можна зробити з 7 мільйонами цифрових артефактів?»
Біля Google Cultural Institute у Парижі, Франція, пошуковий гігант навчає машини класифікувати 7 мільйонів зображень людських мистецьких досягнень протягом століть. Інститут навіть має веб-сайт, а також програми для iOS і Android де можна шукати твори мистецтва з різних музеїв світу. Щоб створити свій каталог мистецтва, митці коду, які проживали в Інституті, повинні були навчити комп’ютерів переглядайте зображення так, як люди, щоб створити точний цифровий архів мистецтва за всю історію людства.
Історія каталогізації – це добре, але деякі навички, які комп’ютери отримують під час сортування та файлування, насправді роблять їх більш творчими. Художники в резиденції зараз експериментують з комп’ютерами, щоб створювати нові витвори мистецтва за допомогою машинного інтелекту та каталогу із 7 мільйонів зображень, які вони зібрали. Під час Google I/O 2016, Кирило Діагне і Маріо Клінгеманн пояснили, як вони навчили машини сприймати мистецтво, як люди, і як вони навчили машини бути творчими.
Навчання комп’ютерів їх азбуці
Одна з перших речей, чому ви навчаєте дитину, це мова. У західній культурі це означає вивчення азбуки. Маріо Клінгеманн, художник коду з Німеччини, почав навчати машин визначати стилізовані літери зі старих текстів, щоб дізнатися, чи зможе він навчити комп’ютер розпізнавати тисячі різних на вигляд символів А, Б, С тощо на. Це був прискорений курс навчання машин класифікувати зображення так, як це роблять люди.
У той час як комп’ютер може дивитися на стилізовану літеру B, вкриту виноградною лозою та квітами, і бачити якусь рослину, навіть 5-річна дитина може одразу ідентифікувати це зображення як літеру B, а не рослину. Щоб навчити свій комп’ютер розпізнавати букви, Клінгеманн завантажив його тисячами зображень стилізованих літер. Він створив інтерфейс, схожий на Tinder, який дозволяє проводити пальцем праворуч або ліворуч, щоб повідомляти своїм машинам, правильно чи неправильно вони вгадали літеру.
Виявляється, машини досить швидко вивчають свою азбуку; вони почали бачити літери у всьому. Подібно до того, як люди бачать обличчя в хмарах і зображення в абстрактних творах мистецтва, його комп’ютери бачили літери в абсолютно непов’язаних зображеннях. Клінгеманн показав своєму комп’ютеру малюнок або гравюру зруйнованої будівлі, і вони побачили літеру B замість неї.
Клінгеманн пояснив, що коли ви тренуєте комп’ютер лише з одним набором зображень, він починає бачити лише це зображення у всьому. Ось чому його машини побачили лист у руїні.
Навчання комп’ютерів класифікувати 7 мільйонів зображень
Коли художник із цифрової взаємодії Сиріл Діань приєднався до Cultural Institute, Google поставив йому досить складне запитання: «Що можна зробити з 7 мільйонами цифрових артефактів?»
Діагне був приголомшений цим питанням, тож він розписав кожне зображення у чудово масивній карті синусоїда, які ви можете побачити нижче. Пізніше ця хвиля стала прекрасним відображенням усього, чого проект сподівається досягти за допомогою машинного навчання. Синусоїда Diagne насправді доступна для пошуку, тому ви можете переглядати море всіх зображень у цифровому архіві, створеному Google Cultural Institute. Зображення згруповані за категоріями, і з висоти пташиного польоту ви бачите просто море точок. У міру просування ви можете бачити конкретні зображення, усі зі спільною темою, будь то цуценята, ферми чи люди.
1 з 3
Ви також можете шукати в ньому та знаходити потрібні зображення. Якщо ви придивитеся достатньо, ви навіть можете натрапити на те, що Діаґне називає Берегом портретів. Саме там зібрані всі зображення облич людей.
Щоб створити доступну для пошуку карту кожного зображення в архіві, Діагні та його команді довелося створити категорію для всього, щоб навчити машину, що є що.
Класифікувати 7 мільйонів артефактів, багато з яких можуть мати кілька категорій, непросте завдання. Команді довелося придумати щось нестандартне. Недостатньо просто класифікувати речі на основі того, якими вони є. Вони також повинні були створити категорії для емоцій, які викликають зображення.
Навчання машин людським емоціям є важливим кроком до того, щоб зробити їх більш творчими.
Таким чином ви можете шукати зображення «спокій», і комп’ютер покаже вам зображення, які викликають відчуття спокою, як-от заходи сонця, тихі озера тощо. Дивовижно, але машини навчилися визначати людські емоції з такою майстерністю, що вони можуть поставити себе на наше місце, щоб зрозуміти, як певне зображення викликатиме почуття у людини.
Навчання машин людським емоціям є важливим кроком до того, щоб зробити їх більш творчими. Зрештою, велика частина сучасного мистецтва — це візуальне відображення людських емоцій.
Але чи може машина бути творчою?
Творчість і артистизм — це дві речі, які ми, люди, любимо вважати лише своїми. Тварини не створюють мистецтва, як і машини… поки що. Проект Google Deep Dream намагався перевернути уявлення про те, що машини не можуть створювати мистецтво, з ніг на голову. Пошуковий гігант навчив комп’ютери маніпулювати зображеннями для створення дивних, психоделічних творів мистецтва. Зображення, створені Google Двигун Deep Dream вони можуть бути некрасивими, але вони точно унікальні та надзвичайно креативні. Машинні творіння містять психоделічні кольори, слимаки, дивні очі та безтілесних тварин, що кружляють у невизначених просторах.
Дехто може заперечити, що це не зовсім мистецтво, якщо машини просто комбінують існуючі зображення, скручують їх і занурюють у екстремальні кольори; Google не погодиться, як і кодист Клінгеманн.
«Люди не здатні на оригінальні ідеї», — пояснив він.
1 з 8
Навіть відомі картини містять елементи попереднього мистецтва, зазначив він. Шедевр Пікассо 1907 року Авіньйонські дівчата, наприклад, має вплив від Африканське мистецтво і попередники кубізму, як Поль Сезанн. З іншого боку, колажі, які поєднують існуючі зображення в художній спосіб, є ще одним добре встановленим видом мистецтва. Пікассо, Енді Воргол, Мен Рей та інші відомі своїми ексцентричними колажами, тож чому колажі, зроблені машинами, також не можуть вважатися мистецтвом?
Клінгеманн хотів розширити межі цифрового мистецтва та побачити, як можуть розвиватися творчі машини задовго до того, як він розпочав свою резиденцію в Google Cultural Institute. Використовуючи власні менш потужні машини, Клінгеманн почав бавитися з Інтернет-архівами та архівами Google TensorFlow програмне забезпечення машинного навчання для створення цифрових колажів.
Він створив інструмент машинного навчання під назвою Ernst, названий на честь сюрреаліста та колажиста Макс Ернст. Клінгеманн визначив серію об’єктів із робіт Ернста та наказав своєму комп’ютеру створити різні колажі з однаковими елементами. Результати часто були сюрреалістичними, іноді кумедними, а в інших випадках абсолютно жахливими.
«Люди не здатні на оригінальні ідеї».
Клінгеманн хотів більше контролювати хаотичні зображення, які створювали його машини, тому він почав навчати їх новому. Він запитав себе: «Що цікаво людям?» Клінгеманн знав, що йому потрібно навчити систему, на що звертати увагу, навчити її розглядати всі ці елементи так, як це зробив би художник-людина.
Отриманий твір мистецтва чудовий і абсолютно унікальний. Хоча Клінгеманн, очевидно, використовував старі зображення для створення своєї роботи, вони відображаються в новому контексті, і це має значення.
Зараз комп’ютерна творчість обмежується цікавими колажами та розумінням того, які зображення добре поєднуються. Машини ще не створюють власного мистецтва, але художники коду, які ними керують, у процесі стають радше кураторами, ніж творцями.
Залишається побачити, наскільки людина може розширити творчий розум машин, але це, безперечно, захоплююче спостерігати.
Рекомендації редакції
- Google Bard тепер може говорити, але чи може він заглушити ChatGPT?
- Тепер ви можете спробувати Google Bard, конкурента ChatGPT
- Новий ШІ Bard від Google може бути достатньо потужним, щоб змусити ChatGPT хвилюватися — і він уже тут
- Google Meet чи Zoom? Скоро це не матиме значення
- Нова химерна клавіатура Google Japan також може виявляти (буквально) помилки