Машинное обучение и искусство – Google I/O 2016
Подумайте о компьютерах, как если бы они были детьми, и вы легко поймете, как программисты могут научить их учиться. Поначалу искусственный интеллект очень прост. Люди-модераторы инструктируют компьютеры, показывая им, как думать и, таким образом, обучаться. Однако как только программисты дадут им основы, они смогут быстро расширить эти знания.
«Что можно сделать с 7 миллионами цифровых артефактов?»
На Google Культурный институт В Париже, Франция, поисковый гигант учит машины классифицировать 7 миллионов изображений творческих достижений человечества на протяжении веков. У института даже есть веб-сайт, а также приложения для iOS и Андроид где вы можете искать произведения искусства из разных музеев по всему миру. Чтобы создать каталог произведений искусства, художники-кодировщики, работавшие в Институте, должны были обучить компьютеры просматривать изображения так, как это делают люди, чтобы создать точный цифровой архив произведений искусства на протяжении всей истории человечества.
Каталогизация истории — это хорошо, но некоторые навыки, которым компьютеры учатся в процессе сортировки и хранения, на самом деле делают их более творческими. Художники, проживающие в резиденции, сейчас экспериментируют с компьютерами, чтобы создавать новые произведения искусства, используя машинный интеллект и каталог из 7 миллионов изображений, которые они собрали вместе. Во время Google I/O 2016 г. Сирил Диань и Марио Клингеманн объяснили, как они научили машины воспринимать искусство так же, как люди, и как они научили машины проявлять творческий подход.
Обучаем компьютеры азбуке
Одна из первых вещей, которым вы учите ребенка, — это язык. В западной культуре это означает изучение азбуки. Марио Клингеманн, художник по кодированию из Германии, начал обучать машины идентифицировать стилизованные буквы из старых текстов, чтобы узнать, сможет ли он научить компьютер распознавать тысячи разных по виду букв «А», «Б», «С» и т. д. на. Это был ускоренный курс обучения машин классификации изображений так, как это делают люди.
В то время как компьютер может посмотреть на стилизованную букву B, покрытую виноградной лозой и цветами, и увидеть какое-то растение, даже пятилетний ребенок может сразу идентифицировать изображение как букву B, а не растение. Чтобы научить свой компьютер распознавать азбуку, Клингеманн загрузил в него тысячи изображений стилизованных букв. Он создал интерфейс, похожий на Tinder, с помощью которого можно проводить пальцем вправо или влево, чтобы сообщать своим машинам, правильно или неправильно они угадали букву.
Оказывается, машины довольно быстро учат азбуку; они начали видеть буквы во всем. Подобно тому, как люди видят лица в облаках и изображения в абстрактных произведениях искусства, его компьютеры видели буквы в совершенно несвязанных изображениях. Клингеманн показал компьютеру рисунок или гравюру разрушенного здания, и вместо этого они увидели букву Б.
Клингеманн объяснил, что когда вы тренируете компьютер только с одним набором изображений, он начинает видеть во всем только этот тип изображений. Вот почему его машины увидели письмо в руинах.
Научим компьютеры классифицировать 7 миллионов изображений
Когда художник по цифровому взаимодействию Сирил Диань присоединился к Институту культуры, Google задал ему довольно пугающий вопрос: «Что вы можете сделать с 7 миллионами цифровых артефактов?»
Диань был ошеломлен этим вопросом, поэтому он нанес каждое изображение на карту в великолепно массивном виде. синусоидальная волна, который вы можете увидеть ниже. Позже эта волна стала прекрасным представлением всего, чего проект надеется достичь с помощью машинного обучения. Синусоидальная волна Дианя на самом деле доступна для поиска, поэтому вы можете просматривать море всех изображений в цифровом архиве, созданном Институтом культуры Google. Изображения сгруппированы по категориям, и с высоты птичьего полета вы видите просто море точек. По мере продвижения вы можете видеть конкретные изображения, объединенные общей темой, будь то щенки, фермы или люди.
1 из 3
Вы также можете выполнить поиск и найти нужные изображения. Если присмотреться, то можно даже наткнуться на то, что Диань называет «Берег портретов». Именно там группируются все изображения лиц людей.
Чтобы создать доступную для поиска карту каждого изображения в архиве, Диань и его команда должны были создать категорию для всего, чтобы научить машину, что к чему.
Классифицировать 7 миллионов артефактов, многие из которых могут относиться к нескольким категориям, — непростая задача. Команде пришлось придумать что-то нестандартное. Недостаточно просто классифицировать вещи в зависимости от того, чем они являются. Им также пришлось создать категории для эмоций, которые вызывают изображения.
Обучение машин человеческим эмоциям — важный шаг к тому, чтобы сделать их более творческими.
Таким образом, вы можете искать изображение «спокойствия», и компьютер покажет вам изображения, которые вызывают ощущение спокойствия, например, закаты, безмятежные озера и т. д. Удивительно, но машины научились распознавать человеческие эмоции с таким мастерством, что могут поставить себя на наше место и оценить, какие чувства вызовет у человека тот или иной образ.
Обучение машин человеческим эмоциям — важный шаг к тому, чтобы сделать их более творческими. В конце концов, большая часть современного искусства — это визуальное представление человеческих эмоций.
Но может ли машина быть творческой?
Творчество и артистизм — это две вещи, о которых нам, людям, нравится думать только о себе. Животные не занимаются искусством, как и машины… пока. Проект Deep Dream от Google попытался перевернуть с ног на голову представление о том, что машины не могут создавать искусство. Поисковый гигант научил компьютеры манипулировать изображениями для создания причудливых психоделических произведений искусства. Изображения, созданные Google Двигатель глубокой мечты возможно, они некрасивы, но они определенно уникальны и невероятно креативны. Машинные творения содержат психоделические цвета, слизней, странные глаза и бестелесных животных, кружащихся в неопределенном пространстве.
Некоторые могут возразить, что это не настоящее искусство, если машины просто комбинируют существующие изображения, искажают их и погружают в яркие цвета; Google не согласился бы с этим, как и художник по программированию Клингеманн.
«Люди не способны на оригинальные идеи», — объяснил он.
1 из 8
Он отметил, что даже известные картины содержат элементы предыдущих произведений искусства. Шедевр Пикассо 1907 года. Авиньонские девицы, например, имеет влияние со стороны Африканское искусство и предшественники кубистов, таких как Поль Сезанн. В этом отношении коллажи, которые художественно объединяют существующие изображения, являются еще одним хорошо зарекомендовавшим себя видом искусства. Пикассо, Энди Уорхол, Ман Рэй и многие другие известны своими эксцентричными коллажами, так почему же коллажи, созданные машинами, не могут считаться искусством?
Клингеманн хотел раздвинуть границы цифрового искусства и увидеть, как могут развиваться творческие машины, задолго до того, как он начал свою стажировку в Институте культуры Google. Используя свои собственные, менее мощные машины, Клингеманн начал экспериментировать с Интернет-архивами и сервисами Google. Тензорфлоу программное обеспечение машинного обучения для создания цифровых коллажей.
Он создал инструмент машинного обучения под названием Ernst, названный в честь сюрреалиста и художника-коллажа. Макс Эрнст. Клингеманн идентифицировал серию объектов из работ Эрнста и приказал компьютеру создать разные коллажи с одними и теми же элементами. Результаты часто были сюрреалистическими, иногда забавными, а иногда совершенно ужасными.
«Люди не способны на оригинальные идеи».
Клингеманн хотел получить больше контроля над хаотичными изображениями, которые создавали его машины, поэтому он начал обучать их новым вещам. Он спросил себя: «Что интересно людям?» Клингеманн знал, что ему нужно научить систему тому, что искать, научить ее видеть все эти элементы так, как это сделал бы человек-художник.
Результат работы великолепен и совершенно уникален. Хотя Клингеманн явно использовал старые изображения для создания своих работ, они показаны в новом контексте, и в этом вся разница.
Сейчас компьютерное творчество ограничивается интересными коллажами и пониманием того, какие изображения хорошо сочетаются друг с другом. Машины еще не создают свои собственные произведения искусства, но художники кода, которые их приводят в действие, в ходе этого процесса становятся скорее кураторами, чем творцами.
Еще неизвестно, насколько человек сможет расширить творческие способности машин, но наблюдать за этим, безусловно, интересно.
Рекомендации редакции
- Google Bard теперь может говорить, но сможет ли он заглушить ChatGPT?
- Теперь вы можете опробовать Bard от Google, конкурента ChatGPT.
- Новый искусственный интеллект Bard от Google может быть достаточно мощным, чтобы заставить ChatGPT беспокоиться — и он уже здесь
- Google Meet или Zoom? Скоро это не будет иметь значения
- Причудливая новая клавиатура Google Japan также может обнаруживать (в буквальном смысле) ошибки