Этот бот, играющий в картинки, является огромной вехой в развитии искусственного интеллекта.

Как и новые навыки Alexa на вашем Amazon Echo, за последние пару десятилетий ИИ стал свидетелем появления новых возможностей. постепенно обретайте способность превосходить человечество во все большем количестве наших любимых игр: Шахматы с Deep Blue в 1997 году, Опасность с IBM Watson в 2011 году, Игры Atari с DeepMind в 2013 году, Идти с AlphaGo в 2016 году, и так далее. По крайней мере, для широкой публики каждый случай превращает абстрактный путь вычислительного прогресса в зрелищный вид спорта. Скайнет становится умнее. Откуда нам знать? Потому что обратите внимание на растущее число развлечений, в которых он может нас убедительно превзойти.

Содержание

Создание мастера Pictionary
Больше, чем кажется на первый взгляд

На этом фоне не так уж и удивительно услышать, что ИИ теперь может превосходно выступать на картинка, игра в угадывание слов, вдохновленная шарадами, в которой один человек должен нарисовать изображение, а другие должны попытаться как можно быстрее понять, что они нарисовали.

Рекомендуемые видео

Именно это недавно осуществили исследователи из британского Университета Суррея, создав Pixelor, «конкурентную систему искусственного интеллекта для рисования эскизов». агент». Учитывая визуальное Концепция Pixelor способна нарисовать эскиз, который будет узнаваем (как людьми, так и машинами) как предполагаемый объект, так же быстро — или даже быстрее — чем человек конкурент.

Связанный

Как Nintendo могла бы использовать ИИ перенести игры 4K на Switch Pro
Директор Yakuza считает, что эволюция PS5 будет сосредоточена на искусственном интеллекте. и машинное обучение

«Наш ИИ. агент способен отрендерить эскиз с нуля», И-Чжэ Сун, читатель кафедры компьютерного зрения и машинного обучения в Центре визуальной обработки речи и сигналов Университета Суррея, рассказал Digital Trends. «Дайте ему такое слово, как «лицо», и он будет знать, что рисовать. … Каждый раз он будет рисовать новую кошку, другую собаку, другое лицо. Но всегда со знанием того, как выиграть игру Pictionary».

Создание мастера Pictionary

Возможность превратить сложное изображение реального мира в эскиз сама по себе впечатляет. Требуется определенный уровень абстракции, чтобы взглянуть на человеческое лицо и увидеть его как овал с двумя меньшими овалами вместо глаз, линией носа и полукругом рта. У детей способность воспринимать изображение таким образом свидетельствует, помимо прочего, о растущем когнитивном понимании понятий.

Однако, как и многие другие аспекты ИИ, которые часто суммируют как Парадокс Моравеца что «сложные проблемы просты, а легкие проблемы сложны», это серьезная проблема для машины. интеллект — несмотря на то, что это базовый, ничем не примечательный навык для большинства двухлетних детей. дети.

Однако это не неразрешимая задача. В 2016 годуМы писали о работе Сонга с инструментом под названием Sketch — нейронной сетью глубокого обучения, способной распознавать нарисованные от руки эскизы и использовать их для поиска реальных продуктов. Эта конкретная сеть была обучена с использованием набора данных, состоящего примерно из 30 000 сравнений эскизов и фотографий, что позволило ей распознавать, как реальные объекты представлены на рисунках от руки. Pixelor делает нечто подобное, но также может генерировать собственные рисунки, а не просто распознавать чужие.

Но этого недостаточно для победы картинка. картинка — это игра на время, цель которой — не просто нарисовать, скажем, кошку, а нарисовать кошку за как можно меньшее количество штрихов. Вы могли бы быть величайшим художником в мире, но если вам понадобится 12 часов, чтобы нарисовать идеальную кошку, вы ужасный картинка игрок.

Это означало создание искусственного интеллекта. который мог бы изучить людей, чтобы увидеть, какие стратегии они используют, чтобы хорошо играть в Pictionary. Как сказал Сон: «Какие наиболее важные моменты нужно нарисовать, чтобы другие судьи-люди могли угадать? Мы хотим, чтобы наш рисунок был угадан как можно раньше».

Для этого исследователи использовали QuickDraw, самый большой доступный на сегодняшний день набор данных о человеческих эскизах. Затем они создали алгоритм нейронной сортировки, который определяет приоритетность мазков, которые должен сделать художник; давая угадываемое представление объекта в как можно меньшем количестве строк. Это означает разбиение эскизов на штрихи, затем перемешивание порядка этих штрихов и тестирование результатов до тех пор, пока не будет установлен точный порядок, в котором их нужно расположить на бумаге.

Например, художник может начать рисовать кошку, нарисовав круговой контур ее головы. Но круг может быть чем угодно, даже если вы знаете, что он должен обозначать голову. Однако нарисуйте два заостренных уха или две пары усов, и количество потенциальных объектов, которые вы могли бы нарисовать, очень и очень быстро уменьшится. Эта информация затем используется для инструктирования агента создания эскизов.

Сон сказал, что команда могла бы выпустить общедоступную версию этого проекта. картинка-игровой бот, чтобы игроки-люди могли самостоятельно победить рисующего ИИ. владелец. (Кто знает? Игра эксперта может даже помочь улучшить ваши собственные картинка игра.)

Больше, чем кажется на первый взгляд

Однако Pixelor — это нечто большее, чем просто еще один тривиальный игровой бот. Точно так же, как компьютерная система имеет как поверхностный интерфейс, с которым мы взаимодействуем, так и скрытый внутренний код, так же и каждый крупный ИИ. игровые вехи имеют неспроста. Исследовательские лаборатории не тратят бесчисленное количество человеко-часов на создание компьютерных игр, если только они не занимаются созданием компьютерных игр. игровой ИИ агенты просто для того, чтобы добавить еще одну запись в большой список того, что люди больше не являются лучшими в. Цель всегда состоит в том, чтобы продвинуть какую-то фундаментальную часть ИИ. решение проблем.

В случае с Pixelor скрытая цель — создать машины, которые смогут лучше понять, что важно для человека в конкретной сцене. Когда мы смотрим на изображение, мы сразу можем определить наиболее важные детали.

Допустим, вы едете домой с работы. Хотя деревья вдоль обочины дороги могут быть живописными, а рекламный щит нового фильма может быть интересным, ни то, ни другое не так важно, как выражение лица и язык тела человека, который может или не собирается выйти перед ты. Еще до того, как вы сознательно обработали информацию, ваш мозг выделил наиболее важные детали. Как научить компьютер делать это? Что ж, оказывается, что один отличный способ сделать это — увидеть, как люди расставляют приоритеты в заметных узнаваемых деталях изображения, когда они его зарисовывают.

«В фотографиях [само по себе] не заключено никаких человеческих знаний», — сказал Сон. «Нам нужны человеческие данные, которые могут дать нам сигналы о том, как люди понимают объект».

Как отмечается, хороший картинка игрок, как хороший боксер, будет знать абсолютный минимум, который ему нужно сделать для достижения определенной цели. В макроэкономическом смысле это то, что волнует И-Чжэ Сун и его коллег. Это не так тривиально, как заставить компьютер играть в игру; он помогает компьютеру понять, что важно в определенных сценах, и, надеюсь, иметь возможность лучше обобщать.

Как все из беспилотные автомобили роботы на рабочем месте становятся все более распространенными, это важная задача, которую необходимо решить.

Документ с описанием работы будет представлен на SIGGRAPH Asia 2020 в ноябре.

Этот бот, играющий в картинки, является огромной вехой в развитии искусственного интеллекта.

Создание мастера Pictionary

Больше, чем кажется на первый взгляд

Рекомендации редакции

Категории

Недавний

Как новые MacBook от Apple останутся конкурентоспособными?

15-летняя девочка придумала противоядие от отравленного дуба

Что случилось с артистом, ранее известным как Мос Деф?