Цей бот, що грає в Pictionary, є важливою віхою для ШІ.

click fraud protection

Подібно до нових навичок Alexa на вашому Amazon Echo, останні кілька десятиліть бачили ШІ. поступово здобувайте здатність перемагати людство у все більшій кількості наших улюблених ігор: Шахи з Deep Blue 1997 року, Небезпека з IBM Watson у 2011 році, Ігри Atari з DeepMind у 2013 році, Іди з AlphaGo у 2016 році, і так далі. Для широкої публіки, принаймні, кожен випадок перетворює абстрактний шлях обчислювального прогресу на вид спорту. Skynet стає розумнішим. Звідки ми знаємо? Тому що подивіться на зростаючу кількість розваг, у яких він може переконливо перемогти нас.

Зміст

  • Створення майстра Pictionary
  • Більше, ніж здається на перший погляд

З огляду на цю історію, це не надто шокує почути, що A.I. тепер може працювати переконливо добре в Pictionary, гра на вгадування слів, натхненну шарадами, яка вимагає, щоб одна особа намалювала зображення, а інші намагалися якнайшвидше зрозуміти, що вони намалювали.

Рекомендовані відео

Саме це нещодавно зробили дослідники з Університету Суррея у Великобританії, створивши Pixelor, «конкурентоспроможний штучний інтелект для малювання ескізів». агент». З огляду на візуальний Концепція Pixelor здатна намалювати ескіз, який розпізнають (як люди, так і машини) як запланований об’єкт так само швидко — або навіть швидше — ніж людина конкурент.

Пов'язані

  • Як Nintendo може використовувати штучний інтелект щоб перенести ігри 4K на Switch Pro
  • Директор Yakuza вважає, що еволюція PS5 буде зосереджена на штучному інтелекті. і машинне навчання

«Наш А.І. агент може відрендерити ескіз з нуля», Пісня І-Чже, читач комп’ютерного бачення та машинного навчання в Центрі обробки зорової мови та сигналів Університету Суррея, розповів Digital Trends. «Дайте йому таке слово, як «обличчя», і воно знатиме, що малювати. … Кожного разу він малюватиме іншого кота, іншу собаку, інше обличчя. Але завжди зі знанням того, як виграти в грі Pictionary».

Створення майстра Pictionary

Можливість перетворити складне зображення реального світу на ескіз сама по собі досить вражаюча. Потрібен рівень абстракції, щоб поглянути на людське обличчя і побачити його як овал із двома меншими овалами для очей, лінією для носа та півколом для рота. У дітей здатність сприймати зображення таким чином свідчить, серед іншого, про зростаюче когнітивне розуміння понять.

Однак, як і багато інших аспектів штучного інтелекту, які часто узагальнюють як Парадокс Моравека що «складні проблеми легкі, а легкі проблеми важкі», це серйозний виклик для машини інтелект — незважаючи на те, що це базова, нічим не примітна навичка для більшості дворічних дітей дітей.

Лабораторія SketchX

Однак це не нерозв’язне завдання. У 2016 році, ми писали про роботу Сонга з інструментом під назвою Sketch, нейронною мережею глибокого навчання, яка могла розпізнавати намальовані вручну ескізи та використовувати їх для пошуку реальних продуктів. Ця конкретна мережа була навчена за допомогою набору даних, що складається з приблизно 30 000 порівнянь ескізів і фотографій, що дозволяє їй розпізнавати, як реальні об’єкти представлені на малюнку від руки. Pixelor робить щось подібне, але може створювати власні малюнки, а не просто розпізнавати малюнки інших людей.

Але цього недостатньо для перемоги Pictionary. Pictionary це складна гра, мета якої не просто намалювати, скажімо, кота, а намалювати кота якомога меншою кількістю рухів. Ви можете бути найбільшим художником у світі, але якщо вам знадобиться 12 годин, щоб намалювати ідеального кота, ви жахливі Pictionary гравець.

Це означало створення штучного інтелекту. що може вивчати людей, щоб побачити, які стратегії вони використовують, щоб добре грати в Pictionary. Як сказав Сонг: «Які найважливіші деталі намалювати, щоб інші люди могли вгадати? Ми хочемо, щоб наш малюнок був вгаданий якомога раніше».

Для цього дослідники взяли QuickDraw, найбільший доступний на сьогодні набір даних ескізів людини. Потім вони створили нейронний алгоритм сортування, який визначає пріоритетність штрихів, які повинен зробити художник; надання об’єкта, який можна вгадати, у якомога меншій кількості рядків. Це означає розбити ескізи на штрихи, потім перетасувати порядок цих штрихів і перевірити результати, доки не буде встановлено точний порядок, у якому їх потрібно розмістити на папері.

Наприклад, художник може почати малювати кота з ескізу круглого контуру його голови. Але коло може бути будь-якою кількістю речей, навіть якщо ви знаєте, що воно має символізувати голову. Однак намалюйте два гострих вуха або два набори вусів, і кількість потенційних речей, які ви могли б намалювати, зменшиться дуже і дуже швидко. Потім ця інформація використовується для надання вказівок агенту, який створює ескізи.

Сонг сказав, що команда може випустити публічну версію цього Pictionary- ігровий бот, щоб люди-гравці могли самостійно перемогти штучного інтелекту, що малює ескізи. майстер. (Хто знає? Гра експерта може навіть допомогти покращити власний Pictionary гра.)

Більше, ніж здається на перший погляд

Однак у Pixelor є щось більше, ніж просто ще один тривіальний ігровий бот. Подібно до того, як комп’ютерна система має інтерфейс поверхневого рівня, з яким ми взаємодіємо, і внутрішній код серверної частини, так само кожен основний ШІ. віха гри має прихований мотив. Якщо вони явно не створюють комп’ютерні ігри, дослідницькі лабораторії не витрачають незліченні людино-години на будівництво ігровий А.І. агентів просто для того, щоб додати ще один запис у великий список того, що люди більше не найкращі в. Метою завжди є просування якоїсь фундаментальної частини ШІ. вирішення проблем.

У випадку Pixelor прихована мета полягає в тому, щоб створити машини, здатні краще визначати, що важливо для людини в конкретній сцені. Дивлячись на зображення, ми одразу можемо визначити найвиразніші деталі.

Припустимо, ви їдете з роботи додому. Хоча дерева, що обсаджують узбіччя дороги, можуть бути мальовничими, а рекламний щит для нового фільму може бути цікавим, жоден з них не такий важливий, як обличчя та мова тіла людини, яка може чи не збирається виходити перед ви. Ще до того, як ви свідомо обробили інформацію, ваш мозок виділив найважливіші деталі. Як навчити комп’ютер це робити? Виявляється, один із чудових способів зробити це — побачити, як люди віддають пріоритет основним впізнаваним деталям зображення, коли вони малюють його.

«Немає ніяких людських знань, вбудованих [одних лише в фотографії], — сказав Сонг. «Нам потрібні людські дані, які можуть дати нам сигнали про те, як люди розуміють об’єкт».

Як зазначалося, добре Pictionary гравець, як і хороший боксер, знатиме абсолютний мінімум, який йому потрібно зробити для досягнення певної мети. Це, у макросенсі, те, про що дбають І-Чже Сон та його колеги. Це не так тривіально, як отримати комп’ютер для гри; це змусити комп’ютер зрозуміти, що важливо в певних сценах — і, сподіваюся, мати можливість краще узагальнювати.

Як і все від безпілотні автомобілі Оскільки роботи на робочому місці стають все більш поширеними, це важливе завдання, яке потрібно вирішити.

Стаття з описом роботи буде представлена ​​на SIGGRAPH Asia 2020 у листопаді.

Рекомендації редакції

  • Вояж - це штучний інтелект ігровий рай, де боти пишуть правила
  • шахи. Небезпека. Іди. Чому ми використовуємо ігри як еталон для ШІ?
  • А.І. розробляє ретро-відеоігри — і вони напрочуд гарні