Оптические иллюзии могут помочь нам создать новое поколение ИИ

Вы смотрите на изображение черного круга на сетке круглых точек. Оно напоминает дыру, выжженную в куске белого сетчатого материала, хотя на самом деле это плоское неподвижное изображение на экране или листе бумаги. Но ваш мозг этого не понимает. Ваш разум отключается, как при каком-то низкоуровневом галлюцинаторном опыте; воспринимая статичное изображение как вход в черный туннель, движущийся к вам.

Содержание

Эволюционное преимущество
Машинное зрение становится лучше
Тест Тьюринга для машинного зрения
Используй свою иллюзию
Достижение общего видения

Отвечая на правдоподобие эффекта, организм начинает бессознательно реагировать: зрачки расширяются, позволяя больше света, точно так же, как они приспосабливаются, если вы собираетесь погрузиться в темноту, чтобы обеспечить наилучшее возможное зрение.

Рассматриваемый эффект был создан Акиеси Китаока, психолог из Университета Рицумейкан в Кобе, Япония. Это одна из десятков оптических иллюзий, которые он создал за свою долгую карьеру. («Они мне нравятся все», — сказал он, отвечая на вопрос Digital Trend о том, есть ли у него фаворит.)

Рекомендуемые видео

Эта новая иллюзия стала предметом исследования, опубликованного недавно. в журнале Frontiers in Human Neuroscience. Хотя основное внимание в статье уделяется физиологическим реакциям человека на новый эффект (который, как выяснилось, испытают около 86 процентов из нас), Общая тема также может иметь большое значение, когда речь идет о будущем машинного интеллекта — как один из исследователей стремился объяснить Digital Тенденции.

Эволюционное преимущество

оптическая иллюзия, известная как спираль Фрейзера — На первый взгляд может показаться, что на этом изображении изображена спираль, извивающаяся к центру. Но попробуйте проследить за одной из линий, которая, казалось бы, изгибается внутрь, и вы поймете, что это вовсе не спираль.

Что-то не так с твоим мозгом. По крайней мере, такой простой вывод можно сделать, исходя из того, как человеческий мозг воспринимает оптические иллюзии. Какое еще объяснение существует для двумерного статического изображения, которое мозг воспринимает как нечто совершенно иное? Долгое время господствующая психология считала именно это.

«Изначально люди думали: «Ладно, наш мозг не идеален… Он не всегда все понимает правильно». Это провал, верно?» сказал Бруно Лаенг, профессор кафедры психологии Университета Осло и первый автор вышеупомянутого исследования. «Иллюзии в этом случае были интересны, потому что они выявили какое-то несовершенство техники».

Мозг не имеет возможности узнать, что [на самом деле] там».

Психологи больше не смотрят на них так. Во всяком случае, подобные исследования показывают, что зрительная система — это не просто камера. Оптическая иллюзия «Иллюзорная расширяющаяся дыра» ясно показывает, что глаз приспосабливается к воспринимаемому, даже воображаемому, свету и темноте, а не к физической энергии.

Самое главное, это демонстрирует, что мы не просто тупо записываем мир с помощью наших зрительных систем, а вместо этого проводите непрерывный набор научных экспериментов, чтобы получить небольшой эволюционный прогресс. преимущество. Цель состоит в том, чтобы проанализировать представленные нам данные и попытаться упреждающе решить проблемы, прежде чем они станут проблемами.

«Мозг не имеет возможности узнать, что [на самом деле] происходит», — сказал Лаенг. «Он создает своего рода виртуальную реальность того, что может быть там. Есть немного догадок. В этом отношении вы можете думать о мозге как о своего рода вероятностной машине. Вы можете назвать это Байесовский машина, если хотите. Он использует какую-то предварительную гипотезу и постоянно пытается ее проверить, чтобы увидеть, работает ли она».

Лаенг приводит пример того, как наши глаза корректируют свои действия, основываясь не более чем на впечатлении от солнечного света: даже когда он виден сквозь облачный покров или лиственный покров над головой. На всякий случай.

«В эволюции важно не то, что это правда [в данный момент], а то, что это вероятно», — продолжил он. «Сужая зрачок, ваше тело уже приспосабливается к ситуации, которая, весьма вероятно, произойдет через короткий промежуток времени. Что происходит [если вдруг выходит солнце]? Вы ослеплены. Ослепленный означает временную недееспособность. Это имеет огромные последствия независимо от того, являетесь ли вы жертвой или хищником. Теряешь долю секунды в конкретной ситуации и можешь не выжить».

Нашей зрительной системе приходится делать предположения не только о свете и тьме. Представьте себе игру в теннис, в которой мяч движется с большой скоростью. Если бы мы полностью основывали свое поведение на том, что зрительная система получает в любой момент времени, мы бы отстали от реальности и не смогли бы вернуть мяч. «Мы способны воспринимать настоящее, хотя на самом деле мы застряли в прошлом», — сказал Лаенг. «Единственный способ сделать это — предсказать будущее. Это немного похоже на игру в слова, но вот в двух словах».

Машинное зрение становится лучше

Так какое же это имеет отношение к компьютерному зрению? Потенциально все. Например, чтобы робот мог эффективно функционировать в реальном мире, он должен иметь возможность вносить подобные изменения на лету. Компьютеры имеют преимущество, когда дело доходит до их способности выполнять чрезвычайно быстрые вычисления. Чего у них нет, так это миллионов лет эволюции на их стороне.

Тем не менее, в последние годы машинное зрение добилось огромных успехов. Они могут распознавать лица или походку в видеопотоках в реальном времени — возможно, даже в огромных толпах людей. Аналогичная классификация изображений и технические инструменты могут также распознавать присутствие других объектов. Прорывы в сегментации объектов позволяют лучше понимать содержание различных сцены. Также был достигнут значительный прогресс в экстраполяции 3D-изображений из 2D-сцен, что позволяет машинам «считывать» трехмерную информацию, такую как глубина, из сцен. Это приближает современное компьютерное зрение к восприятию изображений человеком.

Тем не менее, все еще существует пропасть между лучшими алгоритмами машинного зрения и теми возможностями, которые подавляющее большинство людей способны реализовать с раннего возраста. Хотя мы не можем точно сформулировать, как мы выполняем эти задачи, основанные на видении (цитируя венгерско-британского эрудита Майкла Поланьи, «мы можем знать больше, чем мы можем сказать»), мы, тем не менее, способны выполнять впечатляющий набор задач, которые позволяют нам использовать наше зрение и различные умные способности. пути.

Тест Тьюринга для машинного зрения

Если исследователи и инженеры надеются создать системы компьютерного зрения, которые будут работать хотя бы наравне с визуальными навыки обработки «мокрого» мозга, создание алгоритмов, способных понимать оптические иллюзии, — неплохое начало точка. По крайней мере, это может оказаться хорошим способом измерения того, насколько хорошо системы машинного зрения воздействуют на наш мозг. Возможно, это не ответ на мифический вопрос. Общий искусственный интеллект, но это может быть ключом к разблокировке General Vision.

оптическая иллюзия, которая заставляет ваш мозг видеть ложные цвета — Хотите верьте, хотите нет, но все эти шарики имеют один и тот же оттенок серого, и ваш мозг интерпретирует их как имеющие разные цвета на основе контекстных сигналов цветных линий, которые пересекают их.

«Если бы кто-нибудь однажды разработал искусственную зрительную систему, которая совершает те же иллюзорные ошибки восприятия что мы делаем, вы бы знали, что на этом этапе они [достигают] хорошей симуляции того, как работает наш мозг», — Лаенг сказал. «Это будет своего рода тест Тьюринга. Если у вас есть искусственная сеть, которую обманывают иллюзии, как и мы, тогда мы [будем] очень близки к пониманию лежащих в основе вычислений самого мозга».

И-Чжэ Сун, читатель книги «Компьютерное зрение и машинное обучение» в Центре визуальной обработки речи и сигналов британского университета Суррея, согласен с этой гипотезой. «Просить алгоритмы зрения понять оптические иллюзии как общую тему имеет большую ценность для сообщества», — сказал он Digital Trends. «Это выходит за рамки нынешней направленности сообщества на то, чтобы просить машины [распознавать], расширяя границы возможного и прося машин рассуждать. Этот толчок [будет представлять] значительный шаг вперед к «Общему видению», где необходимо учитывать субъективные интерпретации визуальных концепций».

Используй свою иллюзию

На сегодняшний день было проведено несколько ограниченных исследований в направлении этой цели, хотя они все еще находятся на относительно ранней стадии. Насим Нематзаде, исследователь, доктор философии. в области искусственного интеллекта и робототехники - Модели зрения низкого уровня - это один человек, который имеет опубликованная работа на эту тему.

«Мы считаем, что дальнейшее исследование роли простых гауссовых моделей в низкоуровневой обработке сетчатки и гауссовского ядра на ранней стадии [глубоких нейронных сетей] сетей] и его предсказание об утрате иллюзий восприятия приведут к созданию более точных методов и моделей компьютерного зрения», — сказал Нематзаде в интервью Digital Trends. «[Это может] способствовать созданию моделей более высокого уровня обработки глубины и движения и обобщению для компьютерного понимания естественных изображений».

Движущиеся неподвижные круги (Оптическая иллюзия) !

Макс Уильямс, исследователь искусственного интеллекта, который помог собрать набор данных тысячи изображений оптических иллюзий для систем компьютерного зрения наиболее кратко описывает взаимосвязь между общим зрением и оптическими иллюзиями: «Иллюзии существуют потому, что наши глаза и мозг выполняют беспорядочную и беспорядочную работу. специальный процесс для извлечения визуальной сцены из непонятного иначе светового поля, созданного физическим миром, от которого мы почти полностью изолированы», — рассказали они Digital. Тенденции. «Я не думаю, что возможно сделать зрительную систему достаточно выразительной, чтобы ее можно было считать «восприятием», свободным от иллюзий».

Достижение общего видения

Чтобы внести ясность, достижение общего зрения на человеческом уровне (или лучше) для ИИ не просто научит его распознавать стандартные оптические иллюзии. Никакая сверхспецифическая способность, скажем, расшифровывать иллюзии Magic Eye с точностью 99,9% за 0,001 секунды не заменит миллионы лет человеческой эволюции.

(Интересно, что у машинного зрения уже есть своя версия оптических иллюзий в виде состязательных моделей, которые могут заставить их ошибаться – как на одной тревожной иллюстрации – 3D-печатная игрушка-черепаха для винтовки. Однако они не приносят тех же эволюционных преимуществ, что и оптические иллюзии, действующие на людей.)

Тем не менее, заставить машины понимать оптические иллюзии человека и реагировать на них так, как это делаем мы, может быть очень полезным исследованием.

И одно можно сказать наверняка: когда General Vision AI является Достигнув этого, он попадет на те же оптические иллюзии, что и мы. По крайней мере, в случае с Иллюзорной Расширяющейся Дырой — 86% из нас.

Оптические иллюзии могут помочь нам создать новое поколение ИИ

Эволюционное преимущество

Машинное зрение становится лучше

Тест Тьюринга для машинного зрения

Используй свою иллюзию

Достижение общего видения

Рекомендации редакции

Категории

Недавний

Можно ли доверять рейтингам в App Store? Мы спросили экспертов

Как сохранить цифровые данные навсегда? Это не легко

Когда стоит давать ребенку смартфон? Мы спрашиваем эксперта