Оптичні ілюзії можуть допомогти нам створити нове покоління ШІ

Ви дивитесь на зображення чорного кола на сітці круглих точок. Воно нагадує отвір, прорізаний у шматку білого сітчастого матеріалу, хоча насправді це плоске нерухоме зображення на екрані чи аркуші паперу. Але ваш мозок цього не сприймає. Як якийсь галюцинаторний досвід низького рівня, ваш розум відключається; сприймаючи статичне зображення як вихід чорного тунелю, який рухається до вас.

Зміст

Еволюційний край
Машинний зір покращується
Тест Тюрінга для машинного зору
Використовуйте свою ілюзію
Досягнення загального бачення

Відповідаючи на правдоподібність ефекту, організм починає несвідомо реагувати: зіниці ока розширюються, щоб більше світла, так само, як вони пристосувалися б, якби ви збиралися поринути в темряву, щоб забезпечити найкраще бачення.

Розглянутий ефект був створений Акіоші Кітаока, психолог Університету Ріцумейкан у Кобе, Японія. Це одна з десятків оптичних ілюзій, які він створив протягом тривалої кар’єри. («Мені вони всі подобаються», — сказав він, відповідаючи на запитання Digital Trend про те, чи є у нього улюблений.)

Рекомендовані відео

Ця нова ілюзія була предметом нещодавно опублікованого дослідження в журналі Frontiers in Human Neuroscience. Хоча в центрі уваги стаття — фізіологічна реакція людини на новий ефект (який, як виявляється, відчують приблизно 86 відсотків із нас), загальна тема також може мати велике значення, коли справа доходить до майбутнього машинного інтелекту, як один із дослідників охоче пояснив Digital Тенденції.

Еволюційний край

оптична ілюзія, відома як спіраль Фрейзера — На перший погляд може здатися, що на цьому зображенні зображена спіраль, яка звивається до центру. Але спробуйте прослідкувати за однією з ліній, яка, здавалося б, вигинається всередину, і ви зрозумієте, що це зовсім не спіраль.

Щось не так з вашим мозком. Принаймні, це один простий висновок, який можна зробити з того, як людський мозок сприймає оптичні ілюзії. Яке інше пояснення існує для двовимірного, статичного зображення, яке мозок сприймає як щось зовсім інше? Довгий час основна психологія вважала саме це.

«Спочатку люди думали: «Гаразд, наш мозок не ідеальний... Він не завжди все робить правильно». Це помилка, чи не так?» сказав Бруно Ленг, професор кафедри психології Університету Осло та перший автор вищезгаданого дослідження. «Ілюзії в тому випадку були цікаві, оскільки вони виявляли б якийсь недосконалість механізму».

Мозок не може дізнатися, що там [насправді]».

Психологи вже не сприймають їх так. У всякому разі, такі дослідження підкреслюють, що візуальна система — це не просто проста камера. Оптична ілюзія «Ілюзорна діра, що розширюється» пояснює, що око пристосовується до сприйманого, навіть уявного, світла й темряви, а не до фізичної енергії.

Найважливіше те, що він демонструє, що ми не просто тупо записуємо світ за допомогою наших візуальних систем, а натомість виконайте безперервний набір наукових експериментів, щоб отримати невелику еволюцію перевага. Мета полягає в тому, щоб проаналізувати надані нам дані та спробувати завчасно вирішити проблеми, перш ніж вони стануть, ну, проблемами.

«Мозок не може дізнатися, що [насправді] там», — сказав Ленг. «Те, що він робить, — це створення свого роду віртуальної реальності того, що може бути там. Є трохи здогадок. У цьому відношенні ви можете думати про мозок як про ймовірнісну машину. Ви можете назвати це a байєсівський машина, якщо хочете. Він використовує певну попередню гіпотезу та постійно намагається перевірити її, щоб побачити, чи це працює».

Лаенг наводить приклад того, як наші очі пристосовуються лише на основі враження від світла від сонця: навіть коли воно видно крізь хмарний покрив або листя над головою. Про всяк випадок.

«В еволюції важливо не те, що це правда [на той момент], а ймовірність», — продовжив він. «Звужуючи зіницю, ваше тіло вже пристосовується до ситуації, яка дуже ймовірно станеться за короткий проміжок часу. Що відбувається [якщо сонце раптово виходить], це те, що ви засліплені. Засліплений означає тимчасову недієздатність. Це має величезні наслідки, незалежно від того, чи є ви здобиччю, чи хижаком. Ви втрачаєте частку секунди в конкретній ситуації і можете не вижити».

Наші зорові системи також мають здогадуватися не лише про світло й темряву. Подумайте про гру в теніс, де м’яч рухається з високою швидкістю. Якби ми повністю базували свою поведінку на тому, що отримує зорова система в будь-який момент, ми б відстали від реальності й не змогли б повернути м’яч. «Ми здатні сприймати сьогодення, хоча насправді застрягли в минулому», — сказав Ленг. «Єдиний спосіб зробити це — передбачити майбутнє. Звучить трохи як гра слів, але це все в двох словах».

Машинний зір покращується

розпізнавання обличчя — izusek/Getty Images

Так яке відношення це має до комп’ютерного зору? Потенційно все. Для того, щоб робот, наприклад, міг ефективно функціонувати в реальному світі, він повинен мати можливість робити такі налаштування на льоту. Комп’ютери мають перевагу, коли йдеться про їх здатність виконувати надзвичайно швидкі обчислення. Чого вони не мають, так це мільйонів років еволюції на їхньому боці.

За останні роки машинний зір, тим не менш, досяг величезних успіхів. Вони можуть ідентифікувати обличчя чи ходу у відеопотоках у реальному часі — можливо, навіть у величезних натовпах людей. Подібна класифікація зображень і технічні інструменти можуть розпізнавати присутність інших об'єктів прориви в сегментації об’єктів дають змогу краще зрозуміти зміст різн сцени. Був також досягнутий значний прогрес, коли справа доходить до екстраполяції 3D-зображень із 2D-сцен, дозволяючи машинам «читати» тривимірну інформацію, таку як глибина, зі сцен. Це наближає сучасний комп’ютерний зір до людського сприйняття зображення.

Проте все ще існує прірва між найкращими алгоритмами машинного зору та видами можливостей на основі зору, якими переважна більшість людей здатна користуватися з молодого віку. Хоча ми не можемо чітко сформулювати, як ми виконуємо ці завдання на основі бачення (цитуючи угорсько-британського ерудита Майкла Поланьї, «ми можемо знати, більше, ніж ми можемо сказати»), ми, тим не менш, можемо виконувати вражаючий набір завдань, які дозволяють нам використовувати наш зір різноманітними розумними шляхи.

Тест Тюрінга для машинного зору

Якщо дослідники та інженери сподіваються створити системи комп’ютерного зору, які працюють принаймні нарівні з візуальним обробляти навички мозку wetware, будувати алгоритми, які можуть розуміти оптичні ілюзії, непоганий початок точка. Принаймні, це може виявитися хорошим способом вимірювання того, наскільки добре системи машинного зору працюють з нашим власним мозком. Можливо, це не відповідь на міфічне Загальний штучний інтелект, але це може бути ключем до розблокування General Vision.

оптична ілюзія, яка змушує ваш мозок бачити помилкові кольори — Вірте чи ні, але всі ці кульки одного відтінку сірого, і ваш мозок інтерпретує їх як різні кольори на основі контекстуальних ознак кольорових ліній, які перетинають їх

«Якби хтось одного разу розробив штучну зорову систему, яка допускає ті самі ілюзорні помилки сприйняття, що ми робимо, ви зрозумієте на цьому етапі, що вони [досягають] гарної симуляції того, як працює наш мозок», — Лаєнг. сказав. «Це був би свого роду тест Тьюринга. Якщо у вас є штучна мережа, яка обдурена ілюзією, як ми, тоді ми [будемо] дуже близькі до розуміння базових обчислень самого мозку».

Пісня І-Чже, читач комп’ютерного бачення та машинного навчання в Центрі обробки зорової мови та сигналів Університету Суррея Великобританії, погоджується з гіпотезою. «Попросити алгоритми зору зрозуміти оптичні ілюзії як загальну тему має велике значення для спільноти», — сказав він Digital Trends. «Це виходить за межі нинішнього фокусу спільноти — просити машини [розпізнавати], розширюючи межі [і] вимагаючи від машин міркувати. Цей поштовх [стане] значним кроком уперед до «Загального бачення», де потрібно пристосуватися до суб’єктивних інтерпретацій візуальних концепцій».

Використовуйте свою ілюзію

На сьогоднішній день були проведені деякі обмежені дослідження щодо цієї мети, хоча вони залишаються на відносно ранній стадії. Насім Нематзаде, дослідник, який має ступінь доктора філософії. у галузі штучного інтелекту та робототехніки – моделі низькорівневого зору, одна людина, яка має опубліковані роботи на цю тему.

«Ми вважаємо, що подальше дослідження ролі простих моделей, подібних до Гауса, у низькорівневій обробці сітківки та ядрі Гауса на ранній стадії [глибокі нейронні мереж], і його передбачення втрати ілюзії сприйняття призведе до більш точних методів і моделей комп’ютерного зору», – сказав Нематзаде Digital Trends. «[Це може] сприяти створенню моделей більш високого рівня обробки глибини та руху та узагальнювати комп’ютерне розуміння природних зображень».

Рухомі нерухомі кола (Оптична ілюзія) !

Макс Вільямс, дослідник ШІ, який допоміг зібрати набір даних тисячі зображень оптичної ілюзії для систем комп’ютерного зору найбільш стисло описує зв’язок між загальним зором і оптичними ілюзіями: «Ілюзії існують тому, що наші очі та мозок виконують безладні та спеціальний процес для вилучення візуальної сцени з незрозумілого світлового поля, створеного фізичним світом, від якого ми майже повністю відгороджені», — сказали вони Digital. Тенденції. «Я не думаю, що можливо зробити візуальну систему достатньо виразною, щоб вважати її «сприйняттям», яке також вільне від ілюзій».

Досягнення загального бачення

Щоб було зрозуміло, досягнення людського рівня (або кращого) General Vision для AI не просто навчить їх розпізнавати стандартні оптичні ілюзії. Жодна надспецифічна здатність, скажімо, декодувати ілюзії Чарівного Ока з точністю 99,9% за 0,001 секунди не замінить мільйони років еволюції людини.

(Цікаво, що машинне зір вже має свою власну версію оптичних ілюзій у формі суперницьких моделей, які можуть змусити їх помилитися – як на одній тривожній ілюстрації – 3D-друкована іграшкова черепаха для рушниці. Однак вони не дають таких же еволюційних переваг, як оптичні ілюзії, які працюють на людях.)

Тим не менш, змусити машини розуміти людські оптичні ілюзії та реагувати на них так, як це робимо ми, може бути дуже корисним дослідженням.

І одне можна сказати точно: коли General Vision AI є досягнуто, він попадеться на ті ж види оптичних ілюзій, що й ми. Принаймні, у випадку з Ілюзорною дірою, що розширюється, 86% з нас.

Оптичні ілюзії можуть допомогти нам створити нове покоління ШІ

Еволюційний край

Машинний зір покращується

Тест Тюрінга для машинного зору

Використовуйте свою ілюзію

Досягнення загального бачення

Рекомендації редакції

Категорії

Останні

Ось як камера Samsung Galaxy S9 Plus працює в умовах слабкого освітлення

Чи потрібна нам 48-мегапіксельна камера на телефоні? Ми запитали експертів

VR Fitness з Oculus Quest 2 дав мені можливість грати без почуття провини