Оптичните илюзии могат да ни помогнат да изградим ново поколение AI

Гледате изображение на черен кръг върху решетка от кръгли точки. Прилича на дупка, изпечена в парче бял мрежест материал, въпреки че всъщност е плоско, неподвижно изображение на екран или лист хартия. Но мозъкът ви не го възприема така. Подобно на халюцинаторно преживяване на ниско ниво, умът ви излиза; възприемайки статичното изображение като входа на черен тунел, който се движи към вас.

Съдържание

Еволюционен ръб
Машинното зрение се подобрява
Тест на Тюринг за машинно зрение
Използвай въображението си
Постигане на обща визия

В отговор на правдоподобността на ефекта, тялото започва несъзнателно да реагира: зениците на окото се разширяват, за да позволят повече светлина, точно както биха се приспособили, ако сте на път да потънете в мрак, за да осигурят възможно най-доброто визия.

Въпросният ефект е създаден от Акийоши Китаока, психолог в университета Рицумейкан в Кобе, Япония. Това е една от десетките оптични илюзии, които е създал през дългата си кариера. („Харесвам ги всички“, каза той, отговаряйки на въпроса на Digital Trend дали има любим.)

Препоръчани видеоклипове

Тази нова илюзия беше обект на изследване, публикувано наскоро в списанието Frontiers in Human Neuroscience. Докато фокусът на статията е твърдо върху човешките физиологични реакции към новия ефект (който се оказва, че около 86 процента от нас ще изпитат), Цялостната тема също може да има голямо значение, когато става въпрос за бъдещето на машинния интелект - както един от изследователите беше нетърпелив да обясни на Digital Тенденции.

Еволюционен ръб

оптична илюзия, известна като спиралата на Фрейзър — На пръв поглед може да изглежда, че това изображение показва спирала, която се вие към центъра. Но опитайте да следвате една от линиите, тъй като привидно се извива навътре, и ще разберете, че това изобщо не е спирала.

Нещо не е наред с мозъка ви. Поне това е едно лесно заключение, което може да се направи от начина, по който човешкият мозък възприема оптичните илюзии. Какво друго обяснение има за двуизмерен, статичен образ, който мозъкът възприема като нещо напълно различно? Дълго време основната психология смяташе точно това.

„Първоначално хората си мислеха: „Добре, мозъкът ни не е перфектен… Не винаги го прави правилно.“ Това е провал, нали?“ казах Бруно Ленг, професор в катедрата по психология на университета в Осло и първи автор на гореспоменатото изследване. „Илюзиите в този случай бяха интересни, защото биха разкрили някакъв вид несъвършенство в машината.“

Мозъкът няма начин да разбере какво [наистина] има там.“

Психолозите вече не гледат на тях по този начин. Ако не друго, изследвания като това подчертават как зрителната система не е просто проста камера. Оптичната илюзия „Илюзорна разширяваща се дупка“ ясно показва, че окото се приспособява към възприеманата, дори въображаема, светлина и тъмнина, а не към физическата енергия.

Най-важното е, че показва, че ние не просто тъпо записваме света с нашите визуални системи, но вместо това извършвайте непрекъснат набор от научни експерименти, за да постигнете лека еволюция предимство. Целта е да анализираме представените ни данни и да се опитаме да се справим превантивно с проблемите, преди те да станат, добре, проблеми.

„Мозъкът няма начин да знае какво [наистина] има там“, каза Лаенг. „Това, което прави, е да изгради нещо като виртуална реалност за това, което може да бъде там. Има малко догадки. В това отношение можете да мислите за мозъка като за вид вероятностна машина. Можете да го наречете a байесовски машина, ако искаш. Използва някаква предишна хипотеза и се опитва да я тества през цялото време, за да види дали работи.

Laeng дава пример с нашите очи, които правят корекции въз основа на нищо повече от впечатлението за светлина от слънцето: дори когато това се вижда през облачна покривка или надвес от листа. За всеки случай.

„Това, което има значение в еволюцията, не е, че е вярно [в този момент], а е вероятно“, продължи той. „Свивайки зеницата, тялото ви вече се приспособява към ситуация, която е много вероятно да се случи за кратък период от време. Това, което се случва [ако внезапно изгрее слънце] е, че сте заслепени. Заслепен означава временно недееспособен. Това има огромни последици, независимо дали сте плячка или хищник. Губиш част от секундата в конкретна ситуация и може да не оцелееш.“

Не само светлината и тъмнината трябва да правят предположения и нашите зрителни системи. Помислете за игра на тенис, при която топката се движи с висока скорост. Ако базирахме поведението си изцяло на това, което визуалната система получава във всеки един момент, щяхме да изостанем от реалността и да не успеем да върнем топката. „В състояние сме да възприемаме настоящето, въпреки че наистина сме заседнали в миналото“, каза Лаенг. „Единственият начин да го направим е като предскажем бъдещето. Звучи малко като игра на думи, но това е накратко.“

Машинното зрение се подобрява

лицево разпознаване — izusek/Гети изображения

И така, какво общо има това с компютърното зрение? Потенциално всичко. За да може един робот, например, да функционира ефективно в реалния свят, той трябва да може да прави тези видове корекции в движение. Компютрите имат предимство, когато става въпрос за способността им да извършват изключително бързи изчисления. Това, което те нямат, са милиони години еволюция на тяхна страна.

През последните години машинното зрение все пак направи огромен напредък. Те могат да идентифицират лица или походки във видео потоци в реално време - потенциално дори в огромни тълпи от хора. Подобна класификация на изображения и технически инструменти могат да разпознаят и присъствието на други обекти, докато Пробивите в сегментирането на обекти правят възможно по-доброто разбиране на съдържанието на различни сцени. Освен това е постигнат значителен напредък, когато става дума за екстраполиране на 3D изображения от 2D сцени, което позволява на машините да „четат“ триизмерна информация, като дълбочина, от сцени. Това доближава съвременното компютърно зрение до възприемането на човешкия образ.

Въпреки това все още съществува пропаст между най-добрите алгоритми за машинно зрение и видовете способности, базирани на зрението, които огромното мнозинство от хората могат да изпълняват от ранна възраст. Въпреки че не можем да артикулираме точно как изпълняваме тези базирани на визия задачи (да цитирам унгарско-британския ерудит Майкъл Полани, „ние можем да знаем повече, отколкото можем да кажем“), въпреки това сме в състояние да изпълняваме впечатляващ набор от задачи, които ни позволяват да впрегнем зрението си в различни умни начини.

Тест на Тюринг за машинно зрение

Ако изследователите и инженерите се надяват да създадат системи за компютърно зрение, които работят поне наравно с визуалното умения за обработка на мозъка на wetware, изграждането на алгоритми, които могат да разберат оптичните илюзии, не е лошо начало точка. Най-малкото може да се окаже добър начин за измерване на това доколко системите за машинно зрение работят с нашите собствени мозъци. Може да не е отговорът на митичното Изкуствен общ интелект, но може да е ключът към отключването на General Vision.

оптична илюзия, която подмамва мозъка ви да вижда фалшиви цветове — Вярвате или не, но всички тези топки са с един и същ нюанс на сивото и вашият мозък ги интерпретира като имащи различни цветове въз основа на контекстуалните знаци на цветните линии, които се пресичат върху тях

„Ако някой би разработил един ден изкуствена визуална система, която допуска същите илюзорни грешки във възприятието че ние правим, вие ще знаете в този момент, че те [постигат] добра симулация на това как работи мозъкът ни,” Laeng казах. „Това би било нещо като тест на Тюринг. Ако имате изкуствена мрежа, която е заблудена от илюзия като нас, тогава [ще бъдем] много близо до разбирането на основните изчисления на самия мозък.

И-Дже песен, читател на Компютърно зрение и машинно обучение в Центъра за визуална обработка на реч и сигнали в Университета на Съри в Обединеното кралство, е съгласен с хипотезата. „Искането на визуални алгоритми да разберат оптичните илюзии като обща тема е от голяма стойност за общността“, каза той пред Digital Trends. „Това надхвърля сегашния фокус на общността да се иска от машини да [разпознават], като избутва границите още повече [и] изисква от машините да разсъждават. Този тласък [би представлявал] значителна стъпка напред към „Обща визия“, където трябва да се приспособят субективните интерпретации на визуалните концепции.“

Използвай въображението си

Към днешна дата има някои ограничени изследвания за тази цел - въпреки че остава на сравнително ранен етап. Насим Нематзадех, изследовател с докторска степен. в областта на изкуствения интелект и роботиката - модели на ниско ниво на зрение, е един човек, който има публикувана работа по тази тема.

„Ние вярваме, че по-нататъшното изследване на ролята на прости модели, подобни на Gaussian, в обработката на ретината на ниско ниво и ядрото на Gaussian в ранен етап [deep neural мрежи] и неговата прогноза за загуба на илюзия за възприятие, ще доведе до по-точни техники и модели за компютърно зрение“, каза Нематзаде пред Digital Trends. „[Това би могло] да допринесе за модели на по-високо ниво на обработка на дълбочина и движение и да се обобщи за компютърно разбиране на естествени изображения.“

Движещи се неподвижни кръгове (Оптична илюзия)!

Макс Уилямс, изследовател на AI, който помогна за събирането на набор от данни на хиляди изображения на оптична илюзия за системи за компютърно зрение, поставя най-кратко връзката между общото зрение и оптичните илюзии: „Илюзиите съществуват, защото очите и мозъците ни изпълняват хаос и ad hoc процес за извличане на визуална сцена от иначе неразбираемо светлинно поле, създадено от физически свят, от който сме почти напълно изолирани“, казаха те пред Digital Тенденции. „Не мисля, че е възможно да се направи визуална система достатъчно изразителна, за да се счита за „възприятие“, което също е свободно от илюзии.“

Постигане на обща визия

За да бъде ясно, постигането на общо зрение на човешко ниво (или по-добро) за AI няма просто да ги обучи да разпознават стандартни оптични илюзии. Никаква свръхспецифична способност, да речем, да декодира илюзиите на Magic Eye с 99,9% точност за 0,001 секунди, няма да замени милиони години човешка еволюция.

(Интересното е, че машинното зрение вече има своя собствена версия на оптични илюзии под формата на конкурентни модели, което може да ги направи погрешни – както в една тревожна илюстрация – 3D отпечатана играчка костенурка за пушка. Те обаче не дават същите еволюционни ползи като оптичните илюзии, които работят върху хората.)

Все пак да накараш машините да разбират човешките оптични илюзии и да им реагират по начина, по който го правим ние, може да бъде много полезно изследване.

И едно нещо е сигурно: Когато General Vision AI е постигнато, то ще се поддаде на същите видове оптични илюзии като нас. Поне в случая с илюзорната разширяваща се дупка, 86% от нас.

Препоръки на редакторите

Wix използва ChatGPT, за да ви помогне бързо да създадете цял уебсайт
OpenAI изгражда нов екип, за да спре свръхинтелигентния AI да стане измамник
Тези гениални идеи могат да помогнат да направим ИИ малко по-малко зло
Изглежда, че инструментът на Google за откриване на изображения с изкуствен интелект може да работи
AI може да замени около 7800 работни места в IBM като част от паузата за наемане

Оптичните илюзии могат да ни помогнат да изградим ново поколение AI

Еволюционен ръб

Машинното зрение се подобрява

Тест на Тюринг за машинно зрение

Използвай въображението си

Постигане на обща визия

Препоръки на редакторите

Категории

Скорошни

DisplayPort 2.1 може да бъде огромна сделка за компютърни игри през 2023 г

Как вирусната игра с бодикамера ни подмами да мислим, че е истинска

Лаптопите за игри ни лъжат и изглежда никой не се интересува