Optické ilúzie by nám mohli pomôcť vybudovať novú generáciu AI

Pozeráte sa na obrázok čierneho kruhu na mriežke kruhových bodiek. Pripomína dieru vypálenú do kúska bieleho sieťovaného materiálu, aj keď je to v skutočnosti plochý, nehybný obrázok na obrazovke alebo kúsku papiera. Ale váš mozog to takto nechápe. Ako pri nejakej halucinácii na nízkej úrovni, vaša myseľ vypadne; vnímanie statického obrazu ako ústia čierneho tunela, ktorý sa pohybuje smerom k vám.

Obsah

Evolučný náskok
Strojové videnie sa zlepšuje
Turingov test pre strojové videnie
Použite svoju ilúziu
Dosiahnutie všeobecnej vízie

V reakcii na vierohodnosť účinku začne telo nevedome reagovať: zreničky oka sa rozšíria, aby umožnili viac svetla, rovnako ako by sa prispôsobili, keby ste sa mali ponoriť do tmy, aby zabezpečili to najlepšie možné vízie.

Príslušný efekt vytvoril Akiyoshi Kitaoka, psychológ na Ritsumeikan University v Kobe, Japonsko. Je to jedna z desiatok optických ilúzií, ktoré vytvoril počas dlhej kariéry. („Páčia sa mi všetky,“ odpovedal na otázku Digital Trend, či má obľúbeného.)

Odporúčané videá

Táto nová ilúzia bola predmetom nedávno publikovaného výskumu v časopise Frontiers in Human Neuroscience. Zatiaľ čo sa tento článok zameriava pevne na ľudské fyziologické reakcie na nový efekt (ktorý zažije asi 86 percent z nás), celková téma môže mať tiež veľký význam, pokiaľ ide o budúcnosť strojovej inteligencie – ako jeden z výskumníkov chcel vysvetliť spoločnosti Digital Trendy.

Evolučný náskok

optická ilúzia známa ako Fraserova špirála — Na prvý pohľad sa môže zdať, že tento obrázok ukazuje špirálu, ktorá sa vinie smerom k stredu. Ale skúste sledovať jednu z línií, ktorá sa zdanlivo stáča dovnútra, a zistíte, že to vôbec nie je špirála.

Niečo nie je v poriadku s vaším mozgom. Aspoň to je jeden jednoduchý záver, ktorý možno vyvodiť zo spôsobu, akým ľudský mozog vníma optické ilúzie. Aké iné vysvetlenie existuje pre dvojrozmerný statický obraz, ktorý mozog vníma ako niečo úplne iné? Mainstreamová psychológia si dlho myslela presne to.

"Spočiatku si ľudia mysleli: 'Dobre, náš mozog nie je dokonalý... Nie vždy to funguje správne.' To je zlyhanie, však?" povedal Bruno Laeng, profesor na Katedre psychológie Univerzity v Oslo a prvý autor spomínanej štúdie. "Ilúzie v tomto prípade boli zaujímavé, pretože by odhalili nejaký druh nedokonalosti stroja."

Mozog nemá ako vedieť, čo tam [naozaj] je."

Psychológovia ich už takto nepozerajú. Výskum, ako je tento, poukazuje na to, že vizuálny systém nie je len jednoduchá kamera. Optická ilúzia „Iluzórna rozširujúca sa diera“ objasňuje, že oko sa prispôsobuje vnímanému, dokonca aj predstavovanému svetlu a tme, a nie fyzickej energii.

Najdôležitejšie je, že ukazuje, že svet svojimi vizuálnymi systémami nezaznamenávame len tupo, ale namiesto toho vykonávať nepretržitý súbor vedeckých experimentov s cieľom získať mierny vývoj výhodu. Cieľom je analyzovať údaje, ktoré sú nám predložené, a pokúsiť sa preventívne riešiť problémy skôr, ako sa stanú problémami.

"Mozog nemá spôsob, ako zistiť, čo je [naozaj] tam vonku," povedal Laeng. „To, čo robí, je vytváranie akejsi virtuálnej reality toho, čo by tam mohlo byť. Je tam trochu dohadov. V tomto smere si mozog môžete predstaviť ako akýsi pravdepodobnostný stroj. Môžete to nazvať a Bayesovský stroj, ak chcete. Používa nejakú predchádzajúcu hypotézu a snaží sa ju neustále testovať, aby zistila, či to funguje."

Laeng uvádza príklad našich očí, ktoré robia úpravy založené na ničom inom, než na dojme svetla zo slnka: aj keď je to pozorované cez oblačnosť alebo vrchný baldachýn lístia. Keby niečo.

„V evolúcii nie je dôležité, že je to pravda [v tej chvíli], ale je to pravdepodobné,“ pokračoval. „Zúžením zrenice sa vaše telo už prispôsobuje situácii, ktorá sa veľmi pravdepodobne stane v krátkom čase. Čo sa stane [ak náhle vyjde slnko] je, že ste oslnení. Oslnený znamená dočasne nespôsobilý. To má obrovské dôsledky, či už ste korisť, alebo či ste predátor. V konkrétnej situácii stratíte zlomok sekundy a možno to neprežijete.“

Nie je to len svetlo a tma, kde naše vizuálne systémy potrebujú hádať. Zamyslite sa nad tenisom, kde sa loptička pohybuje vysokou rýchlosťou. Ak by sme svoje správanie zakladali výlučne na tom, čo vizuálny systém v danom okamihu prijíma, zaostali by sme za realitou a nedokázali by sme loptu vrátiť. "Sme schopní vnímať súčasnosť, hoci sme skutočne uviaznutí v minulosti," povedal Laeng. „Jediný spôsob, ako to urobiť, je predpovedať budúcnosť. Znie to trochu ako slovná hračka, ale to je v skratke všetko.“

Strojové videnie sa zlepšuje

rozpoznávanie tváre — izusek/Getty Images

Čo to má spoločné s počítačovým videním? Potenciálne všetko. Aby napríklad robot mohol efektívne fungovať v reálnom svete, musí byť schopný vykonávať tieto druhy úprav za behu. Počítače majú výhodu, pokiaľ ide o ich schopnosť vykonávať extrémne rýchle výpočty. To, čo nemajú, sú milióny rokov evolúcie na ich strane.

V posledných rokoch však strojové videnie urobilo obrovský pokrok. Dokážu identifikovať tváre alebo spôsoby chôdze vo videostreamoch v reálnom čase – potenciálne dokonca aj v obrovských davoch ľudí. Podobné nástroje na klasifikáciu obrázkov a technické nástroje dokážu rozpoznať aj prítomnosť iných objektov prelomy v segmentácii objektov umožňujú lepšie pochopiť obsah rôznych scény. Významný pokrok sa dosiahol aj v oblasti extrapolácie 3D obrazov z 2D scén, čo umožňuje strojom „čítať“ trojrozmerné informácie, ako je hĺbka, zo scén. Tým sa moderné počítačové videnie približuje vnímaniu ľudského obrazu.

Stále však existuje priepasť medzi najlepšími algoritmami strojového videnia a druhmi schopností založených na videní, ktoré je drvivá väčšina ľudí schopná vykonávať od mladého veku. Aj keď nevieme presne formulovať, ako vykonávame tieto úlohy založené na vízii (citujem maďarsko-britského polyhistora Michaela Polanyiho, „môžeme vedieť viac, ako vieme povedať“), napriek tomu sme schopní vykonávať pôsobivé množstvo úloh, ktoré nám umožňujú využiť náš zrak rôznymi inteligentnými spôsoby.

Turingov test pre strojové videnie

Ak výskumníci a inžinieri dúfajú, že vytvoria systémy počítačového videnia, ktoré fungujú aspoň na rovnakej úrovni ako vizuálne spracovateľské schopnosti mozgu mokrého softvéru, budovanie algoritmov, ktoré dokážu pochopiť optické ilúzie, nie je zlý začiatok bod. Prinajmenšom by sa to mohlo ukázať ako dobrý spôsob merania toho, ako dobre fungujú systémy strojového videnia v našom vlastnom mozgu. Možno to nie je odpoveď na mýtus Umelá všeobecná inteligencia, ale môže to byť kľúč k odomknutiu General Vision.

optická ilúzia, ktorá oklame váš mozog, aby videl falošné farby — Verte tomu alebo nie, ale všetky tieto loptičky majú rovnaký odtieň sivej a váš mozog ich interpretuje tak, že majú rôzne farby na základe kontextových signálov farebných čiar, ktoré ich pretínajú.

„Ak by niekto jedného dňa vyvinul umelý vizuálny systém, ktorý by sa dopúšťal rovnakých iluzórnych chýb vnímania že robíme, v tomto bode by ste vedeli, že [dosahujú] dobrú simuláciu toho, ako funguje náš mozog,“ Laeng povedal. „Bol by to akýsi Turingov test. Ak máte umelú sieť, ktorá je oklamaná ilúziou ako my, potom [by sme] boli veľmi blízko k pochopeniu základných výpočtov samotného mozgu.“

Pieseň Yi-Zhe, čitateľ knihy Computer Vision and Machine Learning v Centre for Vision Speech and Signal Processing na University of Surrey v Spojenom kráľovstve, súhlasí s hypotézou. „Požiadať algoritmy videnia, aby chápali optické ilúzie ako všeobecnú tému, má pre komunitu veľkú hodnotu,“ povedal pre Digital Trends. „Presahuje to súčasné zameranie komunity žiadať stroje, aby [rozpoznali], tým, že posúvajú hranice ďalej [a] žiadajú stroje, aby uvažovali. Tento posun [by predstavoval] významný krok vpred smerom k „všeobecnej vízii“, kde je potrebné prispôsobiť sa subjektívnym interpretáciám vizuálnych konceptov.“

Použite svoju ilúziu

K dnešnému dňu došlo k určitému obmedzenému výskumu smerom k tomuto cieľu - hoci zostáva v relatívne skorom štádiu. Nasim Nematzadeh, výskumník, ktorý je držiteľom titulu Ph. D. v modeloch umelej inteligencie a robotiky-nízkoúrovňové videnie je jednou osobou, ktorá má publikované práce na túto tému.

„Veríme, že ďalšie skúmanie úlohy jednoduchých gaussovských modelov v nízkoúrovňovom spracovaní sietnice a gaussovskom jadre v ranom štádiu [hlboká neurálna sietí] a jeho predpoveď straty percepčnej ilúzie povedie k presnejším technikám a modelom počítačového videnia,“ povedal Nematzadeh pre Digital Trends. "[To by mohlo] prispieť k modelom na vyššej úrovni spracovania hĺbky a pohybu a zovšeobecnené na počítačové chápanie prirodzených obrazov."

Pohybujúce sa nehybné kruhy (optická ilúzia) !

Max Williams, výskumník AI, ktorý pomohol zostaviť súbor údajov tisíce obrazov optických ilúzií pre systémy počítačového videnia, vyjadruje vzťah medzi všeobecným videním a optickými ilúziami najvýstižnejšie: „Ilúzie existujú, pretože naše oči a mozgy fungujú zle a ad-hoc proces na extrakciu vizuálnej scény z inak nepochopiteľného svetelného poľa vytvoreného fyzickým svetom, od ktorého sme takmer úplne utesnení,“ povedali pre Digital Trendy. "Nemyslím si, že je možné urobiť vizuálny systém dostatočne expresívnym, aby bol považovaný za "vnímanie", ktoré je tiež bez ilúzií."

Dosiahnutie všeobecnej vízie

Aby bolo jasné, dosiahnutie všeobecnej vízie pre AI na ľudskej (alebo lepšej) úrovni ich nebude len trénovať, aby rozpoznali štandardné optické ilúzie. Žiadna hyperšpecifická schopnosť, povedzme, dekódovať ilúzie magického oka s presnosťou 99,9 % za 0,001 sekundy, nenahradí milióny rokov ľudského vývoja.

(Zaujímavé je, že strojové videnie už má svoju vlastnú verziu optických ilúzií vo forme protichodných modelov, ktoré ich môžu pomýliť – ako na jednej alarmujúcej ilustrácii – a 3D tlačená hračka korytnačka na pušku. Tieto však neprinášajú rovnaké evolučné výhody ako optické ilúzie, ktoré fungujú na ľuďoch.)

Napriek tomu by mohlo byť veľmi užitočným výskumom, aby stroje pochopili ľudské optické ilúzie a reagovali na ne tak, ako to robíme my.

A jedna vec je istá: Keď General Vision AI je dosiahnuté, prepadne rovnakým druhom optických ilúzií ako my. Aspoň v prípade Iluzórnej rozširujúcej sa diery 86 % z nás.

Odporúčania redaktorov

Wix používa ChatGPT, ktorý vám pomôže rýchlo vytvoriť celý web
OpenAI buduje nový tím, aby zastavil nečestnú superinteligentnú AI
Tieto dômyselné nápady by mohli pomôcť urobiť z AI trochu menej zla
Zdá sa, že nástroj na detekciu obrázkov AI od Googlu by mohol fungovať
Umelá inteligencia by mohla nahradiť približne 7 800 pracovných miest v IBM v rámci prestávky v prijímaní zamestnancov

Optické ilúzie by nám mohli pomôcť vybudovať novú generáciu AI

Evolučný náskok

Strojové videnie sa zlepšuje

Turingov test pre strojové videnie

Použite svoju ilúziu

Dosiahnutie všeobecnej vízie

Odporúčania redaktorov

Kategórie

Nedávne

Myslíte si, že je čas upgradovať herný procesor? Najprv si prečítajte toto

Ako funguje Nvidia DLSS 3 a prečo FSR zatiaľ nestíha

Metroid Prime Remastered robí perfektnú hru ešte lepšou