Optiske illusjoner kan hjelpe oss med å bygge en ny generasjon AI

Du ser på et bilde av en svart sirkel på et rutenett med sirkulære prikker. Det ligner et hull brent inn i et stykke hvitt nettingmateriale, selv om det faktisk er et flatt, stasjonært bilde på en skjerm eller et stykke papir. Men hjernen din forstår det ikke slik. Som en hallusinatorisk opplevelse på lavt nivå, snubler tankene dine ut; oppfatter det statiske bildet som munningen av en svart tunnel som beveger seg mot deg.

Innhold

En evolusjonær kant
Maskinsynet blir bedre
En Turing-test for maskinsyn
Bruk illusjonen din
Oppnå generell visjon

Som svar på sannheten av effekten, begynner kroppen å ubevisst reagere: øyets pupiller utvider seg for å la mer lys inn, akkurat som de ville justere hvis du var i ferd med å bli kastet ut i mørket for å sikre best mulig syn.

Den optiske illusjonen av det sorte hullet

Den aktuelle effekten ble skapt av Akiyoshi Kitaoka, en psykolog ved Ritsumeikan University i Kobe, Japan. Det er en av dusinvis av optiske illusjoner han har skapt gjennom en lang karriere. ("Jeg liker dem alle," sa han, og svarte på Digital Trends spørsmål om han har en favoritt.)

Anbefalte videoer

Denne nye illusjonen var gjenstand for et stykke forskning publisert nylig i tidsskriftet Frontiers in Human Neuroscience. Mens fokuset i artikkelen er bestemt på menneskets fysiologiske responser på den nye effekten (som det viser seg at rundt 86 prosent av oss vil oppleve), overordnet emne kan også ha mye relevans når det kommer til fremtiden for maskinintelligens - som en av forskerne var ivrig etter å forklare til Digital Trender.

En evolusjonær kant

en optisk illusjon kjent som Fraser-spiralen — Ved første øyekast kan det se ut som om dette bildet viser en spiral som slynger seg mot midten. Men prøv å følge en av linjene ettersom den tilsynelatende bøyer seg innover, og du vil innse at det ikke er en spiral i det hele tatt.

Noe er galt med hjernen din. I det minste er det en enkel konklusjon å trekke fra måten den menneskelige hjernen oppfatter optiske illusjoner. Hvilken annen forklaring er det på et todimensjonalt, statisk bilde som hjernen oppfatter som noe helt annet? I lang tid regnet mainstream-psykologien akkurat det.

"Til å begynne med tenkte folk: 'Ok, hjernen vår er ikke perfekt... den får det ikke alltid rett.' Det er en fiasko, ikke sant?" sa Bruno Laeng, professor ved Psykologisk institutt ved Universitetet i Oslo og førsteforfatter av den nevnte studien. "Illusjoner i det tilfellet var interessante fordi de ville avsløre en slags ufullkommenhet i maskineriet."

Hjernen har ingen måte å vite hva som [egentlig] er der ute.»

Psykologer ser dem ikke lenger på den måten. Om noe, forskning som dette fremhever hvordan det visuelle systemet ikke bare er et enkelt kamera. Den optiske illusjonen "Illusory Expanding Hole" gjør det klart at øyet tilpasser seg oppfattet, til og med forestilt, lys og mørke, snarere enn til fysisk energi.

Det viktigste er at det viser at vi ikke bare dumt registrerer verden med våre visuelle systemer, men i stedet utføre et kontinuerlig sett med vitenskapelige eksperimenter for å få en liten evolusjon fordel. Målet er å analysere data presentert for oss og prøve å forebyggende håndtere problemer før de blir, vel, problemer.

"Hjernen har ingen måte å vite hva som er [egentlig] der ute," sa Laeng. "Det den gjør er å bygge opp en slags virtuell virkelighet av hva som kan være der ute. Det er litt gjetting. I denne forbindelse kan du tenke på hjernen som en slags sannsynlighetsmaskin. Du kan kalle det a Bayesiansk maskin hvis du vil. Den bruker noen tidligere hypoteser og prøver å teste den hele tiden for å se om det fungerer."

Laeng gir et eksempel på at øynene våre gjør justeringer basert på ikke annet enn inntrykket av lys fra solen: selv når dette sees gjennom skydekke eller en baldakin av løv. For sikkerhets skyld.

"Det som betyr noe i evolusjonen er ikke at det er sant [i det øyeblikket], men det er sannsynlig," fortsatte han. "Ved å trekke sammen pupillen, er kroppen din allerede i ferd med å tilpasse seg en situasjon som med stor sannsynlighet vil skje i løpet av kort tid. Det som skjer [hvis solen plutselig kommer frem] er at du blir blendet. Blendet betyr midlertidig inhabil. Det har enorme konsekvenser enten du er et bytte eller om du er et rovdyr. Du mister en brøkdel av et sekund i en bestemt situasjon, og du vil kanskje ikke overleve.»

Det er ikke bare lys og mørke der visuelle systemene våre trenger å gjette heller. Tenk på et slag tennis, hvor ballen beveger seg i høy hastighet. Skulle vi basere vår oppførsel utelukkende på hva det visuelle systemet mottar til enhver tid, ville vi ligge bak virkeligheten og ikke klare å returnere ballen. "Vi er i stand til å oppfatte nåtiden selv om vi virkelig sitter fast i fortiden," sa Laeng. «Den eneste måten å gjøre det på er å forutsi fremtiden. Det høres litt ut som et ordspill, men det er det i et nøtteskall.»

Maskinsynet blir bedre

ansiktsgjenkjenning — izusek/Getty Images

Så hva har dette med datasyn å gjøre? Potensielt alt. For at en robot, for eksempel, skal kunne fungere effektivt i den virkelige verden, må den være i stand til å gjøre denne typen justeringer i farten. Datamaskiner har en fordel når det kommer til deres evne til å utføre ekstremt raske beregninger. Det de ikke har er millioner av år med evolusjon på deres side.

De siste årene har maskinsyn likevel tatt enorme fremskritt. De kan identifisere ansikter eller gangarter i sanntids videostrømmer – potensielt til og med i store folkemengder. Lignende bildeklassifisering og tekniske verktøy kan gjenkjenne tilstedeværelsen av andre objekter, mens objektsegmenteringsgjennombrudd gjør det mulig å bedre forstå innholdet i ulike scener. Det har også vært betydelige fremskritt når det gjelder å ekstrapolere 3D-bilder fra 2D-scener, slik at maskiner kan "lese" tredimensjonal informasjon, for eksempel dybde, fra scener. Dette tar moderne datasyn nærmere menneskelig bildeoppfatning.

Imidlertid eksisterer det fortsatt en kløft mellom de beste maskinsynsalgoritmene og den slags synsbaserte evner det overveldende flertallet av mennesker er i stand til å utføre fra en ung alder. Selv om vi ikke kan artikulere nøyaktig hvordan vi utfører disse visjonsbaserte oppgavene (for å sitere den ungarsk-britiske polymaten Michael Polanyi, kan vi vite mer enn vi kan fortelle»), er vi likevel i stand til å utføre en rekke imponerende oppgaver som lar oss utnytte synet vårt en rekke smarte måter.

En Turing-test for maskinsyn

Hvis forskere og ingeniører håper å lage datasynssystemer som fungerer minst på nivå med det visuelle å behandle ferdigheter til våtvarehjernen, bygge algoritmer som kan forstå optiske illusjoner er ikke en dårlig start punkt. I det minste kan det vise seg å være en god måte å måle hvor godt maskinsynssystemer fungerer på våre egne hjerner. Det er kanskje ikke svaret på det mytiske Kunstig generell intelligens, men det kan være nøkkelen til å låse opp General Vision.

en optisk illusjon som lurer hjernen din til å se falske farger — Tro det eller ei, men alle disse kulene er den samme gråtonen, og hjernen din tolker dem som å ha forskjellige farger basert på kontekstuelle signalene til de fargede linjene som krysser dem

"Hvis noen en dag ville utvikle et kunstig visuelt system som begår de samme illusoriske oppfatningsfeilene det vi gjør, vil du vite på dette tidspunktet at de [oppnår] en god simulering av hvordan hjernen vår fungerer,» Laeng sa. «Det ville vært en slags Turing-test. Hvis du har et kunstig nettverk som blir lurt av illusjoner som vi er, så [ville vi være] veldig nærme å forstå den underliggende beregningen av selve hjernen.»

Yi-Zhe sang, leser av Computer Vision and Machine Learning ved Center for Vision Speech and Signal Processing ved U.K.s University of Surrey, er enig i hypotesen. "Å be synsalgoritmer om å forstå optiske illusjoner som et generelt tema er av stor verdi for samfunnet," sa han til Digital Trends. "Det går utover det nåværende samfunnsfokuset med å be maskiner om å [gjenkjenne], ved å skyve konvolutten videre [og] be maskiner om å resonnere. Dette pushet [ville representere] et betydelig skritt fremover mot "General Vision", der subjektive tolkninger av visuelle konsepter må imøtekommes."

Bruk illusjonen din

Til dags dato har det vært noe begrenset forskning mot dette målet - selv om det fortsatt er på et relativt tidlig stadium. Nasim Nematzadeh, en forsker som har en Ph.D. i Artificial Intelligence and Robotics-Low-level vision models, er en person som har publisert arbeid om dette emnet.

"Vi tror at videre utforskning av rollen til enkle Gauss-lignende modeller i lavnivå retinal prosessering og Gaussisk kjerne i tidlig stadium [dyp nevrale nettverk], og dets prediksjon om tap av perseptuell illusjon, vil føre til mer nøyaktige datasynsteknikker og modeller,” sa Nematzadeh til Digital Trends. "[Dette kan] bidra til høyere nivåmodeller for dybde- og bevegelsesbehandling og generalisert til datamaskinforståelse av naturlige bilder."

Bevegelige sirkler (optisk illusjon)!

Max Williams, en AI-forsker som hjalp til med å kompilere et datasett av tusenvis av optiske illusjonsbilder for datasynssystemer, setter forholdet mellom generelt syn og optiske illusjoner mest kortfattet: «Illusjoner eksisterer fordi øynene og hjernene våre utfører en rotete og ad-hoc-prosess for å trekke ut en visuell scene fra et ellers uforståelig lysfelt, skapt av en fysisk verden som vi nesten er fullstendig forseglet fra, sa de til Digital Trender. "Jeg tror ikke det er mulig å gjøre et visuelt system uttrykksfullt nok til å bli betraktet som "oppfatning", som også er fritt for illusjoner."

Oppnå generell visjon

For å være tydelig, å oppnå General Vision for AI på menneskelig nivå (eller bedre) er ikke bare å trene dem til å gjenkjenne standard optiske illusjoner. Ingen hyperspesifikk evne til for eksempel å dekode Magic Eye-illusjoner med 99,9 % nøyaktighet på 0,001 sekunder kommer til å erstatte millioner av år med menneskelig evolusjon.

(Interessant nok har maskinsyn allerede sin egen versjon av optiske illusjoner i form av motstridende modeller, som kan gjøre dem feil – som i en alarmerende illustrasjon – en 3D-printet lekeskilpadde for en rifle. Disse gir imidlertid ikke de samme evolusjonære fordelene som de optiske illusjonene som virker på mennesker.)

Likevel kan det være svært nyttig forskning å få maskiner til å forstå menneskelige optiske illusjoner, og svare på dem på den måten vi gjør.

Og én ting er sikkert: Når General Vision AI er oppnådd, vil det falle for de samme typene optiske illusjoner som vi gjør. I det minste, i tilfellet med det illusoriske ekspanderende hullet, 86 % av oss.

Redaktørenes anbefalinger

Wix bruker ChatGPT for å hjelpe deg raskt å bygge et helt nettsted
OpenAI bygger et nytt team for å stoppe superintelligent AI fra å bli useriøs
Disse geniale ideene kan bidra til å gjøre AI litt mindre ond
Googles AI-bildegjenkjenningsverktøy føles som om det kan fungere
AI kan erstatte rundt 7800 jobber hos IBM som en del av en ansettelsespause

Optiske illusjoner kan hjelpe oss med å bygge en ny generasjon AI

En evolusjonær kant

Maskinsynet blir bedre

En Turing-test for maskinsyn

Bruk illusjonen din

Oppnå generell visjon

Redaktørenes anbefalinger

Kategorier

Nylig

Hvilke barneapper samler inn mest data?

Hvorfor Google plutselig ser ut til å bry seg om nettbrett igjen

Lei av at Google ødelegger Fitbiten din? Se på disse 5 alternativene