Optiska illusioner kan hjälpa oss att bygga en ny generation av AI

Du tittar på en bild av en svart cirkel på ett rutnät av cirkulära prickar. Det liknar ett hål som bränts in i en bit vitt nätmaterial, även om det faktiskt är en platt, stationär bild på en skärm eller ett papper. Men din hjärna förstår det inte så. Som en hallucinatorisk upplevelse på låg nivå, snubblar ditt sinne ut; uppfattar den statiska bilden som mynningen av en svart tunnel som rör sig mot dig.

Innehåll

En evolutionär kant
Maskinseendet blir bättre
Ett Turing-test för maskinseende
Använd din illusion
Att uppnå allmän vision

Som svar på verklighetens sanning börjar kroppen omedvetet reagera: ögats pupiller vidgas för att låta mer ljus in, precis som de skulle anpassa sig om du var på väg att kastas ner i mörker för att säkerställa det bästa möjliga syn.

Effekten i fråga skapades av Akiyoshi Kitaoka, en psykolog vid Ritsumeikan University i Kobe, Japan. Det är en av de dussintals optiska illusioner han skapat under en lång karriär. ("Jag gillar dem alla", sa han och svarade på Digital Trends fråga om huruvida han har en favorit.)

Rekommenderade videor

Denna nya illusion var föremål för en forskning som nyligen publicerades i tidskriften Frontiers in Human Neuroscience. Medan fokus i tidningen är bestämt på mänskliga fysiologiska svar på den nya effekten (som det visar sig att cirka 86 procent av oss kommer att uppleva), övergripande ämne kan också ha en hel del relevans när det kommer till framtiden för maskinintelligens - som en av forskarna var ivrig att förklara för Digital Trender.

En evolutionär kant

en optisk illusion känd som Fraserspiralen — Vid första anblicken kan det se ut som om den här bilden visar en spiral som slingrar sig mot mitten. Men försök att följa en av linjerna eftersom den till synes kröker inåt, och du kommer att inse att det inte är en spiral alls.

Något är fel med din hjärna. Åtminstone är det en enkel slutsats att dra från hur den mänskliga hjärnan uppfattar optiska illusioner. Vilken annan förklaring finns det till en tvådimensionell, statisk bild som hjärnan uppfattar som något helt annat? Under lång tid räknade den vanliga psykologin ut exakt det.

"Först tänkte folk, 'Okej, vår hjärna är inte perfekt... det blir inte alltid rätt.' Det är ett misslyckande, eller hur?" sa Bruno Laeng, professor vid Institutionen för psykologi vid Universitetet i Oslo och första författare till den tidigare nämnda studien. "Illusioner i det fallet var intressanta eftersom de skulle avslöja någon form av ofullkomlighet i maskineriet."

Hjärnan har inget sätt att veta vad som [verkligen] finns där ute."

Psykologer ser dem inte längre på det sättet. Om något, forskning som denna belyser hur det visuella systemet inte bara är en enkel kamera. Den optiska illusionen "Illusory Expanding Hole" gör klart att ögat anpassar sig till uppfattat, till och med föreställt, ljus och mörker, snarare än till fysisk energi.

Det viktigaste är att det visar att vi inte bara dumt spelar in världen med våra visuella system, utan utför istället en kontinuerlig uppsättning vetenskapliga experiment för att få en liten evolutionär fördel. Målet är att analysera data som presenteras för oss och försöka hantera problem förebyggande innan de blir, ja, problem.

"Hjärnan har inget sätt att veta vad som finns [egentligen] där ute," sa Laeng. "Vad den gör är att bygga upp en sorts virtuell verklighet av vad som kan finnas där ute. Det finns lite gissningar. I detta avseende kan du tänka på hjärnan som en slags probabilistisk maskin. Du kan kalla det a Bayesian maskin om du vill. Den använder en tidigare hypotes och försöker testa den hela tiden för att se om det fungerar."

Laeng ger exemplet med våra ögon som gör justeringar baserat på inget annat än intrycket av ljus från solen: även när detta ses genom molntäcke eller ett tak av löv ovanför. För säkerhets skull.

"Det som spelar roll i evolutionen är inte att det är sant [i det ögonblicket], men det är troligt," fortsatte han. "Genom att dra ihop pupillen anpassar sig din kropp redan till en situation som med stor sannolikhet kommer att inträffa inom en kort tidsperiod. Det som händer [om solen plötsligt kommer fram] är att du är bländad. Bländad betyder tillfälligt arbetsoförmögen. Det får enorma konsekvenser oavsett om du är ett byte eller om du är ett rovdjur. Du förlorar en bråkdel av en sekund i en viss situation och du kanske inte överlever.”

Det är inte bara ljus och mörker där våra visuella system behöver göra gissningar heller. Tänk på en omgång tennis, där bollen rör sig i hög hastighet. Om vi skulle basera vårt beteende helt på vad det visuella systemet tar emot vid varje givet ögonblick, skulle vi släpa efter verkligheten och misslyckas med att returnera bollen. "Vi kan uppfatta nuet även om vi verkligen har fastnat i det förflutna," sa Laeng. "Det enda sättet att göra det är genom att förutsäga framtiden. Det låter lite som ett ordspel, men det är det i ett nötskal.”

Maskinseendet blir bättre

ansiktsigenkänning — izusek/Getty Images

Så vad har detta med datorseende att göra? Potentiellt allt. För att till exempel en robot ska kunna fungera effektivt i den verkliga världen måste den kunna göra den här typen av justeringar i farten. Datorer har en fördel när det kommer till deras förmåga att utföra extremt snabba beräkningar. Vad de inte har är miljontals år av evolution på deras sida.

De senaste åren har maskinseendet ändå tagit enorma framsteg. De kan identifiera ansikten eller gångarter i realtidsvideoströmmar - potentiellt även i stora skaror av människor. Liknande bildklassificering och tekniska verktyg kan känna igen närvaron av andra objekt också, medan objektsegmenteringsgenombrott gör det möjligt att bättre förstå innehållet i olika scener. Det har också gjorts betydande framsteg när det gäller att extrapolera 3D-bilder från 2D-scener, vilket gör att maskiner kan "läsa" tredimensionell information, såsom djup, från scener. Detta tar modern datorseende närmare människans bilduppfattning.

Men det finns fortfarande en klyfta mellan de bästa maskinseendealgoritmerna och de typer av synbaserade förmågor som den överväldigande majoriteten av människor kan utföra från en ung ålder. Även om vi inte kan formulera exakt hur vi utför dessa visionsbaserade uppgifter (för att citera den ungersk-brittiske polymaten Michael Polanyi, "kan vi veta mer än vi kan säga"), kan vi ändå utföra en imponerande mängd uppgifter som gör att vi kan utnyttja vår syn på en mängd smarta sätt.

Ett Turing-test för maskinseende

If forskare och ingenjörer hoppas kunna skapa datorseendesystem som fungerar åtminstone i paritet med det visuella bearbetning av våtgodshjärnans färdigheter, att bygga algoritmer som kan förstå optiska illusioner är ingen dålig start punkt. Åtminstone kan det visa sig vara ett bra sätt att mäta hur väl maskinseendesystem fungerar till våra egna hjärnor. Det kanske inte är svaret på det mytiska Artificiell allmän intelligens, men det kan vara nyckeln till att låsa upp General Vision.

en optisk illusion som lurar din hjärna att se falska färger — Tro det eller ej, men alla dessa bollar har samma nyans av grått, och din hjärna tolkar dem som att de har olika färger baserat på kontextuella signaler från de färgade linjerna som korsar dem

"Om någon en dag skulle utveckla ett konstgjort visuellt system som begår samma illusoriska uppfattningsfel som vi gör, skulle du veta vid det här laget att de [når] en bra simulering av hur vår hjärna fungerar,” Laeng sa. "Det skulle vara ett slags Turing-test. Om du har ett konstgjort nätverk som luras av illusion som vi är, då [skulle vi vara] mycket nära att förstå den underliggande beräkningen av själva hjärnan."

Yi-Zhe Song, läsare av Computer Vision and Machine Learning vid Center for Vision Speech and Signal Processing vid University of Surrey i Storbritannien, håller med om hypotesen. "Att be synalgoritmer att förstå optiska illusioner som ett allmänt ämne är av stort värde för samhället", sa han till Digital Trends. "Det går utöver det nuvarande gemenskapsfokuset att be maskiner att [igenkänna], genom att driva höljet ytterligare [och] be maskiner att resonera. Denna push [skulle representera] ett betydande steg framåt mot "General Vision", där subjektiva tolkningar av visuella begrepp måste tillgodoses."

Använd din illusion

Hittills har det gjorts en del begränsad forskning mot detta mål - även om det fortfarande är på ett relativt tidigt stadium. Nasim Nematzadeh, en forskare som har en doktorsexamen. i artificiell intelligens och robotik-Lågnivåsynsmodeller, är en person som har publicerat arbete om detta ämne.

"Vi tror att ytterligare utforskning av rollen av enkla Gauss-liknande modeller i lågnivå retinal bearbetning och Gaussian kärna i tidigt skede [djup neural nätverk], och dess förutsägelse av förlust av perceptuell illusion, kommer att leda till mer exakta datorseendetekniker och modeller”, sa Nematzadeh till Digital Trends. "[Detta kan] bidra till modeller på högre nivå av djup- och rörelsebearbetning och generaliserat till datorförståelse av naturliga bilder."

Rörliga orörliga cirklar (Optisk illusion) !

Max Williams, en AI-forskare som hjälpte till att sammanställa en datauppsättning av tusentals optiska illusionsbilder för datorseendesystem, uttrycker förhållandet mellan allmän syn och optiska illusioner mest kortfattat: "Illusioner existerar eftersom våra ögon och hjärnor utför ett rörigt och ad-hoc-process för att extrahera en visuell scen från ett annars obegripligt ljusfält, skapat av en fysisk värld som vi nästan är helt avstängda från", sa de till Digital Trender. "Jag tror inte att det är möjligt att göra ett visuellt system tillräckligt uttrycksfullt för att betraktas som 'perception' som också är fritt från illusioner."

Att uppnå allmän vision

För att vara tydlig, att uppnå General Vision för AI på mänsklig nivå (eller bättre) kommer inte bara att träna dem att känna igen vanliga optiska illusioner. Ingen hyperspecifik förmåga att till exempel avkoda Magic Eye-illusioner med 99,9 % noggrannhet på 0,001 sekunder kommer att ersätta miljontals år av mänsklig evolution.

(Intressant nog har maskinseende redan sin egen version av optiska illusioner i form av motstridiga modeller, vilket kan göra dem misstag – som i en alarmerande illustration – en 3D-printad leksakssköldpadda för ett gevär. Men dessa ger inte samma evolutionära fördelar som de optiska illusioner som fungerar på människor.)

Ändå kan det vara mycket användbar forskning att få maskiner att förstå mänskliga optiska illusioner och svara på dem på det sätt som vi gör.

Och en sak är säker: När General Vision AI är uppnått, kommer det att falla för samma typer av optiska illusioner som vi gör. Åtminstone, i fallet med det illusoriska expanderande hålet, 86% av oss.

Redaktörens rekommendationer

Wix använder ChatGPT för att hjälpa dig att snabbt bygga en hel webbplats
OpenAI bygger ett nytt team för att förhindra att superintelligent AI blir oseriöst
Dessa geniala idéer kan hjälpa till att göra AI lite mindre ond
Googles AI-bilddetekteringsverktyg känns som att det skulle kunna fungera
AI skulle kunna ersätta cirka 7 800 jobb hos IBM som en del av en anställningspaus

Optiska illusioner kan hjälpa oss att bygga en ny generation av AI

En evolutionär kant

Maskinseendet blir bättre

Ett Turing-test för maskinseende

Använd din illusion

Att uppnå allmän vision

Redaktörens rekommendationer

Kategorier

Nyligen

Elektrisk Hummer betyder "Watt Guzzlers" är här. Det är en bra sak

Molntjänster är bekväma, men de skadar smarta hems livslängd

Varför Amazon förvärvar iRobot är fantastiskt för kunderna