Optische illusies kunnen ons helpen een nieuwe generatie AI te bouwen

Je kijkt naar een afbeelding van een zwarte cirkel op een raster van ronde stippen. Het lijkt op een gat dat in een stuk wit gaasmateriaal is gebrand, hoewel het eigenlijk een plat, stilstaand beeld is op een scherm of stuk papier. Maar je hersenen begrijpen het niet zo. Als een hallucinerende ervaring op een laag niveau, struikelt je geest; het statische beeld waarnemen als de monding van een zwarte tunnel die naar je toe beweegt.

Inhoud

Een evolutionair voordeel
Machinevisie wordt steeds beter
Een Turing-test voor machinevisie
Gebruik je illusie
Het bereiken van een algemene visie

Als reactie op de waarheidsgetrouwheid van het effect begint het lichaam onbewust te reageren: de pupillen van het oog verwijden zich om meer licht binnen, net zoals ze zich zouden aanpassen als je op het punt stond in de duisternis te worden ondergedompeld om het best mogelijke te garanderen visie.

Het effect in kwestie is gecreëerd door Akiyoshi Kitaoka, een psycholoog aan de Ritsumeikan Universiteit in Kobe, Japan. Het is een van de tientallen optische illusies die hij gedurende een lange carrière heeft gecreëerd. (“Ik vind ze allemaal leuk”, zei hij, in antwoord op de vraag van Digital Trend of hij een favoriet heeft.)

Aanbevolen video's

Deze nieuwe illusie was het onderwerp van een onlangs gepubliceerd onderzoek in het tijdschrift Frontiers in Human Neuroscience. Hoewel de focus van het artikel sterk ligt op de menselijke fysiologische reacties op het nieuwe effect (waarvan blijkt dat zo’n 86 procent van ons dit zal ervaren), is de het algemene onderwerp kan ook heel relevant zijn als het gaat om de toekomst van machine-intelligentie – zoals een van de onderzoekers graag aan Digital wilde uitleggen Trends.

Een evolutionair voordeel

een optische illusie die bekend staat als de Fraser-spiraal — Op het eerste gezicht lijkt het misschien alsof deze afbeelding een spiraal toont die naar het midden slingert. Maar probeer een van de lijnen te volgen terwijl deze schijnbaar naar binnen buigt, en je zult beseffen dat het helemaal geen spiraal is.

Er is iets mis met je hersenen. Dat is tenminste een gemakkelijke conclusie die kan worden getrokken uit de manier waarop het menselijk brein optische illusies waarneemt. Welke andere verklaring is er voor een tweedimensionaal, statisch beeld dat door de hersenen als iets totaal anders wordt waargenomen? Lange tijd heeft de reguliere psychologie precies dat bedacht.

“Aanvankelijk dachten mensen: ‘Oké, ons brein is niet perfect… Het doet het niet altijd goed.’ Dat is een mislukking, toch?” gezegd Bruno Laeng, een professor aan de afdeling Psychologie van de Universiteit van Oslo en eerste auteur van de bovengenoemde studie. ‘Illusies waren in dat geval interessant omdat ze een onvolkomenheid in de machinerie aan het licht zouden brengen.’

De hersenen kunnen op geen enkele manier weten wat er [echt] daarbuiten is.’

Psychologen zien ze niet langer zo. Onderzoek als dit laat in ieder geval zien dat het visuele systeem niet alleen maar een simpele camera is. De optische illusie ‘Illusory Expanding Hole’ maakt duidelijk dat het oog zich aanpast aan waargenomen, zelfs ingebeelde, licht en duisternis, in plaats van aan fysieke energie.

Het belangrijkste is dat het laat zien dat we de wereld niet zomaar op een stomme manier vastleggen met onze visuele systemen, maar voer in plaats daarvan een continue reeks wetenschappelijke experimenten uit om een klein evolutionair inzicht te verkrijgen voordeel. Het doel is om de aan ons gepresenteerde gegevens te analyseren en te proberen problemen preventief aan te pakken voordat ze, nou ja, problemen worden.

“De hersenen kunnen op geen enkele manier weten wat er [echt] is,” zei Laeng. “Wat het doet is het opbouwen van een soort virtuele realiteit van wat er daarbuiten zou kunnen zijn. Er is een beetje giswerk. In dit opzicht kun je de hersenen zien als een soort probabilistische machine. Je kunt het een noemen Bayesiaans machine als je wilt. Het gebruikt een eerdere hypothese en probeert deze voortdurend te testen om te zien of dat werkt.

Laeng geeft het voorbeeld van onze ogen die aanpassingen maken op basis van niets anders dan de indruk van licht van de zon: zelfs als dit wordt waargenomen door bewolking of een bladerdak. Voor de zekerheid.

‘Wat er in de evolutie toe doet, is niet dat het waar is [op dat moment], maar dat het waarschijnlijk is’, vervolgde hij. “Door de pupil te vernauwen, past je lichaam zich al aan een situatie aan die zich zeer waarschijnlijk in korte tijd zal voordoen. Wat er gebeurt [als de zon plotseling schijnt] is dat je verblind wordt. Verblind betekent tijdelijk arbeidsongeschikt. Dat heeft enorme gevolgen, of je nu een prooi bent of een roofdier. Je verliest in een bepaalde situatie een fractie van een seconde en het kan zijn dat je het niet overleeft.”

Het zijn niet alleen licht en duisternis waar onze visuele systemen moeten raden. Denk eens aan een partijtje tennis, waarbij de bal met hoge snelheid beweegt. Als we ons gedrag volledig zouden baseren op wat het visuele systeem op een bepaald moment ontvangt, zouden we achterlopen op de realiteit en er niet in slagen de bal terug te geven. “We kunnen het heden waarnemen, ook al zitten we echt vast in het verleden”, zegt Laeng. “De enige manier om dit te doen is door de toekomst te voorspellen. Het klinkt een beetje als een woordspel, maar dat is het in een notendop.”

Machinevisie wordt steeds beter

gezichtsherkenning — izusek/Getty Images

Wat heeft dit te maken met computervisie? Potentieel alles. Om bijvoorbeeld een robot effectief te laten functioneren in de echte wereld, moet hij dit soort aanpassingen tijdens de vlucht kunnen doorvoeren. Computers hebben een voordeel als het gaat om hun vermogen om extreem snelle berekeningen uit te voeren. Wat ze niet hebben, is miljoenen jaren evolutie aan hun kant.

Toch heeft machine vision de afgelopen jaren enorme stappen gemaakt. Ze kunnen gezichten of gangen identificeren in realtime videostreams – mogelijk zelfs in grote groepen mensen. Soortgelijke beeldclassificatie en technische hulpmiddelen kunnen ook de aanwezigheid van andere objecten herkennen Doorbraken op het gebied van objectsegmentatie maken het mogelijk om de inhoud van verschillende objecten beter te begrijpen scènes. Er is ook aanzienlijke vooruitgang geboekt als het gaat om het extrapoleren van 3D-beelden uit 2D-scènes, waardoor machines driedimensionale informatie, zoals diepte, uit scènes kunnen ‘lezen’. Dit brengt het moderne computervisie dichter bij de menselijke beeldperceptie.

Er bestaat echter nog steeds een kloof tussen de beste machine vision-algoritmen en de soorten op visie gebaseerde mogelijkheden die de overgrote meerderheid van de mensen vanaf jonge leeftijd kan uitvoeren. Hoewel we niet precies kunnen verwoorden hoe we deze op visie gebaseerde taken uitvoeren (om de Hongaars-Britse polymath Michael Polanyi te citeren, ‘kunnen we wel weten meer dan we kunnen vertellen”), zijn we niettemin in staat een indrukwekkend scala aan taken uit te voeren waarmee we ons gezichtsvermogen op een verscheidenheid aan slimme manieren kunnen benutten manieren.

Een Turing-test voor machinevisie

Als onderzoekers en ingenieurs computervisiesystemen hopen te creëren die op zijn minst op gelijke voet werken met het visuele verwerkingsvaardigheden van het wetware-brein, het bouwen van algoritmen die optische illusies kunnen begrijpen, is geen slecht begin punt. Het zou op zijn minst een goede manier kunnen zijn om te meten hoe goed machine vision-systemen werken voor onze eigen hersenen. Het is misschien niet het antwoord op het mythische Kunstmatige algemene intelligentie, maar het kan de sleutel zijn tot het ontsluiten van algemeen zicht.

een optische illusie die je hersenen ertoe verleidt valse kleuren te zien — Geloof het of niet, maar al deze ballen hebben dezelfde grijstint en je hersenen interpreteren ze als verschillende kleuren op basis van de contextuele signalen van de gekleurde lijnen die er overheen lopen.

“Als iemand op een dag een kunstmatig visueel systeem zou ontwikkelen dat dezelfde illusoire waarnemingsfouten begaat Als we dat doen, zou je op dit punt weten dat ze een goede simulatie [realiseren] van hoe ons brein werkt”, zegt Laeng. gezegd. “Het zou een soort Turingtest zijn. Als je een kunstmatig netwerk hebt dat net als wij voor de gek gehouden wordt door illusie, dan zouden we heel dicht bij het begrijpen van de onderliggende berekening van de hersenen zelf zijn.”

Yi-Zhe-lied, lezer van Computer Vision and Machine Learning bij het Center for Vision Speech and Signal Processing aan de Britse Universiteit van Surrey, is het eens met de hypothese. “Het vragen van vision-algoritmen om optische illusies als een algemeen onderwerp te begrijpen is van grote waarde voor de gemeenschap”, vertelde hij aan Digital Trends. “Het gaat verder dan de huidige focus van de gemeenschap waarbij machines worden gevraagd te [herkennen], door de grenzen verder te verleggen [en] machines te vragen te redeneren. Deze impuls [zou] een belangrijke stap voorwaarts betekenen in de richting van ‘Algemene Visie’, waar rekening moet worden gehouden met subjectieve interpretaties van visuele concepten.”

Gebruik je illusie

Tot nu toe is er beperkt onderzoek gedaan naar dit doel, hoewel het zich nog in een relatief vroeg stadium bevindt. Nasim Nematzadeh, een onderzoeker met een Ph. D. in kunstmatige intelligentie en robotica-visiemodellen op laag niveau, is één persoon die dat wel heeft gedaan gepubliceerd werk over dit onderwerp.

“Wij zijn van mening dat verdere verkenning van de rol van eenvoudige Gaussiaans-achtige modellen in retinale verwerking op laag niveau en de Gaussische kernel in een vroeg stadium [diepe neurale netwerken], en de voorspelling van het verlies van perceptuele illusie, zullen leiden tot nauwkeurigere computer vision-technieken en -modellen”, vertelde Nematzadeh aan Digital Trends. "[Dit zou] kunnen bijdragen aan modellen van een hoger niveau van diepte- en bewegingsverwerking en gegeneraliseerd naar computerbegrip van natuurlijke beelden."

Bewegende bewegingloze cirkels (optische illusie)!

Max Williams, een AI-onderzoeker die hielp bij het samenstellen van een dataset van duizenden optische illusiebeelden voor computervisiesystemen, formuleert de relatie tussen algemeen zicht en optische illusies het meest bondig: “Illusies bestaan omdat onze ogen en hersenen een rommelige en rommelige taak uitvoeren. ad-hocproces om een visuele scène te extraheren uit een anderszins onbegrijpelijk lichtveld, gecreëerd door een fysieke wereld waarvan we bijna volledig zijn afgesloten”, vertelden ze aan Digital Trends. “Ik denk niet dat het mogelijk is om een visueel systeem expressief genoeg te maken om als ‘perceptie’ te kunnen worden beschouwd, die ook vrij is van illusies.”

Het bereiken van een algemene visie

Voor alle duidelijkheid: het bereiken van een algemene visie op menselijk niveau (of beter) voor AI betekent niet alleen dat we hen trainen in het herkennen van standaard optische illusies. Geen enkel hyperspecifiek vermogen om bijvoorbeeld Magic Eye-illusies met een nauwkeurigheid van 99,9% in 0,001 seconden te decoderen, kan miljoenen jaren menselijke evolutie vervangen.

(Interessant is dat machine vision al zijn eigen versie van optische illusies kent in de vorm van vijandige modellen, waardoor ze zich kunnen vergissen – zoals in één alarmerende illustratie – 3D-geprinte speelgoedschildpad voor een geweer. Deze leveren echter niet dezelfde evolutionaire voordelen op als de optische illusies die op mensen werken.)

Toch zou het zeer nuttig onderzoek kunnen zijn om machines menselijke optische illusies te laten begrijpen en erop te laten reageren zoals wij dat doen.

En één ding is zeker: When General Vision AI is bereikt, zal het vallen voor dezelfde soort optische illusies als wij. Tenminste, in het geval van het Illusory Expanding Hole, 86% van ons.

Aanbevelingen van de redactie

Wix gebruikt ChatGPT om u te helpen snel een hele website te bouwen
OpenAI bouwt nieuw team om te voorkomen dat superintelligente AI schurkenstaten wordt
Deze ingenieuze ideeën kunnen ervoor zorgen dat AI iets minder kwaadaardig wordt
De AI-beelddetectietool van Google voelt alsof het zou kunnen werken
AI zou ongeveer 7.800 banen bij IBM kunnen vervangen als onderdeel van een aanwervingspauze

Optische illusies kunnen ons helpen een nieuwe generatie AI te bouwen

Een evolutionair voordeel

Machinevisie wordt steeds beter

Een Turing-test voor machinevisie

Gebruik je illusie

Het bereiken van een algemene visie

Aanbevelingen van de redactie

Categorieën

Recente

De evolutie van de crossover

Fotorealistische CGI-advertenties voor productplaatsing kunnen binnenkort uw favoriete films binnendringen

Samenwerkende robots bouwen samen ruimtestations en redden levens