Les illusions d'optique pourraient nous aider à construire une nouvelle génération d'IA

Vous regardez l’image d’un cercle noir sur une grille de points circulaires. Cela ressemble à un trou gravé dans un morceau de maille blanche, bien qu’il s’agisse en réalité d’une image plate et stationnaire sur un écran ou un morceau de papier. Mais votre cerveau ne le comprend pas comme ça. Comme lors d’une expérience hallucinatoire de bas niveau, votre esprit s’évanouit; percevoir l’image statique comme l’embouchure d’un tunnel noir qui se dirige vers vous.

Contenu

  • Un avantage évolutif
  • La vision industrielle s'améliore
  • Un test de Turing pour la vision industrielle
  • Utilise ton illusion
  • Réaliser une vision générale

Répondant à la vraisemblance de l’effet, le corps commence à réagir inconsciemment: les pupilles de l’œil se dilatent pour laisser plus de lumière, tout comme ils s'ajusteraient si vous étiez sur le point d'être plongé dans l'obscurité pour assurer le meilleur possible vision.

L'illusion d'optique du trou noir

L'effet en question a été créé par Akiyoshi Kitaoka, psychologue à l'Université Ritsumeikan de Kobe, au Japon. C’est l’une des dizaines d’illusions d’optique qu’il a créées au cours de sa longue carrière. ("Je les aime tous", a-t-il déclaré en répondant à la question de Digital Trend de savoir s'il avait un favori.)

Vidéos recommandées

Cette nouvelle illusion a fait l'objet d'une recherche publiée récemment dans la revue Frontiers in Human Neuroscience. Bien que l'article se concentre résolument sur les réponses physiologiques humaines au nouvel effet (que 86 pour cent d'entre nous connaîtront), le Le sujet global peut également avoir beaucoup de pertinence en ce qui concerne l'avenir de l'intelligence artificielle - comme l'un des chercheurs était impatient de l'expliquer à Digital. Les tendances.

Un avantage évolutif

une illusion d'optique connue sous le nom de spirale de Fraser
À première vue, il peut sembler que cette image montre une spirale qui s’enroule vers le centre. Mais essayez de suivre l’une des lignes qui semble se courber vers l’intérieur, et vous réaliserez qu’il ne s’agit pas du tout d’une spirale.

Quelque chose ne va pas avec votre cerveau. C’est du moins une conclusion facile à tirer de la façon dont le cerveau humain perçoit les illusions d’optique. Quelle autre explication existe-t-il pour une image statique bidimensionnelle que le cerveau perçoit comme quelque chose de totalement différent? Pendant longtemps, la psychologie traditionnelle a pensé exactement cela.

« Au début, les gens pensaient: « D’accord, notre cerveau n’est pas parfait… Il ne fait pas toujours les choses correctement. » C’est un échec, n’est-ce pas? dit Bruno Laeng, professeur au Département de psychologie de l'Université d'Oslo et premier auteur de l'étude susmentionnée. "Dans ce cas, les illusions étaient intéressantes car elles révélaient une sorte d'imperfection dans la machinerie."

Le cerveau n’a aucun moyen de savoir ce qui se passe réellement. »

Les psychologues ne les voient plus de cette façon. Au contraire, des recherches comme celle-ci montrent à quel point le système visuel n’est pas simplement une simple caméra. L’illusion d’optique « Illusory Expanding Hole » montre clairement que l’œil s’adapte à la lumière et à l’obscurité perçues, voire imaginées, plutôt qu’à l’énergie physique.

Plus important encore, cela montre que nous n’enregistrons pas bêtement le monde avec nos systèmes visuels, mais effectuez plutôt un ensemble continu d'expériences scientifiques afin d'obtenir une légère évolution avantage. L’objectif est d’analyser les données qui nous sont présentées et d’essayer de traiter les problèmes de manière préventive avant qu’ils ne deviennent des problèmes.

"Le cerveau n'a aucun moyen de savoir ce qui se passe réellement", a déclaré Laeng. « Ce qu’il fait, c’est construire une sorte de réalité virtuelle de ce qui pourrait exister. Il y a un peu de conjecture. À cet égard, on peut considérer le cerveau comme une sorte de machine probabiliste. Vous pouvez appeler ça un Bayésien machine si vous le souhaitez. Il s’agit d’utiliser une hypothèse préalable et d’essayer de la tester tout le temps pour voir si cela fonctionne.

Laeng donne l'exemple de nos yeux qui effectuent des ajustements basés sur rien d'autre que l'impression de la lumière du soleil: même lorsque celle-ci est aperçue à travers la couverture nuageuse ou une canopée de feuilles. Au cas où.

"Ce qui compte dans l'évolution, ce n'est pas que ce soit vrai [à ce moment-là], mais c'est probable", a-t-il poursuivi. « En resserrant la pupille, votre corps s'adapte déjà à une situation qui est très susceptible de se produire dans un court laps de temps. Ce qui arrive [si le soleil apparaît soudainement], c'est que vous êtes ébloui. Ébloui signifie incapable temporairement. Cela a d’énormes conséquences, que vous soyez une proie ou un prédateur. Vous perdez une fraction de seconde dans une situation particulière et vous ne survivrez peut-être pas.

Ce n’est pas seulement la lumière et l’obscurité que nos systèmes visuels doivent deviner. Pensez à une partie de tennis, où la balle se déplace à grande vitesse. Si nous basions entièrement notre comportement sur ce que le système visuel reçoit à un moment donné, nous serions en retard par rapport à la réalité et ne parviendrons pas à renvoyer la balle. "Nous sommes capables de percevoir le présent même si nous sommes vraiment coincés dans le passé", a déclaré Laeng. « La seule façon d’y parvenir est de prédire l’avenir. Cela ressemble un peu à un jeu de mots, mais c’est tout en un mot.

La vision industrielle s'améliore

la reconnaissance faciale
izusek/Getty Images

Alors, qu’est-ce que cela a à voir avec la vision par ordinateur? Potentiellement tout. Pour qu’un robot, par exemple, puisse fonctionner efficacement dans le monde réel, il doit être capable d’effectuer ce type d’ajustements à la volée. Les ordinateurs ont un avantage en ce qui concerne leur capacité à effectuer des calculs extrêmement rapides. Ce qu’ils n’ont pas, ce sont des millions d’années d’évolution de leur côté.

Ces dernières années, la vision industrielle a néanmoins fait d’énormes progrès. Ils peuvent identifier des visages ou des démarches dans des flux vidéo en temps réel, potentiellement même dans de grandes foules de personnes. Des outils technologiques et de classification d'images similaires peuvent également reconnaître la présence d'autres objets, tout en les avancées en matière de segmentation d’objets permettent de mieux comprendre le contenu des différents scènes. Des progrès significatifs ont également été réalisés en matière d’extrapolation d’images 3D à partir de scènes 2D, permettant aux machines de « lire » des informations tridimensionnelles, telles que la profondeur, à partir de scènes. Cela rapproche la vision par ordinateur moderne de la perception de l’image humaine.

Cependant, il existe encore un fossé entre les meilleurs algorithmes de vision industrielle et les types de capacités basées sur la vision que l'écrasante majorité des humains sont capables d'exploiter dès leur plus jeune âge. Même si nous ne pouvons pas expliquer exactement comment nous accomplissons ces tâches basées sur la vision (pour citer le mathématicien hongro-britannique Michael Polanyi, « nous pouvons savoir plus que nous ne pouvons le dire »), nous sommes néanmoins capables d'effectuer un éventail impressionnant de tâches qui nous permettent d'exploiter notre vue dans une variété de fonctions intelligentes. façons.

Un test de Turing pour la vision industrielle

Si les chercheurs et les ingénieurs espèrent créer des systèmes de vision par ordinateur fonctionnant au moins à égalité avec le visuel compétences de traitement du cerveau Wetware, construire des algorithmes capables de comprendre les illusions d'optique n'est pas un mauvais début indiquer. À tout le moins, cela pourrait s’avérer un bon moyen de mesurer l’efficacité des systèmes de vision industrielle sur notre propre cerveau. Ce n'est peut-être pas la réponse au mythe Intelligence générale artificielle, mais cela pourrait être la clé pour débloquer la Vision Générale.

une illusion d'optique qui incite votre cerveau à voir de fausses couleurs
Croyez-le ou non, mais toutes ces boules ont la même nuance de gris et votre cerveau les interprète comme ayant des couleurs différentes en fonction des indices contextuels des lignes colorées qui les traversent.

« Si quelqu’un développait un jour un système visuel artificiel qui commettrait les mêmes erreurs de perception illusoire ce que nous faisons, vous saurez à ce stade qu’ils [réalisent] une bonne simulation du fonctionnement de notre cerveau », Laeng dit. « Ce serait une sorte de test de Turing. Si vous disposez d’un réseau artificiel trompé par l’illusion comme nous le sommes, alors nous serions très près de comprendre le calcul sous-jacent du cerveau lui-même.

Chanson de Yi-Zhe, lecteur de Computer Vision and Machine Learning au Centre for Vision Speech and Signal Processing de l’Université de Surrey au Royaume-Uni, est d’accord avec cette hypothèse. "Demander aux algorithmes de vision de comprendre les illusions d'optique en tant que sujet général est d'une grande valeur pour la communauté", a-t-il déclaré à Digital Trends. «Cela va au-delà de l'objectif actuel de la communauté consistant à demander aux machines de [reconnaître], en repoussant les limites plus loin [et] en demandant aux machines de raisonner. Cette avancée [représenterait] un pas en avant significatif vers la « vision générale », où les interprétations subjectives des concepts visuels doivent être prises en compte.

Utilise ton illusion

À ce jour, quelques recherches limitées ont été menées dans ce sens, même si elles en sont encore à un stade relativement précoce. Nasim Nematzadeh, chercheur titulaire d'un doctorat. en Intelligence Artificielle et Robotique-Modèles de vision de bas niveau, est une personne qui a travaux publiés sur ce sujet.

"Nous pensons qu'une exploration plus approfondie du rôle de modèles simples de type gaussien dans le traitement rétinien de bas niveau et le noyau gaussien à un stade précoce [neural profond" réseaux], et sa prédiction de la perte de l’illusion perceptuelle, conduira à des techniques et des modèles de vision par ordinateur plus précis », a déclaré Nematzadeh à Digital Trends. "[Cela pourrait] contribuer à des modèles de niveau supérieur de traitement de la profondeur et du mouvement et généraliser à la compréhension informatique des images naturelles."

Cercles immobiles en mouvement (Illusion d'optique) !

Max Williams, un chercheur en IA qui a aidé à compiler un ensemble de données sur des milliers d'images d'illusion d'optique pour les systèmes de vision par ordinateur, expose la relation entre la vision générale et les illusions d'optique de la manière la plus succincte: « Les illusions existent parce que nos yeux et notre cerveau effectuent un travail désordonné et désordonné. processus ad hoc pour extraire une scène visuelle d’un champ lumineux autrement incompréhensible, créé par un monde physique dont nous sommes presque complètement isolés », ont-ils déclaré à Digital Les tendances. "Je ne pense pas qu'il soit possible de rendre un système visuel suffisamment expressif pour être considéré comme une "perception", qui soit également exempt d'illusions."

Réaliser une vision générale

Pour être clair, atteindre une vision générale de niveau humain (ou mieux) pour l’IA ne consistera pas simplement à les entraîner à reconnaître les illusions d’optique standard. Aucune capacité hyper-spécifique permettant, par exemple, de décoder les illusions de Magic Eye avec une précision de 99,9 % en 0,001 seconde ne remplacera des millions d'années d'évolution humaine.

(Il est intéressant de noter que la vision industrielle possède déjà sa propre version des illusions d’optique sous la forme de modèles contradictoires, ce qui peut les inciter à se tromper – comme dans une illustration alarmante – Tortue jouet imprimée en 3D pour un fusil. Cependant, celles-ci n’apportent pas les mêmes avantages évolutifs que les illusions d’optique qui fonctionnent sur les humains.)

Pourtant, amener les machines à comprendre les illusions d’optique humaines et à y répondre comme nous le faisons pourrait être une recherche très utile.

Et une chose est sûre: quand General Vision AI est atteint, il tombera dans le même genre d’illusions d’optique que nous. Au moins, dans le cas du Trou Illusoire en Expansion, 86 % d’entre nous.

Recommandations des rédacteurs

  • Wix utilise ChatGPT pour vous aider à créer rapidement un site Web complet
  • OpenAI crée une nouvelle équipe pour empêcher l'IA superintelligente de devenir voyou
  • Ces idées ingénieuses pourraient contribuer à rendre l’IA un peu moins malveillante
  • L’outil de détection d’images IA de Google semble pouvoir fonctionner
  • L'IA pourrait remplacer environ 7 800 emplois chez IBM dans le cadre d'une pause d'embauche