Sie sehen ein Bild eines schwarzen Kreises auf einem Gitter aus kreisförmigen Punkten. Es ähnelt einem Loch, das in ein Stück weißes Netzmaterial gebrannt ist, obwohl es sich tatsächlich um ein flaches, stationäres Bild auf einem Bildschirm oder einem Stück Papier handelt. Aber Ihr Gehirn versteht es nicht so. Wie bei einer leichten halluzinatorischen Erfahrung stolpert Ihr Geist; Nehmen Sie das statische Bild als die Mündung eines schwarzen Tunnels wahr, der sich auf Sie zubewegt.
Inhalt
- Ein evolutionärer Vorsprung
- Die maschinelle Bildverarbeitung wird immer besser
- Ein Turing-Test für maschinelles Sehen
- Benutze deine Illusion
- Allgemeine Vision erreichen
Als Reaktion auf die Wahrhaftigkeit des Effekts beginnt der Körper unbewusst zu reagieren: Die Pupillen des Auges weiten sich, um Luft zu lassen mehr Licht herein, so wie sie sich anpassen würden, wenn Sie in die Dunkelheit eintauchen würden, um das bestmögliche Ergebnis zu erzielen Vision.
Der betreffende Effekt wurde erstellt von Akiyoshi Kitaoka
, ein Psychologe an der Ritsumeikan-Universität in Kobe, Japan. Es ist eine von Dutzenden optischen Täuschungen, die er im Laufe seiner langen Karriere geschaffen hat. („Ich mag sie alle“, antwortete er auf die Frage von Digital Trend, ob er einen Favoriten habe.)Empfohlene Videos
Diese neue Illusion war Gegenstand einer kürzlich veröffentlichten Studie in der Zeitschrift Frontiers in Human Neuroscience. Während der Schwerpunkt des Artikels eindeutig auf den physiologischen Reaktionen des Menschen auf den neuartigen Effekt liegt (den nachweislich etwa 86 Prozent von uns erleben werden), ist der Das Gesamtthema könnte auch für die Zukunft der maschinellen Intelligenz von großer Relevanz sein – wie einer der Forscher Digital unbedingt erklären wollte Trends.
Ein evolutionärer Vorsprung
Mit deinem Gehirn stimmt etwas nicht. Zumindest ist das eine einfache Schlussfolgerung aus der Art und Weise, wie das menschliche Gehirn optische Täuschungen wahrnimmt. Welche andere Erklärung gibt es für ein zweidimensionales, statisches Bild, das das Gehirn als etwas völlig anderes wahrnimmt? Lange Zeit ging die Mainstream-Psychologie genau davon aus.
„Anfangs dachten die Leute: ‚Okay, unser Gehirn ist nicht perfekt … Es macht es nicht immer richtig.‘ Das ist ein Fehlschlag, oder?“ sagte Bruno Länge, Professor am Institut für Psychologie der Universität Oslo und Erstautor der oben genannten Studie. „In diesem Fall waren Illusionen interessant, weil sie irgendeine Art von Unvollkommenheit in der Maschinerie offenbaren würden.“
Das Gehirn hat keine Möglichkeit zu wissen, was [wirklich] da draußen ist.“
Psychologen sehen sie nicht mehr so. Wenn überhaupt, zeigen Untersuchungen wie diese, dass das visuelle System nicht nur eine einfache Kamera ist. Die optische Täuschung „Illusory Expanding Hole“ macht deutlich, dass sich das Auge eher an wahrgenommenes, sogar eingebildetes Licht und Dunkelheit als an physische Energie anpasst.
Am wichtigsten ist, dass es zeigt, dass wir die Welt nicht einfach nur mit unseren visuellen Systemen aufzeichnen, sondern Führen Sie stattdessen eine kontinuierliche Reihe wissenschaftlicher Experimente durch, um eine leichte Evolution zu erreichen Vorteil. Das Ziel besteht darin, die uns vorgelegten Daten zu analysieren und zu versuchen, Probleme präventiv anzugehen, bevor sie zu Problemen werden.
„Das Gehirn hat keine Möglichkeit zu wissen, was [wirklich] da draußen ist“, sagte Laeng. „Es baut eine Art virtuelle Realität dessen auf, was da draußen sein könnte. Es gibt ein wenig Vermutungen. In dieser Hinsicht kann man sich das Gehirn als eine Art Wahrscheinlichkeitsmaschine vorstellen. Man kann es ein nennen Bayesianisch Maschine, wenn Sie möchten. Es geht darum, eine vorherige Hypothese zu verwenden und ständig zu testen, um zu sehen, ob das funktioniert.“
Laeng führt als Beispiel an, wie unsere Augen Anpassungen vornehmen, die auf nichts anderem als dem Eindruck des Lichts der Sonne basieren: selbst wenn dieses durch eine Wolkendecke oder ein Blätterdach über uns gesehen wird. Nur für den Fall.
„Was in der Evolution zählt, ist nicht, dass es [in diesem Moment] wahr ist, sondern dass es wahrscheinlich ist“, fuhr er fort. „Durch die Verengung der Pupille stellt sich Ihr Körper bereits auf eine Situation ein, die sehr wahrscheinlich in kurzer Zeit eintreten wird. Was passiert [wenn die Sonne plötzlich herauskommt], ist, dass man geblendet wird. Geblendet bedeutet vorübergehend außer Gefecht gesetzt. Das hat enorme Konsequenzen, egal ob Sie eine Beute oder ein Raubtier sind. In einer bestimmten Situation verliert man den Bruchteil einer Sekunde und überlebt möglicherweise nicht.“
Es sind nicht nur Licht und Dunkelheit, bei denen unser visuelles System Vermutungen anstellen muss. Denken Sie an eine Partie Tennis, bei der sich der Ball mit hoher Geschwindigkeit bewegt. Würden wir unser Verhalten ausschließlich auf dem basieren, was das visuelle System zu einem bestimmten Zeitpunkt empfängt, würden wir hinter der Realität zurückbleiben und den Ball nicht zurückschlagen. „Wir sind in der Lage, die Gegenwart wahrzunehmen, obwohl wir wirklich in der Vergangenheit feststecken“, sagte Laeng. „Der einzige Weg, dies zu tun, besteht darin, die Zukunft vorherzusagen. Es klingt ein bisschen wie ein Wortspiel, aber das ist es auf den Punkt gebracht.“
Die maschinelle Bildverarbeitung wird immer besser
Was hat das also mit Computer Vision zu tun? Potenziell alles. Damit beispielsweise ein Roboter in der realen Welt effektiv funktionieren kann, muss er in der Lage sein, diese Art von Anpassungen im laufenden Betrieb vorzunehmen. Computer haben einen Vorteil, wenn es um die Fähigkeit geht, extrem schnelle Berechnungen durchzuführen. Was sie nicht haben, sind Millionen von Jahren der Evolution auf ihrer Seite.
Dennoch hat die maschinelle Bildverarbeitung in den letzten Jahren enorme Fortschritte gemacht. Sie können Gesichter oder Gangarten in Echtzeit-Videostreams identifizieren – möglicherweise sogar in großen Menschenmengen. Ähnliche Bildklassifizierungs- und Technologietools können gleichzeitig auch die Anwesenheit anderer Objekte erkennen Durchbrüche bei der Objektsegmentierung ermöglichen es, den Inhalt verschiedener Objekte besser zu verstehen Szenen. Auch bei der Extrapolation von 3D-Bildern aus 2D-Szenen wurden erhebliche Fortschritte erzielt, sodass Maschinen dreidimensionale Informationen, wie beispielsweise die Tiefe, aus Szenen „lesen“ können. Dadurch nähert sich das moderne Computersehen der menschlichen Bildwahrnehmung an.
Es besteht jedoch immer noch eine Kluft zwischen den besten Bildverarbeitungsalgorithmen und den visionsbasierten Fähigkeiten, die die überwiegende Mehrheit der Menschen schon in jungen Jahren anwenden kann. Wir können zwar nicht genau formulieren, wie wir diese auf Visionen basierenden Aufgaben ausführen (um den ungarisch-britischen Universalgelehrten Michael Polanyi zu zitieren), „können wir es aber wissen mehr als wir sagen können“), sind wir dennoch in der Lage, eine beeindruckende Reihe von Aufgaben auszuführen, die es uns ermöglichen, unser Sehvermögen auf vielfältige Weise intelligent zu nutzen Wege.
Ein Turing-Test für maschinelles Sehen
Wenn Forscher und Ingenieure hoffen, Computer-Vision-Systeme zu entwickeln, die dem Visuellen mindestens ebenbürtig sind Angesichts der Verarbeitungsfähigkeiten des Wetware-Gehirns ist die Entwicklung von Algorithmen, die optische Täuschungen verstehen können, kein schlechter Anfang Punkt. Zumindest könnte es sich als gute Möglichkeit erweisen, zu messen, wie gut maschinelle Bildverarbeitungssysteme auf unser eigenes Gehirn funktionieren. Es ist möglicherweise nicht die Antwort auf das Mythische Künstliche allgemeine Intelligenz, aber es könnte der Schlüssel zur Freischaltung von General Vision sein.
„Wenn jemand eines Tages ein künstliches visuelles System entwickeln würde, das die gleichen illusorischen Wahrnehmungsfehler begeht Wenn wir das tun, wissen Sie an diesem Punkt, dass sie eine gute Simulation der Funktionsweise unseres Gehirns erreichen“, sagte Laeng sagte. „Es wäre eine Art Turing-Test. Wenn Sie wie wir über ein künstliches Netzwerk verfügen, das von Illusionen getäuscht wird, dann wären wir dem Verständnis der zugrunde liegenden Berechnungen des Gehirns selbst sehr nahe.“
Yi-Zhe-Lied, Leser von Computer Vision and Machine Learning am Centre for Vision Speech and Signal Processing an der britischen University of Surrey, stimmt der Hypothese zu. „Von Vision-Algorithmen zu verlangen, optische Täuschungen als allgemeines Thema zu verstehen, ist für die Community von großem Wert“, sagte er gegenüber Digital Trends. „Es geht über den aktuellen Community-Fokus hinaus, Maschinen zum [Erkennen] aufzufordern, indem es die Grenzen weiter verschiebt [und] Maschinen zum Nachdenken auffordert. Dieser Vorstoß [wäre] ein bedeutender Schritt vorwärts in Richtung „Allgemeines Sehen“, bei dem subjektive Interpretationen visueller Konzepte berücksichtigt werden müssen.“
Benutze deine Illusion
Bisher gibt es nur begrenzte Forschungsarbeiten zu diesem Ziel – obwohl es sich noch in einem relativ frühen Stadium befindet. Nasim Nematzadeh, ein Forscher mit einem Doktortitel. In künstlichen Intelligenz- und Robotik-Low-Level-Vision-Modellen gibt es eine Person, die dies getan hat veröffentlichte Arbeiten zu diesem Thema.
„Wir glauben, dass eine weitere Erforschung der Rolle einfacher Gauß-ähnlicher Modelle bei der Verarbeitung der Netzhaut auf niedriger Ebene und des Gauß-Kernels im frühen Stadium [deep neural Netzwerke] und seine Vorhersage des Verlusts der Wahrnehmungsillusion werden zu genaueren Computer-Vision-Techniken und -Modellen führen“, sagte Nematzadeh gegenüber Digital Trends. „[Dies könnte] zu übergeordneten Modellen der Tiefen- und Bewegungsverarbeitung beitragen und auf das Computerverständnis natürlicher Bilder verallgemeinert werden.“
Sich bewegende bewegungslose Kreise (optische Täuschung)!
Max Williams, ein KI-Forscher, der bei der Zusammenstellung eines Datensatzes geholfen hat Tausende von optischen Täuschungsbildern Für Computer-Vision-Systeme bringt er die Beziehung zwischen allgemeinem Sehen und optischen Täuschungen am prägnantesten auf den Punkt: „Illusionen existieren, weil unsere Augen und Gehirne eine chaotische und chaotische Leistung erbringen „Ein Ad-hoc-Prozess, um eine visuelle Szene aus einem ansonsten unverständlichen Lichtfeld zu extrahieren, das von einer physischen Welt erzeugt wird, von der wir fast vollständig abgeschottet sind“, sagten sie gegenüber Digital Trends. „Ich glaube nicht, dass es möglich ist, ein visuelles System ausdrucksstark genug zu machen, um als ‚Wahrnehmung‘ betrachtet zu werden, das außerdem frei von Illusionen ist.“
Allgemeine Vision erreichen
Um es klar auszudrücken: Das Erreichen eines allgemeinen Sehvermögens auf menschlicher Ebene (oder besser) für KI bedeutet nicht einfach, sie darin zu trainieren, standardmäßige optische Täuschungen zu erkennen. Keine hyperspezifische Fähigkeit, beispielsweise Illusionen des „Magischen Auges“ mit einer Genauigkeit von 99,9 % in 0,001 Sekunden zu entschlüsseln, wird Millionen von Jahren menschlicher Evolution ersetzen.
(Interessanterweise verfügt die maschinelle Bildverarbeitung bereits über eine eigene Version optischer Täuschungen in Form von kontradiktorischen Modellen, die sie – wie in einer alarmierenden Illustration – zu Fehlern führen können 3D-gedruckte Spielzeugschildkröte für ein Gewehr. Diese bringen jedoch nicht die gleichen evolutionären Vorteile mit sich wie die optischen Täuschungen, die beim Menschen wirken.)
Dennoch könnte es eine sehr nützliche Forschung sein, Maschinen dazu zu bringen, menschliche optische Täuschungen zu verstehen und auf sie in der Art und Weise zu reagieren, wie wir es tun.
Und eines ist sicher: Bei General Vision AI Ist Wenn das erreicht ist, wird es auf die gleichen optischen Täuschungen hereinfallen wie wir. Zumindest im Fall des illusorischen expandierenden Lochs 86 % von uns.
Empfehlungen der Redaktion
- Wix verwendet ChatGPT, um Ihnen beim schnellen Aufbau einer gesamten Website zu helfen
- OpenAI baut neues Team auf, um zu verhindern, dass superintelligente KI abtrünnig wird
- Diese genialen Ideen könnten dazu beitragen, die KI ein wenig weniger böse zu machen
- Das KI-Bilderkennungstool von Google scheint funktionieren zu können
- KI könnte im Zuge einer Einstellungspause rund 7.800 Stellen bei IBM ersetzen