Złudzenia optyczne mogą pomóc nam w zbudowaniu nowej generacji sztucznej inteligencji

Patrzysz na obraz czarnego koła na siatce okrągłych kropek. Przypomina dziurę wypaloną w kawałku białej siatki, chociaż w rzeczywistości jest to płaski, nieruchomy obraz na ekranie lub kartce papieru. Ale twój mózg nie pojmuje tego w ten sposób. Podobnie jak w przypadku halucynacyjnego doświadczenia na niskim poziomie, twój umysł ulega awarii; postrzeganie statycznego obrazu jako wylotu czarnego tunelu, który zbliża się do ciebie.

Zawartość

  • Przewaga ewolucyjna
  • Widzenie maszynowe jest coraz lepsze
  • Test Turinga na widzenie maszynowe
  • Użyj swojej iluzji
  • Osiągnięcie ogólnej wizji

W odpowiedzi na prawdziwość efektu ciało zaczyna nieświadomie reagować: źrenice oka rozszerzają się, pozwalając więcej światła, tak jak przystosowałyby się, gdybyś miał pogrążyć się w ciemności, aby zapewnić najlepsze możliwe wizja.

Złudzenie optyczne czarnej dziury

Efekt, o którym mowa, został stworzony przez Akiyoshiego Kitaoki, psycholog na Uniwersytecie Ritsumeikan w Kobe w Japonii. To jedna z kilkudziesięciu iluzji optycznych, które stworzył w ciągu swojej długiej kariery. („Lubię je wszystkie” – powiedział, odpowiadając na pytanie Digital Trend o to, czy ma ulubioną.)

Polecane filmy

Ta nowa iluzja była przedmiotem niedawno opublikowanych badań w czasopiśmie Frontiers in Human Neuroscience. Chociaż artykuł koncentruje się głównie na reakcjach fizjologicznych człowieka na nowy efekt (którego, jak się okazuje, doświadczy około 86 procent z nas), ogólny temat może mieć również duże znaczenie, jeśli chodzi o przyszłość inteligencji maszyn – jak chciał wyjaśnić Digitalowi jeden z badaczy Trendy.

Przewaga ewolucyjna

złudzenie optyczne znane jako spirala Frasera
Na pierwszy rzut oka może się wydawać, że to zdjęcie przedstawia spiralę wijącą się w kierunku środka. Ale spróbuj podążać za jedną z linii, która pozornie zakrzywia się do wewnątrz, a zdasz sobie sprawę, że to wcale nie jest spirala.

Coś jest nie tak z twoim mózgiem. Przynajmniej taki wniosek można wyciągnąć ze sposobu, w jaki ludzki mózg postrzega złudzenia optyczne. Jakie jest inne wyjaśnienie dwuwymiarowego, statycznego obrazu, który mózg postrzega jako coś zupełnie innego? Przez długi czas psychologia głównego nurtu dokładnie to uważała.

„Początkowo ludzie myśleli: «No dobrze, nasz mózg nie jest doskonały… Nie zawsze mu to wychodzi.» To porażka, prawda?” powiedział Bruno Laenga, profesor na Wydziale Psychologii Uniwersytetu w Oslo i pierwszy autor wspomnianego badania. „W tym przypadku iluzje były interesujące, ponieważ ujawniały pewnego rodzaju niedoskonałości maszynerii”.

Mózg nie ma możliwości dowiedzenia się, co [naprawdę] tam jest”.

Psychologowie nie postrzegają ich już w ten sposób. Badania takie jak to pokazują, że system wizualny to nie tylko zwykła kamera. Złudzenie optyczne „Illusory Expanding Hole” wyraźnie pokazuje, że oko dostosowuje się do postrzeganego, a nawet wyobrażanego światła i ciemności, a nie do energii fizycznej.

Co najważniejsze, pokazuje, że nie tylko głupio rejestrujemy świat za pomocą naszych systemów wizualnych, ale zamiast tego przeprowadzaj ciągły zestaw eksperymentów naukowych, aby uzyskać niewielką ewolucję korzyść. Celem jest analiza przedstawionych nam danych i próba zapobiegawczego poradzenia sobie z problemami, zanim staną się one, cóż, problemami.

„Mózg nie ma możliwości dowiedzenia się, co [naprawdę] tam jest” – powiedział Laeng. „To, co robi, polega na budowaniu czegoś w rodzaju wirtualnej rzeczywistości tego, co może tam być. Jest trochę domysłów. Pod tym względem można myśleć o mózgu jako o maszynie probabilistycznej. Możesz to nazwać Bayesowski maszynę, jeśli chcesz. Wykorzystuje jakąś wcześniejszą hipotezę i próbuje ją cały czas testować, aby zobaczyć, czy to działa.

Laeng podaje przykład, jak nasze oczy dostosowują się jedynie do wrażenia światła słonecznego: nawet jeśli jest ono widziane przez zachmurzenie lub baldachim liści nad głową. W razie czego.

„W ewolucji liczy się nie to, że jest to prawdą [w tym momencie], ale że jest prawdopodobne” – kontynuował. „Zwężając źrenicę, twoje ciało już dostosowuje się do sytuacji, która z dużym prawdopodobieństwem wydarzy się w krótkim czasie. To, co się dzieje [jeśli nagle wzejdzie słońce], oznacza, że ​​jesteś oślepiony. Oszołomiony oznacza chwilową niezdolność do działania. Ma to ogromne konsekwencje, niezależnie od tego, czy jesteś ofiarą, czy drapieżnikiem. W konkretnej sytuacji tracisz ułamek sekundy i możesz nie przeżyć.

Nasze systemy wizualne muszą zgadywać nie tylko w świetle i ciemności. Pomyśl o grze w tenisa, podczas której piłka leci z dużą prędkością. Gdybyśmy opierali swoje zachowanie wyłącznie na tym, co w danym momencie otrzymuje nasz system wzrokowy, pozostalibyśmy w tyle za rzeczywistością i nie udałoby nam się oddać piłki. „Jesteśmy w stanie dostrzec teraźniejszość, chociaż tak naprawdę utknęliśmy w przeszłości” – powiedział Laeng. „Jedynym sposobem, aby to osiągnąć, jest przewidywanie przyszłości. Brzmi to trochę jak gra słowna, ale tak w skrócie wygląda.”

Widzenie maszynowe jest coraz lepsze

rozpoznawanie twarzy
izusek/Getty Images

A co to ma wspólnego z wizją komputerową? Potencjalnie wszystko. Aby na przykład robot mógł efektywnie funkcjonować w świecie rzeczywistym, musi mieć możliwość dokonywania tego rodzaju dostosowań na bieżąco. Komputery mają przewagę, jeśli chodzi o zdolność do wykonywania niezwykle szybkich obliczeń. Jedyne, czego im brakuje, to miliony lat ewolucji po swojej stronie.

Niemniej jednak w ostatnich latach widzenie maszynowe poczyniło ogromne postępy. Potrafią identyfikować twarze lub chody w strumieniach wideo w czasie rzeczywistym – potencjalnie nawet w ogromnych tłumach ludzi. Podobna klasyfikacja obrazu i narzędzia technologiczne mogą również rozpoznawać obecność innych obiektów Przełomy w segmentacji obiektów umożliwiają lepsze zrozumienie treści odmiennych sceny. Poczyniono również znaczny postęp, jeśli chodzi o ekstrapolację obrazów 3D ze scen 2D, umożliwiając maszynom „odczytywanie” ze scen trójwymiarowych informacji, takich jak głębokość. To przybliża współczesną wizję komputerową do postrzegania obrazu przez człowieka.

Jednakże nadal istnieje przepaść pomiędzy najlepszymi algorytmami widzenia maszynowego a możliwościami opartymi na wizji, które przeważająca większość ludzi jest w stanie wdrożyć od najmłodszych lat. Choć nie potrafimy dokładnie określić, w jaki sposób realizujemy te oparte na wizji zadania (cytując węgiersko-brytyjskiego polityka Michaela Polanyi’ego, „możemy wiedzieć, że więcej, niż jesteśmy w stanie stwierdzić”), mimo to jesteśmy w stanie wykonać imponujący wachlarz zadań, które pozwalają nam wykorzystać szereg inteligentnych zdolności naszego wzroku sposoby.

Test Turinga na widzenie maszynowe

Jeśli badacze i inżynierowie mają nadzieję stworzyć komputerowe systemy wizyjne, które będą działać co najmniej na równi z obrazem umiejętności przetwarzania mózgu oprogramowania mokrego, budowanie algorytmów, które potrafią zrozumieć iluzje optyczne, nie jest złym początkiem punkt. Przynajmniej może okazać się dobrym sposobem pomiaru tego, jak dobrze systemy widzenia maszynowego wpływają na nasz mózg. Być może nie jest to odpowiedź na mityczne pytanie Sztuczna inteligencja ogólna, ale może być kluczem do odblokowania Ogólnego Widzenia.

złudzenie optyczne, które oszukuje mózg, aby widział fałszywe kolory
Wierz lub nie, ale wszystkie te kulki mają ten sam odcień szarości, a Twój mózg interpretuje je jako mające różne kolory w oparciu o kontekstowe wskazówki kolorowych linii, które je przecinają

„Gdyby ktoś pewnego dnia opracował sztuczny system wizualny, który popełniałby te same iluzoryczne błędy w percepcji że to robimy, już na tym etapie wiedzielibyście, że [uzyskują] dobrą symulację działania naszego mózgu” – Laeng powiedział. „To byłby rodzaj testu Turinga. Jeśli mamy sztuczną sieć, która tak jak my daje się zwieść iluzji, wówczas bylibyśmy bardzo bliscy zrozumienia podstawowych obliczeń samego mózgu”.

Piosenka Yi-Zhe, czytelnik książki Computer Vision and Machine Learning w Center for Vision Speech and Signal Processing na brytyjskim Uniwersytecie w Surrey, zgadza się z tą hipotezą. „Poproszenie algorytmów wizyjnych o zrozumienie złudzeń optycznych jako ogólnego tematu ma ogromną wartość dla społeczności” – powiedział Digital Trends. „Wykracza to poza obecne skupienie społeczności polegające na proszeniu maszyn o [rozpoznanie], przesuwając granice dalej [i] prosząc maszyny o rozsądek. To pchnięcie [stanowiłoby] znaczący krok naprzód w kierunku „ogólnej wizji”, w której należy uwzględnić subiektywne interpretacje koncepcji wizualnych”.

Użyj swojej iluzji

Do chwili obecnej przeprowadzono pewne ograniczone badania zmierzające w tym kierunku – choć pozostają one na stosunkowo wczesnym etapie. Nasim Nematzadeh, badacz z tytułem doktora. w sztucznej inteligencji i robotyce — modele wizji niskiego poziomu, to jedna osoba, która to ma opublikował pracę na ten temat.

„Wierzymy, że dalsze badania roli prostych modeli gaussowskich w przetwarzaniu siatkówki na niskim poziomie i jądrze Gaussa we wczesnych stadiach [głębokiego neuronu sieci] i przewidywanie utraty złudzeń percepcyjnych doprowadzą do dokładniejszych technik i modeli widzenia komputerowego” – powiedział Nematzadeh Digital Trends. „[Mogłoby to] przyczynić się do powstania modeli wyższego poziomu przetwarzania głębi i ruchu oraz uogólnić je na komputerowe zrozumienie naturalnych obrazów”.

Poruszające się nieruchome koła (złudzenie optyczne) !

Max Williams, badacz sztucznej inteligencji, który pomógł skompilować zbiór danych tysiące obrazów złudzeń optycznych w przypadku komputerowych systemów wizyjnych najkrócej przedstawia związek między widzeniem ogólnym a złudzeniami optycznymi: „Iluzje istnieją, ponieważ nasze oczy i mózg wykonują chaotyczne i doraźny proces polegający na wyodrębnieniu sceny wizualnej z skądinąd niezrozumiałego pola świetlnego, utworzonego przez świat fizyczny, od którego jesteśmy prawie całkowicie odcięci” – powiedzieli Digital Trendy. „Nie sądzę, że możliwe jest stworzenie systemu wizualnego na tyle wyrazistego, aby można go było uznać za «percepcję», która jest jednocześnie wolna od iluzji”.

Osiągnięcie ogólnej wizji

Żeby było jasne, osiągnięcie ogólnego widzenia na poziomie ludzkim (lub lepszym) w przypadku sztucznej inteligencji nie polega po prostu na wyszkoleniu ich w rozpoznawaniu standardowych złudzeń optycznych. Żadna hiperspecyficzna zdolność, powiedzmy, do dekodowania iluzji Magicznego Oka z 99,9% dokładnością w ciągu 0,001 sekundy nie zastąpi milionów lat ewolucji człowieka.

(Co ciekawe, widzenie maszynowe ma już swoją wersję złudzeń optycznych w postaci modeli kontradyktoryjnych, przez co mogą pomylić się – jak na jednej z niepokojących ilustracji – z Wydrukowany w 3D żółw zabawkowy do karabinu. Jednakże nie przynoszą one takich samych korzyści ewolucyjnych jak złudzenia optyczne działające na ludzi.)

Mimo to bardzo przydatne badania mogą okazać się nauczenie maszyn zrozumienia ludzkich złudzeń optycznych i reagowania na nie w taki sam sposób, jak my to robimy.

I jedno jest pewne: kiedy General Vision AI Jest osiągnięty, ulegnie temu samemu rodzajowi złudzeń optycznych co my. Przynajmniej w przypadku Iluzorycznej Rozszerzającej się Dziury – 86% z nas.

Zalecenia redaktorów

  • Wix używa ChatGPT, aby pomóc Ci szybko zbudować całą witrynę internetową
  • OpenAI buduje nowy zespół, aby powstrzymać superinteligentną sztuczną inteligencję przed zbuntowaniem się
  • Te genialne pomysły mogą pomóc uczynić sztuczną inteligencję trochę mniej złą
  • Wydaje się, że narzędzie Google do wykrywania obrazów AI może zadziałać
  • W ramach przerwy w zatrudnieniu sztuczna inteligencja może zastąpić około 7800 stanowisk pracy w IBM