Optične iluzije bi nam lahko pomagale zgraditi novo generacijo umetne inteligence

Pogledate sliko črnega kroga na mreži krožnih pik. Spominja na luknjo, vžgano v kos belega mrežastega materiala, čeprav je v resnici ravna, nepremična slika na zaslonu ali kosu papirja. Toda vaši možgani tega ne razumejo tako. Kot neka halucinatorna izkušnja nizke ravni, vaš um izleti; statično sliko dojemate kot ustje črnega predora, ki se premika proti vam.

Vsebina

  • Evolucijski rob
  • Strojni vid postaja boljši
  • Turingov test za strojni vid
  • Uporabi svojo iluzijo
  • Doseganje splošne vizije

Telo se odzove na verodostojnost učinka in začne nezavedno reagirati: očesne zenice se razširijo, da več svetlobe, tako kot bi se prilagodili, če bi se potopili v temo, da bi zagotovili najboljše možno vizija.

Optična iluzija črne luknje

Zadevni učinek je ustvaril Akiyoshi Kitaoka, psiholog na univerzi Ritsumeikan v Kobeju na Japonskem. To je ena od ducatov optičnih iluzij, ki jih je ustvaril v dolgi karieri. (»Vse so mi všeč,« je rekel in odgovoril na vprašanje Digital Trenda, ali ima najljubšo.)

Priporočeni videoposnetki

Ta nova iluzija je bila predmet nedavno objavljene raziskave

v reviji Frontiers in Human Neuroscience. Čeprav je prispevek osredotočen na človeški fiziološki odziv na nov učinek (za katerega se izkaže, da ga bo izkusilo približno 86 odstotkov nas), celotna tema je lahko tudi zelo pomembna, ko gre za prihodnost strojne inteligence - kot je eden od raziskovalcev vneto pojasnil za Digital Trendi.

Evolucijski rob

optična iluzija, znana kot Fraserjeva spirala
Na prvi pogled se lahko zdi, kot da ta slika prikazuje spiralo, ki se vije proti sredini. Toda poskusite slediti eni od linij, ko se navidezno ukrivi navznoter, in ugotovili boste, da sploh ni spirala.

Nekaj ​​je narobe s tvojimi možgani. Vsaj to je preprost sklep, ki ga je mogoče potegniti iz načina, kako človeški možgani zaznavajo optične iluzije. Kakšna druga razlaga obstaja za dvodimenzionalno, statično sliko, ki jo možgani dojemajo kot nekaj povsem drugega? Dolgo časa je mainstream psihologija mislila točno to.

"Ljudje so sprva mislili:" V redu, naši možgani niso popolni … Ne znajo vedno prav. "To je neuspeh, kajne?" rekel Bruno Laeng, profesorica na Oddelku za psihologijo Univerze v Oslu in prva avtorica omenjene študije. "Iluzije v tem primeru so bile zanimive, ker bi razkrile nekakšno nepopolnost v strojih."

Možgani ne morejo vedeti, kaj je [v resnici] tam zunaj.«

Psihologi nanje ne gledajo več tako. Če sploh kaj, raziskave, kot je ta, poudarjajo, kako vizualni sistem ni le enostavna kamera. Optična iluzija »Illusory Expanding Hole« pojasnjuje, da se oko prilagaja zaznani, celo namišljeni svetlobi in temi, ne pa fizični energiji.

Najpomembneje je, da prikazuje, da sveta ne snemamo le neumno z našimi vizualnimi sistemi, ampak namesto tega izvajajte neprekinjen niz znanstvenih poskusov, da pridobite rahlo evolucijo prednost. Cilj je analizirati podatke, ki so nam predstavljeni, in poskušati preventivno obravnavati težave, preden postanejo, no, težave.

"Možgani ne morejo vedeti, kaj je [res] tam zunaj," je dejal Laeng. »To, kar počne, je ustvarjanje nekakšne virtualne resničnosti tega, kar bi lahko bilo tam zunaj. Malo je ugibanja. V zvezi s tem lahko razmišljate o možganih kot o nekakšnem verjetnostnem stroju. Lahko ga imenujete a Bayesov stroj, če želite. Uporablja neko predhodno hipotezo in jo ves čas poskuša testirati, da bi ugotovil, ali deluje.«

Laeng navaja primer naših oči, ki se prilagajajo na podlagi nič drugega kot vtisa sončne svetlobe: tudi ko to vidimo skozi oblačni pokrov ali krošnje listov nad glavo. Za vsak slučaj.

"Kar je pomembno pri evoluciji, ni, da je res [v tistem trenutku], ampak je verjetno," je nadaljeval. »Z zoženjem zenice se vaše telo že prilagaja na situacijo, ki se bo zelo verjetno zgodila v kratkem času. Kar se zgodi [če nenadoma posije sonce] je, da ste zaslepljeni. Zaslepljen pomeni začasno nezmožen. To ima ogromne posledice ne glede na to, ali ste plen ali plenilec. V določeni situaciji izgubiš delček sekunde in morda ne boš preživel.”

Tudi naši vidni sistemi ne morajo ugibati samo o svetlobi in temi. Pomislite na igro tenisa, kjer žogica potuje z veliko hitrostjo. Če bi svoje vedenje v celoti temeljili na tem, kar vizualni sistem sprejema v danem trenutku, bi zaostajali za realnostjo in ne bi vračali žogice. "Zmožni smo zaznati sedanjost, čeprav smo resnično obtičali v preteklosti," je dejal Laeng. »Edini način za to je napovedovanje prihodnosti. Sliši se nekoliko kot besedna igra, a na kratko je to vse.«

Strojni vid postaja boljši

prepoznavanje obraza
izusek/Getty Images

Torej, kaj ima to opraviti z računalniškim vidom? Potencialno vse. Da bi robot, na primer, lahko učinkovito deloval v resničnem svetu, mora biti sposoben izvajati tovrstne prilagoditve sproti. Računalniki imajo prednost, ko gre za njihovo sposobnost izvajanja izjemno hitrih izračunov. Česar nimajo, so milijoni let evolucije na njihovi strani.

V zadnjih letih je strojni vid vseeno naredil ogromen napredek. Prepoznajo lahko obraze ali hojo v video tokovih v realnem času – potencialno celo v ogromnih množicah ljudi. Podobna klasifikacija slik in tehnološka orodja lahko prepoznajo tudi prisotnost drugih predmetov, medtem ko Preboji v segmentaciji objektov omogočajo boljše razumevanje vsebine različnih prizorov. Pomemben napredek je bil dosežen tudi pri ekstrapolaciji 3D slik iz 2D prizorov, kar omogoča strojem, da "berejo" tridimenzionalne informacije, kot je globina, iz prizorov. S tem se sodobni računalniški vid približa človeškemu zaznavanju slike.

Vendar pa še vedno obstaja prepad med najboljšimi algoritmi strojnega vida in vrstami zmogljivosti, ki temeljijo na vidu, ki jih je velika večina ljudi sposobna izvajati že od mladosti. Čeprav ne moremo natančno artikulirati, kako izvajamo te naloge, ki temeljijo na viziji (če citiram madžarsko-britanskega polihistorja Michaela Polanyija, »lahko vemo, več, kot lahko rečemo«), smo kljub temu sposobni opraviti impresivno paleto nalog, ki nam omogočajo, da izkoristimo svoj vid na različne pametne načine.

Turingov test za strojni vid

Če raziskovalci in inženirji upajo ustvariti sisteme računalniškega vida, ki delujejo vsaj enako kot vizualni sposobnosti obdelave možganov Wetware, izdelava algoritmov, ki lahko razumejo optične iluzije, ni slab začetek točka. Vsaj lahko bi se izkazalo za dober način za merjenje, kako dobro sistemi strojnega vida delujejo na naše lastne možgane. Morda ni odgovor na mitično Umetna splošna inteligenca, vendar je morda ključ do odklepanja General Vision.

optična iluzija, ki zavede vaše možgane, da vidijo lažne barve
Verjeli ali ne, toda vse te krogle so enakega odtenka sive in vaši možgani si jih razlagajo kot različne barve na podlagi kontekstualnih znakov barvnih črt, ki se križajo čez njih.

»Če bi nekdo nekega dne razvil umetni vizualni sistem, ki zagreši enake iluzorne napake zaznavanja kar počnemo, bi na tej točki vedeli, da [dosegajo] dobro simulacijo delovanja naših možganov,« Laeng rekel. »To bi bil neke vrste Turingov test. Če imate umetno omrežje, ki ga prevarajo iluzije, kot smo mi, potem [bi bili] zelo blizu razumevanja osnovnega računanja samih možganov.«

Pesem Yi-Zhe, bralec računalniškega vida in strojnega učenja v Centru za vidno obdelavo govora in signalov na Univerzi Surrey v Združenem kraljestvu, se strinja s hipotezo. "Zahtevanje algoritmom vida, da razumejo optične iluzije kot splošno temo, je velike vrednosti za skupnost," je povedal za Digital Trends. »Presega trenutno osredotočenost skupnosti na zahtevanje od strojev, naj [prepoznajo], tako da še bolj pomika ovojnico [in] zahteva od strojev, naj razmišljajo. Ta pritisk [bi predstavljal] pomemben korak naprej k 'Splošni viziji', kjer se je treba prilagoditi subjektivnim interpretacijam vizualnih konceptov.«

Uporabi svojo iluzijo

Do danes je bilo v smeri tega cilja opravljenih nekaj omejenih raziskav - čeprav ostaja v relativno zgodnji fazi. Nasim Nematzadeh, raziskovalec, ki ima doktorat znanosti. na področju umetne inteligence in robotike – modeli nizkega vida, je ena oseba, ki ima objavljeno delo na to temo.

»Verjamemo, da nadaljnje raziskovanje vloge preprostih modelov, podobnih Gaussu, pri obdelavi mrežnice na nizki ravni in Gaussovem jedru v zgodnji fazi [globoko nevronski omrežij], in njegova napoved izgube zaznavne iluzije bo vodila do natančnejših tehnik in modelov računalniškega vida,« je Nematzadeh povedal za Digital Trends. "[To bi lahko] prispevalo k modelom višje ravni obdelave globine in gibanja ter posplošeno na računalniško razumevanje naravnih slik."

Premikajoči se negibni krogi (optična iluzija) !

Max Williams, raziskovalec AI, ki je pomagal sestaviti nabor podatkov o na tisoče slik optičnih iluzij za sisteme računalniškega vida najbolj jedrnato opiše razmerje med splošnim vidom in optičnimi iluzijami: »Iluzije obstajajo, ker naše oči in možgani izvajajo grdo in ad hoc proces za ekstrahiranje vizualnega prizora iz sicer nerazumljivega svetlobnega polja, ki ga ustvari fizični svet, od katerega smo skoraj popolnoma zaprti,« so povedali za Digital Trendi. "Mislim, da vizualnega sistema ni mogoče narediti dovolj izrazitega, da bi ga lahko imeli za "zaznavo", ki je tudi brez iluzij."

Doseganje splošne vizije

Če želimo biti jasni, doseganje splošnega vida na ravni človeka (ali boljšega) za umetno inteligenco ne bo zgolj njihovo usposabljanje za prepoznavanje standardnih optičnih iluzij. Nobena hiperspecifična zmožnost, na primer dekodiranja iluzij Magic Eye z 99,9-odstotno natančnostjo v 0,001 sekunde, ne bo nadomestila milijonov let človeške evolucije.

(Zanimivo je, da ima strojni vid že svojo lastno različico optičnih iluzij v obliki kontradiktornih modelov, zaradi katerih se lahko zmotijo ​​– kot v eni zaskrbljujoči ilustraciji – 3D-natisnjena igrača želva za puško. Vendar te ne prinašajo enakih evolucijskih koristi kot optične iluzije, ki delujejo na ljudeh.)

Kljub temu bi lahko bilo zelo koristno raziskovanje doseči, da bi stroji razumeli človeške optične iluzije in se nanje odzvali tako kot mi.

In nekaj je gotovo: Ko General Vision AI je dosežen, bo nasedel enakim vrstam optičnih iluzij kot mi. Vsaj v primeru Illusory Expanding Hole nas je 86 %.

Priporočila urednikov

  • Wix uporablja ChatGPT, da vam pomaga hitro zgraditi celotno spletno mesto
  • OpenAI ustvarja novo ekipo, ki bo preprečila, da bi superinteligentni AI postal lopov
  • Te genialne ideje bi lahko pomagale narediti AI malo manj zlo
  • Zdi se, da bi Googlovo orodje za zaznavanje slik z umetno inteligenco lahko delovalo
  • Umetna inteligenca bi lahko nadomestila približno 7800 delovnih mest v IBM-u kot del premora pri zaposlovanju