Az optikai illúziók segíthetnek az AI új generációjának felépítésében

Megnéz egy fekete kör képét egy kör alakú pontok rácsán. Egy darab fehér hálóanyagba beleégetett lyukra hasonlít, bár valójában lapos, álló kép a képernyőn vagy papírdarabon. De az agyad ezt így nem fogja fel. Mint valami alacsony szintű hallucinációs élmény, az elméd kiakad; úgy érzékeli a statikus képet, mint egy fekete alagút száját, amely feléd halad.

Tartalom

  • Evolúciós él
  • A gépi látás egyre jobb
  • A gépi látás Turing-tesztje
  • Használd az illúziód
  • Az általános jövőkép elérése

A hatás valódiságára reagálva a test öntudatlanul reagálni kezd: a szem pupillái kitágulnak, több fényt, éppen úgy, ahogy igazodnának, ha sötétségbe merülnének, hogy a lehető legjobbat biztosítsák látomás.

A fekete lyuk optikai csalódása

A kérdéses hatást az hozta létre Akiyoshi Kitaoka, a japán Kobe-i Ritsumeikan Egyetem pszichológusa. Ez egyike annak a tucatnyi optikai csalódásnak, amelyeket hosszú karrierje során teremtett. („Mindegyik tetszik” – válaszolta a Digital Trend kérdésére, hogy van-e kedvence.)

Ajánlott videók

Ez az új illúzió a közelmúltban megjelent kutatás tárgya volt

a Frontiers in Human Neuroscience folyóiratban. Míg a cikk fókuszában határozottan az új hatásra adott emberi fiziológiai válaszok állnak (amiről kiderült, hogy mintegy 86 százalékunk meg fog tapasztalni), az átfogó téma a gépi intelligencia jövőjét illetően is nagyon fontos lehet – ahogy az egyik kutató szívesen elmagyarázta a Digitalnak. Trendek.

Evolúciós él

Fraser spirálként ismert optikai csalódás
Első pillantásra úgy tűnhet, mintha ez a kép egy spirált mutatna, amely a közepe felé kanyarog. De próbáld meg követni az egyik vonalat, amint az látszólag befelé görbül, és rájössz, hogy ez egyáltalán nem spirál.

Valami nincs rendben az agyaddal. Legalábbis ez egy könnyen levonható következtetés abból a módból, ahogyan az emberi agy érzékeli az optikai csalódásokat. Mi más magyarázata van egy kétdimenziós, statikus képnek, amelyet az agy teljesen másként érzékel? A mainstream pszichológia sokáig pontosan ezt gondolta.

„Kezdetben az emberek azt gondolták: „Rendben, az agyunk nem tökéletes… nem mindig igaz.” Ez kudarc, igaz? mondott Bruno Laeng, az Oslói Egyetem Pszichológiai Tanszékének professzora és a fent említett tanulmány első szerzője. "Az illúziók abban az esetben érdekesek voltak, mert felfednék a gépezet valamiféle tökéletlenségét."

Az agy nem tudja megtudni, mi van [valójában] odakint.”

A pszichológusok már nem így tekintenek rájuk. Ha valami, az ehhez hasonló kutatások rávilágítanak arra, hogy a vizuális rendszer nem csupán egy egyszerű kamera. Az „illuzórikus táguló lyuk” optikai csalódás egyértelművé teszi, hogy a szem az észlelt, sőt elképzelt fényhez és sötétséghez alkalmazkodik, nem pedig a fizikai energiához.

A leglényegesebben azt mutatja be, hogy nem csak bután rögzítjük a világot vizuális rendszereinkkel, hanem ehelyett folytasson tudományos kísérleteket annak érdekében, hogy enyhe evolúciót nyerjen előny. A cél az, hogy elemezzük az elénk tárt adatokat, és megpróbáljuk megelőzően kezelni a problémákat, mielőtt azok problémákká válnának.

"Az agynak nincs módja annak, hogy tudja, mi van [valójában] odakint" - mondta Laeng. „Amit csinál, egyfajta virtuális valóságot épít fel abból, ami odakint lehet. Van egy kis találgatás. Ebből a szempontból az agyat egyfajta valószínűségi gépnek tekintheti. Nevezheted a bayesi gépet ha akarsz. Valamilyen előzetes hipotézist használ, és folyamatosan próbálja tesztelni, hogy kiderüljön, működik-e."

Laeng azt a példát hozza fel, hogy a szemünk nem más, mint a napfény benyomása alapján hajt végre beállítást: még akkor is, ha ezt a felhőtakarón vagy a felső lombkoronán keresztül látjuk. Csak abban az esetben.

„Az evolúcióban nem az a fontos, hogy igaz [abban a pillanatban], hanem az, hogy valószínű” – folytatta. „A pupilla összehúzásával a szervezet már alkalmazkodik egy olyan helyzethez, amely nagyon valószínű, hogy rövid időn belül megtörténik. Az történik [ha hirtelen kisüt a nap], hogy elkápráztatsz. A vakított azt jelenti, hogy átmenetileg cselekvőképtelen. Ennek óriási következményei vannak, akár préda, akár ragadozó. Egy adott helyzetben elveszíted a másodperc töredékét, és előfordulhat, hogy nem éled túl."

Nem csak a fény és a sötétség az, ahol vizuális rendszereinknek is találgatniuk kell. Gondoljon egy teniszjátékra, ahol a labda nagy sebességgel mozog. Ha teljes mértékben arra alapoznánk viselkedésünket, amit a vizuális rendszer egy adott pillanatban fogad, lemaradnánk a valóságtól, és nem tudnánk visszatenni a labdát. „Képesek vagyunk érzékelni a jelent, bár valóban a múltban ragadtunk” – mondta Laeng. „Az egyetlen módja annak, hogy megjósoljuk a jövőt. Kicsit szójátéknak hangzik, de dióhéjban ennyi.”

A gépi látás egyre jobb

arcfelismerő
izusek/Getty Images

Tehát mi köze ennek a számítógépes látáshoz? Potenciálisan mindent. Ahhoz, hogy például egy robot hatékonyan tudjon működni a való világban, képesnek kell lennie arra, hogy az ilyen jellegű beállításokat menet közben végezze el. A számítógépek előnyt jelentenek, ha rendkívül gyors számításokat hajtanak végre. Amivel nem rendelkeznek, az több millió éves evolúció az ő oldalukon.

Az elmúlt években a gépi látás ennek ellenére óriási előrelépést tett. Valós idejű videofolyamokban azonosítani tudják az arcokat vagy a járásmódot – potenciálisan még hatalmas tömegben is. A hasonló képosztályozási és technológiai eszközök más objektumok jelenlétét is felismerik, miközben Az objektumszegmentálás áttörései lehetővé teszik a különböző tartalmak jobb megértését jelenetek. Jelentős előrelépés történt a 3D-s képek 2D-s jelenetekből való extrapolálása terén is, amely lehetővé teszi a gépek számára, hogy háromdimenziós információkat, például mélységet „olvasjanak” a jelenetekből. Ez közelebb viszi a modern számítógépes látást az emberi képészleléshez.

Mindazonáltal még mindig szakadék tátong a legjobb gépi látási algoritmusok és azon látásalapú képességek között, amelyeket az emberek túlnyomó többsége már fiatal korától képes megvalósítani. Bár nem tudjuk pontosan megfogalmazni, hogyan hajtjuk végre ezeket a látáson alapuló feladatokat (hogy Michael Polányi magyar-brit polihisztort idézzem, „tudhatjuk többet, mint amennyit el tudunk mondani”), mindazonáltal számos olyan feladatot vagyunk képesek végrehajtani, amelyek lehetővé teszik számunkra, hogy látásunkat különféle okos eszközökkel hasznosítsuk. módokon.

A gépi látás Turing-tesztje

Ha a kutatók és mérnökök olyan számítógépes látórendszerek létrehozását remélik, amelyek legalább egyenrangúak a vizuálisval A wetware agy feldolgozó készségei, az optikai csalódásokat megértő algoritmusok felépítése nem rossz kezdet pont. Legalább jó módszernek bizonyulhat annak mérésére, hogy a gépi látórendszerek milyen jól működnek a saját agyunkban. Lehet, hogy nem ez a válasz a mitikusra Mesterséges általános intelligencia, de ez lehet a kulcs a General Vision feloldásához.

egy optikai csalódás, amely ráveszi az agyát, hogy hamis színeket lásson
Akár hiszed, akár nem, de ezek a golyók ugyanolyan szürke árnyalatúak, és az agyad úgy értelmezi őket, hogy különböző színűek a rajtuk keresztező színes vonalak kontextuális jelzései alapján.

"Ha valaki egy napon kifejlesztene egy mesterséges vizuális rendszert, amely ugyanazokat az illuzórikus észlelési hibákat követi el Ha ezt tesszük, akkor ezen a ponton tudnád, hogy jól szimulálják agyunk működését.” Laeng mondott. „Ez egyfajta Turing-teszt lenne. Ha van egy mesterséges hálózatunk, amelyet az illúzió bolondít meg, mint mi, akkor nagyon közel járunk ahhoz, hogy megértsük magának az agynak a mögöttes számításait.”

Yi-Zhe Song, a Computer Vision and Machine Learning olvasója az Egyesült Királyság Surrey-i Egyetem Vision Speech and Signal Processing Központjában, egyetért a hipotézissel. „Nagy értéket jelent a közösség számára, ha látási algoritmusokat kérünk az optikai illúziók megértésére, mint általános témát” – mondta a Digital Trendsnek. „Ez túlmutat azon a jelenlegi közösségi fókuszon, amely szerint a gépeket [felismerésre] kell kérni, tovább tolja a borítékot [és] arra kéri a gépeket, hogy érveljenek. Ez a lökés jelentős előrelépést jelentene az „általános jövőkép” felé, ahol a vizuális fogalmak szubjektív értelmezéseihez alkalmazkodni kell.”

Használd az illúziód

A mai napig korlátozott kutatások folytak e cél érdekében – bár ez még viszonylag korai szakaszban van. Nasim Nematzadeh, egy Ph.D. fokozattal rendelkező kutató. a mesterséges intelligencia és a robotika – Alacsony szintű látásmodellek esetében egy személy, aki rendelkezik publikált munkája ebben a témában.

„Úgy gondoljuk, hogy az egyszerű Gauss-szerű modellek szerepének további feltárása az alacsony szintű retina feldolgozásban és a Gauss-kernel korai stádiumában [mély neurális hálózatok], és az észlelési illúzió elvesztésének előrejelzése pontosabb számítógépes látási technikákhoz és modellekhez vezet” – mondta Nematzadeh a Digital Trendsnek. "[Ez] hozzájárulhat a mélység- és mozgásfeldolgozás magasabb szintű modelljéhez, valamint a természetes képek számítógépes megértéséhez."

Mozdulatlan körök mozgatása (optikai csalódás) !

Max Williams, egy mesterséges intelligencia-kutató, aki segített összeállítani egy adatkészletet több ezer optikai csalódás képét a számítógépes látórendszerek esetében a legtömörebben fogalmazza meg az általános látás és az optikai illúziók közötti kapcsolatot: „Az illúziók azért léteznek, mert szemünk és agyunk zűrzavaros és ad-hoc folyamat, amellyel vizuális jelenetet vonhatunk ki egy egyébként felfoghatatlan fénymezőből, amelyet egy olyan fizikai világ hozott létre, amelytől szinte teljesen el vagyunk zárva” – nyilatkozták a Digitalnak. Trendek. „Nem hiszem, hogy lehetséges egy vizuális rendszert elég kifejezővé tenni ahhoz, hogy az illúzióktól is mentes „észlelésnek” lehessen tekinteni.

Az általános jövőkép elérése

Az egyértelműség kedvéért, az emberi szintű (vagy jobb) General Vision for AI elérése nem csupán arra tanítja őket, hogy felismerjék a szabványos optikai csalódásokat. Semmiféle hiperspecifikus képesség, amely mondjuk a Magic Eye illúzióit 99,9%-os pontossággal, 0,001 másodperc alatt dekódolja, nem fogja helyettesíteni az emberi evolúció több millió évét.

(Érdekes módon a gépi látásnak már megvan a saját változata az optikai illúzióknak ellenséges modellek formájában, ami tévedést okozhat – mint az egyik riasztó illusztráción –, 3D-nyomtatott játékteknős puskához. Ezek azonban nem hoznak ugyanolyan evolúciós előnyöket, mint az embereken működő optikai csalódások.)

Mindazonáltal nagyon hasznos kutatás lehet, ha a gépek megértik az emberi optikai csalódásokat, és úgy reagálnak rájuk, ahogy mi tesszük.

És egy dolog biztos: Amikor a General Vision AI van elérjük, ugyanazokra az optikai csalódásokra fog esni, mint mi. Legalábbis az Illuzórikus Táguló Lyuk esetében 86%-unk.

Szerkesztői ajánlások

  • A Wix a ChatGPT segítségével segít egy teljes webhely gyors felépítésében
  • Az OpenAI új csapatot épít, hogy megakadályozza a szuperintelligens mesterséges intelligencia szélhámosságát
  • Ezek a zseniális ötletek segíthetnek abban, hogy az AI egy kicsit kevésbé legyen gonosz
  • A Google mesterséges intelligencia képérzékelő eszköze úgy érzi, működhet
  • A mesterséges intelligencia mintegy 7800 álláshelyet cserélhet le az IBM-nél a munkaerő-felvételi szünet részeként