ऑप्टिकल भ्रम हमें एआई की नई पीढ़ी बनाने में मदद कर सकता है

आप वृत्ताकार बिंदुओं की ग्रिड पर एक काले वृत्त की छवि को देखते हैं। यह सफेद जाली सामग्री के टुकड़े में जलाए गए छेद जैसा दिखता है, हालांकि यह वास्तव में एक स्क्रीन या कागज के टुकड़े पर एक सपाट, स्थिर छवि है। लेकिन आपका मस्तिष्क इसे उस तरह नहीं समझता है। किसी निम्न-स्तरीय मतिभ्रम अनुभव की तरह, आपका दिमाग भटक जाता है; स्थिर छवि को एक काली सुरंग के मुँह के रूप में समझना जो आपकी ओर बढ़ रही है।

अंतर्वस्तु

  • एक विकासवादी बढ़त
  • मशीन की दृष्टि बेहतर हो रही है
  • मशीन दृष्टि के लिए एक ट्यूरिंग टेस्ट
  • भ्रम का प्रयोग करे
  • सामान्य दृष्टिकोण प्राप्त करना

प्रभाव की सत्यता पर प्रतिक्रिया करते हुए, शरीर अनजाने में प्रतिक्रिया करना शुरू कर देता है: आंख की पुतलियाँ फैलने लगती हैं अधिक रोशनी, ठीक वैसे ही जैसे यदि आप अंधेरे में डूबने वाले हों तो सर्वोत्तम संभव सुनिश्चित करने के लिए वे समायोजित हो जाएंगे दृष्टि।

ब्लैक होल ऑप्टिकल भ्रम

प्रश्न में प्रभाव किसके द्वारा निर्मित किया गया था? अकीयोशी किताओका, जापान के कोबे में रित्सुमीकन विश्वविद्यालय में एक मनोवैज्ञानिक। यह उन दर्जनों ऑप्टिकल भ्रमों में से एक है जो उन्होंने अपने लंबे करियर में बनाए हैं। ("मुझे वे सभी पसंद हैं," उन्होंने डिजिटल ट्रेंड के इस सवाल का जवाब देते हुए कहा कि क्या उनका कोई पसंदीदा है।)

अनुशंसित वीडियो

यह नया भ्रम हाल ही में प्रकाशित एक शोध का विषय था फ्रंटियर्स इन ह्यूमन न्यूरोसाइंस जर्नल में. जबकि पेपर का ध्यान दृढ़ता से उपन्यास प्रभाव के लिए मानव शारीरिक प्रतिक्रियाओं पर है (जिससे पता चलता है कि हममें से लगभग 86 प्रतिशत लोग अनुभव करेंगे), जब मशीन इंटेलिजेंस के भविष्य की बात आती है तो समग्र विषय की बहुत अधिक प्रासंगिकता हो सकती है - जैसा कि शोधकर्ताओं में से एक डिजिटल को समझाने के लिए उत्सुक था रुझान.

एक विकासवादी बढ़त

एक ऑप्टिकल भ्रम जिसे फ़्रेज़र सर्पिल के नाम से जाना जाता है
पहली नज़र में, ऐसा प्रतीत हो सकता है मानो यह छवि एक सर्पिल दिखाती है जो केंद्र की ओर घूमती है। लेकिन किसी एक पंक्ति का अनुसरण करने का प्रयास करें क्योंकि यह अंदर की ओर मुड़ती हुई प्रतीत होती है, और आपको एहसास होगा कि यह बिल्कुल भी सर्पिल नहीं है।

आपके दिमाग में कुछ गड़बड़ है. कम से कम, जिस तरह से मानव मस्तिष्क ऑप्टिकल भ्रम को समझता है, उससे यह निष्कर्ष निकालना आसान है। एक द्वि-आयामी, स्थिर छवि के लिए और क्या स्पष्टीकरण है जिसे मस्तिष्क पूरी तरह से कुछ अलग मानता है? लंबे समय तक, मुख्यधारा के मनोविज्ञान ने बिल्कुल यही अनुमान लगाया।

"शुरुआत में लोगों ने सोचा, 'ठीक है, हमारा दिमाग सही नहीं है... यह हमेशा सही नहीं होता।' यह विफलता है, है ना?" कहा ब्रूनो लाएंग, ओस्लो विश्वविद्यालय के मनोविज्ञान विभाग में प्रोफेसर और उपरोक्त अध्ययन के पहले लेखक। "उस मामले में भ्रम दिलचस्प थे क्योंकि वे मशीनरी में किसी प्रकार की अपूर्णता को प्रकट करेंगे।"

मस्तिष्क के पास यह जानने का कोई तरीका नहीं है कि वहां क्या है [वास्तव में]।"

मनोवैज्ञानिक अब उन्हें उस तरह से नहीं देखते हैं। कुछ भी हो, इस तरह के शोध इस बात पर प्रकाश डालते हैं कि कैसे दृश्य प्रणाली सिर्फ एक सीधा कैमरा नहीं है। "भ्रमपूर्ण विस्तार छेद" ऑप्टिकल भ्रम यह स्पष्ट करता है कि आंख भौतिक ऊर्जा के बजाय कथित, यहां तक ​​कि कल्पना की गई, प्रकाश और अंधेरे को समायोजित करती है।

सबसे महत्वपूर्ण बात यह है कि यह दर्शाता है कि हम न केवल अपने दृश्य प्रणालियों के साथ दुनिया को चुपचाप रिकॉर्ड करते हैं, बल्कि इसके बजाय थोड़ा सा विकासवादी लाभ प्राप्त करने के लिए वैज्ञानिक प्रयोगों का एक निरंतर सेट निष्पादित करें फ़ायदा। लक्ष्य हमारे सामने प्रस्तुत आंकड़ों का विश्लेषण करना और समस्याओं के समस्या बनने से पहले ही उनसे निपटने का प्रयास करना है।

लाेंग ने कहा, "मस्तिष्क के पास यह जानने का कोई तरीका नहीं है कि वास्तव में क्या है।" “यह जो कर रहा है वह एक प्रकार की आभासी वास्तविकता का निर्माण कर रहा है जो वहां हो सकता है। इसमें थोड़ा सा अनुमान है। इस संबंध में, आप मस्तिष्क को एक प्रकार की संभाव्य मशीन के रूप में सोच सकते हैं। आप इसे ए कह सकते हैं बायेसियन यदि आप चाहें तो मशीन. यह कुछ पूर्व परिकल्पनाओं का उपयोग कर रहा है और यह देखने के लिए हर समय इसका परीक्षण करने की कोशिश कर रहा है कि क्या यह काम करता है।

लाएंग उदाहरण देता है कि हमारी आंखें सूर्य से प्रकाश की छाप के अलावा और कुछ नहीं के आधार पर समायोजन करती हैं: तब भी जब इसे बादलों के आवरण या पत्तियों की ऊपरी छतरी के माध्यम से देखा जाता है। शायद ज़रुरत पड़े।

"विकास में जो बात मायने रखती है वह यह नहीं है कि यह सच है [उस पल में], बल्कि यह संभावित है," उन्होंने आगे कहा। “पुतली को संकुचित करके, आपका शरीर पहले से ही उस स्थिति में समायोजित हो रहा है जो थोड़े समय में होने की संभावना है। क्या होता है [यदि सूरज अचानक निकल आता है] तो आप चकित हो जाते हैं। चकाचौंध का अर्थ है अस्थायी रूप से अक्षम होना। चाहे आप शिकार हों या शिकारी, इसके बहुत बड़े परिणाम होंगे। आप किसी विशेष स्थिति में एक सेकंड का एक अंश खो देते हैं और आप जीवित नहीं रह सकते।

यह केवल प्रकाश और अंधकार नहीं है जहां हमारे दृश्य तंत्र को अनुमान लगाने की आवश्यकता होती है। टेनिस के एक खेल के बारे में सोचें, जहाँ गेंद तेज़ गति से यात्रा कर रही है। यदि हम अपने व्यवहार को पूरी तरह से इस बात पर आधारित करते हैं कि किसी भी समय दृश्य प्रणाली क्या प्राप्त कर रही है, तो हम वास्तविकता से पीछे रह जाएंगे और गेंद को वापस करने में विफल रहेंगे। लाएंग ने कहा, "हम वर्तमान को समझने में सक्षम हैं, हालांकि हम वास्तव में अतीत में फंसे हुए हैं।" “ऐसा करने का एकमात्र तरीका भविष्य की भविष्यवाणी करना है। यह कुछ-कुछ शब्दों के खेल जैसा लगता है, लेकिन संक्षेप में यही है।''

मशीन की दृष्टि बेहतर हो रही है

चेहरे की पहचान
इज़ुसेक/गेटी इमेजेज़

तो इसका कंप्यूटर विज़न से क्या लेना-देना है? संभावित रूप से सब कुछ. उदाहरण के लिए, किसी रोबोट को वास्तविक दुनिया में प्रभावी ढंग से कार्य करने में सक्षम होने के लिए उसे तुरंत इस प्रकार के समायोजन करने में सक्षम होना चाहिए। जब अत्यधिक तेज़ गणना करने की क्षमता की बात आती है तो कंप्यूटर को एक फायदा होता है। उनके पास लाखों वर्षों का विकास नहीं है।

हाल के वर्षों में, मशीन विज़न ने फिर भी भारी प्रगति की है। वे वास्तविक समय की वीडियो स्ट्रीम में चेहरे या चाल-ढाल की पहचान कर सकते हैं - संभवतः लोगों की विशाल भीड़ में भी। इसी तरह की छवि वर्गीकरण और तकनीकी उपकरण अन्य वस्तुओं की उपस्थिति को भी पहचान सकते हैं वस्तु विभाजन की सफलताओं से विभिन्न की सामग्री को बेहतर ढंग से समझना संभव हो जाता है दृश्य. जब 2डी दृश्यों से 3डी छवियों को निकालने की बात आती है, तो मशीनों को दृश्यों से गहराई जैसी त्रि-आयामी जानकारी को "पढ़ने" की अनुमति देने में भी महत्वपूर्ण प्रगति हुई है। यह आधुनिक कंप्यूटर दृष्टि को मानव छवि धारणा के करीब ले जाता है।

हालाँकि, सर्वोत्तम मशीन विज़न एल्गोरिदम और दृष्टि-आधारित क्षमताओं के बीच अभी भी एक अंतर मौजूद है, जिसे अधिकांश मनुष्य कम उम्र से ही पूरा करने में सक्षम हैं। हालाँकि हम ठीक से स्पष्ट नहीं कर सकते कि हम इन दृष्टि-आधारित कार्यों को कैसे करते हैं (हंगेरियन-ब्रिटिश पॉलिमथ माइकल पोलैनी को उद्धृत करने के लिए, "हम जान सकते हैं जितना हम बता सकते हैं उससे अधिक"), हम फिर भी प्रभावशाली कार्यों को करने में सक्षम हैं जो हमें अपनी दृष्टि को विभिन्न प्रकार की स्मार्ट क्षमताओं का उपयोग करने की अनुमति देते हैं। तौर तरीकों।

मशीन दृष्टि के लिए एक ट्यूरिंग टेस्ट

यदि शोधकर्ता और इंजीनियर ऐसे कंप्यूटर विज़न सिस्टम बनाने की उम्मीद करते हैं जो कम से कम दृश्य के बराबर काम करते हों वेटवेयर मस्तिष्क के प्रसंस्करण कौशल, एल्गोरिदम का निर्माण जो ऑप्टिकल भ्रम को समझ सकता है, एक बुरी शुरुआत नहीं है बिंदु। कम से कम, यह मापने का एक अच्छा तरीका साबित हो सकता है कि मशीन विज़न सिस्टम हमारे मस्तिष्क पर कितनी अच्छी तरह काम करते हैं। हो सकता है कि यह पौराणिक कथा का उत्तर न हो कृत्रिम सामान्य बुद्धि, लेकिन यह जनरल विज़न को अनलॉक करने की कुंजी हो सकती है।

एक ऑप्टिकल भ्रम जो आपके मस्तिष्क को झूठे रंग देखने के लिए प्रेरित करता है
मानो या न मानो, लेकिन ये सभी गेंदें भूरे रंग की एक ही छाया हैं, और आपका मस्तिष्क उन्हें पार करने वाली रंगीन रेखाओं के प्रासंगिक संकेतों के आधार पर अलग-अलग रंगों के रूप में व्याख्या करता है।

“यदि कोई व्यक्ति, एक दिन, एक कृत्रिम दृश्य प्रणाली विकसित करेगा जो समान भ्रामक धारणा त्रुटियां करता है हम ऐसा करते हैं, इस बिंदु पर आपको पता चल जाएगा कि वे हमारा मस्तिष्क कैसे काम करता है इसका एक अच्छा अनुकरण [प्राप्त] कर रहे हैं,'' लाएंग कहा। “यह एक प्रकार का ट्यूरिंग टेस्ट होगा। यदि आपके पास एक कृत्रिम नेटवर्क है जो हमारी तरह भ्रम से मूर्ख बनाया गया है, तो हम मस्तिष्क की अंतर्निहित गणना को समझने के बहुत करीब होंगे।

यी-ज़े गानायूके के सरे विश्वविद्यालय में सेंटर फॉर विज़न स्पीच एंड सिग्नल प्रोसेसिंग में कंप्यूटर विज़न और मशीन लर्निंग के पाठक, परिकल्पना से सहमत हैं। उन्होंने डिजिटल ट्रेंड्स को बताया, "एक सामान्य विषय के रूप में ऑप्टिकल भ्रम को समझने के लिए दृष्टि एल्गोरिदम से पूछना समुदाय के लिए बहुत महत्वपूर्ण है।" “यह मशीनों को [पहचानने] के लिए कहने के मौजूदा सामुदायिक फोकस से आगे निकल जाता है, लिफाफे को और आगे बढ़ाकर [और] मशीनों से तर्क करने के लिए कहता है। यह धक्का 'सामान्य दृष्टि' की दिशा में एक महत्वपूर्ण कदम होगा, जहां दृश्य अवधारणाओं की व्यक्तिपरक व्याख्याओं को समायोजित करने की आवश्यकता है।

भ्रम का प्रयोग करे

आज तक, इस लक्ष्य की दिशा में कुछ सीमित शोध हुए हैं - हालाँकि यह अपेक्षाकृत प्रारंभिक चरण में है। नसीम नेमतज़ादेह, एक शोधकर्ता जो पीएच.डी. आर्टिफिशियल इंटेलिजेंस और रोबोटिक्स-निम्न-स्तरीय दृष्टि मॉडल में, एक ऐसा व्यक्ति है जिसके पास है इस विषय पर प्रकाशित कार्य.

"हमारा मानना ​​है कि प्रारंभिक चरण में निम्न-स्तरीय रेटिना प्रसंस्करण और गॉसियन कर्नेल में सरल गॉसियन-जैसे मॉडल की भूमिका की और खोज की जाएगी [डीप न्यूरल] नेटवर्क], और अवधारणात्मक भ्रम के नुकसान की इसकी भविष्यवाणी, अधिक सटीक कंप्यूटर विज़न तकनीकों और मॉडलों को जन्म देगी,'' नेमात्ज़ादेह ने डिजिटल ट्रेंड्स को बताया। "[यह] गहराई और गति प्रसंस्करण के उच्च स्तरीय मॉडल में योगदान दे सकता है और प्राकृतिक छवियों की कंप्यूटर समझ को सामान्यीकृत कर सकता है।"

गतिहीन वृत्त घूमना (ऑप्टिकल इल्यूजन) !

मैक्स विलियम्स, एक एआई शोधकर्ता जिन्होंने डेटासेट संकलित करने में मदद की हजारों ऑप्टिकल भ्रम छवियां कंप्यूटर विज़न सिस्टम के लिए, सामान्य दृष्टि और ऑप्टिकल भ्रम के बीच संबंध को सबसे संक्षेप में प्रस्तुत करता है: "भ्रम मौजूद हैं क्योंकि हमारी आंखें और दिमाग गड़बड़ कर रहे हैं और उन्होंने डिजिटल को बताया, एक अन्यथा समझ से बाहर होने वाले प्रकाश क्षेत्र से एक दृश्य दृश्य निकालने की तदर्थ प्रक्रिया, जो एक भौतिक दुनिया द्वारा बनाई गई है जिससे हम लगभग पूरी तरह से अलग हैं। रुझान. "मुझे नहीं लगता कि किसी दृश्य प्रणाली को इतना अभिव्यंजक बनाना संभव है कि उसे 'धारणा' माना जाए जो भ्रम से भी मुक्त हो।"

सामान्य दृष्टिकोण प्राप्त करना

स्पष्ट होने के लिए, एआई के लिए मानव-स्तर (या बेहतर) सामान्य दृष्टि प्राप्त करना केवल उन्हें मानक ऑप्टिकल भ्रम को पहचानने के लिए प्रशिक्षित करना नहीं है। 0.001 सेकंड में 99.9% सटीकता के साथ मैजिक आई भ्रम को डिकोड करने की कोई अति-विशिष्ट क्षमता लाखों वर्षों के मानव विकास का विकल्प नहीं बन सकती है।

(दिलचस्प बात यह है कि मशीन विज़न के पास पहले से ही प्रतिकूल मॉडल के रूप में ऑप्टिकल भ्रम का अपना संस्करण है, जो उनसे गलती कर सकता है - जैसा कि एक खतरनाक चित्रण में है - ए राइफल के लिए 3डी-मुद्रित खिलौना कछुआ. हालाँकि, ये ऑप्टिकल भ्रम के समान विकासवादी लाभ नहीं देते हैं जो मनुष्यों पर काम करते हैं।)

फिर भी, मानवीय ऑप्टिकल भ्रमों को समझने और हमारी तरह उन पर प्रतिक्रिया देने के लिए मशीनें प्राप्त करना बहुत उपयोगी शोध हो सकता है।

और एक बात निश्चित है: जब जनरल विजन ए.आई है हासिल कर लिया, यह उसी प्रकार के ऑप्टिकल भ्रम में फंस जाएगा जैसा हम करते हैं। कम से कम, भ्रामक विस्तार छिद्र के मामले में, हममें से 86%।

संपादकों की सिफ़ारिशें

  • Wix आपको शीघ्रता से संपूर्ण वेबसाइट बनाने में मदद करने के लिए ChatGPT का उपयोग करता है
  • सुपरइंटेलिजेंट एआई को खराब होने से रोकने के लिए ओपनएआई नई टीम बना रहा है
  • ये सरल विचार एआई को थोड़ा कम बुरा बनाने में मदद कर सकते हैं
  • ऐसा लगता है कि Google का AI इमेज-डिटेक्शन टूल काम कर सकता है
  • नियुक्ति पर रोक के तहत एआई आईबीएम में लगभग 7,800 नौकरियों की जगह ले सकता है

श्रेणियाँ

हाल का

5 सबसे शक्तिशाली सुपरमैन खलनायकों की रैंकिंग

5 सबसे शक्तिशाली सुपरमैन खलनायकों की रैंकिंग

क्योंकि वह मूलतः पहला सुपरहीरो था, अतिमानव इसका...

फैंटम का मुखौटा अभी भी सर्वश्रेष्ठ बैटमैन अनुकूलन है

फैंटम का मुखौटा अभी भी सर्वश्रेष्ठ बैटमैन अनुकूलन है

मैट रीव्स' बैटमेन अंततः लाइव-एक्शन थिएटर स्पेस ...

जून 2023 यूबीसॉफ्ट फॉरवर्ड में सब कुछ घोषित किया गया

जून 2023 यूबीसॉफ्ट फॉरवर्ड में सब कुछ घोषित किया गया

इस साल के समर गेम फेस्ट लाइव स्ट्रीम की धमाकेदा...