वैज्ञानिक रोबोटों को लुका-छिपी खेलना क्यों सिखा रहे हैं?

कृत्रिम सामान्य बुद्धि, एक बुद्धिमान ए.आई. का विचार। वह एजेंट जो मनुष्य द्वारा किए जा सकने वाले किसी भी बौद्धिक कार्य को समझने और सीखने में सक्षम है, लंबे समय से विज्ञान कथा का एक घटक रहा है। जैसा कि ए.आई. और अधिक स्मार्ट हो जाता है - विशेष रूप से मशीन लर्निंग टूल्स में सफलताओं के साथ जो उन्हें फिर से लिखने में सक्षम हैं नए अनुभवों से सीखने के लिए कोड - यह तेजी से व्यापक रूप से वास्तविक कृत्रिम बुद्धिमत्ता वार्तालाप का एक हिस्सा बन गया है कुंआ।

अंतर्वस्तु

  • दुनिया का निर्माण
  • खेल के नियम
  • कठिन चीज़ आसान है, आसान चीज़ कठिन है

लेकिन एजीआई आने पर हम उसे कैसे मापेंगे? पिछले कुछ वर्षों में, शोधकर्ताओं ने कई संभावनाएँ प्रस्तुत की हैं। सबसे प्रसिद्ध ट्यूरिंग टेस्ट है, जिसमें एक मानव न्यायाधीश मानव और एक मशीन दोनों के साथ, बिना देखे, बातचीत करता है, और उसे कोशिश करनी होती है और अनुमान लगाना होता है कि कौन सा है। दो अन्य, बेन गोएर्टज़ेल का रोबोट कॉलेज स्टूडेंट टेस्ट और निल्स जे। निल्सन का रोजगार परीक्षण, यह देखकर कि क्या यह कॉलेज की डिग्री हासिल कर सकता है या कार्यस्थल पर नौकरियां कर सकता है, एआई की क्षमताओं का व्यावहारिक रूप से परीक्षण करना चाहता है। एक और, जिस पर मुझे व्यक्तिगत रूप से छूट देनी चाहिए, यह मानता है कि बुद्धिमत्ता को बिना किसी समस्या के आइकिया शैली के फ्लैटपैक फर्नीचर को इकट्ठा करने की सफल क्षमता से मापा जा सकता है।

अनुशंसित वीडियो

सबसे दिलचस्प एजीआई उपायों में से एक एप्पल के सह-संस्थापक स्टीव वोज्नियाक द्वारा सामने रखा गया था। वोज़, जैसा कि उनके मित्र और प्रशंसक जानते हैं, कॉफ़ी टेस्ट का सुझाव देते हैं। उन्होंने कहा, एक सामान्य बुद्धिमत्ता का मतलब एक ऐसा रोबोट होगा जो दुनिया के किसी भी घर में जा सकता है, रसोई का पता लगा सकता है, एक ताज़ा कप कॉफी बना सकता है और फिर उसे एक मग में डाल सकता है।

संबंधित

  • एनालॉग ए.आई.? यह पागलपन जैसा लगता है, लेकिन यह भविष्य हो सकता है
  • यहाँ एक प्रवृत्ति-विश्लेषण करने वाला ए.आई. है। सोचता है कि टेक में अगली बड़ी चीज़ होगी
  • ए.आई. का भविष्य: अगले कुछ वर्षों में देखने लायक 4 बड़ी चीज़ें

जैसा कि हर ए.आई. के साथ होता है। बुद्धि परीक्षण, आप इस बारे में बहस कर सकते हैं कि पैरामीटर कितने व्यापक या संकीर्ण हैं। हालाँकि, यह विचार दिलचस्प है कि बुद्धिमत्ता को वास्तविक दुनिया में नेविगेट करने की क्षमता से जोड़ा जाना चाहिए। यह भी एक ऐसा है जिसे एक नई शोध परियोजना परीक्षण करना चाहती है।

दुनिया का निर्माण

“पिछले कुछ वर्षों में, ए.आई. समुदाय ने ए.आई. के प्रशिक्षण में भारी प्रगति की है। जटिल कार्य करने के लिए एजेंट," लुका वेह्सएलन इंस्टीट्यूट फॉर एआई के एक शोध वैज्ञानिक, दिवंगत माइक्रोसॉफ्ट के सह-संस्थापक पॉल एलन द्वारा स्थापित एक कृत्रिम बुद्धिमत्ता प्रयोगशाला, ने डिजिटल ट्रेंड्स को बताया।

AI2-थोर कार्य
ए.आई. के लिए एलन इंस्टीट्यूट

वीह्स ने डीपमाइंड के ए.आई. के विकास का हवाला दिया। एजेंट जो सीखने में सक्षम हैं क्लासिक अटारी गेम खेलें और गो में मानव खिलाड़ियों को हराया. हालाँकि, वेह्स ने कहा कि ये कार्य हमारी दुनिया से "अक्सर अलग" होते हैं। A.I को वास्तविक दुनिया की तस्वीर दिखाएँ अटारी गेम खेलने के लिए प्रशिक्षित, और उसे पता नहीं होगा कि वह क्या देख रहा है। यहीं पर एलन इंस्टीट्यूट के शोधकर्ताओं का मानना ​​है कि उनके पास देने के लिए कुछ है।

ए.आई. के लिए एलन इंस्टीट्यूट एक रियल एस्टेट साम्राज्य का निर्माण किया है। लेकिन यह भौतिक अचल संपत्ति नहीं है, बल्कि आभासी अचल संपत्ति है। इसने सैकड़ों आभासी कमरे और अपार्टमेंट विकसित किए हैं - जिनमें रसोई, शयनकक्ष, स्नानघर और लिविंग रूम शामिल हैं - जिनमें ए.आई. एजेंट हजारों वस्तुओं के साथ इंटरैक्ट कर सकते हैं। ये स्थान यथार्थवादी भौतिकी, कई एजेंटों के लिए समर्थन और यहां तक ​​​​कि गर्म और ठंडे जैसी स्थितियों का दावा करते हैं। ए.आई. को अनुमति देकर एजेंट इन वातावरणों में खेलते हैं, विचार यह है कि वे दुनिया की अधिक यथार्थवादी धारणा बना सकते हैं।

ए.आई. के लिए एलन इंस्टीट्यूट

“[हमारे नए] काम में, हम यह समझना चाहते थे कि ए.आई. एजेंट एक यथार्थवादी वातावरण के भीतर एक इंटरैक्टिव गेम खेलकर उसके बारे में जान सकते हैं," वेह्स ने कहा। “इस प्रश्न का उत्तर देने के लिए, हमने दो एजेंटों को कैश खेलने के लिए प्रशिक्षित किया, जो लुका-छिपी का एक प्रकार है, जिसमें उच्च-निष्ठा के भीतर प्रतिकूल सुदृढीकरण सीखने का उपयोग किया जाता है। AI2-THOR वातावरण. इस गेमप्ले के माध्यम से, हमने पाया कि हमारे एजेंटों ने तरीकों के प्रदर्शन के करीब पहुंचते हुए, व्यक्तिगत छवियों का प्रतिनिधित्व करना सीखा लाखों हस्त-लेबल वाली छवियों की आवश्यकता है - और यहां तक ​​कि कुछ संज्ञानात्मक आदिमताओं को विकसित करना भी शुरू कर दिया है जिनका अध्ययन अक्सर [विकासात्मक] द्वारा किया जाता है। मनोवैज्ञानिक।"

खेल के नियम

नियमित लुका-छिपी के विपरीत, कैश में, बॉट बारी-बारी से टॉयलेट प्लंजर, ब्रेड की रोटियां, टमाटर और बहुत कुछ जैसी वस्तुओं को छिपाते हैं, जिनमें से प्रत्येक की अपनी अलग-अलग ज्यामिति होती है। दो एजेंट - एक छिपाने वाला, दूसरा खोजने वाला - फिर यह देखने के लिए प्रतिस्पर्धा करते हैं कि क्या कोई वस्तु को दूसरे से सफलतापूर्वक छिपा सकता है। इसमें कई चुनौतियाँ शामिल हैं, जिनमें अन्वेषण और मानचित्रण, परिप्रेक्ष्य को समझना, छिपाना, वस्तु में हेरफेर करना और तलाश करना शामिल है। सब कुछ सटीक रूप से अनुकरण किया गया है, यहां तक ​​कि इस आवश्यकता तक भी कि छिपने वाले को अपने हाथ में मौजूद वस्तु में हेरफेर करने में सक्षम होना चाहिए और उसे गिराना नहीं चाहिए।

गहन सुदृढीकरण सीखने का उपयोग करना - एक मशीन सीखने का प्रतिमान जो कार्रवाई करना सीखने पर आधारित है इनाम को अधिकतम करने के लिए पर्यावरण - बॉट वस्तुओं को छिपाने के साथ-साथ खोजने में भी बेहतर से बेहतर होते जाते हैं उन्हें बाहर।

वीह्स ने कहा, "ए.आई. के लिए जो चीज़ इसे इतना कठिन बनाती है वह यह है कि वे दुनिया को उस तरह नहीं देखते जैसे हम देखते हैं।" “अरबों वर्षों के विकास ने इसे ऐसा बना दिया है कि, शिशुओं के रूप में भी, हमारा मस्तिष्क कुशलतापूर्वक फोटॉनों को अवधारणाओं में अनुवाद करता है। दूसरी ओर, एक ए.आई. शून्य से शुरू होता है और अपनी दुनिया को संख्याओं के एक विशाल ग्रिड के रूप में देखता है जिसे फिर उसे अर्थ में समझना सीखना होगा। इसके अलावा, शतरंज के विपरीत, जहां दुनिया 64 वर्गों में बड़े करीने से समाहित है, एजेंट द्वारा देखी गई प्रत्येक छवि केवल एक को कैप्चर करती है पर्यावरण का छोटा सा टुकड़ा, और इसलिए इसे समय के माध्यम से अपनी टिप्पणियों को एकीकृत करना चाहिए ताकि एक सुसंगत समझ बन सके दुनिया।"

ए.आई. गतिशील प्रयोग के परिणाम छिपाएँ और तलाशें
ए.आई. के लिए एलन इंस्टीट्यूट

स्पष्ट होने के लिए, यह नवीनतम कार्य एक अति-बुद्धिमान ए.आई. के निर्माण के बारे में नहीं है। जैसी फिल्मों में टर्मिनेटर 2: फैसले का दिन, स्काईनेट सुपरकंप्यूटर 29 अगस्त 1997 को पूर्वी समयानुसार ठीक 2.14 बजे आत्म-जागरूकता प्राप्त करता है। तारीख के बावजूद, अब हमारे सामूहिक रियरव्यू मिरर में लगभग एक चौथाई सदी हो गई है, ऐसा लगता नहीं है कि जब नियमित ए.आई. एजीआई बन जाता है. इसके बजाय, अधिक से अधिक कम्प्यूटेशनल फल - लो-हैंगिंग और हाई-हैंगिंग - तब तक तोड़े जाएंगे जब तक कि हमारे पास अंततः कई डोमेन में सामान्यीकृत बुद्धिमत्ता के करीब कुछ न हो जाए।

कठिन चीज़ आसान है, आसान चीज़ कठिन है

शोधकर्ता परंपरागत रूप से ए.आई. की जटिल समस्याओं की ओर आकर्षित हुए हैं। इस विचार के आधार पर हल करना कि, यदि कठिन समस्याओं को हल किया जा सकता है, तो आसान समस्याओं को भी बहुत पीछे नहीं रहना चाहिए। यदि आप किसी वयस्क के निर्णय लेने का अनुकरण कर सकते हैं, तो वस्तु स्थायित्व (वह विचार जो वस्तु स्थिर है) जैसे विचारों का अनुकरण कर सकते हैं अस्तित्व तब होता है जब हम उन्हें नहीं देख सकते) एक बच्चा अपने जीवन के पहले कुछ महीनों में सीखता है जो वास्तव में साबित होता है कठिन? इसका उत्तर हां है - और यह विरोधाभास है कि, जब ए.आई. की बात आती है, तो कठिन चीजें अक्सर आसान होती हैं, और आसान चीजें कठिन होती हैं, इसी को संबोधित करने के लिए इस तरह का कार्य निर्धारित किया गया है।

“ए.आई. के प्रशिक्षण के लिए सबसे आम प्रतिमान। एजेंटों में विशाल, मैन्युअल रूप से लेबल किए गए डेटासेट शामिल होते हैं जो केवल एक ही कार्य पर केंद्रित होते हैं - उदाहरण के लिए, वस्तुओं को पहचानना,'' वीह्स ने कहा। “हालांकि इस दृष्टिकोण को बड़ी सफलता मिली है, मुझे लगता है कि यह विश्वास करना आशावादी है कि हम ए.आई. का उत्पादन करने के लिए मैन्युअल रूप से पर्याप्त डेटासेट बना सकते हैं।” एजेंट जो वास्तविक दुनिया में समझदारी से कार्य कर सकता है, मनुष्यों के साथ संवाद कर सकता है और उन सभी प्रकार की समस्याओं का समाधान कर सकता है जिनका उसने पहले सामना नहीं किया है। ऐसा करने के लिए, मेरा मानना ​​है कि हमें एजेंटों को उनकी दुनिया के साथ स्वतंत्र रूप से बातचीत करने की अनुमति देकर उन मूलभूत संज्ञानात्मक आदिमताओं को सीखने देना होगा जिन्हें हम स्वीकार करते हैं। हमारा काम दिखाता है कि ए.आई. को प्रेरित करने के लिए गेमप्ले का उपयोग करना। एजेंटों के साथ बातचीत करने और उनकी दुनिया का पता लगाने के परिणामस्वरूप उनमें सीखना शुरू हो जाता है ये आदिम - और इस तरह से पता चलता है कि गेमप्ले मैन्युअल रूप से लेबल किए गए डेटासेट से दूर और अनुभवात्मक की ओर एक आशाजनक दिशा है सीखना।"

इस कार्य का वर्णन करने वाला पेपर सीखने के अभ्यावेदन पर आगामी 2021 अंतर्राष्ट्रीय सम्मेलन में प्रस्तुत किया जाएगा।

संपादकों की सिफ़ारिशें

  • ऑप्टिकल भ्रम हमें एआई की अगली पीढ़ी बनाने में मदद कर सकता है
  • मज़ेदार फ़ॉर्मूला: क्यों मशीन से उत्पन्न हास्य ए.आई. की पवित्र कब्र है?
  • ए.आई. का अत्यंत सुंदर 'सिंथेटिक शास्त्र' पढ़ें। वह सोचता है कि यह भगवान है
  • एल्गोरिथम वास्तुकला: क्या हमें ए.आई. को अनुमति देनी चाहिए? हमारे लिए इमारतें डिज़ाइन करें?
  • भावना-संवेदन ए.आई. यहाँ है, और यह आपके अगले नौकरी साक्षात्कार में हो सकता है

श्रेणियाँ

हाल का

क्या नेटफ्लिक्स द सैंडमैन के लिए सही घर है?

क्या नेटफ्लिक्स द सैंडमैन के लिए सही घर है?

द सैंडमैन, नील गैमन के सपनों, फंतासी और जादू की...

टिक, टिक... बूम! एक आदर्श संगीतमय संख्या बनाने पर संपादक

टिक, टिक... बूम! एक आदर्श संगीतमय संख्या बनाने पर संपादक

मायरोन केर्स्टीन 2003 से बड़े पर्दे पर संगीत का...