Google रोबोट सिर्फ दो घंटे में खुद को चलना सिखा देता है

क्या आपको वॉल्ट डिज़्नी का वह दृश्य याद है? बांबी जहाँ नामधारी हिरण का बच्चा अपनी शक्ति के अधीन खड़ा होना और चलना सीखता है? यह फिल्म में एक आकर्षक दृश्य है, जिसमें एक कौशल का प्रदर्शन किया गया है कि बहुत सारे बच्चे जानवर - सूअर से जिराफ और हां, हिरण तक - अपने जन्म के कुछ ही मिनटों के भीतर उठा लेते हैं। जीवन के पहले कुछ घंटों में, ये जानवर तेजी से अपने मोटर कौशल को परिष्कृत करते हैं जब तक कि वे अपनी स्वयं की गति पर पूर्ण नियंत्रण नहीं प्राप्त कर लेते। मनुष्य, जो लगभग सात महीने में चीजों को पकड़कर खड़ा होना सीख जाते हैं और जो 15 महीने में चलना शुरू कर देते हैं, तुलनात्मक रूप से निराशाजनक रूप से सुस्त हैं।

अंतर्वस्तु

  • सकारात्मक सुदृढीकरण
  • बेहतर रोबोट का निर्माण

अंदाजा लगाइए कि नवीनतम कार्य में रोबोट ने हमें किस काम में पछाड़ दिया है? एक नए अध्ययन में Google के शोधकर्ताओं द्वारा किया गया, इंजीनियरों ने एक चौगुने मिनीटौर रोबोट को चलना सिखाया है, ठीक है, वास्तव में इसे बहुत कुछ सिखाने की ज़रूरत नहीं है। बल्कि, उन्होंने चार पैरों वाला रोबोट बनाने के लिए एक प्रकार की लक्ष्य-उन्मुख कृत्रिम बुद्धिमत्ता का उपयोग किया है

आगे बढ़ना सीखें, पीछे की ओर, और बाएँ और दाएँ पूरी तरह से अपने आप मुड़ें। यह खुद को तीन अलग-अलग इलाकों में सफलतापूर्वक ऐसा करना सिखाने में सक्षम था, जिसमें समतल जमीन, मुलायम गद्दा और दरारों वाला डोरमैट शामिल था।

अनुशंसित वीडियो

"पैर वाले रोबोट में बहुत अधिक गतिशीलता हो सकती है क्योंकि कच्ची सड़कों और मनुष्यों के लिए डिज़ाइन किए गए स्थानों पर नेविगेट करने के लिए पैर आवश्यक हैं," जी टैनप्रोजेक्ट के प्रमुख अन्वेषक और Google के लोकोमोशन प्रयासों के प्रमुख ने डिजिटल ट्रेंड्स को बताया। "हम पैरों वाले रोबोटों को हमारे विविध और जटिल वास्तविक दुनिया के वातावरण में नेविगेट करने में सक्षम बनाने में रुचि रखते हैं, लेकिन ऐसे रोबोटिक नियंत्रकों को मैन्युअल रूप से इंजीनियर करना कठिन है जो ऐसी विविधता को संभाल सकें जटिलता. इसलिए यह महत्वपूर्ण है कि रोबोट स्वयं सीखने में सक्षम हों। यह काम रोमांचक है क्योंकि यह एक प्रारंभिक प्रदर्शन है कि, हमारे सिस्टम के साथ, एक पैर वाला रोबोट सफलतापूर्वक अपने आप चलना सीख सकता है।

सकारात्मक सुदृढीकरण

न्यूनतम मानवीय प्रयास के साथ वास्तविक दुनिया में चलना सीखना

इस विशेष परियोजना के मूल में मौजूद प्रौद्योगिकी को गहन सुदृढीकरण शिक्षण कहा जाता है गहन शिक्षा के लिए विशिष्ट दृष्टिकोण जो व्यवहारवादी मनोविज्ञान और परीक्षण और त्रुटि से प्रेरित है सीखना। एक निश्चित पुरस्कार को अधिकतम करने के लिए कहा गया है, सॉफ्टवेयर एजेंट ऐसे वातावरण में कार्रवाई करना सीखते हैं जो उन परिणामों को सबसे सटीक, कुशल तरीके से प्राप्त करेगा। सुदृढीकरण सीखने की शक्ति थी 2013 में प्रसिद्ध रूप से प्रदर्शित किया गया जब Google के डीपमाइंड ने एक पेपर जारी किया जिसमें दिखाया गया कि उसने A.I. को कैसे प्रशिक्षित किया था क्लासिक अटारी वीडियो गेम खेलने के लिए। यह ऑन-स्क्रीन स्कोर और लगभग 30,000 पिक्सल के अलावा किसी भी निर्देश के बिना हासिल किया गया था, जो कि खेले जा रहे वीडियो गेम के प्रत्येक फ्रेम को बनाता था।

वीडियो गेम, या कम से कम सिमुलेशन, अक्सर रोबोटिक्स शोधकर्ताओं द्वारा भी उपयोग किए जाते हैं। एक सिमुलेशन सिद्धांत में बिल्कुल सही अर्थ रखता है, क्योंकि यह रोबोटिस्टों को वास्तविक दुनिया में जाने से पहले आभासी दुनिया में अपनी मशीन को प्रशिक्षित करने की अनुमति देता है। यह रोबोट को अपरिहार्य बाधाओं और टूट-फूट से बचाता है, जिससे उसे किसी विशिष्ट कार्य को करना सीखते समय गुजरना पड़ता है। सादृश्य के रूप में, कल्पना करें कि आपके सभी ड्राइविंग सबक ड्राइविंग सिम्युलेटर का उपयोग करके किए गए थे। यह तर्क दिया जा सकता है कि आप अधिक तेज़ी से सीखेंगे क्योंकि आपको अपनी शारीरिक सुरक्षा को जोखिम में डालने या अपनी कार (या किसी और की) को नुकसान पहुँचाने के बारे में इतना सतर्क नहीं रहना होगा। आप आवंटित पाठों की प्रतीक्षा किए बिना या लाइसेंस प्राप्त ड्राइवर के आपको बाहर ले जाने के लिए तैयार होने की प्रतीक्षा किए बिना भी अधिक तेज़ी से प्रशिक्षण ले सकते हैं।

इसके साथ समस्या यह है कि, जैसा कि जिसने भी कभी ड्राइविंग वीडियो गेम खेला है, वह जानता होगा, वास्तविक दुनिया को उस तरह से मॉडल करना बहुत कठिन है जो वास्तविक दुनिया जैसा लगता है। इसके बजाय, Google के शोधकर्ताओं ने बेहतर एल्गोरिदम विकसित करना शुरू किया जो उनके रोबोट को कम परीक्षणों के साथ अधिक तेजी से सीखने की अनुमति देता है। Google अनुसंधान के पिछले अंश पर निर्माण 2018 में प्रकाशितइस नवीनतम प्रदर्शन में उनका रोबोट कुछ ही घंटों में चलना सीखने में सक्षम हो गया।

यह सीखने के लिए अधिक सतर्क, सुरक्षित दृष्टिकोण पर जोर देते हुए भी ऐसा करने में सक्षम है, जिसमें कम गिरावट शामिल है। नतीजतन, यह रोबोट को उठाने और हर बार गिरने पर धूल झाड़ने के लिए किए जाने वाले मानवीय हस्तक्षेपों की संख्या को कम कर देता है।

बेहतर रोबोट का निर्माण

दो घंटे में चलना सीखना चलने-फिरने की दक्षता के बराबर नहीं हो सकता है, लेकिन यह इंजीनियरों द्वारा स्पष्ट रूप से प्रोग्राम करने की तुलना में बहुत दूर है कि रोबोट को आमतौर पर पैंतरेबाज़ी कैसे सिखाई जाती है। (और, जैसा कि उल्लेख किया गया है, यह उस तरह की समय सीमा में मानव शिशुओं की तुलना में बहुत बेहतर है!)

“हालांकि कई अप्रशिक्षित शिक्षण या सुदृढीकरण शिक्षण एल्गोरिदम का प्रदर्शन किया गया है सिमुलेशन, उन्हें वास्तविक, पैर वाले रोबोटों पर लागू करना अविश्वसनीय रूप से कठिन हो जाता है," टैन व्याख्या की। “सबसे पहले, सुदृढीकरण सीखना डेटा-भूख है, और रोबोट डेटा एकत्र करना महंगा है। हमारे पिछले कार्य ने इस चुनौती का समाधान किया है। दूसरा, प्रशिक्षण के लिए किसी को रोबोट की देखरेख में बहुत समय बिताने की आवश्यकता होती है। यदि हमें रोबोट की निगरानी करने और हर बार ठोकर लगने पर इसे मैन्युअल रूप से रीसेट करने के लिए एक व्यक्ति की आवश्यकता है - सैकड़ों या हजारों बार - तो रोबोट को प्रशिक्षित करने में बहुत प्रयास और बहुत लंबा समय लगेगा। इसमें जितना अधिक समय लगेगा, कई अलग-अलग वातावरणों में कई रोबोटों तक सीखने को बढ़ाना उतना ही कठिन होगा।

एक दिन यह शोध अधिक चुस्त रोबोट बनाने में मदद कर सकता है जो विभिन्न इलाकों में तेजी से अनुकूलन करने में सक्षम होंगे। टैन ने कहा, "संभावित अनुप्रयोग असंख्य हैं।" हालाँकि, टैन ने ज़ोर देकर कहा कि यह "अभी शुरुआती दिन हैं, और कई चुनौतियाँ हैं जिनसे हमें अभी भी पार पाने की ज़रूरत है।"

हालाँकि, सुदृढीकरण सीखने के विषय को ध्यान में रखते हुए, यह निश्चित रूप से एक इनाम है जो अधिकतम करने लायक है!

संपादकों की सिफ़ारिशें

  • एआई ने ब्रेकिंग बैड को एनीमे में बदल दिया - और यह भयानक है
  • एआई कभी दुनिया पर राज क्यों नहीं करेगा?
  • जब कोई AI वास्तव में संवेदनशील हो जाएगा तो हमें कैसे पता चलेगा?
  • मज़ेदार फ़ॉर्मूला: क्यों मशीन से उत्पन्न हास्य ए.आई. की पवित्र कब्र है?
  • ए.आई. का अत्यंत सुंदर 'सिंथेटिक शास्त्र' पढ़ें। वह सोचता है कि यह भगवान है

अपनी जीवनशैली को उन्नत करेंडिजिटल ट्रेंड्स पाठकों को सभी नवीनतम समाचारों, मजेदार उत्पाद समीक्षाओं, व्यावहारिक संपादकीय और एक तरह की अनूठी झलक के साथ तकनीक की तेज़ गति वाली दुनिया पर नज़र रखने में मदद करता है।

श्रेणियाँ

हाल का

निंटेंडो स्विच प्रो: 3 सबसे संभावित लॉन्च गेम्स

निंटेंडो स्विच प्रो: 3 सबसे संभावित लॉन्च गेम्स

कथित "सुपर स्विच," "स्विच प्रो," या "स्विच 2" क...

गैलेक्सी एस22 अल्ट्रा हैंड्स-ऑन: अल्टीमेट सुपरफोन मैश-अप

गैलेक्सी एस22 अल्ट्रा हैंड्स-ऑन: अल्टीमेट सुपरफोन मैश-अप

उत्कृष्ट कार्यों के बाद सैमसंग को हमेशा एक कठिन...