यह पिक्शनरी-प्लेइंग बॉट ए.आई. के लिए एक बड़ा मील का पत्थर है।

आपके अमेज़ॅन इको पर नए एलेक्सा कौशल की तरह, पिछले कुछ दशकों में ए.आई. देखा गया है। धीरे-धीरे हमारे अधिक से अधिक प्रिय खेलों में सर्वश्रेष्ठ मानवता की क्षमता हासिल करें: 1997 में डीप ब्लू के साथ शतरंज, ख़तरा 2011 में आईबीएम वॉटसन के साथ, 2013 में डीपमाइंड के साथ अटारी गेम्स, जाना 2016 में अल्फ़ागो के साथ, और इसी तरह। आम जनता के लिए, कम से कम, प्रत्येक उदाहरण कम्प्यूटेशनल प्रगति के अमूर्त पथ को एक दर्शक खेल में बदल देता है। स्काईनेट अधिक स्मार्ट होता जा रहा है। हम कैसे जानते हैं? क्योंकि मनोरंजन की बढ़ती संख्या पर गौर करें तो यह निश्चित रूप से हमें मात दे सकता है।

अंतर्वस्तु

एक पिक्शनरी मास्टर का निर्माण
आंखों के मिलने से ज्यादा

उस पृष्ठभूमि के साथ, यह सुनना बहुत ज्यादा चौंकाने वाला नहीं है कि ए.आई. अब वह जबरदस्त प्रदर्शन कर सकता है चित्रात्मक, सारथी-प्रेरित शब्द अनुमान लगाने का खेल जिसमें एक व्यक्ति को एक छवि बनाने की आवश्यकता होती है और दूसरों को जितनी जल्दी हो सके यह पता लगाने की कोशिश करनी होती है कि उन्होंने क्या रेखाचित्र बनाया है।

अनुशंसित वीडियो

यू.के. के सरे विश्वविद्यालय के शोधकर्ताओं ने हाल ही में एक "प्रतिस्पर्धी स्केचिंग ए.आई." पिक्सेलर के निर्माण के साथ यही किया है। प्रतिनिधि।" एक दृश्य दिया अवधारणा, पिक्सेलर एक ऐसा रेखाचित्र बनाने में सक्षम है जो (मनुष्यों और मशीनों दोनों द्वारा) अपने इच्छित विषय के रूप में पहचानने योग्य है - या उससे भी तेज - एक मानव की तुलना में प्रतिस्पर्धी.

एक पिक्शनरी मास्टर का निर्माण

एक जटिल वास्तविक दुनिया की छवि को एक स्केच में कम करने में सक्षम होना अपने आप में बहुत प्रभावशाली है। किसी मानव चेहरे को देखने और उसे एक अंडाकार के रूप में देखने के लिए अमूर्तता के स्तर की आवश्यकता होती है जिसमें आंखों के लिए दो छोटे अंडाकार, नाक के लिए एक रेखा और मुंह के लिए आधा वृत्त होता है। बच्चों में, इस तरह से एक छवि को समझने की क्षमता, अन्य बातों के अलावा, अवधारणाओं की बढ़ती संज्ञानात्मक समझ को दर्शाती है।

हालाँकि, जैसा कि ए.आई. के कई पहलुओं के साथ होता है, अक्सर इसे संक्षेप में प्रस्तुत किया जाता है मोरावेक का विरोधाभास कि "कठिन समस्याएँ आसान होती हैं और आसान समस्याएँ कठिन होती हैं," यह मशीन के लिए एक महत्वपूर्ण चुनौती है बुद्धिमत्ता - इस तथ्य के बावजूद कि यह दो साल के अधिकांश बच्चों के लिए एक बुनियादी, अचूक कौशल है बच्चे।

हालाँकि, यह कोई अघुलनशील चुनौती नहीं है। 2016 में, हमने स्केच नामक टूल के साथ सॉन्ग के काम के बारे में लिखा, एक गहन-शिक्षण तंत्रिका नेटवर्क जो हाथ से बनाए गए रेखाचित्रों को पहचानने और वास्तविक जीवन के उत्पादों की खोज करने के लिए उनका उपयोग करने में सक्षम था। उस विशेष नेटवर्क को लगभग 30,000 स्केच-फोटो तुलनाओं वाले डेटासेट का उपयोग करके प्रशिक्षित किया गया था, जिससे यह पहचानने में सक्षम हो सके कि वास्तविक वस्तुओं को हाथ से ड्राइंग में कैसे प्रस्तुत किया जाता है। Pixelor भी कुछ ऐसा ही करता है, लेकिन यह अन्य लोगों के चित्रों को पहचानने के बजाय अपने स्वयं के चित्र भी बना सकता है।

लेकिन यह जीतने के लिए पर्याप्त नहीं है चित्रात्मक. चित्रात्मक एक समय-चुनौतीपूर्ण खेल है जहां लक्ष्य सिर्फ एक बिल्ली को आकर्षित करना नहीं है, बल्कि जितना संभव हो उतने कम स्ट्रोक में एक बिल्ली को आकर्षित करना है। आप दुनिया के सबसे महान कलाकार हो सकते हैं, लेकिन अगर आपको एक आदर्श बिल्ली का चित्र बनाने में 12 घंटे लगते हैं, तो आप एक भयानक कलाकार हैं चित्रात्मक खिलाड़ी.

इसका मतलब ए.आई. का निर्माण करना था। जो यह देखने के लिए मनुष्यों का अध्ययन कर सकता है कि वे PEDIA को अच्छी तरह से खेलने के लिए किन रणनीतियों का उपयोग करते हैं। जैसा कि सॉन्ग ने कहा, “अन्य मानव न्यायाधीशों को अनुमान लगाने में सक्षम बनाने के लिए सबसे महत्वपूर्ण अंश क्या हैं? हम चाहते हैं कि हमारी ड्राइंग का जल्द से जल्द अनुमान लगाया जाए।''

ऐसा करने के लिए, शोधकर्ताओं ने क्विकड्रॉ लिया, जो अब तक उपलब्ध सबसे बड़ा मानव स्केच डेटासेट है। फिर उन्होंने एक तंत्रिका सॉर्टिंग एल्गोरिदम बनाया जो एक कलाकार द्वारा किए जाने वाले स्ट्रोक के क्रम को प्राथमिकता देता है; किसी वस्तु का यथासंभव कम पंक्तियों में अनुमान लगाने योग्य प्रतिनिधित्व देना। इसका मतलब है रेखाचित्रों को स्ट्रोक्स में तोड़ना, फिर इन स्ट्रोक्स के क्रम में फेरबदल करना और परिणामों का परीक्षण करना जब तक कि वे सटीक क्रम स्थापित न कर लें जिसमें उन्हें कागज पर रखने की आवश्यकता होती है।

उदाहरण के लिए, एक कलाकार एक बिल्ली का चित्र उसके सिर की गोलाकार रूपरेखा बनाकर शुरू कर सकता है। लेकिन एक वृत्त में कई चीज़ें हो सकती हैं, भले ही आप जानते हों कि यह एक सिर का प्रतिनिधित्व करता है। हालाँकि, दो नुकीले कान या मूंछों के दो सेट बनाएं और आपके द्वारा खींची जा सकने वाली संभावित चीज़ों की संख्या बहुत जल्दी कम हो जाती है। फिर इस जानकारी का उपयोग स्केचिंग एजेंट को निर्देश देने के लिए किया जाता है।

सॉन्ग ने कहा कि टीम इसका सार्वजनिक संस्करण जारी कर सकती है चित्रात्मक-प्लेइंग बॉट ताकि मानव खिलाड़ी स्केचिंग ए.आई. को हराने में अपना योगदान दे सकें। मालिक। (कौन जानता है? किसी विशेषज्ञ की भूमिका निभाने से आपको अपना सुधार करने में भी मदद मिल सकती है चित्रात्मक खेल।)

आंखों के मिलने से ज्यादा

हालाँकि, Pixelor में एक अन्य मामूली गेम खेलने वाले बॉट के अलावा और भी बहुत कुछ है। जैसे एक कंप्यूटर सिस्टम में एक सतह-स्तरीय इंटरफ़ेस होता है जिसके साथ हम इंटरैक्ट करते हैं और अंडर-द-हुड बैकएंड कोड होता है, वैसे ही, हर प्रमुख ए.आई. गेम-प्लेइंग माइलस्टोन का एक गुप्त उद्देश्य होता है। जब तक वे स्पष्ट रूप से कंप्यूटर गेम नहीं बना रहे हों, अनुसंधान प्रयोगशालाएँ निर्माण में अनगिनत व्यक्ति-घंटे खर्च नहीं करती हैं गेम-प्लेइंग ए.आई. एजेंट केवल उन चीजों की बड़ी सूची में एक और प्रविष्टि जोड़ने के लिए हैं जो मनुष्य अब सर्वश्रेष्ठ नहीं हैं पर। उद्देश्य हमेशा A.I के कुछ मूलभूत भाग को आगे बढ़ाना है। समस्या को सुलझाना।

Pixelor के मामले में, छिपा हुआ उद्देश्य ऐसी मशीनें बनाना है जो यह पता लगाने में बेहतर सक्षम हों कि किसी विशेष दृश्य में मानव के लिए क्या महत्वपूर्ण है। जब हम किसी छवि को देखते हैं, तो हम तुरंत यह बताने में सक्षम होते हैं कि सबसे प्रमुख विवरण क्या हैं।

मान लीजिए कि आप काम से घर जा रहे हैं। जबकि सड़क के किनारे लगे पेड़ सुरम्य हो सकते हैं और एक नई फिल्म का बिलबोर्ड दिलचस्प हो सकता है, इनमें से कोई भी उतना महत्वपूर्ण नहीं है जितना कि उस व्यक्ति का चेहरा और शारीरिक भाषा जो सामने से निकलने वाला हो भी सकता है और नहीं भी आप। इससे पहले कि आप सचेत रूप से जानकारी संसाधित करें, आपका मस्तिष्क सबसे महत्वपूर्ण विवरण चुन लेता है। ऐसा करने में सक्षम होने के लिए आप कंप्यूटर को कैसे सिखाते हैं? खैर, यह पता चला है कि ऐसा करने का एक शानदार तरीका यह देखना है कि मनुष्य किसी छवि का स्केच बनाते समय उसमें मुख्य पहचानने योग्य विवरणों को कैसे प्राथमिकता देते हैं।

सॉन्ग ने कहा, "[अकेले] तस्वीरों में कोई मानवीय ज्ञान अंतर्निहित नहीं है।" "हम जो चाहते हैं वह मानव डेटा है जो हमें संकेत दे सकता है कि मनुष्य किसी वस्तु को कैसे समझते हैं।"

जैसा कि उल्लेख किया गया है, एक अच्छा चित्रात्मक एक अच्छे मुक्केबाज की तरह, खिलाड़ी को पता होगा कि एक निश्चित उद्देश्य को प्राप्त करने के लिए उन्हें न्यूनतम कितना कुछ करने की आवश्यकता है। वृहत अर्थ में, यी-ज़े सॉन्ग और उनके सहयोगियों को इसी बात की परवाह है। यह गेम खेलने के लिए कंप्यूटर प्राप्त करने जितनी मामूली बात नहीं है; इसे यह समझने के लिए एक कंप्यूटर मिल रहा है कि कुछ दृश्यों के बारे में क्या महत्वपूर्ण है - और, उम्मीद है, बेहतर सामान्यीकरण करने में सक्षम होने के लिए।

से सब कुछ के रूप में स्व-चालित कारें कार्यस्थल में रोबोट तेजी से आम होते जा रहे हैं, इसे हल करना एक आवश्यक कार्य है।

काम का वर्णन करने वाला एक पेपर नवंबर में सिग्ग्राफ एशिया 2020 में प्रस्तुत किया जाएगा।

संपादकों की सिफ़ारिशें

वॉयेज एक ए.आई. है। गेमिंग स्वर्ग जहां बॉट नियम लिखते हैं
शतरंज। ख़तरा. जाना। हम A.I. के लिए बेंचमार्क के रूप में गेम का उपयोग क्यों करते हैं?
एक ए.आई. रेट्रो वीडियो गेम डिज़ाइन कर रहा है - और वे आश्चर्यजनक रूप से अच्छे हैं

यह पिक्शनरी-प्लेइंग बॉट ए.आई. के लिए एक बड़ा मील का पत्थर है।

एक पिक्शनरी मास्टर का निर्माण

आंखों के मिलने से ज्यादा

संपादकों की सिफ़ारिशें

श्रेणियाँ

हाल का

अद्भुत तकनीक: ओरिगेमी माइक्रोस्कोप, इलेक्ट्रिक कंबल, और बहुत कुछ

युनाइटेड का बोइंग 747 रिटायर हो गया है, इसके जाने से प्रशंसक दुखी क्यों हैं

कोलंबस के स्मार्ट सिटी लक्ष्यों में सार्वजनिक समर्थन का निर्माण शामिल है