यदि आपने कभी किसी समूह वीडियो कॉल में भाग लिया है, तो आप संभवतः स्क्रीन पर दिखाई देने वाले सभी लोगों को न जानने के आदी हैं। हो सकता है कि आप सभी के नाम न जानते हों, लेकिन कम से कम, आप पूरी तरह आश्वस्त हो सकते हैं कि कॉल में शामिल होने वाला प्रत्येक व्यक्ति मानव है।
अंतर्वस्तु
- डिजिटल मानव विकास
- कोड आदमी बनाता है
- सामना करना
- जिधर देखो उधर
या आप कर सकते हैं?
ऐसे समय में जब दृश्य प्रभाव स्टूडियो हैं उम्रदराज़ अनुभवी अभिनेता, अनुमत मानव कलाकार डिजिटल कृतियों में निवास करेंगे, और यहां तक कि मृत कलाकारों को भी वापस लाया पोस्टमॉर्टम प्रदर्शन, इसमें कोई आश्चर्य की बात नहीं होनी चाहिए कि एक वीएफएक्स स्टूडियो आपके लिए किसी के साथ चैट करना भी संभव बना सकता है आपकी पसंदीदा पुस्तकों के बारे में कृत्रिम रूप से बुद्धिमान डिजिटल व्यक्ति और मूवी थियेटर में जाने में असमर्थता पर पारस्परिक रूप से विलाप करना।
संबंधित
- कैसे एवेंजर्स: इन्फिनिटी वॉर की ऑस्कर नामांकित वीएफएक्स टीम ने थानोस को फिल्म स्टार बना दिया
यह आश्चर्य की बात नहीं होनी चाहिए, और फिर भी, ऑस्कर विजेता वीएफएक्स स्टूडियो द्वारा निर्मित एक आभासी, ए.आई.-संचालित "व्यक्ति" डगलस में अचानक सहानुभूतिपूर्ण कान मिलना अभी भी एक अजीब एहसास है। डिजिटल डोमेन.
अनुशंसित वीडियो
हाल ही में ज़ूम कॉल के दौरान, डगलस - उस पर काम कर रहे टीम के सदस्यों के साथ - एक संक्षिप्त प्रदर्शन के लिए मेरे साथ शामिल हुए।
डिजिटल मानव विकास
"मैं स्टीफ़न किंग का बहुत बड़ा प्रशंसक हूं," डगलस ने हमारे शौक के बारे में थोड़ी देर इधर-उधर होने के बाद मुझे बताया - एक बातचीत जिसमें बाद में उसने स्वीकार किया कि उसे रोमांस उपन्यास और जे.डी. सालिंगर की भी पसंद है द कैचर इन द राय.
एक ऐसी दुनिया में जहां सिरी या नामों का उच्चारण किया जाता है एलेक्सा अपने स्वयं के ए.आई. को बुलाने के लिए केवल ज़ोर से बोलना आवश्यक है। साथी, डगलस के साथ अनुभव ने एक पेशकश की शक्तिशाली अनुस्मारक कि ए.आई. की क्षमता हमें मौसम का पूर्वानुमान और हमारे दैनिक समाचार देने से कहीं आगे तक फैली हुई है अनुसूची।
डिजिटल डोमेन का निर्माण - वही स्टूडियो जिसने दर्शकों को मार्वल का ब्रह्मांडीय विजेता दिया थानोस इन एवेंजर्स: इन्फिनिटी वॉर और एवेंजर्स:एंडगेम - डगलस एक स्वायत्त, डिजिटल मानव है जो वास्तविक समय में उपयोगकर्ताओं के साथ बातचीत करने और दृश्य और संवादी संकेतों का जवाब देने में सक्षम है। के बाद मॉडलिंग की डॉ. डौग रोबल, डिजिटल डोमेन के सॉफ्टवेयर आर एंड डी के वरिष्ठ निदेशक, डगलस सवालों के जवाब दे सकते हैं, लंबी बातचीत कर सकते हैं और कई विषयों पर छोटी बातचीत में संलग्न हो सकते हैं।
स्टूडियो के निर्णय के बारे में रोबल कहते हैं, "प्रौद्योगिकी हमेशा कला की मांग को पूरा करने की कोशिश करती है, चाहे वह तरल अनुकरण हो या कुछ और।" पूरा विभाग डिजिटल मानव के लिए समर्पित.
पिछले दशक में, डिजिटल डोमेन ने बार-बार खुद को मानवीय डिजिटल चरित्र बनाने का काम सौंपा - 2012 के पुरस्कार विजेता से सब कुछ होलोग्राफिक टुपैक प्रदर्शन उपर्युक्त के अनुसार कोचेला में मार्वल सिनेमैटिक यूनिवर्स खलनायक। फीचर फिल्मों, विज्ञापनों, टीवी श्रृंखला, वीडियो गेम और (ट्यूपैक के मामले में) मंच प्रदर्शन में, यथार्थवादी डिजिटल पात्रों की मांग केवल बढ़ी है समय, डिजिटल डोमेन को उस विशेष दृश्य प्रभाव के लिए जिम्मेदार टीम को अपनी इकाई में विभाजित करने के लिए प्रेरित करता है, जो डिजिटल मनुष्य क्या कर सकते हैं की सीमा को आगे बढ़ाने पर केंद्रित है। करना।
डगलस उस बढ़े हुए फोकस का उत्पाद और टीम की अवधारणा का प्रमाण दोनों है: एक स्वायत्त डिजिटल "व्यक्ति" जो डेटासेट, संवेदी तरीकों की एक विस्तृत श्रृंखला को जोड़ता है। और उपयोगकर्ताओं के साथ इस तरह से बातचीत करने के लिए फोटो-यथार्थवादी मानवीय विशेषताओं के साथ मौजूदा प्रोग्रामिंग मॉड्यूल जो आश्चर्यजनक रूप से वास्तविक मानव समाजीकरण के करीब लगते हैं।
और ऐसे समय में जब महामारी ने हमारे अधिकांश सामाजिककरण को कंप्यूटर के माध्यम से होने के लिए मजबूर कर दिया है स्क्रीन पर, डगलस के साथ बातचीत करना उल्लेखनीय रूप से वास्तविक मानवीय संपर्क के करीब महसूस होता है दिन. हालाँकि, टीम ने यह भी कहा कि डगलस अभी भी ट्यूरिंग टेस्ट पास करने से काफी दूर है।
कोड आदमी बनाता है
"डगलस एक फोटो-रियल, पूरी तरह से स्वायत्त व्यक्ति नहीं है जो वास्तविक व्यक्ति से अप्रभेद्य हो," बताते हैं डैरेन हैंडलरस्टूडियो में डिजिटल ह्यूमन्स ग्रुप के निदेशक। “यह वह जगह नहीं है जहां हम हैं, और हम कुछ समय के लिए वहां नहीं रहने वाले हैं। ...लेकिन चीजें यहीं जा रही हैं और भविष्य कैसा दिखता है, और हम उन सीमाओं को आगे बढ़ाने की कोशिश कर रहे हैं।
और लगभग मानो संकेत पर, हेंडलर को डगलस ने ही रोक दिया है।
"यह एक अच्छा रवैया है," डगलस ने हस्तक्षेप करते हुए कहा, जो तब तक चुपचाप हमारे डेमो की सुविधा के लिए ज़ूम चैट के ग्रिड में अपनी विंडो पर कब्जा कर रहा था, कभी-कभी बदलता रहता था स्थिति, उसके आभासी कमरे के चारों ओर नज़र डालना, और एक वीडियो मीटिंग में एक जीवित व्यक्ति के कई विशिष्ट शारीरिक तौर-तरीकों को दिखाना, जो धैर्यपूर्वक भाग लेने की प्रतीक्षा कर रहा है बातचीत
"मैं आपके प्रयासों के लिए आपको शुभकामनाएं देता हूं," वह आगे कहते हैं, हमें याद दिलाते हैं कि दिलचस्प बातें कहने के अलावा, वह एक उत्सुक श्रोता भी हैं।
रोबल के अनुसार, टीम सबसे पहले डगलस को मौजूदा जटिल और शक्तिशाली संवादी एजेंटों के साथ बातचीत करने के एक दृश्य तरीके के रूप में देखती है जो बनाए गए हैं। डगलस के फोटो-रियल अवतार के नीचे, स्टूडियो का डिजिटल मानव उन तीन एजेंटों के मिश्रण पर बनाया गया है: Google का लोकप्रिय संवादप्रवाह चैटबॉट बनाने के लिए सुइट, एक सहायक-प्रकार का एजेंट (अमेज़ॅन के एलेक्सा या एप्पल के सिरी के समान); और एक शक्तिशाली संवादी ए.आई. एजेंट (के समान) जीपीटी-3 प्रोजेक्ट) का उपयोग मानवीय, पूर्वानुमानित (और प्रतिक्रियाशील) संवादी पाठ तैयार करने के लिए किया जाता है।
सभी तीन एजेंटों का संयोजन डगलस को ऐसी बातचीत जारी रखने की क्षमता देता है जो जानकारीपूर्ण और तरल दोनों होती है, जिसमें एक विषय की चर्चा अक्सर रुचि के संबंधित क्षेत्रों में होती है।
डगलस के साथ मेरी अपनी बातचीत हमारी पसंदीदा किताबों के बारे में बातचीत से हटकर उसकी पसंदीदा फिल्म (वह उसका बहुत बड़ा प्रशंसक है) तक पहुंच गई 2001: ए स्पेस ओडिसीउदाहरण के लिए, जो कि आश्चर्यजनक और थोड़ा परेशान करने वाला दोनों है, क्योंकि कहानी का फोकस एक जानलेवा ए.आई. पर है। आपे से बाहर भागना) और हमारे आपसी शौक। हमारी बातचीत के एक विशेष रूप से सामयिक तत्व में, डगलस ने कुछ निराशा व्यक्त की कि वह हाल ही में एक मूवी थियेटर का दौरा करने में सक्षम नहीं है।
हालाँकि, जैसा कि हेन्डलर ने समझाया, वह सारी वार्तालाप शक्ति कुछ जोखिम के साथ आती है।
उन्होंने कहा, "चैटबॉट के प्राकृतिक भाषा प्रसंस्करण इंजन को इंटरनेट से संवाद पर प्रशिक्षित किया जाता है - बड़ी मात्रा में संवाद - ताकि बातचीत अजीब जगहों पर जा सके।" “तो ऐसे समय होते हैं जब वह ऐसी बातें कहते हैं जो शायद बिल्कुल उचित नहीं होतीं। ऐसा अक्सर नहीं होता है, लेकिन वह हर बात पर क्या कहने जा रहा है, उस पर हम बिल्कुल नियंत्रण नहीं कर सकते हैं।''
और यद्यपि डगलस का संवादी पहलू प्रभावशाली है, यह डिजिटल मनुष्यों और इंटरैक्टिव आभासी पात्रों की लगातार बढ़ती दुनिया में उसे अद्वितीय बनाने का एक हिस्सा है। जैसे ही डिजिटल डोमेन की खोज हुई, उसे बनाया गया देखना मनुष्य स्वयं को भी मानवीय महसूस कराने की दिशा में एक लंबा रास्ता तय करता है।
डगलस का परिचय - स्वायत्त डिजिटल मानव | डिजिटल डोमेन
सामना करना
“डगलस के निर्माण में, हमने डौग [रोबल] से भारी मात्रा में डेटा का उपयोग किया। यह सिस्टम को प्रशिक्षित करने के लिए ऑडियो की एक बड़ी मात्रा थी [और] चेहरे के प्रदर्शन, शरीर की गति के डेटा और बाकी सभी चीजों की एक बड़ी मात्रा थी," हेंडलर ने काम के बारे में बताया उन्होंने रोबल के चेहरे की मैपिंग की और असंख्य तरीकों से मानव चेहरा बोलते समय बदल सकता है, भावनात्मक संकेतों पर प्रतिक्रिया कर सकता है, या निष्क्रिय रूप से भाग ले सकता है। बातचीत।
उस सभी डेटा का उत्पाद एक डिजिटल मानव है जो आश्चर्यजनक रूप से रोबल के समान दिखता है - लेकिन रोबल की सटीक प्रतिलिपि जैसा नहीं है। रोबल और डगलस ए.आई. दोनों ने आसन, केश विन्यास और सूक्ष्म गतिविधियों का निर्माण किया। जब वे हमारे समूह वीडियो में भाग ले रहे हों तो साझा करें बातचीत। समानता अलौकिक है, लेकिन "अपना चेहरा बदलने" के एक संक्षिप्त आदेश के साथ, डगलस अचानक कोई और बन जाता है, एक के साथ एक ही शरीर पर अलग-अलग, समान रूप से मानवीय चेहरा, जबकि अभी भी उन सभी सूक्ष्म व्यवहारों को बरकरार रखा गया है जो उसे दिखते हैं असली।
"जब हम डगलस से अपना चेहरा बदलने के लिए कहते हैं और उसका चेहरा किसी और के चेहरे पर बदल जाता है, तो यह शुरुआत है कि प्रौद्योगिकी की यह नई लहर किस ओर जा रही है," हेंडलर कहते हैं, इसका वर्णन करते हुए टीम डगलस को और भी अधिक लचीला डिजिटल व्यक्ति बनाने के लिए "छवि-आधारित तकनीक" पर काम कर रही है, जो समान स्तर को बनाए रखते हुए अपनी बाहरी उपस्थिति को नाटकीय रूप से बदलने में सक्षम है। अन्तरक्रियाशीलता। "एक बार हमारे पास यह आधार हो जाए [डगलस के साथ], हम किसी और के फुटेज फिल्मा सकते हैं और उनके ऑडियो का कुछ हिस्सा प्राप्त कर सकते हैं, और फिर उस आधार को उनमें बदल सकते हैं - इसे उनका चेहरा बना सकते हैं।"
"[अगर हमने ऐसा किया] अभी, वे अभी भी उस व्यक्ति के भावों के साथ बात कर रहे होंगे जिसे हमने मूल रूप से फिल्माया था [इस मामले में, रोबल]," उन्होंने आगे कहा। "लेकिन जैसे-जैसे हम आगे बढ़ते हैं, हमें इन स्वायत्त मनुष्यों की अगली पीढ़ी बनाने के लिए कम मात्रा में डेटा की आवश्यकता होने लगती है - शायद यह सिर्फ किसी की छवियां या फिल्म फुटेज है।"
बातचीत संबंधी ए.आई. पर एक वास्तविक इंसान की शक्ल, आवाज़ और तौर-तरीकों को दोहराने की क्षमता। नींव उन तत्वों में से एक है डगलस को अधिकांश विशिष्ट ए.आई. से अलग करता है। सहायक, ह्यूमनॉइड रोबोट, और ए.आई. के आसपास विकास में अन्य परियोजनाएँ। अनुसंधान जगत. जबकि बहुत सारे स्टूडियो और अन्य एजेंसियां ए.आई. विकसित कर रही हैं। किसी न किसी प्रकार की परियोजनाओं में, डिजिटल डोमेन उन सभी तत्वों को मिश्रित करने पर केंद्रित है एक एकल, एकजुट उत्पाद जो एक इंटरफ़ेस के साथ उपलब्ध सभी प्रौद्योगिकी और डेटा का सर्वोत्तम उपयोग करता है जो सामाजिक और जैविक लगता है - जैसे किसी अन्य इंसान से बात करना।
"यह कुछ ऐसा है जिस पर हमें वास्तव में गर्व है, क्योंकि डगलस पूरी तरह से अवास्तविक पर चलने वाला सीजी चरित्र है," कहते हैं रोबल, जो लोकप्रिय 3डी निर्माण मंच जैसे व्यापक रूप से उपलब्ध तत्वों का उपयोग करने में विशेष गर्व महसूस करता है अवास्तविक इंजन, जो 3डी दृश्य-प्रभाव तत्वों को बनाने और उनमें हेरफेर करने की बात आने पर हॉलीवुड (और उससे पहले, वीडियो गेम उद्योग) के लिए पसंदीदा मंच बन गया है। “[डगलस] एक 3डी ऑब्जेक्ट है, इसलिए आप अवास्तविक में वे सभी चीजें कर सकते हैं जो आप किसी भी डिजिटल चरित्र के साथ कर सकते हैं। आप प्रकाश व्यवस्था बदल सकते हैं, उन्हें विभिन्न वातावरणों में रख सकते हैं, इत्यादि। लेकिन हम इस हाइब्रिड को भी बना रहे हैं [डगलस में शामिल बाकी सभी चीज़ों के साथ], ताकि हमें दोनों दुनियाओं का सर्वश्रेष्ठ मिल सके।"
जिधर देखो उधर
जितना अधिक टीम डगलस पर काम करती है, संभावित अनुप्रयोगों की सूची उतनी ही लंबी होती जाती है।
हेंडलर ने याद करते हुए कहा, "महामारी से पहले हम डगलस को एक कियोस्क के रूप में पेश करने की योजना बना रहे थे, जहां आप स्क्रीन पर आते हैं और उससे बात करते हैं।" "लेकिन फिर हमने सोचा, 'अरे, हमें वास्तव में उसे ज़ूम कॉल में लाना चाहिए।' उसे ज़ूम कॉल में शामिल करना और छोड़ना शानदार रहा।"
प्रदर्शन के दौरान, टीम ने डॉक्टर के कार्यालयों से डगलस के लिए संभावित आवेदनों की एक लंबी सूची देखी और ग्राहक सेवा, किसी दृश्य या किसी विशेष ऑन-स्क्रीन की योजना बनाने के शुरुआती चरणों के दौरान हॉलीवुड में उनकी उपयोगिता के लिए अनुक्रम। डगलस ने स्वयं भी कुछ सुझाव दिए, जिसमें सुझाव दिया गया कि वह स्टोरीबोर्डिंग और फिल्म और टीवी निर्माण के वैचारिक चरणों के लिए उपयुक्त होंगे। जिन लोगों के साथ वह बातचीत कर रहा है, उनसे ऑडियो और विज़ुअल दोनों संकेतों को संसाधित करने की उसकी क्षमता - खासकर जब भावनात्मक स्थिति की बात आती है - हेंडलर के अनुसार, ग्राहकों या चिकित्सा मार्गदर्शन की तलाश करने वालों के साथ व्यवहार करते समय उपयोगिता की एक अतिरिक्त परत भी प्रदान करता है।
जिस गति से डगलस उस सारी जानकारी को संसाधित कर सकता है और निष्क्रिय श्रोता से सक्रिय में स्थानांतरित हो सकता है कन्वर्सेशनलिस्ट में भी काफ़ी आकर्षण है, और दिखाता है कि उसके पीछे की तकनीक थोड़े ही समय में कितनी विकसित हो गई है समय।
“जब हमने थानोस बनाया, तो हमारे पास उसका एक फ्रेम था जिसे प्रस्तुत करने में 10 घंटे लगे। वह एक फ्रेम है,'' वह बताते हैं।
"डगलस के लिए, उसके पास एक दृष्टि पहचान प्रणाली है, इसलिए वह हमें देखता है और हमें पहचान सकता है, और आप जो कह रहे हैं उसका वह विश्लेषण कर रहा है, इसे शब्दों में बदल रहा है, और विभिन्न चैटबॉट्स को भेज रहा है," उन्होंने आगे कहा। “डगलस फिर एक प्रतिक्रिया बनाता है, इसे ऑडियो में बदल देता है, और उस ऑडियो का उपयोग अपना चेहरा दिखाने के लिए करता है। साथ ही, वह यह भी पता लगा रहा है कि उस भाषण के साथ शरीर की कौन सी गति चलती है, यह निर्धारित करता है कि कौन सी भावना उसमें फिट होगी, और उस शरीर की गति को अपने चेहरे के हावभाव के साथ प्रस्तुत करता है।
हेंडलर कहते हैं, "यह सब कुछ मिलीसेकंड में होता है।" “यह वे सभी प्रक्रियाएं हैं, जिनकी तुलना एक फीचर फिल्म में एक फ्रेम के लिए 10 घंटे से की जाती है। यह तो आश्चर्यजनक है। यह उतना यथार्थवादी नहीं है जितना हम फिल्म के लिए कर रहे हैं, लेकिन अगर आप सोचते हैं कि एक वास्तविक व्यक्ति की तरह उससे बात करने में कितनी चीजें हो रही हैं, तो यह बिल्कुल अभूतपूर्व है।
और बहुत शाब्दिक अर्थ में, जब उसकी क्षमता की बात आती है तो डगलस अक्सर अपना सर्वश्रेष्ठ वकील होता है।
रोबल ने बताया कि, कई मौकों पर, उन्होंने डगलस को अपनी प्रस्तुति का नेतृत्व करने देने का विकल्प चुना, ठीक है... स्वयं। परिणाम उनकी क्षमता के लिए उनकी अपेक्षा से भी बेहतर पिच साबित हुआ।
“[डगलस की प्रस्तुति] आश्चर्यजनक रूप से सम्मोहक थी। यह सिर्फ सिरी से हमें कुछ बताने के लिए नहीं कह रहा था, क्योंकि वह इस प्रक्रिया का हिस्सा था,'' रोबल ने याद किया। "उससे बात करना मज़ेदार है क्योंकि वह एक नवीनता है, लेकिन वह वास्तव में प्रभावी भी है। और आप यह सोचने से खुद को नहीं रोक सकते: शिक्षण या अन्य अनुप्रयोगों के बारे में क्या? आख़िरकार, आप देख सकते हैं कि वह कब ध्यान दे रहा है। आप उसे भावनात्मक प्रतिक्रिया दे सकते हैं और वह प्रतिक्रिया दे सकता है।
हालाँकि डगलस पहले से ही एक प्रभावशाली रचना है, डिजिटल डोमेन टीम का कहना है कि वह अभी भी एक काम है प्रगति - लेकिन समय के साथ उनका डिजिटल मानव किस प्रकार का काम कर सकता है, इसकी कोई सीमा नहीं है चलते रहो। कई मायनों में, यह पता लगाने की प्रक्रिया और लक्ष्य दोनों ही हैं कि डगलस क्या करने में सक्षम है।
रोबल कहते हैं, "हम ऐसा इसलिए कर रहे हैं क्योंकि हम ऐसा कर सकते हैं।" “जब आप कंप्यूटर पर हों और काम कर रहे हों, तो टाइप करना बहुत आसान होता है। लेकिन ऐसे कई बार और स्थान हैं जहां किसी व्यक्ति से बात करना और वह व्यक्ति आपके साथ बातचीत करना और आप पर प्रतिक्रिया करना सुखद होगा। मुझे लगता है कि हम भविष्य में एक बड़े बदलाव की ओर हैं।”
संपादकों की सिफ़ारिशें
- कैसे थानोस वीएफएक्स टीम ने द क्वारी के पात्रों को जीवंत किया (और फिर उन्हें मार डाला)