5 तरीके जिनसे भविष्य में ए.आई. असिस्टेंट वॉयस तकनीक को अगले स्तर पर ले जाएंगे

सेब

2011 में iPhone 4s पर सिरी की शुरुआत के बाद से, वॉयस असिस्टेंट छह अमेरिकी घरों में से एक में पाए जाने वाले स्मार्ट स्पीकर तकनीक के लिए अव्यवहारिक नौटंकी से आधार बन गए हैं।

अंतर्वस्तु

  • मो 'ज्ञान, कम समस्याएं
  • अधिक (और बेहतर) वैयक्तिकरण
  • सक्रिय होना
  • यह सब फीडबैक के बारे में है
  • नई बातचीत के तरीके

"सिरी से पहले, जब मैं [मैं क्या करता हूं] के बारे में बात करता था तो लोग घूरकर देखते थे," इनोवेशन के प्रमुख टॉम हेबनेर ने कहा नुअंस कम्युनिकेशंस, जो अत्याधुनिक ए.आई. विकसित करता है। वॉयस टेक्नोलॉजी, डिजिटल ट्रेंड्स को बताया। "लोग कहेंगे, 'क्या आप उन भयानक फोन सिस्टम का निर्माण करते हैं? मैं तुमसे नफरत करता हूं।' वह लोगों का एक समूह था जो आवाज प्रौद्योगिकी के साथ एकमात्र संपर्क था।'

अनुशंसित वीडियो

आज वह स्थिति नहीं है। eMarketer के पूर्वानुमान के अनुसार, लगभग 100 मिलियन स्मार्टफोन उपयोगकर्ता 2020 तक वॉयस असिस्टेंट का उपयोग करने लगेंगे। लेकिन जब ए.आई. सहायक अब कोई नवीनता नहीं हैं, हम अभी भी उनके विकास की शुरुआत में हैं। एक उत्पाद श्रेणी के रूप में वॉयस असिस्टेंट के वादे पर पूरी तरह खरा उतरने से पहले उन्हें अभी एक लंबा रास्ता तय करना है।

यहां पांच तरीके दिए गए हैं जिनसे प्रौद्योगिकी में सुधार करके इसे अधिक स्मार्ट और अधिक कुशल बनाया जा सकता है - और परिणामस्वरूप हमें अधिक उत्पादक जीवन जीने में मदद मिल सकती है। उन्हें "भविष्यवाणियाँ" कहें या "इच्छा सूची", ये चुनौतियाँ हैं जिन्हें हल करने की आवश्यकता है।

मो 'ज्ञान, कम समस्याएं

एलेक्सा आपको बता सकता है कि कुआलालंपुर, मलेशिया में मौसम कैसा है; 720 दक्षिण अफ़्रीकी रैंड के लिए आपको मिलने वाले अमेरिकी डॉलर की कुल संख्या, और "विस्थापनवाद" का उच्चारण कैसे करें। लेकिन उपभोक्ता ए.आई. सहायक, संक्षेप में, अप-टू-डेट की पूरी व्यवस्था वाले व्यक्ति के डिजिटल समकक्ष हैं विश्वकोश. आपको (उम्मीद है) सही जानकारी मिलेगी, लेकिन वहां विशेषज्ञता का कोई प्रो-ग्रेड स्तर नहीं है।

हेब्नर ने डिजिटल ट्रेंड्स को बताया, "आपके घर के सिस्टम के सामने चुनौती यह है कि वे बहुत सी चीजों को करने की कोशिश कर रहे हैं।"

इसे हल करना कठिन है, लेकिन ऐसा करना गेम-चेंजर होगा। Nuance एक विशिष्ट उपयोग-मामले के उद्देश्य से कई विशेषज्ञ प्रणालियाँ विकसित करता है, जैसे एयरलाइन ग्राहकों को प्रश्नों का उत्तर देने या डॉक्टरों को नोट्स लेने में मदद करना। ऐसा करने का मतलब न केवल ये सिस्टम अधिक विस्तृत जानकारी प्राप्त करने के लिए ड्रिल कर सकते हैं, बल्कि इसका मतलब यह भी है कि अधिक खुफिया जानकारी प्राप्त की जा सकती है। हेब्नर ने कहा, "लोग उन कंप्यूटरों के बारे में बहुत उत्साहित थे जो शब्दों को समझ सकते थे, लेकिन इससे कोई फर्क नहीं पड़ता अगर आप नहीं जानते कि उन शब्दों के साथ क्या करना है।"

एक उदाहरण जो वह देता है वह एक नुअंस प्रणाली का है जो न केवल तब समझती है जब डॉक्टर मरीजों के लिए संभावित दवाओं की सूची पढ़ते हैं, बल्कि संभावित संघर्षों को भी दूर कर सकते हैं। यह अधिकांश उपयोगकर्ता-ग्रेड ए.आई. की क्षमताओं से कहीं परे है। सहायक।

हालाँकि, विभिन्न डोमेन का अधिक विशेषज्ञ विस्तृत ज्ञान होना कुछ है एलेक्सा स्किल्स द्वारा संकेत दिया गया - परिवर्तनकारी हो सकता है। अपने स्मार्ट स्पीकर से कानूनी या चिकित्सीय सलाह माँगना प्रथम दृष्टया पागलपन जैसा लगता है। लेकिन वहाँ रहे हैं कानूनी बॉट जैसे क्षेत्रों में असाधारण प्रगति, जबकि हाल ही में प्रकाशित एक रिपोर्ट से पता चलता है कि Apple चाहता है कि Siri इसमें सक्षम हो 2021 तक उपयोगकर्ताओं के साथ स्वास्थ्य-केंद्रित बातचीत.

ए.आई. के लिए विशेषज्ञ ज्ञान ग्राफ़ सहायक अभी विज्ञान-कल्पना के सपनों का विषय हैं, हालाँकि ए हालिया Voicebot.ai रिपोर्ट यह दर्शाता है कि आभासी सहायकों के कौशल का विस्तार कितनी तेजी से हो रहा है। हालाँकि, जब कौशल विशिष्टताओं के क्षेत्र में आगे बढ़ते हैं, तो हमें बहुत आनंद मिलता है!

अधिक (और बेहतर) वैयक्तिकरण

आज के स्मार्ट स्पीकर का वैयक्तिकरण अभी भी प्रारंभिक अवस्था में है। आप वॉइस असिस्टेंट के उच्चारण और प्रस्तुतिकरण लिंग को बदल सकते हैं, कौशल जोड़ या हटा सकते हैं, और इसे अपने नाम और कार्यस्थल जैसी कुछ जानकारी फ़ीड कर सकते हैं। कुछ मामलों में, आप एकाधिक ध्वनि प्रोफ़ाइल सेट कर सकते हैं गूगल होम आपके घर के अलग-अलग सदस्यों को पहचान लेगा।

अमेज़ॅन इको शो

लेकिन अभी भी एक लंबा रास्ता तय करना बाकी है - हालाँकि रस निचोड़ने लायक होना चाहिए। मैटर्साइट कॉरपोरेशन ने ए.आई. विकसित किया है। कॉल सेंटर टेक्नोलॉजी, कहा जाता है पूर्वानुमानित व्यवहार अनुमार्गण, जो कॉल करने वालों के भाषण पैटर्न का विश्लेषण करता है और उन्हें संगत व्यक्तित्व प्रकारों वाले मानव संचालकों के साथ मिलाता है। कंपनी के अनुसार, एक अनुकूल व्यक्तित्व वाले व्यक्ति का मिलान करने पर एक सफल कॉल आएगी जो परस्पर विरोधी व्यक्तित्व प्रकार वाले व्यक्ति की तुलना में केवल आधे समय तक चलेगी।

समान दृष्टिकोण का उपयोग करने से ए.आई. प्राप्त हो सकता है। सहायक जो आपसे वैसे ही बात करते हैं जैसे आप संबोधित किया जाना पसंद करते हैं। यह जिस व्यक्ति से बात कर रहे हैं उसके उच्चारण और आवाज की मात्रा का मिलान करने जैसा सरल कुछ हो सकता है। या यह कुछ उपयोगकर्ताओं के लिए अधिक भावनात्मक शब्दों का उपयोग करके विचारों को संबोधित करने के तरीके को बदल सकता है, जबकि यह दूसरों के लिए अधिक सघन विस्तृत जानकारी का उपयोग कर सकता है। हो सकता है कि कुछ लोग लंबी बातचीत के लिए एक वॉइस असिस्टेंट चाहते हों, जबकि अन्य चाहते हों कि एक वॉयस असिस्टेंट सबसे संक्षिप्त तरीके से आवश्यक जानकारी दे सके। ए.आई. सहायकों को दोनों में सक्षम होना चाहिए।

जैसी तकनीकें गूगल डुप्लेक्स दिखाएँ कि A.I.-जनित संश्लेषित आवाज़ें और बातचीत कितनी सटीक हो रही हैं। जैसे-जैसे एआई गाने के अनुरोधों और भोजन टाइमर को पूरा करने की तुलना में अधिक जटिल क्षेत्रों में आगे बढ़ रहा है, उम्मीद है कि यह तकनीक एक प्रमुख भूमिका निभाएगी।

आवाज से उपयोगकर्ताओं की पहचान करने की क्षमता में प्रगति से इसमें सहायता मिल सकती है। हेबनेर का कहना है कि नुअंस की तकनीक केवल एक सेकंड के ऑडियो से उपयोगकर्ताओं की पहचान कर सकती है। उन्होंने कहा, "यह समझने में कि आप कौन हैं, सटीक संकेत पाने में 10 सेकंड लगते थे।" "उसकी शक्ति महत्वपूर्ण है।" आवाज के एक छोटे से अंश द्वारा उपयोगकर्ताओं की पहचान करने में सक्षम होने से समस्या का समाधान हो जाता है पासवर्ड की समस्या, और अधिक नाजुक गोपनीयता के लिए ध्वनि सहायकों का उपयोग करने का अवसर खोलता है जानकारी।

सक्रिय होना

एक अच्छा सहायक आपके कहने पर कुछ करेगा। एक महान सहायक को पूछने की आवश्यकता नहीं होगी। अभी, ए.आई. सहायक अभी भी इस पहले चरण पर हैं। उपयोगकर्ता अपना पसंदीदा गाना या अनुस्मारक प्राप्त कर सकते हैं, लेकिन आम तौर पर केवल तभी जब इसके लिए स्पष्ट रूप से अनुरोध किया गया हो। जैसे-जैसे लोग वॉयस असिस्टेंट के साथ अधिक सहज होते जा रहे हैं, उनके लिए विशुद्ध रूप से प्रतिक्रियाशील उपकरणों से आगे बढ़कर सक्रिय उपकरणों की ओर बढ़ने का एक शानदार अवसर है।

इस बारे में बड़े सवाल हैं कि लोग कुछ काम मशीनों को सौंपना चाहते हैं या नहीं।

आप ए.आई. के बारे में कैसा महसूस करेंगे? आपकी ओर से निर्णय लेने वाला सहायक? यह कुछ भी हो सकता है, जैसे जब कोई कहता है कि उन्हें ठंड लग रही है तो थर्मोस्टेट को तेज़ करना या दोपहर के भोजन की दोबारा बुकिंग करना इसलिए मिलना क्योंकि आप देर से चल रहे हैं, आपको अधिक व्यायाम करने या अपनी बचत में बेहतर होने के लिए प्रेरित करना तनख्वाह. जैसे-जैसे अधिक से अधिक स्मार्ट डिवाइस घर में प्रवेश कर रहे हैं, वॉयस असिस्टेंट द्वारा कमांड की जा सकने वाली चीजों की संख्या में काफी वृद्धि होगी।

इसका एक हिस्सा एक सामाजिक प्रश्न है कि लोग अपनी ओर से निर्णय लेने वाली मशीनों के प्रति कितने सहज हैं। इस बारे में बड़े सवाल हैं कि लोग कुछ काम मशीनों को सौंपना चाहते हैं या नहीं। इसे ऐसे समझें जैसे कि आप अपने क्रेडिट कार्ड और घर की चाबियाँ अपने हाड़-मांस के सहायक को दे रहे हैं - केवल स्काईनेट के बहुत बड़े छिड़काव के साथ। नकारात्मक पक्ष एक निश्चित मात्रा में नियंत्रण छोड़ना है। संभावित लाभ यह है कि आपका खाली समय बढ़ रहा है। बेशक, एक बड़ी तकनीकी चुनौती है...

यह सब फीडबैक के बारे में है

टॉम हेब्नर ने सक्रियता के मुद्दे पर एक बड़ी चुनौती की ओर इशारा किया: हमारी मशीनों को कैसे पता चलेगा कि उन्होंने इसे सही कर लिया है? अच्छे बनाम के विचार पर लौटना। महान सहायक, एक महान सहायक एक बड़ी बैठक से पहले आपकी सभी फ़ाइलें आपके बिना पूछे ही रख सकता है। लेकिन क्या होगा यदि वे ग़लत फ़ाइलें हों? घर पर ए.आई. बनाने में एक बड़ा मुद्दा सहायकों की अधिक सक्रियता यह है कि वर्तमान में यह बताने के सीमित तरीके हैं कि हमें जो जानकारी मिल रही है वह सही जानकारी है या नहीं।

ए.आई. रोबोट अच्छा काली मिर्च है
तोमोहिरो ओहसुमी/गेटी इमेजेज़

"अगर मैं हर दिन अपने घर में प्रवेश करते समय एक ही गाना मांगता हूं, और जिस दिन मैं अंदर जाता हूं और वह बजने लगता है, तो उन्हें कैसे पता चलेगा कि उन्होंने इसे सही तरीके से गाया है?" हेबनेर ने कहा. "अगर मैं इसे बजाना बंद नहीं करता, तो क्या इसका मतलब यह सही है? अगर मैं 'रुकें' कहता हूं, तो क्या इसका मतलब यह है कि उसने गलत किया है और उसे दोबारा ऐसा नहीं करना चाहिए? फीडबैक तंत्र उन कारणों में से एक है जिनके कारण आपको अधिक सक्रिय सिस्टम नहीं मिल पा रहे हैं।"

इंजीनियरों के लिए इसका पता लगाना चुनौतीपूर्ण है। जिस किसी के पास कभी कोई प्रशिक्षु रहा हो जो उनसे प्रत्येक कार्य पर निर्देश और प्रतिक्रिया मांगता हो, वह जानता है कि कभी-कभी किसी कार्य को सौंपने की तुलना में स्वयं करना अधिक आसान होता है। एक ए.आई. आपके जीवन को अधिक घर्षण रहित बनाने के लिए सहायक मौजूद है; यह पुष्टि करने के लिए कि क्या इसने अपना काम सही ढंग से किया है, आपको हर दिन दर्जनों लघु सर्वेक्षण नहीं देने चाहिए। इसे इस तरह से हल करने की आवश्यकता होगी जो इन उपकरणों की उपयोगकर्ता मित्रता के लिए बाधा न बने, और सिस्टम को आपकी प्राथमिकताएं जानने से पहले बहुत अधिक प्रशिक्षण की आवश्यकता न हो।

उत्तर क्या है? मुझे यकीन नहीं है। लेकिन, जैसा कि स्टीव जॉब्स ने एक बार कहा था, इसका पता लगाना ग्राहक का काम नहीं है।

नई बातचीत के तरीके

इसमें एक दृश्य है 2001: ए स्पेस ओडिसी जिसमें जानलेवा एचएएल 9000, चिंताजनक रूप से अभी भी सबसे प्रसिद्ध काल्पनिक ए.आई. इतिहास में सहायक, यह बताता है कि यह केवल यह निर्धारित करने के लिए माइक्रोफ़ोन का उपयोग नहीं करता है कि उससे क्या कहा जा रहा है। जब चालक दल के दो सदस्य बात करने के लिए एक स्थान चुनने का प्रयास करते हैं जहां उन्हें पता है कि एचएएल सुन नहीं सकता है, तो एचएएल को पता चलता है कि वह अभी भी उन्हें समझ सकता है, उनके होठों की हरकत को पढ़ने के आधार पर.

2001: ए स्पेस ओडिसी

फिल्म का डरावना पल? ज़रूर। ए.आई. कैसे होता है इसका एक उदाहरण सहायक भविष्य में काम कर सकते हैं? हम्म नि: संदेह!

यह विचार कि ध्वनि सहायकों को आवाज तक ही सीमित रखा जाना चाहिए, उन तरीकों की संभावित संख्या को कम कर देता है जिनसे वे हमारे साथ उपयोगी ढंग से बातचीत कर सकते हैं। के उदय के साथ चेहरे की पहचान और भावना-ट्रैकिंग प्रौद्योगिकियाँ, निरंतर आधार पर उपयोगकर्ताओं के बारे में एकत्रित बायोमेट्रिक्स की बढ़ती संख्या, और यहां तक ​​कि इसकी संभावना भी क्षितिज पर दिमाग पढ़ने वाली तकनीक, बहुत सारे अलग-अलग सिग्नल हैं जिनका उपयोग ए.आई. द्वारा किया जा सकता है। सहायक अपने निष्कर्ष निकालने के लिए।

यह विचार कि, अब से 10 साल बाद, हम इन ए.आई. को नियंत्रित करने के लिए केवल आवाज का उपयोग करेंगे। असिस्टेंट्स 80 के दशक की शुरुआत में पीसी को देखने जैसा है और सोचते हैं कि हमारे पास कभी भी एक कीबोर्ड से अधिक नहीं होगा।

संपादकों की सिफ़ारिशें

  • भावना-संवेदन ए.आई. यहाँ है, और यह आपके अगले नौकरी साक्षात्कार में हो सकता है
  • एप्पल का नया सिएटल परिसर सिरी, कृत्रिम बुद्धिमत्ता के लिए बड़ी चीजें हो सकता है
  • Google ने A.I का उपयोग करने का एक तरीका ढूंढ लिया है पवन ऊर्जा की उपयोगिता को बढ़ावा देना

श्रेणियाँ

हाल का