एआर का भविष्य ईयरबड्स है, चश्मा नहीं

एक व्यक्ति के कान में ईयरबड का चित्रण
जेनेवीव पोब्लानो/डिजिटल ट्रेंड्स ग्राफिक्स

रोमित रॉय चौधरी के कान बड़े हैं। लेकिन अंदर नहीं वह रास्ता। रॉय चौधरीअर्बाना-शैंपेन में इलिनोइस विश्वविद्यालय में इलेक्ट्रिकल इंजीनियरिंग और कंप्यूटर विज्ञान के प्रोफेसर, अपने शब्दों की प्रतिमान-परिवर्तनकारी क्षमता में एक मजबूत विश्वास रखते हैं। सुनने योग्य (नहीं, पहनने योग्य नहीं) कंप्यूटिंग.

अंतर्वस्तु

  • दिमाग पढ़ने वाले ईयरबड?
  • कानों में उतारना
  • डोर्मेहल का नियम
  • पहनने योग्य वस्तुओं का वादा

इसका मतलब है कि हार्डवेयर और सॉफ्टवेयर के लिए विशाल संभावनाओं को शामिल करना जो आपके सिर के किनारों पर उन दो फैंसी श्रवण छिद्रों का उपयोग करके चलते हैं। और गोपनीयता और सुरक्षा अनुप्रयोगों से लेकर चिकित्सा निदान तक सब कुछ विकसित करने में सहायता करना संवर्धित वास्तविकता के भविष्य पर केंद्रित उपकरण, वह अपनी सहायता के लिए विशेषज्ञों की एक क्रैक टीम को इकट्ठा कर रहा है।

अनुशंसित वीडियो

उन्होंने डिजिटल ट्रेंड्स को बताया, "मैं कंप्यूटर विज्ञान और इलेक्ट्रिकल इंजीनियरिंग में लगभग किसी का भी उपयोग कर सकता हूं।" "मेरे रडार पर समस्याओं का दायरा बहुत बड़ा है।"

संबंधित

  • एफबीआई की डीपफेक चेतावनी से चिंतित हैं? इन विशेषज्ञ युक्तियों का पालन करें
  • OpenAI का नया ChatGPT ऐप iPhone और iPad के लिए मुफ़्त है
  • अब आप चैटजीपीटी एआई के साथ वीडियो चैट कर सकते हैं - यह कैसा दिखता है
ऐप्पल एयरपॉड्स प्रो और सैमसंग गैलेक्सी बड्स लाइव
जारोन श्नाइडर/डिजिटल ट्रेंड्स

इयरफ़ोन पहले से ही एक बड़ा बाज़ार है। सेब का AirPodsवायरलेस ईयरबड्स की इसकी श्रृंखला ने अकेले 2019 में 60 मिलियन यूनिट्स बेचीं। पिछले साल यह संख्या थी बढ़कर 85 मिलियन होने का अनुमान है. आज, कई कंपनियां स्मार्ट ईयरबड बना रही हैं जो सक्रिय शोर रद्दीकरण, ए.आई. प्रदान करते हैं। स्मार्ट सहायक, और भी बहुत कुछ।

एयरपॉड्स से कई दशक पहले, 1980 के दशक में, वॉकमैन था, जो शायद पहली आधुनिक पहनने योग्य तकनीक थी, जो उपयोगकर्ताओं को जहां भी वे जाते थे, अपना संगीत अपने साथ ले जाने की अनुमति देती थी। वॉकमैन ने उपयोगकर्ताओं को न केवल उन बातों पर नियंत्रण दिया जो वे सुनते थे (कहते हैं, द स्मिथ्स), बल्कि, इसके प्लास्टिक ईयरबड्स के कारण उनके कानों को प्लग करके, जो उन्होंने नहीं सुना (कहते हैं, उनके माता-पिता) पर भी। इसने लोगों को अपने जीवन में साउंडट्रैक बनाने और उस पर नियंत्रण स्थापित करने की अनुमति दी, जिससे हमें अर्थ के अपने व्यक्तिगत बुलबुले मिले। जबकि बूमबॉक्स दूसरों को हमारा संगीत सुनने देने या, कुछ मामलों में, मजबूर करने के बारे में था, वॉकमैन ने सुनने को मौलिक रूप से व्यक्तिगत, पृथक अनुभव बना दिया।

फ़्लोरियन श्मेट्ज़/अनस्प्लैश

लेकिन रॉय चौधरी और उनकी टीम इससे भी आगे जाना चाहती है. वे आज के ईयरबड्स को एक बिल्कुल नए कंप्यूटिंग प्लेटफ़ॉर्म में बदलना चाहते हैं, जो कुछ मामलों में, आपकी पहुंच की आवश्यकता को प्रतिस्थापित कर सके। स्मार्टफोन या कंप्यूटर. यदि इस युग में, वॉकमैन ने सड़क पर चलने पर आनंद लेने के लिए हर किसी को ध्वनि का अपना व्यक्तिगत बुलबुला जारी किया बेहतर तकनीक और वैयक्तिकरण, उन्हीं बुलबुलों का उपयोग नए, रोमांचक और - कभी-कभी - थोड़े अजीब तरीके से किया जा सकता है तौर तरीकों।

दिमाग पढ़ने वाले ईयरबड?

रॉय चौधरी ने कहा, "पहनने योग्य कंप्यूटिंग बाजार का अधिकांश हिस्सा [अब तक] उन उपकरणों पर केंद्रित है जो शरीर के निचले हिस्से पर पहने जाते हैं, ज्यादातर आपकी जेब में या आपकी कलाई पर, शायद आपके जूते में।" इसका मतलब है कि आप शरीर के निचले हिस्से को समझ पाते हैं, जैसे कि आप अपने हाथों से, अपनी कलाइयों से, अपने पैरों से क्या कर रहे हैं। लेकिन ऐसी बहुत सी जानकारी है जो शरीर के ऊपरी हिस्से पर उत्पन्न होती है, मुख्य रूप से आपके सिर पर - जैसे सुनना, बोलना, खाना, चेहरे की भावनाएं, चिकित्सा संबंधी जानकारी के लिए संभावित सुराग - ये हो सकते हैं अमूल्य. पवित्र कब्र, इसकी अंतिम सीमा भी हो सकती है मस्तिष्क के संकेतों को महसूस करना आपके सिर के करीब से।"

इन-ईयर डिवाइस को न केवल निष्क्रिय रूप से सुनने में सक्षम होने, बल्कि उससे बात करने में सक्षम होने का विचार, सिरी जैसे स्मार्ट सहायकों के पीछे का आधार है। लेकिन भाषण, जैसा कि आज के ए.आई. में उपयोग किया जाता है। सहायक, जानबूझकर उथला है। एक तस्वीर (हजारों शब्दों के बराबर) की तुलना में, सिरी जानकारी के त्वरित विस्फोट के मामले में सर्वश्रेष्ठ है, जैसे मौसम का पूर्वानुमान ढूंढना या रसोई में टाइमर सेट करना। लेकिन यह सीमा के बारे में है. सुनने योग्य कंप्यूटिंग का विचार उन कुछ अन्य चीजों को उतारने के तरीके ढूंढना है जिनके लिए हमें वर्तमान में स्क्रीन पर घूरना पड़ता है और उन्हें अपने कानों में (और) डालना पड़ता है।

गीत की पहचान ऐ
कृष्णा पी. मियापुरम

उन्होंने कहा, "आप विजुअल स्क्रीन पर जो कुछ भी कर रहे हैं, उसमें आप अपना पूरा संज्ञानात्मक ध्यान लगा रहे हैं।" “पढ़ने के लिए - भले ही यह एक मूर्खतापूर्ण मजाक हो जिसे आप स्क्रीन पर पढ़ते हैं - आप किसी और चीज़ पर ध्यान केंद्रित नहीं कर सकते। पढ़ना आपका पूरा संज्ञानात्मक ध्यान लेता है। मेरा मानना ​​है कि ऐसी कई चीजें हैं जो आपके पूर्ण संज्ञानात्मक ध्यान के योग्य नहीं हैं। हम उन्हें दृश्य क्षेत्र से बाहर निकाल सकते हैं, और उन्हें अप्रयुक्त और असंबद्ध ऑडियो डोमेन में धकेल सकते हैं, जहां मानव मस्तिष्क स्वाभाविक रूप से बहुत अच्छी तरह से विकसित हुआ है ऐसी ऑडियो जानकारी के बीच मल्टीप्लेक्स... इन सरल चीजों को क्यों न लें, और उन्हें अपने संज्ञानात्मक, दृश्य संज्ञानात्मक चैनल से दूर और ध्वनिक में ले जाएं बैंडविड्थ?”

टीम द्वारा हाल ही में किए गए एक प्रयोग में उन तरीकों की खोज शामिल थी जिनसे हम पाठ का अधिक सार्थक उपभोग कर सकते हैं सुनाई देने योग्य रूप। यदि आप कोई लेख पढ़ रहे हैं, तो हो सकता है कि आपको कोई ऐसा कीवर्ड दिखाई दे जिसमें आपकी रुचि हो, और आप उसी बिंदु पर पढ़ना शुरू कर दें। हालाँकि, ऐसा करने का कोई आसान तरीका नहीं है, उदाहरण के लिए, जब आप पॉडकास्ट सुन रहे हों।

"उन चीजों में से एक जो हम अपनी प्रयोगशाला में करने की कोशिश कर रहे हैं वह है [पूछें], क्या मैं किसी लेख को सुनने की गति तेज कर सकता हूं?" रॉय चौधरी ने कहा।

कानों में उतारना

समूह के प्रमाण-अवधारणा प्रदर्शन में, श्रोता के पास एक लेख में कई पैराग्राफ होते हैं जो उन्हें एक साथ पढ़ते हैं। इस कार्य को करने की तरकीब सिग्नल प्रोसेसिंग का उपयोग करके प्रत्येक पैराग्राफ को ऐसी ध्वनि प्रदान करना है जैसे कि यह एक अलग दिशा से आ रहा हो - यह कुछ-कुछ बैठने जैसा है एक रेस्तरां में और आस-पास की टेबलों पर चार बार बातचीत हो रही थी, लेकिन एक में डायल करना क्योंकि वहां रहने वाले लोग एक ऐसे व्यक्ति का उल्लेख करते हैं जिसे आप कहते हैं जानना। इस कार्य को बेहतर बनाने के लिए, टीम ने ईयरबड्स में जड़त्वीय माप इकाई (आईएमयू) को टैप किया ताकि उपयोगकर्ता अपना सिर थोड़ा घुमाकर एक विशेष आवाज (पाठ का एक भाग) उठा सकता है दिशा।

उन्होंने कहा, "मैं इस परियोजना को 'ध्वनिक क्षेत्र में पढ़ना' कहता हूं, जहां मैं तीसरे पैराग्राफ की आवाज की दिशा को देखता हूं, और वह आवाज तेज हो जाती है और अन्य आवाजें धीमी हो जाती हैं।"

यह सब भाषण के बारे में भी नहीं है। टीम ने यह भी पाया है कि इयरफ़ोन में माइक्रोफ़ोन और आईएमयू दोनों का उपयोग चेहरे में अविश्वसनीय रूप से सूक्ष्म कंपन को पकड़ने के लिए किया जा सकता है, जैसे कि दांत किटकिटाता व्यक्ति या चेहरे की मांसपेशियां तमतमाती या मुस्कुराती हैं। नहीं, आप संभवतः अपने स्मार्टफोन को दांतों से मोर्स कोड के माध्यम से संदेश भेजने के लिए नहीं छोड़ेंगे। लेकिन यह विचार कि चेहरे की इन छोटी-छोटी विकृतियों, जैसे कि आपके दाहिनी ओर के दांतों को खिसकाना, का उपयोग किया जा सकता है कमांड निष्पादित करें - या यहां तक ​​कि दो-कारक प्रमाणीकरण के लिए पहचान पुष्टि के रूप में कार्य करें - निश्चित रूप से है दिलचस्प।

"हर कोई सिरी से परिचित है, लेकिन कल्पना करें कि सिरी के लिए कितने संभावित उपयोग खुल सकते हैं यदि इसमें केवल एक स्थानिक आयाम होता, एक वेंट्रिलोक्विस्ट की तरह जो अपनी आवाज फेंकने में सक्षम है।"

यह चिकित्सीय निदान जैसी चीज़ों के लिए अनुदैर्ध्य डेटा कैप्चर करने के लिए भी उपयोगी हो सकता है। उदाहरण के लिए, चिंता विकारों का निदान दांतों की गति में पाए गए कुछ पैटर्न से किया जा सकता है। रॉय चौधरी ने यह भी कहा कि ऐसे शोधकर्ता हैं जो हृदय गति, ग्लूकोज स्तर, मांसपेशियों की गतिविधि और बहुत कुछ मापने के लिए कानों के माध्यम से रक्त के प्रवाह को मापने जैसी समस्याओं पर काम कर रहे हैं।

क्या आप कोई अन्य संभावित उपयोग चाहते हैं? कैसा रहेगा श्रव्य संवर्धित वास्तविकता? संवर्धित वास्तविकता वर्तमान में वास्तविक दुनिया के शीर्ष पर कंप्यूटर-जनित वस्तुओं को ओवरले करने के लिए सबसे अच्छी तरह से जानी जाती है। लेकिन ऐसा कोई कारण नहीं है कि संवर्द्धन पूरी तरह से दृश्य स्पेक्ट्रम पर हो। रॉय चौधरी की टीम आपके परिदृश्य पर कुछ ध्वनियों को मैप करने के लिए सिग्नल प्रोसेसिंग तकनीक का उपयोग करने की संभावना से उत्साहित है, ताकि आपके रास्ते को नेविगेट किया जा सके। हवाई अड्डे, संग्रहालय, या किसी अन्य सार्वजनिक स्थान पर "मेरे पीछे आओ" कहने वाली आवाज़ की ओर चलना शामिल हो सकता है, जो उस दिशा से आती हुई प्रतीत होती है जिस दिशा में आपको जाना है में।

महोदय मै

हर कोई सिरी से परिचित है, लेकिन कल्पना करें कि सिरी के लिए कितने संभावित उपयोग खुल सकते हैं यदि इसका केवल एक स्थानिक आयाम होता, एक वेंट्रिलोक्विस्ट की तरह जो अपनी आवाज फेंकने में सक्षम है। यह स्थानिक संवर्द्धन बड़ी आभासी बैठकों को बेहतर बनाने में भी मदद कर सकता है, जिसमें प्रत्येक व्यक्ति की आवाज़ को एक विशिष्ट स्थान पर मैप किया जाता है, जिससे तुरंत यह बताना आसान हो जाता है कि कौन बोल रहा है।

निस्संदेह, ये सब पूरा नहीं होगा। वे एक कॉपीराइटर का इंजीनियरिंग संस्करण हैं जो किसी विज्ञापन के लिए विचार तैयार करता है। हो सकता है कि उनमें से कई लोग शामिल न हो पाएं, लेकिन एक या दो उदाहरण अत्यंत उपयोगी हो सकते हैं।

डोर्मेहल का नियम

यह एक और कारण है कि रॉय चौधरी निरंतर सुनने योग्य कंप्यूटिंग की क्षमता और वास्तविक दुनिया में इसकी सफलता की संभावनाओं के बारे में इतने उत्साहित हैं। सामाजिक प्रतिक्रियाएँ प्रौद्योगिकीविदों की तुलना में कहीं अधिक तय करती हैं कि कौन सी प्रौद्योगिकियाँ पकड़ में आती हैं। नई प्रौद्योगिकियाँ, परिभाषा के अनुसार, नई हैं। नया, अजीब के समान हो सकता है। मेरे खुद के एक फॉर्मूलेशन का उपयोग करने के लिए (आने वाली पीढ़ी पर वार के लिए इसे डोरमेहल का नियम कहें), किसी भी नई तकनीक की आउट-ऑफ-द-गेट उपयोगिता को इसके उपयोग की अंतर्निहित नीरसता को दोगुना करना चाहिए।

"यह एक समस्या है क्योंकि बहुत कम प्रौद्योगिकियाँ पूरी तरह से उभर कर सामने आती हैं।"

पर्सनल कंप्यूटर, जिसे लोग अपने घरों में उपयोग करते थे, बाज़ार में अपने पहले कई वर्षों तक बहुत कम उपयोग कर सका क्योंकि इसके उपयोग का सामाजिक जोखिम बहुत कम था। एक लैपटॉप, जिसका उपयोग सार्वजनिक रूप से किया जाता है, का जोखिम थोड़ा अधिक था। पहनने योग्य वस्तुएं, जो विशेष रूप से शरीर पर पहने जाने के कारण प्रमुख हैं, अधिकांश तकनीकी की तुलना में अधिक अजीब हैं। तकनीक का एक टुकड़ा जो सिर पर फंसने वाला है, बोर्ग ड्रोन पर साइबरनेटिक इम्प्लांट जैसा दिखता है, उसे होना ही चाहिए शानदार और तत्काल उपयोगी यदि उपयोगकर्ता इसे देखे जाने के हानिकारक सामाजिक प्रभाव के लायक समझता है इसे पहनना.

जारोन श्नाइडर/डिजिटल ट्रेंड्स

यह एक समस्या है क्योंकि बहुत कम प्रौद्योगिकियाँ पूर्ण रूप से उभर कर सामने आती हैं। ज्यादातर मामलों में, किसी उत्पाद की पहली कुछ पीढ़ियां त्रुटिपूर्ण वादे पर बनाई जाती हैं, इससे पहले कि तीसरी पुनरावृत्ति के आसपास अधिक आकर्षक पेशकश सामने आती है। यदि कोई अत्यधिक दृश्यमान उत्पाद पहले दिन से ही वितरित होने में विफल रहता है, तो लंबी अवधि में इसकी सफलता की संभावना विफल हो सकती है, भले ही वह अंततः एक अच्छे उत्पाद में बदल जाए। पुराने तकनीकी प्रशंसकों के लिए, पोर्टेबल ऐप्पल न्यूटन डिवाइस और लिखावट पहचान में इसके शुरुआती चरण पर विचार करें। युवा प्रशंसकों के लिए, डोरमेहल का नियम Google ग्लास की विफलता को समझा सकता है, जो जबरदस्त सामाजिक कलंक और निर्णय के साथ आया और काम किया... लगभग ठीक।

जैसा कि रॉय चौधरी ने कहा, ईयरबड अलग हैं। उनके बारे में जो भी लड़ाइयाँ कभी हुई होंगी, वे कमोबेश पहले ही जीती जा चुकी हैं। उन्होंने कहा, "समाज ने पहले से ही इयरफ़ोन पहनने वाले लोगों को स्वीकार कर लिया है।" “… कुछ अर्थों में, यह केवल एल्गोरिदम और सेंसर और हार्डवेयर हैं जिन्हें अब अपग्रेड किया जाना है। यह केवल एक तकनीकी बाधा है, और अब कोई सामाजिक, मनोवैज्ञानिक बाधा नहीं है।"

पहनने योग्य वस्तुओं का वादा

तथ्य यह है कि ईयरबड्स को स्वीकार कर लिया गया है, इससे जोखिम कम हो गया है, और इसका मतलब है कि अब कोई तत्काल द्विआधारी परिणाम नहीं होना चाहिए। भले ही रॉय चौधरी द्वारा वर्णित सबसे ऊंचे लक्ष्य लंबे समय तक हासिल नहीं किए गए हों, वृद्धिशील सुधार एक सिद्ध फॉर्म फैक्टर में उपयोगिता जोड़ देगा।

"ऊंचे लटकते फल [ऐसी चीजें हैं] 'मेरे दांतों के हावभाव से, मैं दौरे का पता लगा सकता हूं' या 'मेरे दांतों से' चेहरे के हावभाव से, मैं व्यक्ति के मूड को समझ सकता हूं ताकि यह मूड के लिए फिटबिट जैसा हो जाए,'' उन्होंने कहा कहा। “लेकिन अगर वह विफल भी होता है, तो यह उत्पाद पाइपलाइन में बाधा नहीं डालता है। हालाँकि, यदि वे सफल होते हैं, तो यह उत्पाद को एक शानदार चीज़ में बदल देता है।'

रॉय चौधरी का मानना ​​है कि सुनने योग्य कंप्यूटिंग की संभावना लगभग असीमित है। उन्होंने कहा, "मुझे लगता है कि आगे का रास्ता भाषण से कहीं आगे तक जाता है।" “मैं कहूंगा कि भाषण सबसे भीतरी चक्र है, जो [इस तकनीक के] मूल में है। उस अंतःक्रिया के बाहर सामान्य रूप से ध्वनिकी है। और बाहरी ध्वनिकी सभी प्रकार के अन्य सेंसर और क्षमताएं हैं। यदि आप सोचते हैं कि हम इस प्लेटफ़ॉर्म का निर्माण कैसे शुरू करने जा रहे हैं, तो भविष्य में संभावित परिणाम सामने आएंगे भाषण-आधारित बातचीत: 'टाइमर सेट करें,' 'अरे सिरी, आज मौसम क्या है?' लेकिन यह बहुत दूर तक जा सकता है उसके परे।"

रॉय चौधरी के साथ पहनने योग्य कंप्यूटिंग पर काम करने वाले अन्य शोधकर्ता भी शामिल हैं झिजियन यांग, यू-लिन वेई, जय प्रकाश, और ज़ियू ली.

संपादकों की सिफ़ारिशें

  • चैटजीपीटी के आईफोन ऐप में अब बिंग बिल्ट-इन है
  • Apple ने WWDC में सिरी को ChatGPT किलर नहीं बनाया - और इससे मुझे डर लगता है
  • चैटजीपीटी को भूल जाइए - सिरी और गूगल असिस्टेंट ये 4 काम बेहतर तरीके से करते हैं
  • रिपोर्ट में दावा किया गया है कि ऐप्पल वॉच के लिए ऐप्पल एक एआई हेल्थ कोच बना रहा है
  • यह विचित्र AI डिवाइस भविष्य में आपके स्मार्टफोन की जगह ले सकता है

श्रेणियाँ

हाल का

जनवरी 2023 के सर्वश्रेष्ठ वीडियो गेम

जनवरी 2023 के सर्वश्रेष्ठ वीडियो गेम

गेम रिलीज़ के मामले में 2023 पहले से ही एक मजबू...

एमसीयू के नए थानोस, कांग के बारे में वह सब कुछ जो आपको जानना आवश्यक है

एमसीयू के नए थानोस, कांग के बारे में वह सब कुछ जो आपको जानना आवश्यक है

कांग विजेता की रिलीज के साथ मार्वल सिनेमैटिक यू...