مستقبل الواقع المعزز هو سماعات الأذن، وليس النظارات

رسم توضيحي لسماعة أذن في أذن شخص ما
جينيفيف بوبلانو / رسومات الاتجاهات الرقمية

روميت روي تشودري كبير في الأذنين. ولكن ليس في الذي - التي طريق. روي تشودري، أستاذ الهندسة الكهربائية وعلوم الكمبيوتر في جامعة إلينوي في أوربانا شامبين، وهو مؤمن بشدة بإمكانية التحول النموذجي لما يسميه الحوسبة القابلة للأذن (لا، غير القابلة للارتداء)..

محتويات

  • سماعات أذن لقراءة الأفكار؟
  • التفريغ إلى الأذنين
  • قانون دورميل
  • الوعد بالأجهزة القابلة للارتداء

وهذا يعني الاستفادة من الإمكانيات الهائلة للأجهزة والبرامج التي تعمل باستخدام فتحتي الاستماع الرائعتين الموجودتين على جانبي رأسك. وللمساعدة في تطوير كل شيء بدءًا من تطبيقات الخصوصية والأمان وحتى التشخيص الطبي الأدوات التي تركز على مستقبل الواقع المعزز، يقوم بتجميع فريق من الخبراء لمساعدته.

مقاطع الفيديو الموصى بها

وقال لـ Digital Trends: "يمكنني الاستعانة بأي شخص تقريبًا في علوم الكمبيوتر والهندسة الكهربائية". "إن سلسلة المشاكل التي أشاهدها على راداري ضخمة."

متعلق ب

  • هل أنت قلق بشأن تحذير مكتب التحقيقات الفيدرالي بشأن التزييف العميق؟ اتبع نصائح الخبراء هذه
  • تطبيق ChatGPT الجديد من OpenAI متاح مجانًا لأجهزة iPhone وiPad
  • يمكنك الآن إجراء محادثة فيديو باستخدام ChatGPT AI — وهذا ما يبدو عليه الأمر
Apple AirPods Pro وSamsung Galaxy Buds Live
جارون شنايدر / الاتجاهات الرقمية

سماعات الأذن هي بالفعل سوق ضخمة. تفاح ايربودز، خطها من سماعات الأذن اللاسلكية، باعت 60 مليون وحدة في عام 2019 وحده. العام الماضي كان هذا العدد ومن المتوقع أن يرتفع إلى 85 مليونا. واليوم، تقوم العديد من الشركات بتصنيع سماعات أذن ذكية توفر خاصية إلغاء الضوضاء النشطة، والذكاء الاصطناعي. المساعدين الأذكياء، وأكثر من ذلك.

قبل عدة عقود من ظهور AirPods، في الثمانينيات، كان هناك جهاز Walkman، الذي ربما كان أول تقنية حديثة يمكن ارتداؤها، والتي سمحت للمستخدمين بأخذ موسيقاهم معهم أينما ذهبوا. أعطى جهاز Walkman للمستخدمين السيطرة ليس فقط على ما يستمعون إليه (على سبيل المثال، The Smiths)، ولكن أيضًا، من خلال سماعات الأذن البلاستيكية التي تسد آذانهم، وما لم يستمعوا إليه (على سبيل المثال، آبائهم). لقد سمح للناس بإبداع وممارسة السيطرة على الموسيقى التصويرية لحياتهم، مما منحنا جميعًا فقاعاتنا الفردية من المعنى. في حين أن جهاز Boombox كان يدور حول السماح - أو في بعض الحالات، إجبار - الآخرين على الاستماع إلى موسيقانا، فإن جهاز Walkman جعل الاستماع تجربة شخصية ومعزولة بشكل أساسي.

فلوريان شميتز / Unsplash

لكن روي تشودري وفريقه يريدون الذهاب إلى أبعد من ذلك. إنهم يسعون إلى تحويل سماعات الأذن اليوم إلى منصة حوسبة جديدة تمامًا يمكنها، في بعض الحالات، أن تحل محل الحاجة إلى الوصول إلى سماعاتك الخاصة. هاتف ذكي أو الكمبيوتر. إذا أصدر جهاز Walkman للجميع فقاعة صوتية خاصة بهم ليستمتعوا بها أثناء سيرهم في الشارع، في هذا العصر التكنولوجيا والتخصيص الأكثر ذكاءً، يمكن تسخير تلك الفقاعات نفسها في أشياء جديدة ومثيرة - وفي بعض الأحيان - غريبة بعض الشيء طرق.

سماعات أذن لقراءة الأفكار؟

وقال روي شودري: "معظم سوق الحوسبة القابلة للارتداء ركزت [حتى الآن] على الأجهزة التي يتم ارتداؤها في الجزء السفلي من الجسم، ومعظمها في جيوبك أو على معصميك، وربما في حذائك". "وهذا يعني أنك تستطيع أن تستشعر الجزء السفلي من الجسم، مثل ما تفعله بيديك، ومعصميك، وساقيك. ولكن هناك الكثير من المعلومات التي يتم توليدها في الجزء العلوي من الجسم، وخاصة رأسك - مثل الاستماع، والتحدث، والأكل، وعواطف الوجه، ومن المحتمل أن تكون أدلة للمعلومات المتعلقة بالطب - قد تكون كذلك لا يقدر بثمن. الكأس المقدسة، الحدود النهائية لهذا، قد تكون كذلك استشعار إشارات الدماغ من قريب من رأسك."

إن فكرة القدرة على الاستماع ليس فقط بشكل سلبي إلى جهاز داخل الأذن، ولكن أيضًا التحدث إليه، هي الأساس وراء المساعدين الأذكياء مثل Siri. لكن الكلام، كما هو مستخدم في الذكاء الاصطناعي اليوم. المساعدين، سطحية عمدا. بالمقارنة مع صورة (تساوي ألف كلمة)، فإن Siri هو في أفضل حالاته مع تدفقات سريعة من المعلومات، مثل العثور على توقعات الطقس أو ضبط مؤقت في المطبخ. لكن هذا يتعلق بالحد الأقصى. تتمثل فكرة الحوسبة القابلة للأذن في إيجاد طرق لتفريغ بعض الأشياء الأخرى التي يتعين علينا حاليًا التحديق في الشاشات من أجلها ووضعها في (وفي) آذاننا.

تحديد الأغنية بالنيابة
كريشنا ب. ميابورام

وقال: "كل ما تفعله على الشاشة المرئية، فإنك تضع كامل انتباهك الإدراكي فيه". "القراءة - حتى لو كانت نكتة سخيفة تقرأها على الشاشة - لا يمكنك التركيز على أي شيء آخر. القراءة تأخذ اهتمامك المعرفي الكامل. أعتقد أن هناك العديد من الأشياء التي لا تستحق اهتمامك المعرفي الكامل. يمكننا إخراج هؤلاء من المجال البصري، ودفعهم إلى المجال الصوتي غير المستغل وغير المحتكر، حيث تطور العقل البشري بشكل طبيعي بشكل جيد للغاية تعدد الإرسال بين هذه المعلومات الصوتية... لماذا لا تأخذ هذه الأشياء البسيطة، وتنقلها بعيدًا عن قناتك المعرفية والبصرية المعرفية وإلى القناة الصوتية عرض النطاق؟"

تضمنت تجربة حديثة أجراها الفريق استكشاف الطرق التي يمكننا من خلالها استهلاك النص بشكل أكثر فائدة مسموع استمارة. إذا كنت تقرأ مقالًا، فقد ترى كلمة رئيسية تهمك، وتبدأ في القراءة عند تلك النقطة. ومع ذلك، لا توجد طريقة سهلة للقيام بذلك، على سبيل المثال، عندما تستمع إلى بودكاست.

"أحد الأشياء التي نحاول القيام بها في مختبرنا هو [اسأل]، هل يمكنني تسريع عملية الاستماع إلى مقال ما؟" قال روي تشودري.

التفريغ إلى الأذنين

في العرض التوضيحي لإثبات المفهوم للمجموعة، يكون لدى المستمع فقرات متعددة في مقال تتم قراءتها لهم في وقت واحد. تكمن الحيلة في إنجاز هذا العمل في استخدام معالجة الإشارات لجعل كل فقرة تبدو وكأنها قادمة من اتجاه مختلف - إنه يشبه إلى حد ما الجلوس في مطعم وإجراء أربع محادثات على الطاولات المحيطة، ولكن الاتصال بمحادثة واحدة لأن الركاب يذكرون شخصًا ما يعرف. ولجعل هذا العمل أفضل، قام الفريق بالضغط على وحدة قياس القصور الذاتي (IMU) الموجودة في سماعات الأذن بحيث يمكن للمستخدم رفع صوت معين (جزء واحد من النص) عن طريق تحريك رأسه قليلاً في ذلك اتجاه.

وقال: "أسمي هذا المشروع "القراءة في المجال الصوتي"، حيث أنظر إلى اتجاه صوت الفقرة الثالثة، ويصبح هذا الصوت أعلى والأصوات الأخرى خافتة نوعًا ما".

الأمر لا يتعلق بالكلام أيضًا. وقد وجد الفريق أيضًا أنه يمكن استخدام كل من الميكروفون وIMU في سماعات الأذن لالتقاط اهتزازات دقيقة للغاية في الوجه، صغيرة مثل ميكروفون. شخص يثرثر بأسنانه أو عضلات الوجه عابسة أو مبتسمة. لا، ربما لن تتخلى عن هاتفك الذكي لتتبادل الرسائل عبر شفرة مورس بأسنانك. لكن فكرة أن هذه التشوهات الدقيقة في الوجه، مثل تحريك أسنانك اليمنى، يمكن استخدامها من المؤكد أن تنفيذ الأوامر - أو حتى العمل كتأكيد للهوية للمصادقة الثنائية مثير للاهتمام.

"الجميع على دراية بـ Siri، لكن تخيل عدد الاستخدامات المحتملة التي يمكن فتحها لـ Siri إذا كان لها بعد مكاني فقط، مثل المتكلم من بطنه القادر على إلقاء صوته."

قد يكون هذا مفيدًا أيضًا في التقاط البيانات الطولية لأشياء مثل التشخيص الطبي. على سبيل المثال، يمكن تشخيص اضطرابات القلق من خلال أنماط معينة يتم اكتشافها في حركة الأسنان. وأشار روي تشودري أيضًا إلى أن هناك باحثين يعملون على مشاكل مثل قياس تدفق الدم عبر الأذنين لقياس معدل ضربات القلب ومستويات الجلوكوز ونشاط العضلات والمزيد.

هل تريد استخدام آخر محتمل؟ ماذا عن الواقع المعزز مسموع? يُعرف الواقع المعزز حاليًا بتراكب الكائنات التي تم إنشاؤها بواسطة الكمبيوتر فوق العالم الحقيقي. ولكن لا يوجد سبب وجيه لإجراء التعزيزات على الطيف البصري فقط. إن فريق Roy Choudhury متحمس لاحتمال استخدام تقنية معالجة الإشارات لرسم أصوات معينة على المشهد الطبيعي الخاص بك، بحيث يمكنك التنقل في طريقك عبر يمكن أن يتضمن المطار أو المتحف أو أي مكان عام آخر السير باتجاه الصوت الذي يقول "اتبعني"، والذي يبدو أنه قادم من الاتجاه الذي تريد التوجه إليه في.

سيري

الجميع على دراية بـ Siri، لكن تخيل عدد الاستخدامات المحتملة التي يمكن فتحها لـ Siri إذا كان لها بعد مكاني فقط، مثل المتكلم من بطنه القادر على إلقاء صوته. يمكن أن يساعد هذا التعزيز المكاني أيضًا في تحسين الاجتماعات الافتراضية الكبيرة، حيث يتم تعيين صوت كل شخص إلى موقع محدد، مما يسهل معرفة من يتحدث على الفور.

لن تتحقق كل هذه الأمور بالطبع. إنها النسخة الهندسية لأفكار مؤلف الإعلانات الخربشة للإعلان. قد لا يكون الكثير منها ناجحًا، لكن مثالًا أو مثالين يمكن أن يكونا مفيدين للغاية.

قانون دورميل

وهذا سبب آخر يجعل روي تشودري متحمسًا للغاية بشأن إمكانية استمرار الحوسبة القابلة للأذن - وفرص نجاحها في العالم الحقيقي. إن الاستجابات المجتمعية تملي المزيد حول التكنولوجيات التي ستحظى بالانتشار أكثر مما قد يرغب خبراء التكنولوجيا بالضرورة. التكنولوجيات الجديدة، بحكم تعريفها، جديدة. جديد يمكن أن يساوي غريب. وإذا استخدمنا صيغة خاصة بي (ولنطلق عليها قانون دورميل لطعن الأجيال القادمة)، فإن المنفعة الخارجية لأي تكنولوجيا جديدة يجب أن تعادل بشكل مضاعف الحماقة المتأصلة في استخدامها.

"هذه مشكلة لأن عددًا قليلاً جدًا من التقنيات تظهر بشكل كامل."

لم يكن بمقدور أجهزة الكمبيوتر الشخصية، التي يستخدمها الناس في منازلهم، أن تحقق سوى القليل من الاستخدام خلال السنوات القليلة الأولى من ظهورها في السوق لأن المخاطر الاجتماعية لاستخدامها كانت منخفضة للغاية. وكان لجهاز الكمبيوتر المحمول، الذي يستخدم في الأماكن العامة، مخاطر أعلى قليلاً. تعتبر الأجهزة القابلة للارتداء، والتي تبرز بشكل خاص بسبب ارتدائها على الجسم، أكثر غرابة بشكل واضح من معظم التقنيات. يجب إزالة قطعة من التكنولوجيا التي ستعلق على الرأس، وتبدو وكأنها مزروعة عبر الإنترنت في طائرة بدون طيار من طراز Borg. رائعة ومفيدة على الفور إذا كان المستخدم سيعتبرها تستحق التأثير الاجتماعي الضار لرؤيتها ارتدائه.

جارون شنايدر / الاتجاهات الرقمية

وهذه مشكلة لأن عددًا قليلًا جدًا من التقنيات تظهر بشكل كامل. في معظم الحالات، تكون الأجيال القليلة الأولى من المنتج مبنية على وعد معيب، قبل أن يظهر عرض أكثر إقناعًا في مكان ما حول التكرار الثالث. إذا فشل منتج واضح للغاية في تحقيق النجاح منذ اليوم الأول، فقد تتضاءل فرص نجاحه على المدى الطويل، حتى لو تحول في النهاية إلى منتج جيد. بالنسبة لعشاق التكنولوجيا الأقدم، فكر في جهاز Apple Newton المحمول، ومحاولة التعرف على خط اليد المبكرة. بالنسبة للمشجعين الأصغر سنا، قد يفسر قانون دورميل فشل نظارة جوجل، التي جاءت مصحوبة بوصمة عار مجتمعية هائلة وحكم عليها وحققت نجاحا كبيرا.

سماعات الأذن، كما أشار روي تشودري، مختلفة. وأيًا كانت المعارك التي ربما كانت موجودة بشأنهم، فقد تم الفوز بها بالفعل بشكل أو بآخر. وقال: "لقد قبل المجتمع بالفعل الأشخاص الذين يرتدون سماعات الأذن". "... إلى حد ما، لا يلزم الآن ترقية سوى الخوارزميات وأجهزة الاستشعار والأجهزة. إنه مجرد عنق الزجاجة التكنولوجي، ولم يعد عنق الزجاجة المجتمعي والنفسي.

الوعد بالأجهزة القابلة للارتداء

إن حقيقة قبول سماعات الأذن تقلل من المخاطر، وتعني أنه لم يعد هناك حاجة إلى نتيجة ثنائية فورية. حتى لو لم يتم تحقيق الأهداف السامية التي وصفها روي تشودري لفترة طويلة، فإن التحسين التدريجي سيضيف فائدة إلى عامل الشكل الذي أثبت كفاءته.

"الثمرة المعلقة هي أشياء مثل: "من خلال حركات أسناني، يمكنني اكتشاف النوبات" أو "من خلال حركات أسناني" "إيماءات الوجه، أستطيع أن أفهم الحالة المزاجية للشخص بحيث يصبح هذا مثل فيتبيت للمزاج". قال. "ولكن حتى لو فشل ذلك، فإنه لا يعيق خط أنابيب المنتج. ومع ذلك، إذا نجحوا، فهذا يعني تحويل المنتج إلى شيء رائع.

يعتقد روي تشودري أن إمكانات الحوسبة القابلة للأذن لا حدود لها تقريبًا. وأضاف: "أعتقد أن الطريق أمامنا يتجاوز مجرد الكلام". “أود أن أقول إن الخطاب هو الدائرة الأعمق، التي هي في جوهر [هذه التكنولوجيا]. خارج هذا التفاعل هو الصوتيات بشكل عام. والصوتيات الخارجية هي جميع أنواع أجهزة الاستشعار والقدرات الأخرى. إذا فكرت في كيفية البدء في بناء هذه المنصة، فستكون الثمار سهلة المنال التفاعل القائم على الكلام: "اضبط مؤقتًا"، "مرحبًا سيري، ما هو الطقس اليوم؟" ولكن يمكن أن يذهب بعيدًا جدًا أبعد من ذلك."

ومن بين الباحثين الآخرين الذين يعملون على الحوسبة القابلة للارتداء مع روي تشودري زيجيان يانغ, يو لين وي, جاي براكاش، و زيو لي.

توصيات المحررين

  • يحتوي تطبيق ChatGPT على iPhone الآن على Bing مدمج
  • لم تجعل شركة Apple Siri أداة قاتلة لـ ChatGPT في مؤتمر WWDC - وهذا يخيفني
  • انسَ ChatGPT — يقوم Siri وGoogle Assistant بهذه الأشياء الأربعة بشكل أفضل
  • يدعي التقرير أن شركة Apple تقوم ببناء مدرب صحي يعتمد على الذكاء الاصطناعي لساعة Apple Watch
  • قد يحل جهاز الذكاء الاصطناعي الغريب هذا محل هاتفك الذكي في المستقبل