LipNet: ما مدى سهولة قراءة الشفاه في رأيك؟
مع العلم أن HAL يستمع باستمرار إلى ما يقولونه، فإنهم يتراجعون إلى مكان ما يعرفون أن HAL لا يستطيع الاستماع إليه ويوافقون على قطع الاتصال به. يقلب HAL خطته بعد فشل رائدي الفضاء في أخذها بعين الاعتبار قدرات الذكاء الاصطناعي الفائقة في قراءة الشفاه.
أشياء مستقبلية، أليس كذلك؟ ليس وفقًا للبحث الذي أجراه الباحثون في جامعة أكسفورد. لقد قاموا بتطوير برنامج ذكاء اصطناعي يسمى LipNet، وهو قادر على تفسير ما يقوله الناس بدقة، بناءً على الطريقة التي يحركون بها أفواههم عند التحدث.
متعلق ب
- يعتقد Photoshop AI أن "السعادة" هي ابتسامة بأسنان فاسدة
- لقد عرضت فكرتي السخيفة لبدء التشغيل على روبوت VC
- كيف سنعرف متى يصبح الذكاء الاصطناعي واعيًا بالفعل؟
"يقوم برنامج LipNet بقراءة الشفاه على مستوى الجملة باستخدام التعلم الآلي" بريندان شيلينجفورد، أحد الباحثين في
ورق، قال الاتجاهات الرقمية. "تقوم شبكة عصبية تشبه أحدث نماذج التعرف على الكلام بمعالجة سلسلة من إطارات الفيديو، وربطها بجملة. وكانت الأساليب السابقة تعمل من خلال الكلمات الفردية المتوقعة بدلاً من الجمل.مقاطع الفيديو الموصى بها
أداء LipNet يقارن بشكل إيجابي بشكل لا يصدق مع خبراء قراءة الشفاه من البشر في مجموعة GRID، وهي أكبر مجموعة بيانات متاحة للجمهور لقراءة الشفاه على مستوى الجملة. في الواقع، في حين حصل الخبراء البشريون على 52% فقط، حصلت LipNet على 93%. كما حطم أسلوبها القائم على الجملة في قراءة الشفاه أفضل محاولة سابقة قامت بها آلة، والتي تمكنت من تحقيق دقة بنسبة 79.6 بالمائة على نفس مجموعة البيانات.
ومع ذلك، في حين أن HAL 9000 الوهمي يستخدم قدراته في قراءة الشفاه بلا فائدة، فإن الفريق الذي يقف وراء LipNet لديه أهداف أخرى من إنشائه. يعاني حوالي 360 مليون شخص في جميع أنحاء العالم من فقدان السمع المعوق. يمكن لأدوات مثل LipNet أن تكون ذات أهمية كبيرة لهؤلاء الأفراد، من خلال المساعدة في تفسير الكلام بدقة بطريقة تجعل حياتهم أسهل.
"وتشمل التطبيقات الأخرى التي نهتم بها الإملاء الصامت في الأماكن العامة، والمحادثات السرية، التعرف على الكلام في البيئات الصاخبة، وتحديد الهوية البيومترية، ومعالجة الأفلام الصامتة واصلت.
في حين أن المراقبة ستكون مشكلة مع أي تكنولوجيا مثل هذه، ناندو دي فريتاس، الذي عمل أيضًا في المشروع، قال إنه ليس تطبيقًا ركزوا عليه. ومع ذلك، قال إنه "لن يكون مفاجئًا" إذا حاولت مختبرات أخرى البناء على مثل هذا العمل لهذا الغرض في المستقبل.
وتابع دي فريتاس: "يجب أن يدرك الجمهور ذلك، وأن يعتمد على مؤسساتنا الديمقراطية القانونية لوضع القوانين المناسبة التي تحمي خصوصيتنا وكرامتنا". "نأمل أن نساعد من خلال نشر هذا العمل في رفع مستوى الوعي، مع الاستمرار في التأكيد على فائدة هذه التكنولوجيا لمساعدة الأشخاص المحتاجين."
توصيات المحررين
- قد يقوم منافس ChatGPT من Apple بكتابة التعليمات البرمجية لك تلقائيًا
- قام Meta بإنشاء DALL-E للفيديو، وهو أمر مخيف ومذهل في نفس الوقت
- الخدع البصرية يمكن أن تساعدنا في بناء الجيل القادم من الذكاء الاصطناعي
- الكمبيوتر المحمول للتعلم الآلي من Lambda هو جهاز Razer مقنع
- اقرأ "الكتاب المقدس الاصطناعي" الجميل والمخيف للذكاء الاصطناعي. الذي يعتقد أنه الله
ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والمقالات الافتتاحية الثاقبة ونظرات خاطفة فريدة من نوعها.