يمكن لهذا الذكاء الاصطناعي أن ينتحل صوتك بعد ثلاث ثوانٍ فقط

الذكاء الاصطناعي (AI) هو الحصول على لحظة الآن، وما زالت الرياح تهب في أشرعتها مع الأخبار التي تفيد بأن Microsoft تعمل على الذكاء الاصطناعي الذي يمكنه تقليد صوت أي شخص بعد تلقيه عينة قصيرة مدتها ثلاث ثوانٍ.

وتم تدريب الأداة الجديدة، التي يطلق عليها اسم VALL-E، على ما يقرب من 60 ألف ساعة من البيانات الصوتية باللغة الإنجليزية، والتي تقول مايكروسوفت إنها "أكبر بمئات المرات من الأنظمة الحالية". باستخدام هذه المعرفة، يدعي منشئوها أنها تحتاج فقط إلى القليل من المدخلات الصوتية لفهم كيفية تكرار صوت المستخدم.

رجل يتحدث في الهاتف
فيزكيس / شترستوك

والأمر الأكثر إثارة للإعجاب هو أن VALL-E يمكنه إعادة إنتاج المشاعر والنغمات الصوتية والبيئة الصوتية الموجودة في كل عينة، وهو أمر عانت منه برامج الذكاء الاصطناعي الصوتية الأخرى. وهذا يمنحها هالة أكثر واقعية ويجعل نتائجها أقرب إلى شيء يمكن اعتباره خطابًا بشريًا حقيقيًا.

متعلق ب

  • GPT-4: كيفية استخدام chatbot AI الذي يضع ChatGPT في العار
  • بإمكان Google Bard الآن التحدث، لكن هل يمكنه إخفاء ChatGPT؟
  • تهدف شركة الذكاء الاصطناعي الجديدة التابعة لإيلون ماسك إلى "فهم الكون"

عند مقارنتها بالمنافسين الآخرين لتحويل النص إلى كلام (TTS)، تقول Microsoft إن VALL-E "يتفوق بشكل كبير على نظام تحويل النص إلى كلام (TTS) المتطور من حيث الكلام الطبيعية وتشابه المتحدث." بمعنى آخر، يبدو VALL-E أشبه بالبشر الحقيقيين منه بأنظمة الذكاء الاصطناعي المنافسة التي تواجه مدخلات صوتية لم يتم تدريبها عليها على.

مقاطع الفيديو الموصى بها

على GitHub، قامت Microsoft بإنشاء ملف مكتبة صغيرة من العينات تم إنشاؤها باستخدام VALL-E. وكانت النتائج في الغالب مثيرة للإعجاب للغاية، مع وجود العديد من العينات التي تعيد إنتاج نغمة ولهجة أصوات المتحدثين. بعض الأمثلة أقل إقناعًا، مما يشير إلى أن VALL-E ربما لا يكون منتجًا نهائيًا، لكن الناتج بشكل عام مقنع.

إمكانات هائلة – ومخاطر

شخص يجري مكالمة فيديو على جهاز Microsoft Surface يعمل بنظام التشغيل Windows 11.
مايكروسوفت / أونسبلاش

في ورقة إدخال VALL-Eوتوضح مايكروسوفت أن VALL-E “قد يحمل مخاطر محتملة في سوء استخدام النموذج، مثل انتحال الصوت تحديد هوية أو انتحال شخصية متحدث معين." مثل هذه الأداة القادرة على توليد خطاب يبدو واقعيًا شبح المزيد من التزييف العميق المقنعوالتي يمكن استخدامها لتقليد أي شيء بدءًا من الشريك الرومانسي السابق وحتى الشخصية العالمية البارزة.

وللتخفيف من هذا التهديد، تقول مايكروسوفت: "من الممكن بناء نموذج كشف للتمييز فيما إذا كان المقطع الصوتي قد تم تصنيعه بواسطة VALL-E". وتقول الشركة إنها ستستخدم أيضًا منتجاتها الخاصة مبادئ الذكاء الاصطناعي عند تطوير عملها. تغطي هذه المبادئ مجالات مثل العدالة والسلامة والخصوصية والمساءلة.

يعد VALL-E مجرد أحدث مثال على تجارب Microsoft مع الذكاء الاصطناعي. في الآونة الأخيرة، كانت الشركة تعمل على دمج ChatGPT في Bingباستخدام الذكاء الاصطناعي تلخيص اجتماعات Teams الخاصة بكوتطعيم الأدوات المتقدمة في تطبيقات مثل أوتلوك، وورد، و باور بوينت. ووفقا لـ Semafor، فإن مايكروسوفت تتطلع إلى ذلك استثمر 10 مليارات دولار في OpenAI، صانع ChatGPT، وهي الشركة التي استثمرت أموالاً كبيرة فيها بالفعل.

على الرغم من المخاطر الواضحة، فإن أدوات مثل VALL-E يمكن أن تكون مفيدة بشكل خاص في الطب، على سبيل المثال، لمساعدة الأشخاص على استعادة صوتهم بعد وقوع حادث. إن القدرة على تكرار الكلام باستخدام مجموعة المدخلات الصغيرة هذه يمكن أن تكون واعدة للغاية في هذه المواقف، بشرط أن يتم ذلك بشكل صحيح. ولكن مع كل الأموال التي يتم إنفاقها على الذكاء الاصطناعي – سواء من قبل شركة مايكروسوفت أو غيرها – فمن الواضح أن هذا الأمر لن يختفي في أي وقت قريب.

توصيات المحررين

  • يطالب كبار المؤلفين بالدفع من شركات الذكاء الاصطناعي مقابل استخدام أعمالهم
  • أفضل أدوات تحرير الفيديو بتقنية الذكاء الاصطناعي
  • يواجه صانع ChatGPT OpenAI تحقيقًا من لجنة التجارة الفيدرالية (FTC) بشأن قوانين حماية المستهلك
  • يقول العلماء إن اختراقات الذكاء الاصطناعي يمكن أن تأتي عبر أدمغة النحل
  • تقوم OpenAI ببناء فريق جديد لمنع الذكاء الاصطناعي الفائق من الانحراف

ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والمقالات الافتتاحية الثاقبة ونظرات خاطفة فريدة من نوعها.