التعلم العميق يمكنه تقليد صوت مضخمات الجيتار الشهيرة

يتم تحويل صناعة الموسيقى إلى صيغة رقمية بشكل متزايد هنا في عام 2020، ولكن لا يزال من الصعب جدًا إعادة إنتاج بعض التأثيرات الصوتية التناظرية بهذه الطريقة. أحد هذه التأثيرات هو نوع تشويه الجيتار الصاخب الذي يفضله آلهة الروك في كل مكان. حتى الآن، كانت إعادة إنشاء هذه التأثيرات رقميًا، والتي تتضمن مكبرات صوت الجيتار، أقرب إلى المستحيل.

لقد تغير هذا الآن بفضل عمل الباحثين في قسم معالجة الإشارات والصوتيات في جامعة آلتو الفنلندية. باستخدام الذكاء الاصطناعي للتعلم العميق (A.I.)، قاموا بإنشاء شبكة عصبية للغيتار نموذج التشويه الذي، لأول مرة، يمكن أن يخدع مستمعي الاختبار الأعمى إلى الاعتقاد بأنه حقيقي شرط. فكر في الأمر مثل أ اختبار تورينج، مكرنك وصولاً إلى نمط Spınal Tap 11.

مقاطع الفيديو الموصى بها

"لقد كان الاعتقاد العام لدى الباحثين في مجال الصوت لعقود من الزمن هو أن التقليد الدقيق للصوت المشوه لمضخمات الجيتار الأنبوبية يمثل تحديًا كبيرًا". البروفيسور فيسا فاليماكي قال الاتجاهات الرقمية. "أحد الأسباب هو أن التشويه يرتبط بالسلوك الديناميكي غير الخطي، والذي من المعروف أنه من الصعب محاكاته حتى من الناحية النظرية. قد يكون السبب الآخر هو أن أصوات الجيتار المشوهة عادة ما تكون بارزة جدًا في الموسيقى، لذلك يبدو من الصعب إخفاء أي مشاكل هناك؛ جميع الأخطاء ستكون ملحوظة للغاية.

جيتار_امب_في_غرفة_الصدى_26-1-2020_photo_mikko_raskinen_006 1
سجل الباحثون تأثيرات الجيتار في غرفة خاصة كاتمة للصدى.ميكو راسكينن

لتدريب الشبكة العصبية على إعادة إنشاء مجموعة متنوعة من تأثيرات التشويه، كل ما هو مطلوب هو بضع دقائق من الصوت المسجل من مكبر الصوت المستهدف. استخدم الباحثون صوتًا "نظيفًا" مسجلاً من غيتار كهربائي في آلة موسيقية غرفة كاتمة للصدى، ومن ثم تشغيله من خلال مكبر للصوت. يوفر هذا مدخلاً في شكل صوت جيتار لا تشوبه شائبة، وإخراجًا في شكل مخرج مضخم صوت الجيتار "الهدف" المقابل.

"يتم التدريب عن طريق تغذية الشبكة العصبية بمقطع قصير من صوت الجيتار النظيف، ومقارنة مخرجات الشبكة مع مخرجات الشبكة العصبية. وقال أليك رايت، وهو طالب دكتوراه يركز على معالجة الصوت باستخدام التعلم العميق، لـ Digital Trends: "إخراج مكبر الصوت المستهدف". "تتم هذه المقارنة في "دالة الخسارة"، وهي ببساطة معادلة تمثل مدى مخرجات الشبكة العصبية هي من المخرجات المستهدفة، أو ما مدى "خطأ" تنبؤات نموذج الشبكة العصبية كان. المفتاح هو عملية تسمى "النزول المتدرج"، حيث تقوم بحساب كيفية ضبط الشبكة العصبية المعلمات بشكل طفيف جدًا، بحيث يكون تنبؤ الشبكة العصبية أقرب قليلاً إلى تنبؤ مكبر الصوت المستهدف انتاج. ثم يتم تكرار هذه العملية آلاف المرات - أو في بعض الأحيان أكثر من ذلك بكثير - حتى يتوقف إنتاج الشبكة العصبية عن التحسن.

يمكنك الاطلاع على العرض التوضيحي لـ A.I. في العمل في Research.spa.aalto.fi/المنشورات / الأوراق / التطبيقات العلميةعميق/. وكانت ورقة تصف العمل نشرت مؤخرا في مجلة العلوم التطبيقية.

توصيات المحررين

  • الخدع البصرية يمكن أن تساعدنا في بناء الجيل القادم من الذكاء الاصطناعي
  • التناظرية منظمة العفو الدولية؟ قد يبدو الأمر جنونيًا، لكنه قد يكون المستقبل
  • أحدث تقنيات الذكاء الاصطناعي من نفيديا. تثبت النتائج أن ARM جاهز لمركز البيانات
  • Nvidia تخفض حاجز الدخول إلى الذكاء الاصطناعي مع قيادة الأسطول وLaunchPad
  • هل يستطيع أ. هل تتفوق على المهندسين البشريين في تصميم الرقائق الدقيقة؟ جوجل تعتقد ذلك

ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والمقالات الافتتاحية الثاقبة ونظرات خاطفة فريدة من نوعها.