Głębokie uczenie się AI Potrafi imitować dźwięk kultowych wzmacniaczy gitarowych

W 2020 r. tworzenie muzyki będzie tutaj coraz bardziej digitalizowane, ale niektóre analogowe efekty dźwiękowe nadal będą bardzo trudne do odtworzenia w ten sposób. Jednym z tych efektów jest rodzaj piskliwego zniekształcenia gitary, preferowany przez bogów rocka na całym świecie. Do tej pory efekty te, które wykorzystywano we wzmacniaczach gitarowych, były prawie niemożliwe do odtworzenia cyfrowo.

Teraz to się zmieniło dzięki pracy naukowców z katedry przetwarzania sygnałów i akustyki fińskiego uniwersytetu Aalto. Wykorzystując sztuczną inteligencję głębokiego uczenia się (AI), stworzyli sieć neuronową dla gitary modelowanie zniekształceń, które po raz pierwszy może oszukać słuchaczy ślepych testów, myśląc, że to oryginał artykuł. Pomyśl o tym jak o Test Turinga, wykręcony aż do modelu Spınal Tap 11.

Polecane filmy

„Od kilkudziesięciu lat badacze zajmujący się dźwiękiem panuje powszechne przekonanie, że dokładne imitowanie zniekształconego brzmienia lampowych wzmacniaczy gitarowych stanowi duże wyzwanie”

Profesor Vesa Välimäki powiedział Digital Trends. „Jednym z powodów jest to, że zniekształcenie jest związane z dynamicznym, nieliniowym zachowaniem, o którym wiadomo, że jest trudne do symulacji nawet teoretycznie. Innym powodem może być to, że zniekształcone dźwięki gitary są zwykle dość widoczne w muzyce, więc trudno ukryć w tym przypadku jakiekolwiek problemy; wszelkie niedokładności będą bardzo zauważalne.”

gitara_amp_in_anechoic_chamber_26-1-2020_photo_mikko_raskinen_006 1
Naukowcy zarejestrowali efekty gitarowe w specjalnej komorze bezechowej.Mikko Raskinena

Aby wytrenować sieć neuronową w zakresie odtwarzania różnorodnych efektów zniekształceń, wystarczy kilka minut dźwięku nagranego ze wzmacniacza docelowego. Badacze wykorzystali „czysty” dźwięk nagrany z gitary elektrycznej w formacie audio komora bezechowa, a następnie przepuścił go przez wzmacniacz. Zapewniało to zarówno sygnał wejściowy w postaci nieskazitelnego brzmienia gitary, jak i sygnał wyjściowy w postaci odpowiedniego „docelowego” wyjścia wzmacniacza gitarowego.

„Trening odbywa się poprzez dostarczenie do sieci neuronowej krótkiego fragmentu czystego dźwięku gitarowego i porównanie sygnału wyjściowego sieci z sygnałem wyjściowym „docelowe” wyjście wzmacniacza” – powiedział Digital Trends Alec Wright, doktorant zajmujący się przetwarzaniem dźwięku z wykorzystaniem głębokiego uczenia. „To porównanie odbywa się za pomocą „funkcji straty”, która jest po prostu równaniem przedstawiającym, jak daleko wynik sieci neuronowej pochodzi z wyniku docelowego, czyli jak „błędne” jest przewidywanie modelu sieci neuronowej był. Kluczem jest proces zwany „schodzeniem gradientowym”, podczas którego oblicza się, jak dostosować sieć neuronową parametrów bardzo nieznacznie, tak że przewidywania sieci neuronowej są nieco bliższe przewidywaniom wzmacniacza docelowego wyjście. Proces ten jest następnie powtarzany tysiące razy – a czasami znacznie częściej – aż wydajność sieci neuronowej przestanie się poprawiać.

Możesz obejrzeć wersję demonstracyjną A.I. w akcji na research.spa.aalto.fi/publikacje/artykuły/aplikacje-głęboko/. Artykuł opisujący tę pracę był niedawno opublikowane w czasopiśmie Applied Sciences.

Zalecenia redaktorów

  • Złudzenia optyczne mogą pomóc nam w zbudowaniu sztucznej inteligencji nowej generacji
  • Analogowa sztuczna inteligencja? Brzmi szalenie, ale może to być przyszłość
  • Najnowsza sztuczna inteligencja Nvidii wyniki dowodzą, że ARM jest gotowy na centrum danych
  • Nvidia obniża barierę wejścia do AI. z Fleet Command i LaunchPadem
  • Czy sztuczna inteligencja pokonać inżynierów w projektowaniu mikroczipów? Google tak uważa

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.