Комуникацията във Facebook може да се осъществява предимно чрез текст, но въпреки това гигантът на социалните медии може да помогне за решаването на някои от най-големите предизвикателства с аудио комуникацията. Обявено в петък, 10 юли, преди Международна конференция за машинно обучение, Facebook разработи нов, авангарден изкуствен интелект който може да различи до пет гласа, говорещи едновременно.
Това може да бъде трансформиращо за всичко - от слухови апарати от следващо поколение или интелигентни високоговорители, набиращи и усилващи определени гласове към бъдещи видеоконференции в стил Zoom научаване за по-добро приоритизиране на високоговорителите, за да спре всеки да говори над всеки друго.
Препоръчани видеоклипове
„Това е подход за контролирано обучение за разделяне на речта,“ Елия Нахмани, научен сътрудник във FAIR (Facebook ИИ Research) Тел Авив, каза Digital Trends. „За първи път показваме, че е възможно да се отделят пет отделни високоговорителя от един запис с микрофон. Ние също така показваме как моделът може да открие броя на високоговорителите в записа и съответно да го оформи предварително. Моделът е без маска, което означава, че не оценяваме маскиране, което премахва други гласове. Вместо това нашият модел се научава да филтрира другите гласове или фонов шум.
Анимация за разделяне на гласа на 2 високоговорителя ФИНАЛ
Този елемент „без маска“ е важен. Предишни модели, които постигнаха впечатляващи показатели, използват маска за премахване на други гласове. Проблемът с този подход е, че моделите се влошават, когато броят на високоговорителите се увеличава или е неизвестен. Въпреки че моделът на Facebook все още изисква да се посочи броят на високоговорителите, той използва някои интелигентни технологии, за да автоматично определя броя на хората, които говорят, и след това избира най-подходящия модел за работа това число.
Нахмани посочи, че тази технология за разделяне на реч може да има и други приложения. В допълнение към разделянето на гласове, той може също да сортира други звуци от фоновия шум. Например, това може да го позволи изолирайте различни музикални инструменти от един аудио файл.
Ще намери ли някоя от тези технологии скоро в продукт на Facebook? Това не е ясно. Това е фундаментален ИИ. изследвания, които не е задължително да бъдат заложени в бъдещето
Този ИИ демонстрацията е само един от повече от 30 документа, които Facebook обсъжда на Международната конференция за машинно обучение, която започва този уикенд.
Препоръки на редакторите
- Twitter току-що коригира един от най-досадните си проблеми
- Как Nintendo може да използва A.I. за да внесете 4K игри в Switch Pro
- Умен нов A.I. системата обещава да обучи вашето куче, докато сте далеч от дома
- Това основно човешко умение е следващият основен крайъгълен камък за ИИ.
- Обзор на GTC 2020: Виртуалният свят на Nvidia за роботи, A.I. видео разговори
Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.