Facebook A.I. Може вирішити неприємну проблему в програмах для відеочату

Комунікація у Facebook може переважно здійснюватися за допомогою текстових повідомлень, але гігант соціальних мереж, тим не менш, може допомогти вирішити деякі з найбільших проблем за допомогою аудіоспілкування. Оголошено в п’ятницю, 10 липня, напередодні Міжнародна конференція з машинного навчання, Facebook розробив новий, найсучасніший штучний інтелект здатний розрізняти до п’яти голосів, які говорять одночасно.

Це може трансформувати будь-що, починаючи від слухових апаратів наступного покоління чи розумних динаміків, які підключаються та підсилюють певні голоси для майбутніх відеоконференцій у стилі Zoom навчитися краще розставляти пріоритети доповідачів, щоб усі не говорили через кожного інший.

Рекомендовані відео

«Це підхід до навчання під наглядом для розділення мовлення», Елія Нахмані, науковий співробітник FAIR (Facebook А.І. Дослідження) Тель-Авів, розповіли Digital Trends. «Ми вперше показуємо, що можна відокремити п’ять окремих динаміків від одного запису мікрофона. Ми також показуємо, як модель може визначити кількість динаміків у записі та попередньо сформувати відповідно. Модель не містить масок, тобто ми не оцінюємо маскування, яке видаляє інші голоси. Замість цього наша модель вчиться фільтрувати інші голоси або фоновий шум».

Анімація розділення голосів 2 динаміків ФІНАЛ

Цей елемент «без масок» є важливим. Попередні моделі, які досягли вражаючих показників, використовували маску для видалення інших голосів. Проблема цього підходу полягає в тому, що моделі погіршуються, коли кількість динаміків збільшується або стає невідомою. Хоча модель Facebook все ще вимагає вказувати кількість спікерів, для цього використовуються деякі розумні технології автоматично визначає кількість людей, які розмовляють, а потім вибирає найбільш підходящу модель для роботи це число.

Нахмані зазначив, що ця технологія розділення мови може мати й інші застосування. Окрім відокремлення голосів, він також може сортувати інші звуки від фонового шуму. Наприклад, це може дозволити ізолювати різні музичні інструменти з одного аудіофайлу.

Чи незабаром якась із цих технологій потрапить у продукт Facebook? Це незрозуміло. Це фундаментальний А.І. дослідження, яке не обов’язково буде відкладено в майбутньому Facebook додаток Але, звичайно, легко зрозуміти, наскільки такий інструмент може бути корисним. Враховуючи це Facebook вже пропонує різні функції відео- та голосового чату, не виключено, що це може стати частиною майбутнього продукту колись у майбутньому.

Цей А.І. Демонстрація — лише одна з понад 30 документів, які Facebook обговорює на Міжнародній конференції з машинного навчання, яка стартує цими вихідними.

Рекомендації редакції

  • Twitter щойно вирішив одну з найбільш неприємних проблем
  • Як Nintendo може використовувати штучний інтелект щоб перенести ігри 4K на Switch Pro
  • Розумний новий A.I. система обіцяє дресирувати вашу собаку, поки вас немає вдома
  • Цей базовий людський навик є наступною важливою віхою для ШІ.
  • Огляд GTC 2020: віртуальний світ Nvidia для роботів, штучний інтелект відеодзвінки

Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.