Facebook ИИ Может решить раздражающую проблему в приложениях видеочата

Общение в Facebook может осуществляться преимущественно с помощью текстовых сообщений, но гигант социальных сетей, тем не менее, может помочь решить некоторые из самых больших проблем с помощью аудиосвязи. Об этом было объявлено в пятницу, 10 июля, накануне Международная конференция по машинному обучению, Facebook разработал новый, передовой искусственный интеллект способный различать до пяти голосов, говорящих одновременно.

Это может изменить ситуацию во всем: от слуховых аппаратов следующего поколения до умных колонок, подключающихся и усиливающих определенные голоса для будущих видеоконференций в стиле Zoom: научиться лучше расставлять приоритеты выступающих, чтобы никто не говорил поверх каждого другой.

Рекомендуемые видео

«Это контролируемый подход к обучению разделению речи», Элия ​​Нахмани, научный сотрудник FAIR (Фейсбук А.И. Исследования) в Тель-Авиве, рассказали Digital Trends. «Впервые мы показываем, что можно отделить пять отдельных динамиков от записи с одного микрофона. Мы также показываем, как модель может определять количество говорящих в записи и соответствующим образом формировать ее. Модель не содержит масок, а это означает, что мы не оцениваем маскирование, удаляющее другие голоса. Вместо этого наша модель учится фильтровать другие голоса и фоновый шум».

Анимация с разделением голосов на 2 динамика ФИНАЛ

Этот элемент «без маски» имеет большое значение. Предыдущие модели, добившиеся впечатляющих результатов, использовали маску для удаления других голосов. Проблема этого подхода в том, что модели становятся хуже по мере увеличения количества говорящих или его неизвестности. Хотя модель Facebook по-прежнему требует указания количества говорящих, она использует некоторые интеллектуальные технологии для автоматически определять количество разговаривающих людей, а затем выбирать наиболее подходящую модель для работы это число.

Нахмани отметил, что эта технология разделения речи может иметь и другие применения. Помимо разделения голосов, он также мог отделять другие звуки от фонового шума. Например, это могло бы позволить ему изолировать разные музыкальные инструменты из одного аудиофайла.

Сможет ли какая-либо из этих технологий в ближайшее время найти применение в продукте Facebook? Это не совсем ясно. Это фундаментальный ИИ. исследования, которые не обязательно будут перенесены в будущее Фейсбук приложение. Но, безусловно, легко понять, чем такой инструмент может быть полезен. При условии Фейсбук уже предлагает различные функции видео и голосового чата, не исключено, что когда-нибудь в будущем это может появиться в будущем продукте.

Этот А.И. Демонстрация — лишь один из более чем 30 документов, которые Facebook обсуждает на Международной конференции по машинному обучению, которая стартует в эти выходные.

Рекомендации редакции

  • Twitter только что исправил одну из самых неприятных проблем
  • Как Nintendo могла бы использовать ИИ перенести игры 4K на Switch Pro
  • Умный новый ИИ. система обещает дрессировать вашу собаку, пока вы находитесь вдали от дома
  • Этот базовый человеческий навык является следующей важной вехой в развитии ИИ.
  • Обзор GTC 2020: виртуальный мир Nvidia для роботов, искусственный интеллект видеозвонки

Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.

Категории

Недавний