Общение в Facebook может осуществляться преимущественно с помощью текстовых сообщений, но гигант социальных сетей, тем не менее, может помочь решить некоторые из самых больших проблем с помощью аудиосвязи. Об этом было объявлено в пятницу, 10 июля, накануне Международная конференция по машинному обучению, Facebook разработал новый, передовой искусственный интеллект способный различать до пяти голосов, говорящих одновременно.
Это может изменить ситуацию во всем: от слуховых аппаратов следующего поколения до умных колонок, подключающихся и усиливающих определенные голоса для будущих видеоконференций в стиле Zoom: научиться лучше расставлять приоритеты выступающих, чтобы никто не говорил поверх каждого другой.
Рекомендуемые видео
«Это контролируемый подход к обучению разделению речи», Элия Нахмани, научный сотрудник FAIR (Фейсбук А.И. Исследования) в Тель-Авиве, рассказали Digital Trends. «Впервые мы показываем, что можно отделить пять отдельных динамиков от записи с одного микрофона. Мы также показываем, как модель может определять количество говорящих в записи и соответствующим образом формировать ее. Модель не содержит масок, а это означает, что мы не оцениваем маскирование, удаляющее другие голоса. Вместо этого наша модель учится фильтровать другие голоса и фоновый шум».
Анимация с разделением голосов на 2 динамика ФИНАЛ
Этот элемент «без маски» имеет большое значение. Предыдущие модели, добившиеся впечатляющих результатов, использовали маску для удаления других голосов. Проблема этого подхода в том, что модели становятся хуже по мере увеличения количества говорящих или его неизвестности. Хотя модель Facebook по-прежнему требует указания количества говорящих, она использует некоторые интеллектуальные технологии для автоматически определять количество разговаривающих людей, а затем выбирать наиболее подходящую модель для работы это число.
Нахмани отметил, что эта технология разделения речи может иметь и другие применения. Помимо разделения голосов, он также мог отделять другие звуки от фонового шума. Например, это могло бы позволить ему изолировать разные музыкальные инструменты из одного аудиофайла.
Сможет ли какая-либо из этих технологий в ближайшее время найти применение в продукте Facebook? Это не совсем ясно. Это фундаментальный ИИ. исследования, которые не обязательно будут перенесены в будущее
Этот А.И. Демонстрация — лишь один из более чем 30 документов, которые Facebook обсуждает на Международной конференции по машинному обучению, которая стартует в эти выходные.
Рекомендации редакции
- Twitter только что исправил одну из самых неприятных проблем
- Как Nintendo могла бы использовать ИИ перенести игры 4K на Switch Pro
- Умный новый ИИ. система обещает дрессировать вашу собаку, пока вы находитесь вдали от дома
- Этот базовый человеческий навык является следующей важной вехой в развитии ИИ.
- Обзор GTC 2020: виртуальный мир Nvidia для роботов, искусственный интеллект видеозвонки
Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.