Искусственный интеллект (ИИ) – это у меня сейчас момент, и ветер продолжает дуть в паруса с новостями о том, что Microsoft работает над искусственным интеллектом, который может имитировать чей-либо голос после короткого трехсекундного образца.
Новый инструмент, получивший название VALL-E, был обучен примерно 60 000 часов голосовых данных на английском языке, что, по словам Microsoft, «в сотни раз больше, чем существующие системы». Используя эти знания, его создатели утверждают, что ему достаточно лишь небольшого количества голосовых данных, чтобы понять, как воспроизвести голос пользователя.
Еще более впечатляюще то, что VALL-E может воспроизводить эмоции, вокальные тона и акустическую среду, обнаруженные в каждом сэмпле, с чем боролись другие программы голосового искусственного интеллекта. Это придает ему более реалистичную ауру и приближает его результаты к тому, что можно было бы сойти за настоящую человеческую речь.
Связанный
- GPT-4: как использовать чат-бота с искусственным интеллектом, который посрамляет ChatGPT
- Google Bard теперь может говорить, но сможет ли он заглушить ChatGPT?
- Новая компания Илона Маска, занимающаяся искусственным интеллектом, стремится «понять вселенную»
По сравнению с другими конкурентами по преобразованию текста в речь (TTS), Microsoft утверждает, что VALL-E «значительно превосходит современную систему TTS с нулевым выстрелом с точки зрения речи». естественность и сходство говорящих». Другими словами, ВАЛЛ-И гораздо больше похож на настоящих людей, чем на конкурирующих ИИ, которые сталкиваются с аудиовходами, которым они не обучены. на.
Рекомендуемые видео
На GitHub Microsoft создала небольшая библиотека образцов создан с использованием ВАЛЛ-Э. Результаты в основном очень впечатляющие: множество сэмплов воспроизводят ритм и акцент голосов говорящих. Некоторые примеры менее убедительны, указывая на то, что VALL-E, вероятно, не является законченным продуктом, но в целом результат убедительный.
Огромный потенциал и риски
В документ, представляющий ВАЛЛ-ЭMicrosoft объясняет, что VALL-E «может нести потенциальные риски при неправильном использовании модели, такие как подмена голоса идентификация или выдача себя за конкретного говорящего». Такой мощный инструмент для создания реалистично звучащей речи повышает призрак все более убедительные дипфейки, который можно использовать для имитации чего угодно: от бывшего романтического партнера до выдающейся международной личности.
Чтобы смягчить эту угрозу, Microsoft заявляет, что «можно создать модель обнаружения, позволяющую определить, был ли аудиоклип синтезирован VALL-E». Компания заявляет, что также будет использовать собственную Принципы ИИ при разработке своей работы. Эти принципы охватывают такие области, как справедливость, безопасность, конфиденциальность и подотчетность.
VALL-E — это лишь последний пример экспериментов Microsoft с ИИ. В последнее время компания работает над интеграция ChatGPT в Bing, используя ИИ для подведите итоги ваших собраний Teamsи внедрять в такие приложения расширенные инструменты, как Outlook, Word и PowerPoint. По словам Семафора, Microsoft стремится инвестировать 10 миллиардов долларов в производителя ChatGPT OpenAI, компании, в которую он уже вложил значительные средства.
Несмотря на очевидные риски, такие инструменты, как VALL-E, могут быть особенно полезны в медицине, например, чтобы помочь людям восстановить голос после несчастного случая. Возможность воспроизвести речь с помощью такого небольшого набора входных данных может быть чрезвычайно многообещающей в таких ситуациях, при условии, что все сделано правильно. Но учитывая все деньги, которые тратит на ИИ — как Microsoft, так и другие компании — ясно, что в ближайшее время он никуда не денется.
Рекомендации редакции
- Ведущие авторы требуют от компаний, занимающихся искусственным интеллектом, оплату за использование их работ
- Лучшие инструменты для редактирования видео с искусственным интеллектом
- Производитель ChatGPT OpenAI сталкивается с расследованием Федеральной торговой комиссии по поводу законов о защите прав потребителей
- Прорывы в области искусственного интеллекта могут произойти благодаря мозгу пчел, говорят ученые
- OpenAI создает новую команду, чтобы не дать сверхразумному ИИ выйти из-под контроля
Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.