Новий голос від Nvidia A.I. Звучить як справжня людина

Для опису часто використовують «страшну долину». штучний інтелект (ШІ) імітація людської поведінки. Але новий голос Nvidia A.I. набагато реалістичніше, ніж усе, що ми чули раніше. Використовуючи комбінацію А.І. і людський довідковий запис, підроблений голос звучить майже ідентично справжньому.

Усі відчуття: NVIDIA ділиться дослідженнями експресивного синтезу мовлення на Interspeech

У відео (вище) внутрішня творча команда Nvidia описує процес досягнення точного синтезу голосу. Команда прирівнює мову до музики, використовуючи складні та нюансовані ритми, висоту та тембри, які непросто відтворити. Nvidia створює інструменти для відтворення цих тонкощів за допомогою штучного інтелекту.

Рекомендовані відео

Компанія оприлюднила свої останні досягнення на Interspeech, технічній конференції, присвяченій дослідженням технологій обробки мови. Голосові інструменти Nvidia доступні через відкритий код Набір інструментів NeMo, і вони оптимізовані для роботи на графічних процесорах Nvidia (звичайно, згідно з Nvidia).

А.І. голос — це також не просто демонстрація. Nvidia перейшла на A.I. оповідач для свого Я А.І. серії відео, які показують вплив машинного навчання на різні галузі. Тепер Nvidia може використовувати штучний голос як диктора без звичайних звукових артефактів, які виникають разом із синтезованими голосами.

Nvidia займається штучним інтелектом голоси одним із двох способів. Перший — навчити модель синтезу мовлення на основі мови людини. Після достатнього навчання модель може сприймати будь-який введений текст і перетворювати його на мовлення. Інший спосіб - перетворення голосу. У цьому випадку програма використовує аудіофайл людини, що говорить, і перетворює голос на штучний інтелект. один, відповідаючи малюнку та інтонації.

Для практичних застосувань Nvidia вказує на незліченну кількість віртуальних помічників, які керують лініями обслуговування клієнтів, а також тих, які присутні в інтелектуальних пристроях, таких як Алекса і Google Assistant. Однак Nvidia каже, що ця технологія просувається набагато далі. «Перетворення тексту в мовлення можна використовувати в іграх, щоб допомогти людям з обмеженими голосовими можливостями або допомогти користувачам перекладати між мовами власним голосом», — повідомляє Nvidia. публікація в блозі читає.

Nvidia розвиває вміння обманювати людей за допомогою штучного інтелекту. Нещодавно компанія детально розповіла про те, як це відбувається створив віртуального генерального директора для своєї конференції GPU Technology Conference, частково завдяки власному програмному забезпеченню Omniverse.

Рекомендації редакції

  • Я протестував нову функцію RTX від Nvidia, і вона виправила найгіршу частину комп’ютерних ігор
  • Я протестував нову RTX 4060 від Nvidia проти RX 7600 — і це не дуже добре
  • Новий інструмент Guardrails від Nvidia вирішує найбільшу проблему з чат-ботами ШІ
  • На жаль, Nvidia щойно випадково показала абсолютно новий графічний процесор
  • Я перейшов на графічний процесор AMD на місяць — ось чому я не сумую за Nvidia

Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.