Новият гласов изкуствен интелект на Nvidia Звучи точно като истински човек

„Зловещата долина“ често се използва за описание изкуствен интелект (A.I.) имитиране на човешко поведение. Но новият глас на Nvidia A.I. е много по-реалистично от всичко, което сме чували досега. Използвайки комбинация от A.I. и референтен запис на човек, фалшивият глас звучи почти идентично с истинския.

Всички усещания: NVIDIA споделя изследване на експресивния синтез на реч в Interspeech

Във видеоклип (по-горе) вътрешният творчески екип на Nvidia описва процеса за постигане на точен гласов синтез. Екипът приравнява речта към музиката, като включва сложни и нюансирани ритми, височини и тембри, които не са лесни за възпроизвеждане. Nvidia създава инструменти за възпроизвеждане на тези тънкости с A.I.

Препоръчани видеоклипове

Компанията разкри най-новите си постижения на Interspeech, която е техническа конференция, посветена на изследванията на технологиите за обработка на реч. Гласовите инструменти на Nvidia са достъпни чрез отворен код NeMo инструментариум, и те са оптимизирани да работят на Nvidia GPU (според Nvidia, разбира се).

ИИ гласът също не е просто демонстрация. Nvidia премина към A.I. разказвач за своя Аз съм ИИ видео поредица, която показва въздействието на машинното обучение в различни индустрии. Сега Nvidia може да използва изкуствен глас като разказвач, без обичайните аудио артефакти, които идват заедно със синтезираните гласове.

Nvidia се заема с A.I. гласове по един от двата начина. Първият е да се обучи модел за преобразуване на текст в реч върху реч, изнесена от човек. След достатъчно обучение моделът може да приеме всеки въведен текст и да го преобразува в реч. Другият метод е гласово преобразуване. В този случай програмата използва аудио файл на говорещ човек и преобразува гласа в A.I. един, съответстващ на модела и интонацията.

За практически приложения Nvidia посочва безбройните виртуални асистенти, управляващи линиите за обслужване на клиенти, както и тези, присъстващи в смарт устройства като Алекса и Google Assistant. Nvidia обаче казва, че тази технология достига много по-далеч. „Преобразуването на текст в реч може да се използва в игри, за подпомагане на хора с вокални увреждания или за подпомагане на потребителите да превеждат между езици със собствения си глас“, Nvidia's блог пост чете.

Nvidia развива умение да мами хората, използвайки A.I. Компанията наскоро влезе в подробности за това как създаде виртуален изпълнителен директор за своята GPU технологична конференция, подпомогната отчасти от собствения си софтуер Omniverse.

Препоръки на редакторите

  • Тествах новата RTX функция на Nvidia и тя поправи най-лошата част от компютърните игри
  • Тествах новата RTX 4060 на Nvidia срещу RX 7600 - и не е хубава
  • Новият инструмент Guardrails на Nvidia коригира най-големия проблем с AI чатботовете
  • Ами сега — Nvidia току-що случайно разкри чисто нов графичен процесор
  • Преминах на AMD GPU за един месец — ето защо Nvidia не ми липсва

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.