„Зловещата долина“ често се използва за описание изкуствен интелект (A.I.) имитиране на човешко поведение. Но новият глас на Nvidia A.I. е много по-реалистично от всичко, което сме чували досега. Използвайки комбинация от A.I. и референтен запис на човек, фалшивият глас звучи почти идентично с истинския.
Всички усещания: NVIDIA споделя изследване на експресивния синтез на реч в Interspeech
Във видеоклип (по-горе) вътрешният творчески екип на Nvidia описва процеса за постигане на точен гласов синтез. Екипът приравнява речта към музиката, като включва сложни и нюансирани ритми, височини и тембри, които не са лесни за възпроизвеждане. Nvidia създава инструменти за възпроизвеждане на тези тънкости с A.I.
Препоръчани видеоклипове
Компанията разкри най-новите си постижения на Interspeech, която е техническа конференция, посветена на изследванията на технологиите за обработка на реч. Гласовите инструменти на Nvidia са достъпни чрез отворен код NeMo инструментариум, и те са оптимизирани да работят на Nvidia GPU (според Nvidia, разбира се).
ИИ гласът също не е просто демонстрация. Nvidia премина към A.I. разказвач за своя Аз съм ИИ видео поредица, която показва въздействието на машинното обучение в различни индустрии. Сега Nvidia може да използва изкуствен глас като разказвач, без обичайните аудио артефакти, които идват заедно със синтезираните гласове.
Nvidia се заема с A.I. гласове по един от двата начина. Първият е да се обучи модел за преобразуване на текст в реч върху реч, изнесена от човек. След достатъчно обучение моделът може да приеме всеки въведен текст и да го преобразува в реч. Другият метод е гласово преобразуване. В този случай програмата използва аудио файл на говорещ човек и преобразува гласа в A.I. един, съответстващ на модела и интонацията.
За практически приложения Nvidia посочва безбройните виртуални асистенти, управляващи линиите за обслужване на клиенти, както и тези, присъстващи в смарт устройства като Алекса и Google Assistant. Nvidia обаче казва, че тази технология достига много по-далеч. „Преобразуването на текст в реч може да се използва в игри, за подпомагане на хора с вокални увреждания или за подпомагане на потребителите да превеждат между езици със собствения си глас“, Nvidia's блог пост чете.
Nvidia развива умение да мами хората, използвайки A.I. Компанията наскоро влезе в подробности за това как създаде виртуален изпълнителен директор за своята GPU технологична конференция, подпомогната отчасти от собствения си софтуер Omniverse.
Препоръки на редакторите
- Тествах новата RTX функция на Nvidia и тя поправи най-лошата част от компютърните игри
- Тествах новата RTX 4060 на Nvidia срещу RX 7600 - и не е хубава
- Новият инструмент Guardrails на Nvidia коригира най-големия проблем с AI чатботовете
- Ами сега — Nvidia току-що случайно разкри чисто нов графичен процесор
- Преминах на AMD GPU за един месец — ето защо Nvidia не ми липсва
Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.