Nvidia jaunā balss A.I. Izklausās gluži kā īsts cilvēks

Lai aprakstītu, bieži tiek izmantota "neparastā ieleja". mākslīgais intelekts (A.I.) cilvēka uzvedības atdarināšana. Taču Nvidia jaunā balss A.I. ir daudz reālāks nekā jebkas, ko mēs jebkad esam dzirdējuši. Izmantojot kombināciju A.I. un cilvēka atsauces ieraksts, viltus balss izklausās gandrīz identiski īstajai.

Visas sajūtas: NVIDIA kopīgo izteiksmīgo runas sintēzes pētījumu vietnē Interspeech

Videoklipā (iepriekš) Nvidia iekšējā radošā komanda apraksta precīzas balss sintēzes sasniegšanas procesu. Komanda runu pielīdzina mūzikai, izmantojot sarežģītus un niansētus ritmus, toņus un tembrus, kurus nav viegli atkārtot. Nvidia rada rīkus, lai reproducētu šīs sarežģītības ar A.I.

Ieteiktie videoklipi

Uzņēmums atklāja savus jaunākos sasniegumus Interspeech, kas ir tehniskā konference, kas veltīta runas apstrādes tehnoloģiju izpētei. Nvidia balss rīki ir pieejami caur atvērtā koda palīdzību NeMo rīku komplekts, un tie ir optimizēti darbam ar Nvidia GPU (protams, saskaņā ar Nvidia).

A.I. arī balss nav tikai demonstrācija. Nvidia ir pārgājusi uz A.I. stāstītājs par to

Es esmu A.I. video sērija, kurā parādīta mašīnmācīšanās ietekme dažādās nozarēs. Tagad Nvidia spēj mākslīgi izmantot diktora balsi, bez parastajiem audio artefaktiem, kas nāk kopā ar sintezētām balsīm.

Nvidia cīnās ar A.I. balsis vienā no diviem veidiem. Pirmais ir apmācīt teksta pārvēršanas runā modeli uz cilvēka teiktu runu. Pēc pietiekamas apmācības modelis var izmantot jebkuru teksta ievadi un pārvērst to runā. Otra metode ir balss konvertēšana. Šajā gadījumā programma izmanto cilvēka runas audio failu un pārvērš balsi par A.I. viens, saskaņojot rakstu un intonāciju.

Praktiskiem pielietojumiem Nvidia norāda uz neskaitāmiem virtuālajiem palīgiem, kas vada klientu apkalpošanas līnijas, kā arī viedierīcēs, piemēram, Alexa un Google palīgs. Tomēr Nvidia saka, ka šī tehnoloģija sasniedz daudz tālāk. "Teksta pārvēršanu runā var izmantot spēlēs, lai palīdzētu personām ar balss traucējumiem vai palīdzētu lietotājiem tulkot no vienas valodas savā balsī," norāda Nvidia. emuāra ieraksts skan.

Nvidia attīsta iemaņas cilvēku apmānīšanai, izmantojot A.I. Uzņēmums nesen detalizēti izklāstīja, kā tas notiek izveidoja virtuālo izpilddirektoru GPU tehnoloģiju konferencei, ko daļēji palīdzēja paša Omniverse programmatūra.

Redaktoru ieteikumi

  • Es pārbaudīju Nvidia jauno RTX funkciju, un tā noteica datora spēļu sliktāko daļu
  • Es pārbaudīju Nvidia jauno RTX 4060 pret RX 7600 — un tas nav skaisti
  • Nvidia jaunais Guardrails rīks novērš lielāko problēmu ar AI tērzēšanas robotiem
  • Hmm! Nvidia tikko nejauši atklāja pavisam jaunu GPU
  • Es uz mēnesi pārgāju uz AMD GPU — lūk, kāpēc man nepietrūkst Nvidia

Uzlabojiet savu dzīvesveiduDigitālās tendences palīdz lasītājiem sekot līdzi steidzīgajai tehnoloģiju pasaulei, izmantojot visas jaunākās ziņas, jautrus produktu apskatus, ieskatu saturošus rakstus un unikālus ieskatus.