Acest discurs realist sintetic ar putea fi viitorul cărților audio

click fraud protection

Vocile sintetizate precum cele folosite de Siri și Alexa sunt bune pentru a ne spune prognoza meteo a zilei sau cum Au rămas multe minute pe cronometrul de gătit, dar chiar ai vrea să te citească tonurile lor plate și monotone? cărți audio? Probabil că nu, motiv pentru care majoritatea dintre noi apelăm la servicii cu voce umană, cum ar fi Audible, pentru a obține corectarea cărții audio. Cu toate acestea, actorii vocali umani s-ar putea să nu primească aprobarea pentru prea mult timp, din cauza muncii de pionierat a unui startup din Londra numit DeepZen.

Folosind algoritmi de inteligență artificială, sporiți de puterea de foc tehnologică a IBM Power A.I. și tehnologiile Watson, DeepZen a dezvoltat instrumente de transformare a textului în vorbire care nu numai că sună uman la prima ascultare, dar pot, de asemenea, să capteze indiciile emoționale necesare pentru a citi textul într-o manieră convingătoare. Procedând astfel, compania susține că ar putea reduce timpul și costul de a produce cărți audio cu până la 90%.

Videoclipuri recomandate

„Sistemul nostru este cu adevărat revoluționar”, a declarat Taylan Kamis, CEO și co-fondator al DeepZen, pentru Digital Trends. „Funcționează folosind învățarea profundă și rețelele neuronale pentru a înțelege cum vorbește și citește un om. Apoi antrenăm sistemul astfel încât să poată recunoaște unde să aplice emoțiile și intonația potrivite atunci când citește o bucată de text. Rezultatul este un discurs asemănător uman, care seamănă foarte mult cu lucrul real.”

Legate de

  • Iluziile optice ne-ar putea ajuta să construim următoarea generație de IA
  • Atingerea finală: modul în care oamenii de știință le oferă roboților simțuri tactile asemănătoare oamenilor
  • Citiți „scriptura sintetică” ciudat de frumoasă a unui A.I. care crede că este Dumnezeu

În mod inevitabil, o astfel de lucrare poate fi prezentată ca un alt exemplu de IA de ultimă oră. unelte amenințarea unei profesii umane. În acest caz, acea profesie implică actori care, în ciuda a ceea ce sunt capabile să obțină câteva figuri de profil, nu au cariera cea mai stabilă și stabilă așa cum este. Ar fi naiv să credem că un astfel de software nu va avea un impact asupra viitorului actorilor vocali, dar, după cum Kamis subliniază că există o mulțime de scenarii în care instrumente precum DeepZen ar putea fi un pozitiv net pentru umanitatea.

De exemplu, ar putea face posibilă crearea de cărți audio bazate pe lucrări ale unor scriitori noi și emergenți sau de la editori care nu au luxul bugetelor mari. De asemenea, ar putea fi folosit pentru a ajuta la dezvoltarea unor instrumente superioare de transpunere a textului în vorbire pentru persoanele care suferă de dislexie sau au probleme de citire.

„În ceea ce privește viitorul, ne uităm și la producerea de voice-over pentru industria de producție video, așa cum precum și jocuri, unde este nevoie de text-to-speech în timp real pentru a îmbunătăți experiența jucătorului”, Kami a spus. „Ne uităm și la alte limbi.”

Puteți verifica un eșantion al sistemului Aici.

Recomandările editorilor

  • Roboții de securitate ar putea veni la o școală din apropierea ta
  • Cum vom ști când un AI devine de fapt sensibil?
  • I.A. analogic? Sună nebunesc, dar ar putea fi viitorul
  • Viitorul A.I.: 4 lucruri mari de urmărit în următorii câțiva ani
  • Această tehnologie era science fiction acum 20 de ani. Acum este realitatea

Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.