Questo discorso sintetizzato realistico potrebbe essere il futuro degli audiolibri

Le voci sintetizzate come quelle utilizzate da Siri e Alexa vanno bene per dirci le previsioni del tempo del giorno o come rimangono molti minuti sul timer di cottura, ma vorresti davvero che i loro toni piatti e monotoni ti leggessero audiolibri? Probabilmente no, motivo per cui la maggior parte di noi si rivolge a servizi con voce umana come Audible per ottenere la correzione dell'audiolibro. Tuttavia, i doppiatori umani potrebbero non ottenere il consenso ancora per molto, a causa del lavoro pionieristico di una startup londinese chiamata Deep Zen.

Utilizzando algoritmi di intelligenza artificiale, aumentati dalla potenza di fuoco tecnologica di Power A.I. di IBM e tecnologie Watson, DeepZen ha sviluppato strumenti di sintesi vocale che non solo suonano umani al primo ascolto, ma possono anche cogliere i segnali emotivi necessari per leggere il testo in modo avvincente. In tal modo, la società afferma che potrebbe ridurre i tempi e i costi di produzione degli audiolibri fino al 90%.

Video consigliati

"Il nostro sistema è davvero rivoluzionario", ha dichiarato a Digital Trends Taylan Kamis, CEO e co-fondatore di DeepZen. “Funziona utilizzando il deep learning e le reti neurali per capire come un essere umano parla e legge. Quindi addestriamo il sistema in modo che possa riconoscere dove applicare le giuste emozioni e intonazione durante la lettura di un pezzo di testo. Il risultato è un linguaggio umano molto somigliante alla realtà”.

Imparentato

  • Le illusioni ottiche potrebbero aiutarci a costruire la prossima generazione di intelligenza artificiale
  • Tocco finale: come gli scienziati stanno dando ai robot sensi tattili simili a quelli umani
  • Leggi la "scrittura sintetica" stranamente bella di un A.I. che pensa che sia Dio

Inevitabilmente, un lavoro come questo può essere considerato un altro esempio di intelligenza artificiale all'avanguardia. utensili minacciando una professione umana. In questo caso, quella professione coinvolge attori che, nonostante ciò che alcune figure di alto profilo sono in grado di realizzare, non hanno carriere stabili e stabili come sono. Sarebbe ingenuo pensare che un software come questo non avrà un impatto sul futuro dei doppiatori, ma, come Kamis sottolinea che ci sono molti scenari in cui strumenti come quello di DeepZen potrebbero essere nettamente positivi umanità.

Ad esempio, potrebbe rendere possibile la creazione di audiolibri basati su opere di scrittori nuovi ed emergenti o di editori che non possono permettersi il lusso di grandi budget. Potrebbe anche essere usato per aiutare a sviluppare strumenti di sintesi vocale superiori per le persone che soffrono di dislessia o che hanno comunque difficoltà a leggere.

“Per quanto riguarda il futuro, stiamo anche valutando la possibilità di produrre voci fuori campo per l'industria della produzione video così come i giochi, dove c’è bisogno di sintesi vocale in tempo reale per migliorare l’esperienza del giocatore”, Kami disse. "Stiamo esaminando anche altre lingue."

Puoi controllare un esempio del sistema Qui.

Raccomandazioni degli editori

  • I robot di sicurezza potrebbero arrivare in una scuola vicino a te
  • Come faremo a sapere quando un'intelligenza artificiale diventerà effettivamente senziente?
  • IA analogica? Sembra pazzesco, ma potrebbe essere il futuro
  • Il futuro dell'intelligenza artificiale: 4 grandi cose a cui prestare attenzione nei prossimi anni
  • Questa tecnologia era fantascienza 20 anni fa. Ora è realtà

Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.