Ce discours synthétisé réaliste pourrait être l’avenir des livres audio

Les voix synthétisées comme celles utilisées par Siri et Alexa conviennent parfaitement pour nous indiquer les prévisions météorologiques du jour ou comment il reste plusieurs minutes sur un minuteur de cuisson, mais voudriez-vous vraiment que leurs tons plats et monotones vous lisent des livres audio? Probablement pas, c'est pourquoi la plupart d'entre nous se tournent vers des services à voix humaine comme Audible pour obtenir notre solution de livres audio. Cependant, les acteurs de la voix humaine pourraient ne pas obtenir le feu vert trop longtemps, en raison du travail pionnier d'une startup basée à Londres appelée DeepZen.

Utiliser des algorithmes d’intelligence artificielle, augmentés par la puissance de feu technologique de La puissance A.I. d'IBM et les technologies Watson, DeepZen a développé des outils de synthèse vocale qui non seulement semblent humains à la première écoute, mais peuvent également capter les signaux émotionnels nécessaires à la lecture d'un texte de manière convaincante. Ce faisant, la société affirme qu’elle pourrait réduire jusqu’à 90 % le temps et les coûts de production des livres audio.

Vidéos recommandées

"Notre système est vraiment révolutionnaire", a déclaré Taylan Kamis, PDG et co-fondateur de DeepZen, à Digital Trends. « Cela fonctionne en utilisant l'apprentissage profond et les réseaux de neurones pour comprendre comment un humain parle et lit. Nous entraînons ensuite le système afin qu’il puisse reconnaître où appliquer les bonnes émotions et intonations lors de la lecture d’un morceau de texte. Le résultat est un discours humain très proche de la réalité.

En rapport

  • Les illusions d'optique pourraient nous aider à construire la prochaine génération d'IA
  • Touche finale: comment les scientifiques donnent aux robots des sens tactiles semblables à ceux des humains
  • Lisez les « écritures synthétiques » étrangement belles d’un IA. qui pense que c'est Dieu

Inévitablement, un travail comme celui-ci peut être présenté comme un autre exemple d’IA de pointe. outils menacer une profession humaine. Dans ce cas, ce métier implique des acteurs qui, malgré ce que quelques personnalités sont capables de réaliser, n’ont pas la carrière la plus stable et la plus stable qui soit. Il serait naïf de penser qu’un logiciel comme celui-ci n’aura pas d’impact sur l’avenir des doubleurs, mais, comme Kamis le souligne, il existe de nombreux scénarios dans lesquels des outils tels que DeepZen pourraient être un net positif pour humanité.

Par exemple, cela pourrait rendre possible la création de livres audio basés sur des œuvres d’écrivains nouveaux et émergents, ou d’éditeurs qui n’ont pas le luxe de disposer de gros budgets. Il pourrait également être utilisé pour aider à développer des outils de synthèse vocale de qualité supérieure pour les personnes dyslexiques ou ayant des difficultés à lire.

« Quant à l'avenir, nous envisageons également de produire des voix off pour l'industrie de la production vidéo, comme ainsi que les jeux, où il existe un besoin de synthèse vocale en temps réel pour améliorer l'expérience du joueur », Kami dit. "Nous étudions également d'autres langues."

Vous pouvez consulter un échantillon du système ici.

Recommandations des rédacteurs

  • Des robots de sécurité pourraient arriver dans une école près de chez vous
  • Comment saurons-nous quand une IA devient réellement sensible?
  • Une IA analogique? Ça paraît fou, mais ça pourrait être l'avenir
  • L’avenir de l’IA: 4 grandes choses à surveiller dans les prochaines années
  • Cette technologie relevait de la science-fiction il y a 20 ans. Maintenant c'est la réalité

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.