Las voces sintetizadas como las que usan Siri y Alexa están bien para decirnos el pronóstico del tiempo del día o cómo Quedan muchos minutos en el temporizador de cocción, pero ¿realmente quieres que sus tonos planos y monótonos te lean? audiolibros? Probablemente no, razón por la cual la mayoría de nosotros recurrimos a servicios de voz humana como Audible para arreglar nuestro audiolibro. Sin embargo, es posible que los actores de voz humanos no obtengan el visto bueno por mucho tiempo debido al trabajo pionero de una startup con sede en Londres llamada DeepZen.
Utilizando algoritmos de inteligencia artificial, aumentados por la potencia de fuego tecnológica de Power A.I. de IBM y tecnologías Watson, DeepZen ha desarrollado herramientas de conversión de texto a voz que no sólo suenan humanas a primera vista, sino que también pueden captar las señales emocionales necesarias para leer un texto de manera convincente. Al hacerlo, la empresa afirma que podría reducir el tiempo y el coste de producción de audiolibros hasta en un 90%.
Vídeos recomendados
"Nuestro sistema es verdaderamente revolucionario", dijo a Digital Trends Taylan Kamis, director ejecutivo y cofundador de DeepZen. “Funciona mediante aprendizaje profundo y redes neuronales para comprender cómo habla y lee un ser humano. Luego entrenamos el sistema para que pueda reconocer dónde aplicar las emociones y la entonación correctas al leer un texto. El resultado es un habla humana muy parecida a la real”.
Relacionado
- Las ilusiones ópticas podrían ayudarnos a construir la próxima generación de IA
- Toque final: cómo los científicos están dando a los robots sentidos táctiles similares a los humanos
- Lea la inquietantemente hermosa "escritura sintética" de una IA. que piensa que es dios
Inevitablemente, un trabajo como este puede considerarse otro ejemplo más de inteligencia artificial de vanguardia. herramientas amenazando una profesión humana. En este caso, esa profesión involucra a actores que, a pesar de lo que algunas figuras de alto perfil son capaces de lograr, no tienen las carreras más estables y estables. Sería ingenuo pensar que un software como este no tendrá un impacto en el futuro de los actores de doblaje, pero, como Kamis, hay muchos escenarios en los que herramientas como la de DeepZen podrían ser netamente positivas para humanidad.
Por ejemplo, podría hacer posible la creación de audiolibros basados en obras de escritores nuevos y emergentes, o de editoriales que no pueden darse el lujo de grandes presupuestos. También podría usarse para ayudar a desarrollar herramientas superiores de conversión de texto a voz para personas que tienen dislexia o problemas para leer.
“En cuanto al futuro, también estamos pensando en producir locuciones para la industria de producción de vídeo, así como así como en los juegos, donde existe la necesidad de conversión de texto a voz en tiempo real para mejorar la experiencia del jugador”, Kami dicho. "También estamos analizando otros idiomas".
Puedes ver una muestra del sistema. aquí.
Recomendaciones de los editores
- Los robots de seguridad podrían llegar a una escuela cercana a ti
- ¿Cómo sabremos cuándo una IA realmente se vuelve sensible?
- ¿IA analógica? Parece una locura, pero podría ser el futuro.
- El futuro de la IA: 4 grandes cosas a tener en cuenta en los próximos años
- Esta tecnología era ciencia ficción hace 20 años. Ahora es la realidad
Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.