Este discurso sintetizado realista pode ser o futuro dos audiolivros

Vozes sintetizadas como as usadas por Siri e Alexa são ótimas para nos informar a previsão do tempo do dia ou como restam muitos minutos em um cronômetro de cozimento, mas você realmente gostaria que seus tons monótonos e monótonos lessem você audiolivros? Provavelmente não, e é por isso que a maioria de nós recorre a serviços de voz humana, como o Audible, para obter a correção do audiolivro. No entanto, os dubladores humanos podem não receber a aprovação por muito mais tempo, devido ao trabalho pioneiro de uma startup com sede em Londres chamada DeepZen.

Usando algoritmos de inteligência artificial, aumentados pelo poder de fogo tecnológico de O poder de IA da IBM e tecnologias Watson, a DeepZen desenvolveu ferramentas de conversão de texto em fala que não apenas soam humanas na primeira audição, mas também podem captar as pistas emocionais necessárias para a leitura de texto de maneira convincente. Ao fazer isso, a empresa afirma que poderia reduzir o tempo e o custo de produção de audiolivros em até 90%.

Vídeos recomendados

“Nosso sistema é verdadeiramente revolucionário”, disse Taylan Kamis, CEO e cofundador da DeepZen, à Digital Trends. “Funciona usando aprendizagem profunda e redes neurais para entender como um ser humano fala e lê. Em seguida, treinamos o sistema para que ele reconheça onde aplicar as emoções e a entonação corretas ao ler um trecho de texto. O resultado é uma fala humana muito parecida com a real.”

Relacionado

  • Ilusões de ótica podem nos ajudar a construir a próxima geração de IA
  • Toque final: como os cientistas estão dando aos robôs sentidos táteis semelhantes aos humanos
  • Leia a estranhamente bela “escritura sintética” de uma IA. que pensa que é Deus

Inevitavelmente, trabalhos como este podem ser considerados mais um exemplo de IA de ponta. ferramentas ameaçando uma profissão humana. Neste caso, essa profissão envolve atores que, apesar do que algumas figuras de destaque conseguem alcançar, não têm as carreiras mais estáveis ​​e estáveis ​​como são. Seria ingênuo pensar que um software como este não terá impacto no futuro dos dubladores, mas, como Kamis aponta, há muitos cenários em que ferramentas como a do DeepZen podem ser positivas para humanidade.

Por exemplo, poderia tornar possível a criação de audiolivros baseados em obras de escritores novos e emergentes, ou de editoras que não podem se dar ao luxo de grandes orçamentos. Também poderia ser usado para ajudar a desenvolver ferramentas superiores de conversão de texto em fala para pessoas com dislexia ou com dificuldade de leitura.

“No futuro, também pretendemos produzir locuções para a indústria de produção de vídeo, assim como bem como jogos, onde há necessidade de conversão de texto em fala em tempo real para aprimorar a experiência do jogador”, Kami disse. “Também estamos olhando para outros idiomas.”

Você pode conferir uma amostra do sistema aqui.

Recomendações dos Editores

  • Robôs de segurança podem estar chegando a uma escola perto de você
  • Como saberemos quando uma IA realmente se tornará senciente?
  • IA analógica? Parece loucura, mas pode ser o futuro
  • O futuro da IA: quatro grandes coisas a serem observadas nos próximos anos
  • Essa tecnologia era ficção científica há 20 anos. Agora é realidade

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.