Esta IA pode falsificar sua voz depois de apenas três segundos

A inteligência artificial (IA) é tendo um momento agora, e o vento continua soprando com a notícia de que a Microsoft está trabalhando em uma IA que pode imitar a voz de qualquer pessoa depois de receber uma curta amostra de três segundos.

A nova ferramenta, batizada de VALL-E, foi treinada em cerca de 60 mil horas de dados de voz no idioma inglês, que a Microsoft afirma ser “centenas de vezes maior que os sistemas existentes”. Usando esse conhecimento, seus criadores afirmam que é necessário apenas um pequeno conhecimento de voz para entender como replicar a voz de um usuário.

homem falando ao telefone
Fizkes/Shutterstock

Mais impressionante, o VALL-E pode reproduzir as emoções, os tons vocais e o ambiente acústico encontrados em cada amostra, algo com que outros programas de IA de voz têm lutado. Isso lhe confere uma aura mais realista e aproxima seus resultados de algo que poderia passar por fala humana genuína.

Relacionado

  • GPT-4: como usar o chatbot AI que envergonha o ChatGPT
  • O Google Bard agora pode falar, mas será que pode abafar o ChatGPT?
  • A nova empresa de IA de Elon Musk visa ‘entender o universo’

Quando comparado com outros concorrentes de conversão de texto em fala (TTS), a Microsoft afirma que o VALL-E “supera significativamente o sistema TTS de última geração em termos de fala naturalidade e semelhança de alto-falante. Em outras palavras, o VALL-E se parece muito mais com humanos reais do que com IAs rivais que encontram entradas de áudio que não foram treinadas. sobre.

Vídeos recomendados

No GitHub, a Microsoft criou um pequena biblioteca de amostras criado usando VALL-E. Os resultados são, em sua maioria, muito impressionantes, com muitos samples que reproduzem a cadência e o sotaque das vozes dos locutores. Alguns dos exemplos são menos convincentes, indicando que o VALL-E provavelmente não é um produto acabado, mas no geral o resultado é convincente.

Enorme potencial – e riscos

Uma pessoa realizando uma videochamada em um dispositivo Microsoft Surface com Windows 11.
Microsoft/Unsplash

Em um artigo apresentando VALL-E, a Microsoft explica que VALL-E “pode trazer riscos potenciais no uso indevido do modelo, como falsificação de voz identificação ou personificação de um orador específico.” Uma ferramenta tão capaz de gerar uma fala com som realista aumenta o espectro de deepfakes cada vez mais convincentes, que poderia ser usado para imitar qualquer coisa, desde um ex-parceiro romântico até uma personalidade internacional proeminente.

Para mitigar essa ameaça, a Microsoft afirma que “é possível construir um modelo de detecção para discriminar se um clipe de áudio foi sintetizado pelo VALL-E”. A empresa diz que também usará seu próprio Princípios de IA ao desenvolver seu trabalho. Esses princípios abrangem áreas como justiça, segurança, privacidade e responsabilidade.

VALL-E é apenas o exemplo mais recente da experimentação da Microsoft com IA. Recentemente, a empresa vem trabalhando integrando ChatGPT ao Bing, usando IA para recapitule suas reuniões do Teamse incorporando ferramentas avançadas em aplicativos como Outlook, Word e PowerPoint. E de acordo com a Semafor, a Microsoft está procurando investir US$ 10 bilhões na OpenAI, fabricante do ChatGPT, uma empresa na qual já investiu fundos significativos.

Apesar dos riscos aparentes, ferramentas como o VALL-E podem ser especialmente úteis na medicina, por exemplo, para ajudar as pessoas a recuperar a voz após um acidente. Ser capaz de replicar a fala com um conjunto de entradas tão pequeno pode ser imensamente promissor nessas situações, desde que seja feito da maneira correta. Mas com todo o dinheiro gasto em IA – tanto pela Microsoft como por outros – está claro que isso não irá desaparecer tão cedo.

Recomendações dos Editores

  • Os principais autores exigem pagamento de empresas de IA pelo uso de seu trabalho
  • As melhores ferramentas de edição de vídeo com IA
  • OpenAI, fabricante do ChatGPT, enfrenta investigação da FTC sobre leis de proteção ao consumidor
  • Avanços na IA podem vir do cérebro das abelhas, dizem os cientistas
  • OpenAI construindo nova equipe para impedir que a IA superinteligente se torne desonesta

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.