La inteligencia artificial (IA) es teniendo un momento ahora mismo, y el viento sigue soplando a favor con la noticia de que Microsoft está trabajando en una IA que puede imitar la voz de cualquier persona después de recibir una breve muestra de tres segundos.
La nueva herramienta, denominada VALL-E, ha sido entrenada con aproximadamente 60.000 horas de datos de voz en inglés, que según Microsoft es "cientos de veces más grande que los sistemas existentes". Utilizando ese conocimiento, sus creadores afirman que solo se necesita un pequeño conocimiento vocal para comprender cómo replicar la voz de un usuario.
Lo que es más impresionante es que VALL-E puede reproducir las emociones, los tonos vocales y el entorno acústico que se encuentran en cada muestra, algo con lo que otros programas de IA de voz han tenido problemas. Esto le da un aura más realista y acerca sus resultados a algo que podría pasar como un habla humana genuina.
Relacionado
- GPT-4: cómo utilizar el chatbot de IA que avergüenza a ChatGPT
- Google Bard ahora puede hablar, pero ¿puede ahogar a ChatGPT?
- La nueva empresa de inteligencia artificial de Elon Musk tiene como objetivo "comprender el universo"
En comparación con otros competidores de texto a voz (TTS), Microsoft dice que VALL-E "supera significativamente al sistema TTS de última generación en términos de voz". naturalidad y similitud del hablante”. En otras palabras, VALL-E suena mucho más como humanos reales que las IA rivales que encuentran entradas de audio que no han sido entrenadas. en.
Vídeos recomendados
En GitHub, Microsoft ha creado un pequeña biblioteca de muestras creado con VALL-E. Los resultados son en su mayoría muy impresionantes, con muchas muestras que reproducen el ritmo y el acento de las voces de los hablantes. Algunos de los ejemplos son menos convincentes, lo que indica que VALL-E probablemente no sea un producto terminado, pero en general el resultado es convincente.
Enorme potencial y riesgos
en un documento de presentación de VALL-E, Microsoft explica que VALL-E “puede conllevar riesgos potenciales en caso de un mal uso del modelo, como la suplantación de voz identificar o hacerse pasar por un hablante específico”. Una herramienta tan capaz para generar discursos que suenen realistas plantea el espectro de deepfakes cada vez más convincentes, que podría usarse para imitar cualquier cosa, desde una ex pareja romántica hasta una personalidad internacional prominente.
Para mitigar esa amenaza, Microsoft dice que "es posible construir un modelo de detección para discriminar si VALL-E sintetizó un clip de audio". La empresa dice que también utilizará su propia Principios de la IA al desarrollar su trabajo. Esos principios cubren áreas como equidad, seguridad, privacidad y responsabilidad.
VALL-E es sólo el último ejemplo de la experimentación de Microsoft con la IA. Recientemente, la empresa ha estado trabajando en integrando ChatGPT en Bing, usando IA para recapitula tus reuniones de Teamse injertar herramientas avanzadas en aplicaciones como Outlook, Word y PowerPoint. Y según Semafor, Microsoft está buscando invertir 10 mil millones de dólares en OpenAI, creador de ChatGPT, una empresa en la que ya ha invertido importantes fondos.
A pesar de los riesgos aparentes, herramientas como VALL-E podrían resultar especialmente útiles en medicina, por ejemplo, para ayudar a las personas a recuperar la voz después de un accidente. Ser capaz de replicar el habla con un conjunto de entradas tan pequeño podría resultar inmensamente prometedor en estas situaciones, siempre que se haga correctamente. Pero con todo el dinero que se gasta en IA (tanto por parte de Microsoft como de otros), está claro que no desaparecerá pronto.
Recomendaciones de los editores
- Los principales autores exigen un pago a las empresas de inteligencia artificial por utilizar su trabajo
- Las mejores herramientas de edición de vídeo con IA
- OpenAI, fabricante de ChatGPT, se enfrenta a una investigación de la FTC sobre las leyes de protección al consumidor
- Los avances en IA podrían llegar a través del cerebro de las abejas, dicen los científicos
- OpenAI crea un nuevo equipo para evitar que la IA superinteligente se vuelva deshonesta
Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.