Cette IA peut usurper votre voix après seulement trois secondes

L'intelligence artificielle (IA) est j'ai un moment en ce moment, et le vent continue de souffler dans ses voiles avec l’annonce que Microsoft travaille sur une IA capable d’imiter la voix de n’importe qui après avoir reçu un court échantillon de trois secondes.

Le nouvel outil, baptisé VALL-E, a été formé sur environ 60 000 heures de données vocales en langue anglaise, ce qui, selon Microsoft, est « des centaines de fois plus volumineux que les systèmes existants ». En utilisant ces connaissances, ses créateurs affirment qu’il suffit d’un petit peu d’entrée vocale pour comprendre comment reproduire la voix d’un utilisateur.

homme parlant au téléphone — Fizkes/Shutterstock

Plus impressionnant encore, VALL-E peut reproduire les émotions, les tonalités vocales et l'environnement acoustique trouvés dans chaque échantillon, ce avec quoi d'autres programmes d'IA vocale ont eu du mal. Cela lui donne une aura plus réaliste et rapproche ses résultats de quelque chose qui pourrait passer pour un véritable discours humain.

En rapport

GPT-4: comment utiliser le chatbot IA qui fait honte à ChatGPT
Google Bard peut désormais parler, mais peut-il étouffer ChatGPT?
La nouvelle société d’IA d’Elon Musk vise à « comprendre l’univers »

Comparé à d'autres concurrents de synthèse vocale (TTS), Microsoft affirme que VALL-E « surpasse considérablement le système TTS zéro tir de pointe en termes de parole ». naturel et similitude des locuteurs. En d’autres termes, VALL-E ressemble beaucoup plus à de vrais humains qu’à des IA rivales qui rencontrent des entrées audio pour lesquelles elles n’ont pas été entraînées. sur.

Vidéos recommandées

Sur GitHub, Microsoft a créé un petite bibliothèque d'échantillons créé à l'aide de VALL-E. Les résultats sont pour la plupart très impressionnants, avec de nombreux échantillons qui reproduisent le rythme et l’accent des voix des intervenants. Certains exemples sont moins convaincants, indiquant que VALL-E n’est probablement pas un produit fini, mais dans l’ensemble, le résultat est convaincant.

Potentiel énorme – et risques

Une personne effectuant un appel vidéo sur un appareil Microsoft Surface exécutant Windows 11. — Microsoft/Unsplash

Dans un article présentant VALL-E, Microsoft explique que VALL-E « peut comporter des risques potentiels en cas d'utilisation abusive du modèle, tels que l'usurpation de la voix. identification ou usurpation de l’identité d’un locuteur spécifique. Un outil aussi performant pour générer des discours réalistes augmente le spectre de des deepfakes toujours plus convaincants, qui pourrait être utilisé pour imiter n'importe quoi, d'un ancien partenaire romantique à une personnalité internationale de premier plan.

Pour atténuer cette menace, Microsoft affirme « qu’il est possible de créer un modèle de détection permettant de déterminer si un clip audio a été synthétisé par VALL-E ». L'entreprise affirme qu'elle utilisera également ses propres Principes de l'IA lors du développement de son travail. Ces principes couvrent des domaines tels que l'équité, la sécurité, la confidentialité et la responsabilité.

VALL-E n’est que le dernier exemple de l’expérimentation de Microsoft en matière d’IA. Récemment, l'entreprise a travaillé sur intégrer ChatGPT dans Bing, en utilisant l'IA pour récapitulez vos réunions Teams, et en greffant des outils avancés dans des applications comme Outlook, Word et PowerPoint. Et selon Semafor, Microsoft cherche à investir 10 milliards de dollars dans le créateur de ChatGPT OpenAI, une entreprise dans laquelle elle a déjà investi des fonds importants.

Malgré les risques apparents, des outils comme VALL-E pourraient être particulièrement utiles en médecine, par exemple pour aider les gens à retrouver la voix après un accident. Être capable de reproduire la parole avec un si petit ensemble d’entrées pourrait être extrêmement prometteur dans ces situations, à condition que cela soit bien fait. Mais avec tout l’argent dépensé pour l’IA – tant par Microsoft que par d’autres – il est clair que cela ne va pas disparaître de si tôt.

Recommandations des rédacteurs

Les meilleurs auteurs exigent une rémunération des entreprises d’IA pour l’utilisation de leurs travaux
Les meilleurs outils de montage vidéo IA
Le créateur de ChatGPT, OpenAI, fait face à une enquête de la FTC sur les lois sur la protection des consommateurs
Les avancées en matière d’IA pourraient provenir du cerveau des abeilles, selon des scientifiques
OpenAI crée une nouvelle équipe pour empêcher l'IA superintelligente de devenir voyou

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.

Cette IA peut usurper votre voix après seulement trois secondes

Potentiel énorme – et risques

Recommandations des rédacteurs

Catégories

Récent

Razer divulgue les informations personnelles de plus de 100 000 clients

Les vélos Rambo sont conçus pour les aventures extrêmes dans l'arrière-pays

Le dernier projet farfelu de Dubaï est une forêt tropicale à l'intérieur d'un hôtel