Deze AI kan je stem al na drie seconden vervalsen

Kunstmatige intelligentie (AI) wel heb nu even een momentje, en de wind blijft in de zeilen waaien met het nieuws dat Microsoft werkt aan een AI die ieders stem kan imiteren nadat hij een korte sample van drie seconden heeft gekregen.

De nieuwe tool, genaamd VALL-E, is getraind op ongeveer 60.000 uur aan spraakgegevens in de Engelse taal, wat volgens Microsoft “honderden keren groter is dan bestaande systemen”. Met behulp van die kennis beweren de makers dat het slechts een klein beetje vocale input nodig heeft om te begrijpen hoe de stem van een gebruiker kan worden gerepliceerd.

man die in de telefoon spreekt
Fizkes/Shutterstock

Nog indrukwekkender is dat VALL-E de emoties, stemtonen en akoestische omgeving in elke sample kan reproduceren, iets waar andere stem-AI-programma's moeite mee hebben. Dat geeft het een realistischer uitstraling en brengt de resultaten dichter bij iets dat voor echte menselijke spraak zou kunnen doorgaan.

Verwant

  • GPT-4: hoe je de AI-chatbot gebruikt die ChatGPT te schande maakt
  • Google Bard kan nu spreken, maar kan het ChatGPT overstemmen?
  • Het nieuwe AI-bedrijf van Elon Musk wil 'het universum begrijpen'

Vergeleken met andere tekst-naar-spraak (TTS)-concurrenten zegt Microsoft dat VALL-E “aanzienlijk beter presteert dan het ultramoderne zero-shot TTS-systeem op het gebied van spraak natuurlijkheid en gelijkenis van de sprekers.” Met andere woorden: VALL-E klinkt veel meer als echte mensen dan concurrerende AI's die audio-invoer tegenkomen die ze niet hebben getraind op.

Aanbevolen video's

Op GitHub heeft Microsoft een kleine bibliotheek met monsters gemaakt met VAL-E. De resultaten zijn meestal zeer indrukwekkend, met veel samples die de melodie en het accent van de stemmen van de sprekers reproduceren. Sommige voorbeelden zijn minder overtuigend, wat aangeeft dat VALL-E waarschijnlijk geen voltooid product is, maar over het algemeen is de output overtuigend.

Enorm potentieel – en risico’s

Een persoon die een videogesprek voert op een Microsoft Surface-apparaat met Windows 11.
Microsoft/Unsplash

In een paper waarin VAL-E wordt geïntroduceerd, legt Microsoft uit dat VALL-E “mogelijke risico’s met zich meebrengt bij misbruik van het model, zoals het vervalsen van stemgeluid”. identificatie of het nabootsen van een specifieke spreker.” Zo'n capabel hulpmiddel voor het genereren van realistisch klinkende spraakverhogingen het spook van steeds overtuigender deepfakes, die kan worden gebruikt om alles na te bootsen, van een voormalige romantische partner tot een prominente internationale persoonlijkheid.

Om die dreiging te verzachten zegt Microsoft: “Het is mogelijk om een ​​detectiemodel te bouwen om te onderscheiden of een audiofragment door VALL-E is gesynthetiseerd.” Het bedrijf zegt dat het ook zijn eigen zal gebruiken AI-principes bij het ontwikkelen van zijn werk. Deze principes bestrijken gebieden als eerlijkheid, veiligheid, privacy en verantwoordingsplicht.

VALL-E is slechts het nieuwste voorbeeld van Microsoft’s experimenten met AI. De laatste tijd is er door het bedrijf aan gewerkt ChatGPT integreren in Bing, met behulp van AI een samenvatting van uw Teams-vergaderingen, en het enten van geavanceerde tools in apps zoals Outlook, Word en PowerPoint. En volgens Semafor is Microsoft daar naar op zoek investeer $10 miljard in ChatGPT-maker OpenAI, een bedrijf waar het al aanzienlijke bedragen in heeft gestoken.

Ondanks de schijnbare risico's zouden hulpmiddelen als VALL-E vooral nuttig kunnen zijn in de geneeskunde, bijvoorbeeld om mensen te helpen hun stem terug te krijgen na een ongeval. Het kunnen repliceren van spraak met zo’n kleine inputset zou in deze situaties enorm veelbelovend kunnen zijn, op voorwaarde dat het goed wordt gedaan. Maar nu al het geld dat aan AI wordt uitgegeven – zowel door Microsoft als door anderen – is het duidelijk dat dit niet snel zal verdwijnen.

Aanbevelingen van de redactie

  • Topauteurs eisen betaling van AI-bedrijven voor het gebruik van hun werk
  • De beste AI-videobewerkingstools
  • ChatGPT-maker OpenAI wordt geconfronteerd met een FTC-onderzoek naar wetten inzake consumentenbescherming
  • Doorbraken op het gebied van AI zouden via de hersenen van bijen kunnen komen, zeggen wetenschappers
  • OpenAI bouwt nieuw team om te voorkomen dat superintelligente AI schurkenstaten wordt

Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.