Denne AI kan forfalske din stemme efter kun tre sekunder

Kunstig intelligens (AI) er har et øjeblik lige nu, og vinden fortsætter med at blæse i sejlene med nyheden om, at Microsoft arbejder på en AI, der kan efterligne enhvers stemme efter at være blevet fodret med en kort prøve på tre sekunder.

Det nye værktøj, kaldet VAL-E, er blevet trænet i omkring 60.000 timers taledata på engelsk, som Microsoft siger er "hundredvis af gange større end eksisterende systemer". Ved at bruge den viden hævder dets skabere, at det kun behøver en lille smule vokalinput for at forstå, hvordan man replikerer en brugers stemme.

mand taler i telefonen — Fizkes/Shutterstock

Mere imponerende, VALL-E kan gengive de følelser, vokale toner og akustiske omgivelser, der findes i hver sample, noget andre stemme-AI-programmer har kæmpet med. Det giver den en mere realistisk aura og bringer dens resultater tættere på noget, der kunne passere som ægte menneskelig tale.

Relaterede

GPT-4: hvordan man bruger AI chatbot, der gør ChatGPT til skamme
Google Bard kan nu tale, men kan den overdøve ChatGPT?
Elon Musks nye AI-virksomhed har til formål at 'forstå universet'

Sammenlignet med andre tekst-til-tale (TTS)-konkurrenter, siger Microsoft, at VALL-E "væsentligt overgår det avancerede zero-shot TTS-system med hensyn til tale naturlighed og talerlighed." Med andre ord, VALL-E lyder meget mere som rigtige mennesker end rivaliserende AI'er, der støder på lydindgange, som de ikke er blevet trænet på.

Anbefalede videoer

På GitHub har Microsoft oprettet en lille bibliotek af prøver oprettet ved hjælp af ALL-E. Resultaterne er for det meste meget imponerende, med mange samples, der gengiver lyden og accenten af højttalernes stemmer. Nogle af eksemplerne er mindre overbevisende, hvilket indikerer, at VALL-E sandsynligvis ikke er et færdigt produkt, men generelt er outputtet overbevisende.

Kæmpe potentiale - og risici

En person, der udfører et videoopkald på en Microsoft Surface-enhed, der kører Windows 11. — Microsoft/Unsplash

I en papir, der introducerer ALL-E, forklarer Microsoft, at VALL-E "kan medføre potentielle risici ved misbrug af modellen, såsom spoofing-stemme identifikation eller efterligning af en bestemt taler." Sådan et dygtigt værktøj til at generere realistisk klingende taleforhøjelser spøgelset af stadig mere overbevisende deepfakes, som kunne bruges til at efterligne alt fra en tidligere romantisk partner til en fremtrædende international personlighed.

For at afbøde denne trussel siger Microsoft "det er muligt at bygge en detektionsmodel for at skelne, om et lydklip blev syntetiseret af VALL-E." Virksomheden siger, at den også vil bruge sin egen AI principper når man udvikler sit arbejde. Disse principper dækker områder som retfærdighed, sikkerhed, privatliv og ansvarlighed.

VALL-E er blot det seneste eksempel på Microsofts eksperimenter med kunstig intelligens. På det seneste har virksomheden arbejdet på at integrere ChatGPT i Bing, ved hjælp af AI til opsummere dine Teams-møder, og podning af avancerede værktøjer i apps som Outlook, Word og PowerPoint. Og ifølge Semafor søger Microsoft investere $10 milliarder i ChatGPT-producenten OpenAI, en virksomhed den allerede har pløjet betydelige midler ind i.

På trods af de tilsyneladende risici kunne værktøjer som VALL-E være særligt nyttige inden for medicin, for eksempel for at hjælpe folk med at genvinde deres stemme efter en ulykke. At være i stand til at replikere tale med et så lille inputsæt kunne være uhyre lovende i disse situationer, forudsat at det gøres rigtigt. Men med alle de penge, der bliver brugt på kunstig intelligens - både af Microsoft og andre - er det klart, at det ikke forsvinder med det samme.

Redaktørens anbefalinger

Topforfattere kræver betaling fra AI-virksomheder for at bruge deres arbejde
De bedste AI-videoredigeringsværktøjer
ChatGPT-producenten OpenAI står over for FTC-undersøgelse over forbrugerbeskyttelseslove
AI-gennembrud kan komme via biernes hjerner, siger videnskabsmænd
OpenAI bygger nyt hold for at forhindre, at superintelligent kunstig intelligens bliver useriøs

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.

Denne AI kan forfalske din stemme efter kun tre sekunder

Kæmpe potentiale - og risici

Redaktørens anbefalinger

Kategorier

Nylig

Rygte: Netflix rejser til Europa i 2012

Google opdaterer Product Search i god tid til ferien

Twitter erhverver opstart af udstyr til det sociale netværk Bagcheck