Ovaj AI može prevariti vaš glas nakon samo tri sekunde

Umjetna inteligencija (AI) je imati trenutak upravo sada, a vjetar nastavlja puhati u jedra s vijestima da Microsoft radi na umjetnoj inteligenciji koja može imitirati bilo čiji glas nakon što mu se unese kratki uzorak od tri sekunde.

Novi alat, nazvan VALL-E, obučen je na približno 60.000 sati glasovnih podataka na engleskom jeziku, za koje Microsoft kaže da su "stotinama puta veći od postojećih sustava". Koristeći to znanje, njegovi tvorci tvrde da mu treba samo mali dio vokalnog unosa da bi se razumjelo kako replicirati glas korisnika.

čovjek koji govori u telefon — Fizkes/Shutterstock

Što je još impresivnije, VALL-E može reproducirati emocije, vokalne tonove i akustično okruženje koje se nalazi u svakom uzorku, nešto s čime su se drugi glasovni AI programi borili. To mu daje realističniju auru i približava njegove rezultate nečemu što bi moglo proći kao pravi ljudski govor.

Povezano

GPT-4: kako koristiti AI chatbot koji posramljuje ChatGPT
Google Bard sada može govoriti, ali može li ugušiti ChatGPT?
Nova AI tvrtka Elona Muska ima za cilj 'razumjeti svemir'

U usporedbi s drugim konkurentima za pretvaranje teksta u govor (TTS), Microsoft kaže da VALL-E „značajno nadmašuje najsuvremeniji TTS sustav bez snimanja u smislu govora prirodnost i sličnost govornika.” Drugim riječima, VALL-E zvuči puno više poput pravih ljudi nego suparničkih AI-ova koji nailaze na audio ulaze za koje nisu bili obučeni na.

Preporučeni videozapisi

Na GitHubu Microsoft je stvorio mala biblioteka uzoraka stvoren pomoću VALL-E. Rezultati su uglavnom vrlo impresivni, s mnogo uzoraka koji reproduciraju ton i naglasak glasova govornika. Neki od primjera su manje uvjerljivi, što ukazuje da VALL-E vjerojatno nije gotov proizvod, ali sveukupno je rezultat uvjerljiv.

Ogroman potencijal — i rizici

Osoba koja vodi videopoziv na Microsoft Surface uređaju sa sustavom Windows 11. — Microsoft/Unsplash

U papir koji predstavlja VALL-E, Microsoft objašnjava da VALL-E “može nositi potencijalne rizike u zlouporabi modela, kao što je krivotvorenje glasa identifikacija ili lažno predstavljanje određenog govornika.” Tako sposoban alat za generiranje govora koji zvuči realno avet od sve uvjerljiviji deepfakeovi, koji se može koristiti za oponašanje bilo čega, od bivšeg romantičnog partnera do istaknute međunarodne ličnosti.

Kako bi ublažio tu prijetnju, Microsoft kaže da je "moguće izgraditi model detekcije za diskriminaciju je li VALL-E sintetizirao audio zapis." Tvrtka kaže da će također koristiti svoje AI načela kada razvija svoj rad. Ta načela pokrivaju područja kao što su poštenje, sigurnost, privatnost i odgovornost.

VALL-E je samo posljednji primjer Microsoftovog eksperimentiranja s umjetnom inteligencijom. Nedavno je tvrtka radila na integracija ChatGPT-a u Bing, koristeći AI za rekapitulirajte svoje timove sastanke, te usađivanje naprednih alata u aplikacije poput Outlook, Word i PowerPoint. A prema Semaforu, Microsoft želi uložiti 10 milijardi dolara u ChatGPT proizvođač OpenAI, tvrtke u koju je već uložio značajna sredstva.

Unatoč prividnim rizicima, alati poput VALL-E mogli bi biti posebno korisni u medicini, na primjer, za pomoć ljudima da povrate svoj glas nakon nesreće. Mogućnost repliciranja govora s tako malim ulaznim skupom mogla bi biti neizmjerno obećavajuća u ovakvim situacijama, pod uvjetom da se napravi kako treba. Ali uz sav novac koji se troši na umjetnu inteligenciju - i Microsoft i drugi - jasno je da neće nestati u skorije vrijeme.

Preporuke urednika

Vrhunski autori traže plaćanje od AI tvrtki za korištenje njihovog rada
Najbolji AI alati za uređivanje videa
Proizvođač ChatGPT-a OpenAI suočava se s istragom FTC-a zbog zakona o zaštiti potrošača
Znanstvenici kažu da bi otkrića umjetne inteligencije mogla doći preko mozgova pčela
OpenAI gradi novi tim koji će spriječiti da superinteligentna umjetna inteligencija postane skitnica

Nadogradite svoj životni stilDigitalni trendovi pomažu čitateljima da prate brzi svijet tehnologije sa svim najnovijim vijestima, zabavnim recenzijama proizvoda, pronicljivim uvodnicima i jedinstvenim brzim pregledima.

Ovaj AI može prevariti vaš glas nakon samo tri sekunde

Ogroman potencijal — i rizici

Preporuke urednika

Kategorije

Nedavno

Vijesti o HTC tabletima: specifikacije, datum lansiranja, cijena i više

Vijesti o Apple Watchu: specifikacije, cijena, datum izlaska

Cyanogen uređaji dolazit će s Microsoftovim aplikacijama