Inteligența artificială (IA) este având un moment chiar acum, iar vântul continuă să bată în pânze cu vestea că Microsoft lucrează la un AI care poate imita vocea oricui după ce a fost alimentat cu o mostră scurtă de trei secunde.
Noul instrument, numit VALL-E, a fost instruit pe aproximativ 60.000 de ore de date vocale în limba engleză, despre care Microsoft spune că este „de sute de ori mai mare decât sistemele existente”. Folosind aceste cunoștințe, creatorii săi susțin că are nevoie doar de o mică parte de input vocal pentru a înțelege cum să reproducă vocea unui utilizator.
Mai impresionant, VALL-E poate reproduce emoțiile, tonurile vocale și mediul acustic găsite în fiecare probă, ceva cu care s-au luptat alte programe vocale AI. Acest lucru îi conferă o aură mai realistă și îi aduce rezultatele mai aproape de ceva care ar putea trece drept vorbire umană autentică.
Legate de
- GPT-4: cum să folosești chatbot-ul AI care face ChatGPT de rușine
- Google Bard poate vorbi acum, dar poate îneca ChatGPT?
- Noua companie de inteligență artificială a lui Elon Musk își propune să „înțeleagă universul”
În comparație cu alți concurenți din text-to-speech (TTS), Microsoft spune că VALL-E „depășește semnificativ sistemul TTS zero-shot de ultimă generație în ceea ce privește vorbirea. naturalețea și asemănarea vorbitorului.” Cu alte cuvinte, VALL-E sună mai mult ca oameni adevărați decât AI-uri rivale care întâlnesc intrări audio pe care nu le-au antrenat. pe.
Videoclipuri recomandate
Pe GitHub, Microsoft a creat un bibliotecă mică de mostre creat folosind VALL-E. Rezultatele sunt în mare parte foarte impresionante, cu multe mostre care reproduc ritmul și accentul vocilor difuzoarelor. Unele dintre exemple sunt mai puțin convingătoare, indicând că VALL-E nu este probabil un produs finit, dar în general rezultatul este convingător.
Potențial uriaș - și riscuri
Într-o lucrare de introducere a VALL-E, Microsoft explică că VALL-E „poate comporta riscuri potențiale în utilizarea greșită a modelului, cum ar fi falsificarea vocii. identificarea sau uzurparea identității unui anumit vorbitor.” Un astfel de instrument capabil pentru a genera ridicări de vorbire cu sunet realist spectrul lui deepfake-uri tot mai convingătoare, care ar putea fi folosit pentru a imita orice, de la un fost partener romantic la o personalitate internațională proeminentă.
Pentru a atenua această amenințare, Microsoft spune că „este posibil să se construiască un model de detectare pentru a discrimina dacă un clip audio a fost sintetizat de VALL-E”. Compania spune că va folosi și propriile sale Principiile AI atunci când își dezvoltă activitatea. Aceste principii acoperă domenii precum corectitudinea, siguranța, confidențialitatea și responsabilitatea.
VALL-E este doar cel mai recent exemplu al experimentării Microsoft cu AI. Recent, compania a lucrat integrarea ChatGPT în Bing, folosind AI pentru recapitulați întâlnirile tale Teamsși grefarea instrumentelor avansate în aplicații precum Outlook, Word și PowerPoint. Și conform Semafor, Microsoft caută investește 10 miliarde de dolari în producătorul ChatGPT OpenAI, o companie în care a investit deja fonduri semnificative.
În ciuda riscurilor aparente, instrumente precum VALL-E ar putea fi deosebit de utile în medicină, de exemplu, pentru a ajuta oamenii să-și recapete vocea după un accident. A fi capabil să reproducă vorbirea cu un set de intrări atât de mic ar putea fi extrem de promițător în aceste situații, cu condiția să fie făcut corect. Dar, având în vedere toți banii cheltuiți pe AI – atât de Microsoft, cât și de alții – este clar că nu va dispărea prea curând.
Recomandările editorilor
- Autorii de top cer plăți de la firmele de inteligență artificială pentru utilizarea lucrărilor lor
- Cele mai bune instrumente de editare video AI
- Creatorul de ChatGPT OpenAI se confruntă cu o anchetă FTC cu privire la legile privind protecția consumatorilor
- Descoperirile AI ar putea veni prin creierul albinelor, spun oamenii de știință
- OpenAI construiește o nouă echipă pentru a împiedica IA superinteligentă să devină necinstită
Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.