Táto AI dokáže sfalšovať váš hlas už po troch sekundách

Umelá inteligencia (AI) je mať chvíľku práve teraza vietor mu stále fúka do plachiet so správou, že Microsoft pracuje na AI, ktoré dokáže napodobniť hlas kohokoľvek po nakŕmení krátkou trojsekundovou ukážkou.

Nový nástroj s názvom VALL-E bol vyškolený na približne 60 000 hodinách hlasových údajov v anglickom jazyku, ktorý je podľa Microsoftu „stokrát väčší ako existujúce systémy“. Na základe týchto poznatkov jeho tvorcovia tvrdia, že na pochopenie toho, ako replikovať hlas používateľa, potrebuje iba malý vokálny vstup.

muž hovorí do telefónu — Fizkes/Shutterstock

Pôsobivejšie, VALL-E dokáže reprodukovať emócie, vokálne tóny a akustické prostredie nachádzajúce sa v každej vzorke, s čím iné programy hlasovej AI zápasili. To mu dodáva realistickejšiu auru a približuje jeho výsledky niečomu, čo by sa dalo považovať za skutočnú ľudskú reč.

Súvisiace

GPT-4: ako používať chatbota AI, ktorý robí ChatGPT hanbou
Google Bard teraz môže hovoriť, ale dokáže prehlušiť ChatGPT?
Nová spoločnosť Elona Muska zameraná na umelú inteligenciu má za cieľ „pochopiť vesmír“

V porovnaní s ostatnými konkurentmi prevodu textu na reč (TTS) spoločnosť Microsoft hovorí, že VALL-E „výrazne prekonáva najmodernejší systém TTS s nulovým záberom, pokiaľ ide o reč. prirodzenosť a podobnosť rečníkov.“ Inými slovami, VALL-E znie oveľa viac ako skutoční ľudia než konkurenčné AI, ktoré sa stretávajú so zvukovými vstupmi, ktoré neboli trénované. na.

Odporúčané videá

Na GitHub spoločnosť Microsoft vytvorila a malá knižnica vzoriek vytvorené pomocou VALL-E. Výsledky sú väčšinou veľmi pôsobivé, s mnohými vzorkami, ktoré reprodukujú jas a prízvuk hlasov rečníkov. Niektoré z príkladov sú menej presvedčivé, čo naznačuje, že VALL-E pravdepodobne nie je hotový produkt, ale celkovo je výstup presvedčivý.

Obrovský potenciál – a riziká

Osoba, ktorá vedie videohovor na zariadení Microsoft Surface so systémom Windows 11. — Microsoft/Unsplash

V papier predstavujúci VALL-EMicrosoft vysvetľuje, že VALL-E „môže niesť potenciálne riziká pri zneužití modelu, ako je spoofing voice identifikácia alebo odcudzenie identity konkrétneho rečníka.“ Takýto schopný nástroj na generovanie realisticky znejúcej reči zvyšuje strašidlo stále presvedčivejšie deepfakes, pomocou ktorého by sa dalo napodobniť čokoľvek od bývalého romantického partnera až po významnú medzinárodnú osobnosť.

Na zmiernenie tejto hrozby spoločnosť Microsoft hovorí, že „je možné vytvoriť detekčný model na rozlíšenie, či bol zvukový klip syntetizovaný VALL-E“. Spoločnosť tvrdí, že bude používať aj vlastné princípy AI pri rozvíjaní svojej práce. Tieto zásady pokrývajú oblasti ako spravodlivosť, bezpečnosť, súkromie a zodpovednosť.

VALL-E je len najnovším príkladom experimentovania spoločnosti Microsoft s AI. V poslednej dobe spoločnosť pracuje na integrácia ChatGPT do Bingupomocou AI zrekapitulujte si stretnutia v aplikácii Teamsa vrúbľovanie pokročilých nástrojov do aplikácií, ako napr Outlook, Word a PowerPoint. A podľa Semaforu to Microsoft hľadá investovať 10 miliárd dolárov do výrobcu ChatGPT OpenAI, spoločnosť, do ktorej už investovala značné prostriedky.

Napriek zjavným rizikám by nástroje ako VALL-E mohli byť obzvlášť užitočné napríklad v medicíne, aby pomohli ľuďom znovu získať svoj hlas po nehode. Schopnosť replikovať reč s takou malou vstupnou sadou by mohla byť v týchto situáciách nesmierne sľubná, za predpokladu, že sa to robí správne. Ale so všetkými peniazmi vynaloženými na AI – Microsoftom aj inými – je jasné, že to tak skoro nezmizne.

Odporúčania redaktorov

Špičkoví autori požadujú od firiem AI platbu za používanie ich práce
Najlepšie nástroje na úpravu videa AI
Výrobca ChatGPT OpenAI čelí vyšetrovaniu FTC v súvislosti so zákonmi na ochranu spotrebiteľa
Vedci tvrdia, že objavy AI by mohli prísť cez mozgy včiel
OpenAI buduje nový tím, aby zastavil nečestnú superinteligentnú AI

Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.

Táto AI dokáže sfalšovať váš hlas už po troch sekundách

Obrovský potenciál – a riziká

Odporúčania redaktorov

Kategórie

Nedávne

Najnovšie hodinky Hublot stoja 25 000 USD a môžete platiť iba bitcoínmi

Cana One má za cieľ zjednotiť SodaStream s inteligentnými funkciami

Elon Musk: plne naložená Tesla Semi es 500-míľový pohon