Umělá inteligence (AI) ano mít teď chvilkua vítr mu stále fouká do plachet se zprávou, že Microsoft pracuje na AI, která dokáže napodobit hlas kohokoli poté, co jí nakrmí krátkou třísekundovou ukázku.
Nový nástroj nazvaný VALL-E byl trénován na zhruba 60 000 hodinách hlasových dat v anglickém jazyce, který je podle Microsoftu „stokrát větší než stávající systémy“. S využitím těchto znalostí jeho tvůrci tvrdí, že potřebuje pouze malý vokální vstup, aby pochopil, jak replikovat hlas uživatele.
![muž mluví do telefonu](/f/cd7d144624280a34f84f21e2840a782e.jpg)
Působivější je, že VALL-E dokáže reprodukovat emoce, vokální tóny a akustické prostředí obsažené v každém vzorku, což je něco, s čím se jiné hlasové programy AI potýkaly. To mu dodává realističtější auru a přibližuje jeho výsledky něčemu, co by se dalo považovat za ryzí lidskou řeč.
Příbuzný
- GPT-4: jak používat chatbota s umělou inteligencí, který dělá ChatGPT hanbou
- Google Bard nyní umí mluvit, ale dokáže přehlušit ChatGPT?
- Nová společnost Elona Muska zaměřená na umělou inteligenci si klade za cíl ‚porozumět vesmíru‘
Ve srovnání s ostatními konkurenty převodu textu na řeč (TTS) Microsoft říká, že VALL-E „výrazně překonává nejmodernější systém zero-shot TTS, pokud jde o řeč. přirozenost a podobnost mluvčích.“ Jinými slovy, VALL-E zní mnohem více jako skuteční lidé než konkurenční AI, které se setkávají se zvukovými vstupy, které nebyly natrénovány. na.
Doporučená videa
Na GitHubu vytvořil Microsoft a malá knihovna vzorků vytvořené pomocí VALL-E. Výsledky jsou většinou velmi působivé, s mnoha vzorky, které reprodukují lesk a přízvuk hlasů mluvčích. Některé příklady jsou méně přesvědčivé, což naznačuje, že VALL-E pravděpodobně není hotový produkt, ale celkově je výstup přesvědčivý.
Obrovský potenciál – a rizika
![Osoba provádějící videohovor na zařízení Microsoft Surface se systémem Windows 11.](/f/d8ee217ada1a5024d555042df629a097.jpg)
V papír představující VALL-EMicrosoft vysvětluje, že VALL-E „může nést potenciální rizika při zneužití modelu, jako je falšování hlasu identifikace nebo vydávání se za konkrétního mluvčího.“ Takový schopný nástroj pro generování realisticky znějící řeči vyvolává přízrak stále přesvědčivější deepfakes, který by mohl být použit k napodobení čehokoli od bývalého romantického partnera po významnou mezinárodní osobnost.
Ke zmírnění této hrozby Microsoft říká, že „je možné sestavit detekční model, který bude rozlišovat, zda byl zvukový klip syntetizován VALL-E“. Společnost tvrdí, že bude používat i vlastní Principy AI při rozvíjení své práce. Tyto zásady pokrývají oblasti, jako je spravedlnost, bezpečnost, soukromí a odpovědnost.
VALL-E je jen posledním příkladem experimentování společnosti Microsoft s umělou inteligencí. V poslední době společnost pracuje na integrace ChatGPT do Bingupomocí AI zrekapitulujte si schůzky Teamsa roubování pokročilých nástrojů do aplikací, jako je Outlook, Word a PowerPoint. A podle Semaforu to Microsoft hledá investovat 10 miliard dolarů do výrobce ChatGPT OpenAI, společnost, do které již investovala značné prostředky.
Navzdory zjevným rizikům mohou být nástroje jako VALL-E zvláště užitečné například v medicíně, aby pomohly lidem získat zpět svůj hlas po nehodě. Schopnost replikovat řeč s tak malou vstupní sadou by mohla být v těchto situacích nesmírně slibná, za předpokladu, že se to udělá správně. Ale se všemi penězi utrácenými za AI – jak Microsoftem, tak dalšími – je jasné, že to v dohledné době nezmizí.
Doporučení redakce
- Špičkoví autoři požadují od firem zabývajících se umělou inteligencí platby za použití jejich díla
- Nejlepší nástroje pro úpravu videa AI
- Tvůrce ChatGPT OpenAI čelí vyšetřování FTC kvůli zákonům na ochranu spotřebitele
- Vědci říkají, že průlomy v umělé inteligenci by mohly přijít prostřednictvím mozku včel
- OpenAI buduje nový tým, aby zabránil tomu, že superinteligentní umělá inteligence bude nečestná
Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.