Veritone chce Deepfake klonovat váš hlas

Je tu video které se pravidelně objevují na mém kanálu YouTube. Je to rozhovor mezi rappery Snoop Doggem a 50 Centem, kteří si stěžují na to, že ve srovnání s jejich generací znějí všichni moderní hiphopoví umělci zřejmě stejně. „Když se člověk rozhodne být sám sebou, nabízí něco, co nemůže být nikdo jiný,“ říká 50 Cent. "Jo, protože když jednou budeš ty - kdo jiný může být než ty?" Snoop odpovídá.

Obsah

  • “Můžeme předělat hodně”
  • Jak bude reagovat veřejnost?
  • Myslete na budoucnost

Snoop Dogg zosobňuje dnešní rappery zvukově podobný tok

Když bylo video nahráno v říjnu 2014, mohla to být z velké části pravda. Ale o pár let později to rozhodně není. Ve světě audio deepfakes je možné trénovat A.I. aby to znělo děsivě podobně jako jiná osoba tím, že ji naplníte zvukovým korpusem sestávajícím z hodin jejich mluvených dat. Výsledky jsou znepokojivě přesné.

Doporučená videa

Veřejné osobnosti jako např rapper Jay-Z a psycholog Jordan Peterson si již stěžovali na lidi, kteří si neoprávněně přivlastňují jejich hlasy tím, že vytvářejí zvukové deepfakes a pak je nutí říkat hloupé věci na internetu. "Vzbudit,"

napsal Peterson. "Posvátnost tvého hlasu a tvého obrazu je vážně ohrožena." To jsou jen ty nešťastné případy. V jiných se mohou výsledky převrhnout do nevýrazné kriminality. v jeden incident z roku 2019, zločinci použili audio deepfake, aby se vydávali za hlas generálního ředitele energetické společnosti a přesvědčili po telefonu podřízeného, ​​aby urychleně převedl 243 000 dolarů na bankovní účet.

Veritone, A.I. společnost, která vytváří chytré nástroje pro označování médií pro zábavní průmysl, je vrátit zvukovou sílu hlubokého falešného zvuku zpět do rukou (nebo, ehm, do hrdla) těch, kterým právem patří. Tento měsíc společnost oznámila Marvel.ai, což prezident společnosti Ryan Steelberg popsal pro Digital Trends jako „kompletní řešení hlasu jako služby“. Veritone za poplatek postaví A.I. modelovat to zní jako vy (nebo pravděpodobněji jako slavná osoba s okamžitě rozpoznatelným hlasem), což lze následně licencovat na zapůjčení jako high-tech verzi Ariel's hlas jako kolaterál smlouva z Malá mořská víla.

Syntetický hlas od MARVEL.ai

„Váš hlas je stejně cenný jako jakýkoli jiný obsah nebo atribut značky, který máte,“ řekl Steelberg. „[Je to na úrovni] vašeho jména a podoby, vaší tváře, vašeho podpisu nebo písně, kterou jste napsali, nebo obsahu, který jste vytvořili.“

“Můžeme předělat hodně”

Někteří jedinci samozřejmě již dlouho prodávají své hlasy ve formě natáčení reklam nebo voiceoverů, zpívání písní a bezpočtu dalších forem zpeněžení. Ale všechny tyto snahy vyžadovaly, aby osoba skutečně řekla slova. Řešení Veritone slibuje, že bude individuálně škálovatelné.

Co kdyby bylo například možné, aby Kevin Hart licencoval svůj hlas luxusní značce, která by jej pak mohla použít k vytváření personalizovaných reklam? obsahující jméno diváka, umístění jeho nejbližší kamenné prodejny a konkrétní produkt, který by s největší pravděpodobností mohl Koupit? Spíše než trávit doslova dny v nahrávací kabině, A.I. by to mohlo dovolit udělat s trochou více (zap alespoň Hartova část), než podepsáním tečkované čáry souhlasit s tím, že jeho hlasovou podobu využije zmíněný třetí oslava. Zatímco byl na natáčení filmu nebo na komediálním turné nebo na dovolené nebo dokonce spal, jeho digitální hlas mohl shrábnout peníze.

"Můžeme toho hodně změnit," vysvětlil Steelberg ohledně tréninkového procesu. „Lidé, kteří už hodně mluví, pokud produkují podcast nebo v médiích, je tam spousta dat. Pravděpodobně už toho máme spoustu, kdyby náhodou byli naším zákazníkem.“

„Co považujeme za tak fascinující na této nové kategorii A.I. je rozšiřitelnost a variabilita."

Steelberg řekl, že myšlenka hlasu jako služby napadla Veritone před několika lety. V té době však nebyl přesvědčen, že modely strojového učení jsou schopny vytvořit hyperrealistické syntetické hlasy, které hledal. To je zvláště důležité, pokud jde o hlasy, které důvěrně známe, i když jsme dotyčného mluvčího nikdy nepotkali. Výsledky by mohly být nějaké slyšitelný tajemné údolí, kde každý špatný zvuk upozorňuje posluchače na skutečnost, že poslouchají falešné. Ale tady v roce 2021 je přesvědčen, že věci pokročily do bodu, kdy je to nyní možné. Proto Marvel.ai.

Steelberg mluví ve vzrušených buzzwordech o obrovském potenciálu technologie a mluví o možném množství „způsobů provádění“. Veritone umí vytvářet modely pro převod textu na řeč. Může také vytvářet modely pro řeč na řeč, přičemž hlasový herec může „řídit“ vokální výkon čtením slova s ​​vhodným skloňováním a poté mít hotový hlas překrytý na konci jako Snapchat filtr. Společnost může také otisknout každý hlas, aby mohla zjistit, zda byl pomocí její technologie vytvořen kus zjevně skutečného zvuku, který se někde objeví.

„Čím více o tom budete přemýšlet… doslova přijdete na 50 dalších [možných případů použití],“ řekl. „Co považujeme za tak fascinující na této nové kategorii A.I. je rozšiřitelnost a variabilita."

Zvažte některé další. Slavný sportovec může být bohem na basketbalovém hřišti, ale ďáblem, když na to přijde čtení řádků ve scénáři způsobem, který zní přirozeně. Pomocí technologie Veritone, jejich role ve videoherních scénách nebo čtení zvukové knihy svých memoárů (které možná také nenapsal) mohl hrát hlasový herec, který je pak digitálně upraven tak, aby zněl jako sportovec. Jako další možnost by mohl být film přeložen pro jiné země se stejným hereckým hlasem, který nyní čte linky ve francouzštině, mandarínštině nebo v jakémkoli jiném z mnoha jazyků, i když herec ve skutečnosti nemluví jim.

Jak bude reagovat veřejnost?

Nad tím vším samozřejmě visí velká otázka, jak se k tomu postaví veřejnost. To je ten ošemetný, nepředvídatelný kousek. Celebrity dnes musí hrát složitou roli: Jak nadživotní postavy, které stojí za to, aby jejich tvář byla vylepena na billboardech, tak také příbuzní jedinci, kteří mají problémy ve vztazích, tweetují o sledování televize v pyžamu a dělají hloupé obličeje, když jedí horko omáčka.

Co se tedy stane, když se objeví reklamy, které nejenže představují celebritu, která čte řádky, ale v případech, kdy to víme Interpret tyto řádky ve skutečnosti nikdy neřekl, ale jejich hlas byl programově využit, aby nám přinesl cílené inzerát? Steelberg řekl, že je to trochu jiné, když celebrita předá kontrolu nad svými sociálními médii správci účtu třetí strany. Pokud uvidíme tweet Taylor Swift, víme, že to dost možná nevyťukává samotná Taylor, zvláště pokud se jedná o podporu nebo propagační obsah.

Ale hlas je velmi reálným způsobem jiný, právě proto, že je osobnější. Zvláště pokud je to doprovázeno mírou personalizace, což je jeden z případů použití, který dává největší smysl. Pravda je taková, že, abych citoval scénáristu Williama Goldmana, nikdo neví, jaká bude odezva veřejnosti – právě proto, že přesně tohle ještě nikdo neudělal.

"Bude to provozovat spektrum, že?" řekl Steelberg. „[Někteří] lidé řeknou: ‚Použiji tento nástroj trochu, abych si zlepšil den, aby mi pomohl ušetřit čas.‘ Jiní řeknou naplno: „Chci, aby můj hlas všude rozšiřoval mou značku, a udělím mu licenci ven.'"

Jeho nejlepší odhad je, že přijetí bude případ od případu. "Musíte být v souladu s reakcí svého publika, a pokud vidíte, že věci fungují nebo nefungují," řekl. „Možná se jim to bude líbit. Mohou říci: ‚Víš co? Líbí se mi, že mi dáváte 10krát více obsahu nebo více osobního obsahu, i když vím, že jste k jeho rozšíření použili syntetický obsah. Děkuji. Děkuji.'"

Myslete na budoucnost

Veritone MARVEL.ai
Veritone

Pokud jde o budoucnost? Steelberg řekl: „Chceme spolupracovat se všemi hlavními talentovými agenturami. Myslíme si, že každý, kdo podniká ve vydělávání peněz kolem nedostatkové značky, by měl přemýšlet o své hlasové strategii.“

A také neočekávejte, že zůstane čistě u zvuku. „Vždy nás fascinoval potenciál použití syntetického obsahu buď k rozšíření, rozšíření nebo potenciálně úplně nahradit některé ze starších forem produkce obsahu,“ pokračoval. „Ať už v audio smyslu, nebo nakonec v budoucnu a video smysl.”

To je pravda: Jakmile Veritone ovládne trh ve světě audio deepfakes, plánuje jít ještě o krok dále a vstoupit do světa plně realizované virtuální avatary že oba znějí i vypadají k nerozeznání od svého zdroje.

Najednou ty personalizované reklamy od Zpráva o menšinách zní mnohem méně jako sci-fi.

Doporučení redakce

  • Ocenění CES 2023 Tech For Change společnosti Digital Trends
  • Uvnitř rychle eskalující války mezi deepfakes a deepfake detektory
  • Alexa a Siri nerozumí tónu vašeho hlasu, ale Oto ano
  • Kalifornie potírá deepfakes pro politiku a porno
  • Udržujte anonymitu online pomocí technologie deepfake, která vám vytvoří zcela novou tvář