Veritone chce Deepfake klonovať váš hlas

Existuje a video ktorý sa pravidelne objavuje na mojom kanáli YouTube. Je to rozhovor medzi rappermi Snoop Doggom a 50 Centom, ktorí si sťažujú, že v porovnaní s ich generáciou všetci moderní hip-hop umelci zjavne znejú rovnako. „Keď sa človek rozhodne byť sám sebou, ponúka niečo, čo nemôže byť nikto iný,“ hovorí 50 Cent. "Áno, pretože keď raz budeš ty - kto môže byť tebou okrem teba?" Snoop odpovedá.

Obsah

  • “Môžeme prerobiť veľa”
  • Ako zareaguje verejnosť?
  • Myslite na budúcnosť

Snoop Dogg zosobňuje dnešný rapper zvukovo podobný tok

Keď bolo video nahrané v októbri 2014, mohla to byť vo všeobecnosti pravda. Ale len o pár rokov neskôr to určite nie je. Vo svete zvukových deepfakes je možné trénovať A.I. znieť strašidelne podobne ako iná osoba tým, že jej dáte zvukový korpus pozostávajúci z hodín ich hovorených údajov. Výsledky sú znepokojivo presné.

Odporúčané videá

Verejné osobnosti ako napr rapper Jay-Z a psychológ Jordan Peterson sa už sťažovali na ľudí, ktorí si privlastňujú svoj hlas vytváraním zvukových falzifikátov a potom ich nútia hovoriť hlúpe veci na internete. "Zobudiť sa,"

napísal Peterson. "Posvätnosť tvojho hlasu a tvojho obrazu je vážne ohrozená." To sú len tie nešťastné prípady. V iných prípadoch sa výsledky môžu prevrátiť do nevýraznej kriminality. In jeden incident z roku 2019, zločinci použili zvukový deepfake, aby sa vydávali za hlas generálneho riaditeľa energetickej spoločnosti a cez telefón presvedčili podriadeného, ​​aby urýchlene previedol 243 000 dolárov na bankový účet.

Veritone, A.I. spoločnosť, ktorá vytvára inteligentné nástroje na označovanie médií pre zábavný priemysel, je vrátením zvukovej deepfake moci späť do rúk (alebo, omylom, do hrdla) tých, ktorým to právom patrí. Tento mesiac spoločnosť oznámila Marvel.ai, čo prezident spoločnosti Ryan Steelberg opísal pre Digital Trends ako „kompletné riešenie hlasu ako služby“. Veritone za poplatok postaví A.I. modelovať to znie presne ako vy (alebo, čo je pravdepodobnejšie, slávna osoba s okamžite rozpoznateľným hlasom), na ktorú je možné požičať licenciu ako na high-tech verziu Ariel's hlasový obchod ako kolaterál od Malá morská víla.

Syntetický hlas od MARVEL.ai

„Váš hlas je rovnako cenný ako akýkoľvek iný obsah alebo atribút značky, ktorý máte,“ povedal Steelberg. „[Je to na úrovni] s vaším menom a podobou, vašou tvárou, podpisom alebo skladbou, ktorú ste napísali, alebo obsahom, ktorý ste vytvorili.“

“Môžeme prerobiť veľa”

Niektorí jednotlivci, samozrejme, už dlho predávali svoje hlasy vo forme nahrávania reklám alebo hlasových záznamov, spievania piesní a nespočetných iných foriem speňažovania. Všetky tieto snahy však vyžadovali, aby osoba skutočne povedala slová. Riešenie Veritone sľubuje, že bude individuálne škálovateľné.

Čo keby bolo napríklad pre Kevina Harta možné licencovať svoj hlas luxusnej značke, ktorá by ho potom mohla použiť na vytváranie prispôsobených reklám? s názvom diváka, umiestnením jeho najbližšej kamennej predajne a konkrétnym produktom, ktorý by s najväčšou pravdepodobnosťou mohol kúpiť? Namiesto toho, aby trávil doslova dni v nahrávacej kabíne, A.I. by to mohlo umožniť urobiť s trochou viac (zap aspoň časť Harta), než podpísať bodkovanú čiaru, aby ste súhlasili s tým, aby jeho hlasovú podobu využila uvedená tretia osoba večierok. Kým bol na natáčaní filmu, komediálnom turné, dovolenke či dokonca spánku, jeho digitálny hlas mohol hrabať peniaze.

"Môžeme zmeniť účel veľa," vysvetlil Steelberg v súvislosti s tréningovým procesom. „Ľudia, ktorí už veľa hovoria, ak produkujú podcast alebo v médiách, je tam veľa údajov. Pravdepodobne ich už máme veľa, ak sú náhodou našim zákazníkom.“

„To, čo považujeme za také fascinujúce na tejto novej kategórii A.I. je rozšíriteľnosť a variabilita."

Steelberg povedal, že myšlienka hlasu ako služby napadla Veritone pred niekoľkými rokmi. V tom čase však nebol presvedčený, že modely strojového učenia dokážu vytvoriť hyperrealistické syntetické hlasy, ktoré hľadal. Toto je obzvlášť dôležité, pokiaľ ide o hlasy, ktoré dôverne poznáme, aj keď sme sa s daným rečníkom v skutočnosti nikdy nestretli. Výsledky by mohli byť nejaké počuteľný tajomné údolie, pričom každý nesprávny zvuk upozorňuje poslucháčov na skutočnosť, že počúvajú falošné. Ale tu v roku 2021 je presvedčený, že veci pokročili do bodu, kedy je to teraz možné. Preto Marvel.ai.

Steelberg hovorí v nadšených módnych slovách o obrovskom potenciáli technológie a hovorí o jej možnom množstve „spôsobov vykonávania“. Veritone dokáže vytvárať modely pre prevod textu na reč. Môže tiež vytvárať modely pre reč na reč, pričom hlasový herec môže „riadiť“ vokálny výkon čítaním slová s vhodným skloňovaním a potom mať hotový hlas prekrytý na konci ako Snapchat filter. Spoločnosť môže tiež odtlačok prsta každého hlasu, aby mohla zistiť, či kus zdanlivo skutočného zvuku, ktorý sa niekde objaví, bol vytvorený pomocou jej technológie.

„Čím viac o tom budete premýšľať... doslova prídete na 50 ďalších [možných prípadov použitia],“ povedal. „To, čo považujeme za také fascinujúce na tejto novej kategórii A.I. je rozšíriteľnosť a variabilita."

Zvážte niektoré ďalšie. Slávny športovec môže byť bohom na basketbalovom ihrisku, ale diablom, keď na to príde čítanie riadkov v scenári spôsobom, ktorý znie prirodzene. Pomocou technológie Veritone sa podieľajú na scénach videohier alebo čítajú zvukovú knihu svojich spomienok (ktoré možno tiež nenapísal) mohol hrať hlasový herec, ktorý sa potom digitálne upraví, aby znelo ako športovec. Ďalšou možnosťou je preložiť film do iných krajín s rovnakým hereckým hlasom, ktorý teraz číta linky vo francúzštine, mandarínčine alebo akomkoľvek inom z množstva jazykov, aj keď herec v skutočnosti nehovorí ich.

Ako zareaguje verejnosť?

Nad tým všetkým samozrejme visí veľká otázka, ako sa k tomu postaví verejnosť. Toto je ten zložitý, nepredvídateľný kúsok. Celebrity dnes musia hrať komplexnú úlohu: Obidve nadživotné postavy, ktoré si zaslúžia mať tvár nalepenú na billboardoch, a tiež príbuzní jedinci, ktorí majú problémy so vzťahmi, tweetujú o pozeraní televízie v pyžame a robia hlúpe tváre, keď jedia horúce omáčka.

Čo sa potom stane, keď sa objavia reklamy, ktoré nielenže predstavujú celebritu čítajúcu riadky, ale v prípadoch, keď vieme, že je to povedané Interpret v skutočnosti nikdy nepovedal tieto riadky, ale skôr ich hlas programovo využil, aby nám priniesol cielené reklama? Steelberg povedal, že je to trochu iné, keď celebrita odovzdá kontrolu nad svojimi sociálnymi médiami správcovi účtu tretej strany. Ak uvidíme tweet Taylor Swift, vieme, že je dosť možné, že správu neodklepáva samotná Taylor, najmä ak ide o podporu alebo propagačný obsah.

Ale hlas je veľmi skutočným spôsobom iný, práve preto, že je osobnejší. Najmä ak je to sprevádzané určitým stupňom prispôsobenia, čo je jeden z prípadov použitia, ktorý dáva najväčší zmysel. Pravda je taká, že, aby som citoval scenáristu Williama Goldmana, nikto nevie, aká bude odozva verejnosti – práve preto, že presne toto ešte nikto neurobil.

"Bude to riadiť spektrum, však?" povedal Steelberg. „[Niektorí] ľudia povedia: ‚Trochu použijem tento nástroj, aby som si zlepšil deň, aby som ušetril čas.‘ Iní povedia naplno: „Chcem, aby môj hlas všade rozširoval moju značku, a udelím mu licenciu von.'"

Jeho najlepší odhad je, že prijatie bude od prípadu k prípadu. "Musíte byť v súlade s reakciou publika a ak vidíte, že veci fungujú alebo nefungujú," povedal. „Možno sa im to bude páčiť. Môžu povedať: ‚Vieš čo? Páči sa mi, že mi dávate 10-krát viac obsahu alebo viac osobného obsahu, aj keď viem, že ste na jeho rozšírenie použili syntetický obsah. Ďakujem. Ďakujem.'"

Myslite na budúcnosť

Veritone MARVEL.ai
Veritone

Čo sa týka budúcnosti? Steelberg povedal: „Chceme spolupracovať so všetkými hlavnými talentovými agentúrami. Myslíme si, že každý, kto podniká v oblasti zarábania peňazí na vzácnej značke, by sa mal zamyslieť nad svojou hlasovou stratégiou.“

A nečakajte, že to zostane iba pri zvuku. „Vždy nás fascinoval potenciál používania syntetického obsahu buď na rozšírenie, rozšírenie alebo potenciálne úplné nahradenie niektorých starých foriem produkcie obsahu,“ pokračoval. „Či už v audio zmysle alebo v konečnom dôsledku v budúcnosti a video zmysel.”

Je to tak: Keď Veritone ovládne trh vo svete audio deepfakes, plánuje ísť ešte o krok ďalej a vstúpiť do sveta plne realizovaných virtuálnych avatarov že znejú aj vyzerajú na nerozoznanie od ich zdroja.

Zrazu tie prispôsobené reklamy od Správa o menšinách znie oveľa menej ako sci-fi.

Odporúčania redaktorov

  • Ocenenia CES 2023 Tech For Change od Digital Trends
  • Vnútri rýchlo eskalujúcej vojny medzi deepfake a deepfake detektormi
  • Alexa a Siri nerozumejú tónu vášho hlasu, ale Oto áno
  • Kalifornia tvrdo zasahuje proti deepfakes pre politiku a porno
  • Zostaňte v anonymite online pomocou technológie deepfake, ktorá vám vytvorí úplne novú tvár