A Veritone mélyen hamisítani akarja a hangját

Van egy videó amely időnként megjelenik a YouTube hírfolyamomban. Ez egy beszélgetés Snoop Dogg és 50 Cent rapperek között, ami azt sérelmezi, hogy generációjukhoz képest minden modern hip-hop előadó ugyanúgy hangzik. „Amikor egy személy úgy dönt, hogy önmaga lesz, olyasmit kínál, amit senki más nem lehet” – mondja 50 Cent. – Igen, mert ha egyszer te vagy, ki más lehetsz, mint te? Snoop válaszol.

Tartalom

  • „Sokat hasznosíthatunk újra”
  • Hogyan reagál a közvélemény?
  • Gondolj a jövőre

Snoop Dogg megszemélyesíti a mai rapperek hangzását

Amikor a videót 2014 októberében feltöltötték, ez nagyjából igaz lehetett. De néhány évvel később már biztosan nem. Az audio mélyhamisítások világában lehetséges egy A.I. hogy kísértetiesen hasonlítson egy másik személyre, ha a kimondott adataikból több órányi hanganyagot táplál be neki. Az eredmények az idegesítően pontos.

Ajánlott videók

Olyan közszereplők, mint a rapper Jay-Z Jordan Peterson pszichológus pedig már panaszkodott amiatt, hogy az emberek elsajátították a hangjukat azáltal, hogy mélyhamisítványokat készítettek, majd butaságokat ejtenek velük az interneten. "Kelj fel,"

írta Peterson. "A hangod és a képed szentsége komoly veszélyben van." Ezek csak a huncut esetek. Más esetekben az eredmények árnyalt bűnözéssé válhatnak. Ban ben egy 2019-es esemény, a bűnözők mélyhamisítást használtak, hogy egy energetikai vállalat vezérigazgatójának hangját kiadják, és telefonon rávegyék egy alárendeltjét, hogy sürgősen utaljon át 243 000 dollárt egy bankszámlára.

Veritone, egy A.I. cég, amely intelligens eszközöket hoz létre a szórakoztatóipar médiacímkézésére visszaadni a hang mélyhamisítási erejét azoknak a kezébe (vagy, igaz, a torkába), akiknek ez jogos. tartozik. Ebben a hónapban a cég bejelentette Marvel.ai, amit Ryan Steelberg, a vállalat elnöke a Digital Trendsnek „teljes hangszolgáltatásként szolgáló megoldásként” jellemez. Térítés ellenében a Veritone egy A.I. modellezd azt pont úgy hangzik, mint te (vagy, ami valószínűbb, egy híres személy, akinek azonnal felismerhető a hangja), amit aztán kölcsönadhatnak, mint egy high-tech verziót. Ariel-é hang-mint fedezet alku tól től A kis hableány.

A MARVEL.ai szintetikus hangja

„A hangod ugyanolyan értékes, mint bármely más tartalom vagy márkajellemző” – mondta Steelberg. „[Ez egy szinten van] a neveddel és a képmásoddal, az arcoddal, az aláírásoddal vagy egy általad írt dallal vagy az általad létrehozott tartalommal.”

„Sokat hasznosíthatunk újra”

Bizonyos személyek természetesen régóta eladják hangjukat reklámok vagy hangfelvételek, dalok éneklése és számtalan egyéb bevételszerzési forma formájában. De ezek a törekvések mind azt követelték, hogy a személy valóban kimondja a szavakat. A Veritone megoldása azt ígéri, hogy ezt egyénileg méretezhetővé teszi.

Mi lenne, ha például Kevin Hart engedélyezhetné a hangját egy luxusmárkának, amely személyre szabott hirdetések létrehozására használhatná fel tartalmazza a néző nevét, a legközelebbi hagyományos értékesítési hely helyét, és azt a konkrét terméket, amelyre a legnagyobb valószínűséggel megvesz? Ahelyett, hogy szó szerint napokat töltene a felvevőfülkében, A.I. megengedhetné, hogy ezt kevéssel többel (on Hart része, legalábbis), mint aláírni a szaggatott vonalra, hogy beleegyezzen abba, hogy a hangja hasonlóságot használjon az említett harmadik buli. Amíg filmet forgatott, vígjátékot csinált, vagy nyaralt, vagy akár aludt, digitális hangja a készpénzt kereste.

„Sokat hasznosíthatunk újra” – magyarázta Steelberg az edzési folyamatot illetően. „Azok az emberek, akik már most is sokat beszélnek, ha podcastot készítenek vagy a médiában, rengeteg adat van kint. Valószínűleg már rengetegünk van belőle, ha véletlenül ügyfelünk lesz.”

„Amit annyira lenyűgözőnek találunk az A.I. új kategóriájában. a bővíthetőség és a változékonyság.”

Steelberg elmondta, hogy a hang szolgáltatásként ötlete néhány évvel ezelőtt merült fel Veritonében. Azonban akkoriban nem volt meggyőződve arról, hogy a gépi tanulási modellek képesek létrehozni az általa keresett hiperrealisztikus szintetikus hangokat. Ez különösen fontos, ha olyan hangokról van szó, amelyeket közelről ismerünk, még akkor is, ha valójában soha nem találkoztunk a szóban forgó beszélővel. Az eredmények lehetnek valamiféle hallható elképesztő völgyben, minden rossz hang figyelmezteti a hallgatókat, hogy hamisítványt hallgatnak. De itt 2021-ben meg van győződve arról, hogy a dolgok odáig fejlődtek, hogy ez most lehetséges. Ezért a Marvel.ai.

Steelberg izgatott hívószavakkal beszél a technológiában rejlő hatalmas lehetőségekről, és a lehetséges „végrehajtási módok” sokaságáról beszél. A Veritone modelleket tud létrehozni a szövegfelolvasáshoz. Modelleket is tud építeni a beszédbeszédre, ahol a szinkronszínész „meghajthatja” a vokális előadást olvasással. a szavakat megfelelő ragozással, majd a befejezett hangot a végére úgy takarva, mint egy Snapchat szűrő. A cég ujjlenyomatot is tud minden hangról lenyomatolni, így meg tudja állapítani, hogy a valahol felbukkanó, látszólag valódi hangdarabot az ő technológiájával hozták-e létre.

„Minél többet gondolsz rá… szó szerint további 50 [lehetséges felhasználási esetet] fogsz találni” – mondta. „Amit annyira lenyűgözőnek találunk az A.I. új kategóriájában. a bővíthetőség és a változékonyság.”

Vegye figyelembe néhány mást. Lehet, hogy egy híres sportoló isten a kosárlabdapályán, de ördög, ha arról van szó sorok olvasása egy forgatókönyvben természetesnek hangzó módon. A Veritone technológiájának felhasználásával, a videojátékok jeleneteiben való szerepükkel vagy az emlékiratuk hangoskönyvének elolvasásával (amit lehet, hogy nem is írta) egy szinkronszínész is előadhatná, majd digitálisan úgy hangzik, mint a sportoló. Egy másik lehetőség, hogy egy filmet lefordíthatnak más országok számára ugyanazzal a színészi hanggal, amely most olvassa a filmet sorokat franciául, mandarinul vagy bármely más nyelven, még akkor is, ha a színész valójában nem beszél őket.

Hogyan reagál a közvélemény?

Egy nagy kérdés természetesen az, hogy a közvélemény hogyan reagál majd minderre. Ez a trükkös, kiszámíthatatlan rész. A hírességeknek manapság összetett szerepet kell játszaniuk: mind az életnél nagyobb figurák, akik méltóak arra, hogy az óriásplakátokra ragasszák az arcukat, és rokon emberek, akiknek kapcsolati problémái vannak, pizsamában tévéznek a Twitteren, és ostoba arcokat vágnak, amikor meleget esznek szósz.

Mi történik akkor, ha olyan hirdetések jelennek meg, amelyekben nem csak egy híresség olvas fel sorokat, hanem olyan esetekben is, amikor tudjuk, hogy az előadó valójában soha nem mondta ki ezeket a sorokat, inkább a hangját programszerűen használták fel, hogy célzottat hozzanak nekünk hirdetés? Steelberg elmondta, hogy ez alig különbözik attól, hogy egy híresség átadja a közösségi média irányítását egy harmadik fél fiókkezelőjének. Ha látjuk Taylor Swift tweetét, tudjuk, hogy valószínűleg nem maga Taylor koppint az üzenetre, különösen, ha ez egy támogatás vagy egy promóciós tartalom.

De a hang nagyon is más, pontosan azért, mert személyesebb. Főleg, ha ez bizonyos fokú személyre szabással jár, ami az egyik legértelmesebb használati eset. Az igazság az, hogy William Goldman forgatókönyvírót idézve, senki sem tudja, mi lesz a közvélemény reakciója – pontosan azért, mert még senki sem csinált pontosan ilyet.

– Ez fogja futtatni a spektrumot, igaz? Steelberg mondta. „[Néhány] ember azt fogja mondani: „Használni fogom ezt az eszközt egy kicsit a napom bővítésére, hogy időt takarítsak meg.” Mások teljes hangon azt fogják mondani: „Azt akarom, hogy a hangom mindenhol kiterjessze a márkám, és engedélyezni fogom. ki.'"

A legjobb tippje az, hogy az elfogadás eseti alapon történik. „Összhangban kell lennie a közönség reakciójával, és ha azt látja, hogy a dolgok működnek vagy nem működnek” – mondta. „Lehet, hogy szeretik. Mondhatják: „Tudod mit? Szeretem, hogy 10-szer több tartalmat vagy személyesebb tartalmat adsz meg nekem, bár tudom, hogy szintetikus tartalmat használtál ennek kiegészítésére. Köszönöm. Köszönöm.'"

Gondolj a jövőre

Veritone MARVEL.ai
Veritone

Ami a jövőt illeti? Steelberg azt mondta: „Az összes jelentős tehetségügynökséggel együtt akarunk dolgozni. Úgy gondoljuk, hogy mindenkinek, aki egy szűkös márkával keres pénzt, el kell gondolkodnia a hangstratégiáján.”

És azt se várja el, hogy pusztán a hangról szóljon. „Mindig is lenyűgözött bennünket a szintetikus tartalom felhasználásának lehetősége a tartalomgyártás egyes örökölt formáinak kiterjesztésére, kiegészítésére vagy potenciálisan teljes helyettesítésére” – folytatta. „Legyen szó audio értelemben, vagy végső soron a jövőben a videó értelme.”

Ez így van: Miután sarokba szorította a piacot az audio mélyhamisítások világában, a Veritone azt tervezi, hogy egy lépéssel tovább megy, és belép a teljesen megvalósított virtuális avatarok amelyek hangzásuk és forrásuktól megkülönböztethetetlennek tűnik.

Hirtelen azok személyre szabott hirdetések innen Kisebbségi jelentés sokkal kevésbé hangzik úgy, mint a sci-fi.

Szerkesztői ajánlások

  • A Digital Trends Tech For Change CES 2023 díjai
  • Belül a gyorsan eszkalálódó háborúba a deepfake és a deepfake detektorok között
  • Alexa és Siri nem érti a hangod tónusát, de Oto igen
  • Kalifornia leállítja a politikai és pornóhamisításokat
  • Maradjon névtelen online a mélyhamisítású technológiával, amely teljesen új arcot generál számodra