Veritone vēlas viltotu jūsu balss klonēšanu

Tur ir video kas periodiski parādās manā YouTube plūsmā. Tā ir saruna starp reperiem Snoop Dogg un 50 Cent, kas žēlojas par to, ka salīdzinājumā ar viņu paaudzi visi mūsdienu hiphopa mākslinieki šķiet vienādi. “Kad cilvēks nolemj būt pats par sevi, viņš piedāvā kaut ko tādu, ko neviens cits nevar būt,” saka 50 Cent. "Jā, jo tad, kad tu esi tu, kas var būt tu, ja ne tu?" Snūps atbild.

Saturs

  • “Mēs varam daudz ko mainīt”
  • Kā sabiedrība reaģēs?
  • Padomājiet par nākotni

Snoop Dogg tēlo mūsdienu reperu skaņu līdzīgu plūsmu

Kad videoklips tika augšupielādēts 2014. gada oktobrī, tā kopumā varēja būt taisnība. Bet tikai dažus gadus vēlāk tas noteikti nav. Audio dziļo viltojumu pasaulē ir iespējams apmācīt A.I. lai izklausītos šausmīgi līdzīgi citai personai, ievadot tai audio korpusu, kas sastāv no stundām ilgi izrunātiem datiem. Rezultāti ir satraucoši precīzi.

Ieteiktie videoklipi

Publiskas personas, piemēram, reperis Jay-Z un psihologs Džordans Pītersons jau ir sūdzējies par to, ka cilvēki piesavinās viņu balsis, izveidojot audio viltojumus un pēc tam liekot viņiem runāt muļķīgas lietas internetā. "Celies,"

rakstīja Pētersons. "Jūsu balss un jūsu tēla svētums ir nopietni apdraudēts." Tie ir tikai ļaunie gadījumi. Citos gadījumos rezultāti var pārvērsties neniansētā noziedzībā. In viens 2019. gada incidents, noziedznieki izmantoja audio dziļo viltojumu, lai uzdoties par enerģētikas uzņēmuma izpilddirektora balsi un pa tālruni pārliecinātu pavēlnieku steidzami pārskaitīt uz bankas kontu 243 000 USD.

Veritone, A.I. uzņēmums, kas rada viedus rīkus mediju marķēšanai izklaides industrijai, ir nododot audio deepfake spēku atpakaļ to cilvēku rokās (vai, kļūdaini, rīklēs), kuriem tas ir pamatoti pieder. Šomēnes uzņēmums paziņoja Marvel.ai, ko uzņēmuma prezidents Raiens Stīlbergs izdevumam Digital Trends raksturoja kā “pilnīgu balss kā pakalpojuma risinājumu”. Par maksu Veritone uzbūvēs A.I. modeli, kas izklausās tāpat kā jūs (vai, visticamāk, slavens cilvēks ar uzreiz atpazīstamu balsi), ko pēc tam var iznomāt kā augsto tehnoloģiju versiju Ariela balss kā nodrošinājuma darījums no Mazā nāriņa.

Synthetic Voice no MARVEL.ai

"Jūsu balss ir tikpat vērtīga kā jebkurš cits saturs vai zīmola atribūts," sacīja Stīlbergs. "[Tas ir vienā līmenī ar] jūsu vārdu un līdzību, jūsu seju, jūsu parakstu vai dziesmu, kuru esat uzrakstījis, vai satura gabalu, ko esat izveidojis."

“Mēs varam daudz ko mainīt”

Dažas personas, protams, jau sen ir pārdevušas savas balsis, ierakstot reklāmas vai balss ierakstus, dziedot dziesmas un neskaitāmus citus monetizācijas veidus. Bet visi šie centieni prasīja, lai cilvēks patiešām pateiktu vārdus. Tas, ko sola Veritone risinājums, ir padarīt to individuāli mērogojamu.

Kā būtu, ja, piemēram, Kevinam Hārtam būtu iespējams licencēt savu balsi luksusa zīmolam, kas pēc tam varētu to izmantot personalizētu reklāmu izveidei ar skatītāja vārdu, viņa tuvākās tradicionālo tirdzniecības vietu atrašanās vietu un konkrēto produktu, ko viņš, visticamāk, varētu pirkt? Tā vietā, lai burtiski pavadītu dienas ierakstu kabīnē, A.I. varētu ļaut to izdarīt ar nedaudz vairāk (ieslēgts vismaz Hārta daļa), nekā parakstīties uz punktētās līnijas, lai piekristu, ka viņa balss līdzību izmantos minētais trešais ballīte. Kamēr viņš filmēja filmu vai devās komēdijas tūrē, vai devās atvaļinājumā vai pat gulēja, viņa digitālā balss, iespējams, grābj naudu.

"Mēs varam daudz ko izmantot no jauna," Stīlbergs paskaidroja par apmācības procesu. "Cilvēki, kuri jau runā ļoti daudz, ja viņi veido aplādes apraidi vai plašsaziņas līdzekļos, ir daudz datu. Droši vien mums jau ir daudz to, ja viņi ir mūsu klienti.

“Tas, kas mums šķiet tik aizraujošs šajā jaunajā A.I kategorijā. ir paplašināmība un mainīgums.

Stīlbergs sacīja, ka ideja par balsi kā pakalpojumu Veritonei radās pirms vairākiem gadiem. Tomēr tajā laikā viņš nebija pārliecināts, ka mašīnmācīšanās modeļi spēj radīt hiperreālistiskas sintētiskās balsis, kuras viņš meklēja. Tas ir īpaši svarīgi, ja runa ir par balsīm, kuras mēs labi pazīstam, pat ja mēs nekad neesam tikušies ar attiecīgo runātāju. Rezultāti varētu būt sava veida dzirdams neparastā ielejā ar katru nepareizu skaņu, kas brīdina klausītājus par to, ka viņi klausās viltojumu. Taču šeit 2021. gadā viņš ir pārliecināts, ka lietas ir pavirzījušās tik tālu, ka tagad tas ir iespējams. Tādējādi Marvel.ai.

Stīlbergs sajūsminātos vārdos runā par tehnoloģijas milzīgo potenciālu, runājot par tās iespējamo "izpildes veidu" pārpilnību. Veritone var izveidot modeļus teksta pārvēršanai runā. Tas var arī izveidot modeļus runas pārvēršanai runā, kā rezultātā balss aktieris var "vadīt" vokālo priekšnesumu, lasot vārdus ar piemērotu locījumu un pēc tam gatavo balsi pārklājot beigās kā Snapchat filtru. Uzņēmums var arī nodrukāt katras balss pirkstu nospiedumu, lai varētu noteikt, vai šķietami īsta audio gabals, kas kaut kur parādās, ir izveidots, izmantojot tā tehnoloģiju.

"Jo vairāk jūs par to domāsit, jūs burtiski nāksit klajā ar vēl 50 [iespējamiem lietošanas gadījumiem]," viņš teica. “Tas, kas mums šķiet tik aizraujošs šajā jaunajā A.I kategorijā. ir paplašināmība un mainīgums.

Apsveriet dažus citus. Slavens sportists varētu būt dievs basketbola laukumā, bet velns, kad runa ir lasot rindiņas skriptā tā, lai tas izklausītos dabiski. Izmantojot Veritone tehnoloģiju, viņu lomu videospēļu sižetos vai lasot savu memuāru audiogrāmatu (kuru viņi var arī nav rakstījis) varētu izpildīt balss aktieris, kas pēc tam tiek digitāli pielāgots, lai izklausītos kā sportists. Kā vēl vienu iespēju filmu varētu tulkot citām valstīm ar tādu pašu aktiera balsi, kuru tagad lasa rindas franču, mandarīnu vai jebkurā citā no vairākām valodām, pat ja aktieris patiesībā nerunā viņiem.

Kā sabiedrība reaģēs?

Liels jautājums, kas uz to visu attiecas, protams, ir tas, kā sabiedrības locekļi uz to visu reaģēs. Šī ir viltīgā, neparedzamā daļa. Slavenībām mūsdienās ir jāuzņemas sarežģīta loma: gan lielākām figūrām, kas ir cienīgas, lai viņu seja tiktu uzlīmēta uz stendiem, gan arī draudzīgas personas, kurām ir attiecību problēmas, čivināt par TV skatīšanos pidžamā un veido muļķīgas sejas, kad ēd karstu mērci.

Kas tad notiek, kad parādās reklāmas, kurās ne tikai slavenība lasa rindas, bet arī gadījumos, kad mēs zinām, ka izpildītājs nekad nav teicis šīs rindas, bet gan programmatiski izmantoja viņu balsi, lai sniegtu mums mērķtiecīgu reklāma? Stīlbergs sacīja, ka tas maz atšķiras no tā, ka slavenība nodod kontroli pār saviem sociālajiem medijiem trešās puses konta pārvaldniekam. Ja mēs redzam Teilores Sviftas tvītu, mēs zinām, ka, iespējams, nav tā, ka pati Teilore izrunā ziņojumu, it īpaši, ja tas ir apstiprinājums vai reklāmas satura daļa.

Bet balss ļoti reālā veidā ir atšķirīga tieši tāpēc, ka tā ir personiskāka. It īpaši, ja to papildina personalizācijas pakāpe, kas ir viens no vissaprātīgākajiem lietošanas gadījumiem. Patiesība ir tāda, ka, citējot scenāristu Viljamu Goldmenu, neviens nezina, kāda būs sabiedrības reakcija - tieši tāpēc, ka neviens to iepriekš nav darījis.

"Tas vadīs spektru, vai ne?" Stīlbergs teica. "[Daži] cilvēki sacīs:" Es mazliet izmantošu šo rīku, lai palielinātu savu dienu un palīdzētu man ietaupīt laiku. Citi teiks pilnībā: "Es gribu, lai mana balss visur paplašinātu savu zīmolu, un es gatavojos to licencēt ārā.’”

Viņa labākais minējums ir tāds, ka pieņemšana tiks veikta katrā gadījumā atsevišķi. "Jums ir jābūt saskaņotam ar auditorijas reakciju un, ja redzat, ka lietas darbojas vai nedarbojas," viņš teica. "Viņiem tas var patikt. Viņi var teikt: "Zini ko? Man patīk tas, ka jūs man sniedzat 10 reizes vairāk satura vai personiskāku saturu, lai gan es zinu, ka izmantojāt sintētisko saturu, lai to papildinātu. Paldies. Paldies.'"

Padomājiet par nākotni

Veritone MARVEL.ai
Veritone

Kas attiecas uz nākotni? Stīlbergs sacīja: "Mēs vēlamies sadarboties ar visām lielākajām talantu aģentūrām. Mēs domājam, ka ikvienam, kurš nodarbojas ar naudas pelnīšanu ar ierobežotu zīmolu, vajadzētu padomāt par savu balss stratēģiju.

Un arī negaidiet, ka tas paliks tikai par audio. "Mēs vienmēr esam aizrāvuši ar sintētiskā satura izmantošanas potenciālu, lai paplašinātu, papildinātu vai, iespējams, pilnībā aizstātu dažus mantotos satura veidošanas veidus," viņš turpināja. “Vai tas būtu audio nozīmē vai, galu galā, nākotnē a video sajūta.”

Tieši tā: kad Veritone ir iespiedis tirgu audio dziļo viltojumu pasaulē, tā plāno spert soli tālāk un ienākt pilnībā realizēti virtuālie iemiesojumi kas gan izklausās, gan izskatās neatšķirami no to avota.

Pēkšņi tie personalizētas reklāmas no Mazākuma ziņojums izklausās daudz mazāk pēc zinātniskās fantastikas.

Redaktoru ieteikumi

  • Digital Trends' Tech For Change CES 2023 balvas
  • Strauji saasināšanās karā starp deepfake un deepfake detektoriem
  • Alexa un Siri nevar saprast jūsu balss toni, bet Oto to var
  • Kalifornija cīnās pret viltojumiem politikā un pornogrāfijā
  • Esiet anonīms tiešsaistē, izmantojot deepfake tehnoloģiju, kas jums rada pilnīgi jaunu seju