„Veritone“ nori padirbti, klonuoti jūsų balsą

Ten yra vaizdo įrašą kuris periodiškai pasirodo mano „YouTube“ sklaidos kanale. Tai pokalbis tarp reperių Snoop Dogg ir 50 Cent, apgailestaujantis dėl to, kad, palyginti su jų karta, visi šiuolaikiniai hiphopo atlikėjai skamba vienodai. „Kai žmogus nusprendžia būti savimi, jis siūlo tai, ko niekas kitas negali būti“, – sako 50 Cent. „Taip, nes kai tu būsi savimi, kas gali būti tu, jei ne tu? Snoopas atsako.

Turinys

  • „Mes galime daug ką pakeisti“
  • Kaip reaguos visuomenė?
  • Galvok apie ateitį

„Snoop Dogg“ apsimeta šiuolaikinių reperių srautu

Kai vaizdo įrašas buvo įkeltas 2014 m. spalio mėn., tai iš esmės galėjo būti tiesa. Bet tik po kelerių metų tai tikrai ne. Garso padirbinėjimo pasaulyje įmanoma išmokyti A.I. skambėti klaikiai panašiai į kitą asmenį, pateikus jam garso korpusą, susidedantį iš kelių valandų jo ištartų duomenų. Rezultatai yra neapsakomai tikslus.

Rekomenduojami vaizdo įrašai

Tokie visuomenės veikėjai kaip reperis Jay-Z ir psichologas Jordanas Petersonas jau skundėsi, kad žmonės neteisėtai pasisavina savo balsus kurdami gilias garso klastotes ir versdami juos sakyti kvailus dalykus internete. „Pabusk“,

rašė Petersonas. „Jūsų balso ir įvaizdžio šventumui kyla rimtas pavojus“. Tai tik išdykę atvejai. Kitais atvejais rezultatai gali virsti be niuansų nusikalstamumu. Į vienas 2019 m, nusikaltėliai panaudojo garso padirbinėjimą, kad apsimetinėdavo energetikos įmonės generalinio direktoriaus balsu ir telefonu įtikintų pavaldinį skubiai pervesti 243 000 USD į banko sąskaitą.

Veritone, A.I. kompanija, kurianti išmaniuosius įrankius, skirtus pramogų industrijai skirtoms žiniasklaidos priemonėms ženklinti, yra garso padirbinėjimo galios grąžinimas į rankas (arba, klysta, į gerkles) tų, kuriems tai pagrįstai priklauso. Šį mėnesį bendrovė paskelbė Marvel.ai, ką bendrovės prezidentas Ryanas Steelbergas „Digital Trends“ apibūdino kaip „išsamų balso kaip paslaugos sprendimą“. Už tam tikrą mokestį „Veritone“ sukurs A.I. modeliuok tai skamba taip pat kaip jūs (arba, labiau tikėtina, garsus žmogus, turintis iš karto atpažįstamą balsą), kuris vėliau gali būti paskolintas kaip aukštųjų technologijų versija Arielio balso kaip užstato sandorisUndinėlė.

MARVEL.ai sintetinis balsas

„Jūsų balsas yra toks pat vertingas kaip ir bet kuris kitas jūsų turimas turinys ar prekės ženklo atributas“, – sakė Steelbergas. „[Tai lygiagrečiai] jūsų vardui ir panašumui, veidui, parašui ar dainai, kurią parašėte, arba jūsų sukurtą turinį.

„Mes galime daug ką pakeisti“

Žinoma, tam tikri asmenys jau seniai parduodavo savo balsus įrašydami reklamą ar įgarsindami, dainuodami dainas ir daugybę kitų pajamų gavimo būdų. Tačiau visos šios pastangos reikalavo, kad žmogus iš tikrųjų ištartų žodžius. „Veritone“ sprendimas žada padaryti tai individualiai keičiamą.

Ką daryti, jei, pavyzdžiui, Kevinui Hartui būtų įmanoma suteikti savo balsą prabangos prekės ženklui, kuris galėtų jį panaudoti kurdamas suasmenintus skelbimus nurodant žiūrinčiojo vardą, pavardę, artimiausio pardavimo vietos vietą ir konkretų produktą, kurį jis greičiausiai galėtų įsigyti pirkti? Užuot praleidęs dienas įrašų kabinoje, A.I. galėtų leisti tai padaryti su šiek tiek daugiau (įjungta bent jau Harto dalis), nei pasirašyti ant punktyrinės linijos, kad sutiktų, kad jo balso panašumas būtų panaudotas trečiajam vakarėlis. Kol jis filmavosi filme, surengė komedijos turą, atostogavo ar net miegojo, jo skaitmeninis balsas galėjo grobti pinigus.

„Mes galime daug ką pakeisti“, – paaiškino Steelbergas apie treniruočių procesą. „Žmonės, kurie jau daug kalba, jei kuria podcast'ą ar žiniasklaidą, ten yra daug duomenų. Turbūt jau turime daug, jei jie yra mūsų klientai.

„Tai, kas mums taip žavi šioje naujoje A.I kategorijoje. yra išplėtimas ir kintamumas.

Steelbergas teigė, kad balso kaip paslaugos idėja Veritone kilo prieš keletą metų. Tačiau tuo metu jis nebuvo įsitikinęs, kad mašininio mokymosi modeliai gali sukurti hiperrealistiškus sintetinius balsus, kurių jis ieškojo. Tai ypač svarbu, kai kalbame apie balsus, kuriuos pažįstame artimai, net jei niekada nebuvome susitikę su atitinkamu kalbėtoju. Rezultatai gali būti kažkokie girdimas Neįtikėtinas slėnis, kuriame kiekvienas neteisingas garsas įspėja klausytojus apie tai, kad jie klauso netikros. Tačiau čia, 2021 m., jis įsitikinęs, kad viskas pažengė taip, kad dabar tai įmanoma. Taigi Marvel.ai.

Steelbergas susijaudinęs kalba apie didžiulį technologijos potencialą, kalbėdamas apie galimą „vykdymo būdų“ gausą. „Veritone“ gali sukurti teksto į kalbą modelius. Jis taip pat gali sukurti kalbėjimo į kalbą modelius, kai balso aktorius gali „pavaryti“ vokalinį pasirodymą skaitydamas žodžius su tinkama linksniu, o tada baigtą balsą uždengia kaip Snapchat filtras. Bendrovė taip pat gali atspausdinti kiekvieno balso pirštų atspaudus, kad galėtų pasakyti, ar kažkur iššokantis tikras garso įrašas buvo sukurtas naudojant jos technologiją.

„Kuo daugiau apie tai galvosite... tiesiogine prasme sugalvosite dar 50 [galimų naudojimo atvejų]“, – sakė jis. „Tai, kas mums taip žavi šioje naujoje A.I kategorijoje. yra išplėtimas ir kintamumas.

Apsvarstykite kai kuriuos kitus. Garsus sportininkas gali būti dievas krepšinio aikštelėje, bet velnias, kai kalbama apie tai skaityti scenarijaus eilutes natūraliai skambančiu būdu. Naudodami Veritone technologiją, savo vaidmenį vaizdo žaidimų scenose arba skaitydami savo atsiminimų garso knygą (kurią jie taip pat galėjo neparašyti) galėtų atlikti balso aktorius, kuris vėliau skaitmeniniu būdu patobulinamas, kad skambėtų kaip sportininkas. Kita galimybė – filmą būtų galima išversti į kitas šalis tuo pačiu aktoriaus balsu, kuris dabar skaito eilutės prancūzų, mandarinų ar bet kuria kita iš daugelio kalbų, net jei aktorius iš tikrųjų nekalba juos.

Kaip reaguos visuomenė?

Žinoma, didelis klausimas, kylantis dėl viso to, yra tai, kaip į visa tai reaguos visuomenės nariai. Tai sudėtingas, nenuspėjamas dalykas. Įžymybės šiandien turi atlikti sudėtingą vaidmenį: tiek didesnės nei gyvybės figūros, vertos veidą užklijuoti ant reklaminių skydų, ir taip pat artimi asmenys, kurie turi santykių problemų, tviteryje rašo apie televizorių žiūrėdami su pižama ir daro kvailus veidus, kai valgo karštai padažas.

Kas nutinka tada, kai pasirodo skelbimai, kuriuose ne tik įžymybė skaito eiles, bet ir tais atvejais, kai žinome, kad atlikėjas iš tikrųjų niekada nesakė tų eilučių, o jų balsas buvo programiškai panaudotas, kad suteiktų mums tikslinį Reklama? Steelbergas teigė, kad tai mažai kuo skiriasi nuo to, kaip įžymybė perduoda savo socialinės žiniasklaidos valdymą trečiosios šalies paskyros valdytojui. Jei matome Taylor Swift tviterį, žinome, kad tai greičiausiai ne pati Taylor paliečia pranešimą, ypač jei tai yra pritarimas ar reklaminio turinio dalis.

Tačiau balsas iš tikrųjų yra kitoks, nes jis yra asmeniškesnis. Ypač jei jį lydi tam tikras suasmeninimas, o tai yra vienas iš prasmingiausių naudojimo atvejų. Tiesa ta, kad, cituojant scenaristų Williamą Goldmaną, niekas nežino, koks bus visuomenės atsakas – būtent todėl, kad anksčiau niekas to tiksliai nepadarė.

"Tai veiks spektrą, tiesa?" Steelbergas sakė. „[Kai kurie] žmonės sakys: „Šiek tiek naudosiu šį įrankį, kad prailginčiau savo dieną, kad sutaupyčiau laiko. Kiti sakys visapusiškai: „Noriu, kad mano balsas visur išplėstų mano prekės ženklą, ir aš ketinu jį licencijuoti lauk.’“

Geriausias jo spėjimas yra tai, kad priėmimas bus priimtas kiekvienu konkrečiu atveju. „Turite prisitaikyti prie savo auditorijos reakcijos ir, jei matote, kad viskas veikia ar neveikia“, - sakė jis. „Jiems gali patikti. Jie gali pasakyti: „Žinai ką? Man patinka tai, kad man pateikiate 10 kartų daugiau arba asmeniškesnio turinio, nors žinau, kad naudojote sintetinį turinį, kad jį papildytumėte. Ačiū. Ačiū.'"

Galvok apie ateitį

Veritone MARVEL.ai
Veritone

Kalbant apie ateitį? Steelbergas sakė: „Norime dirbti su visomis pagrindinėmis talentų agentūromis. Manome, kad kiekvienas, užsidirbantis pinigų iš riboto prekės ženklo, turėtų pagalvoti apie savo balso strategiją.

Ir nesitikėkite, kad tai liks tik dėl garso. „Mus visada žavėjo galimybė naudoti sintetinį turinį, siekiant išplėsti, papildyti arba galbūt visiškai pakeisti kai kurias senas turinio kūrimo formas“, – tęsė jis. „Ar tai būtų garso prasme, ar, galiausiai, ateityje a vaizdo pojūtis.”

Teisingai: kai tik užsuks rinką giliųjų garso padirbinėjimų pasaulyje, „Veritone“ planuoja žengti dar vieną žingsnį ir įžengti į visiškai realizuoti virtualūs avatarai kad ir skamba, ir atrodo neatskiriami nuo jų šaltinio.

Staiga tie suasmeninti skelbimai iš Mažumos ataskaita skamba daug mažiau kaip mokslinė fantastika.

Redaktorių rekomendacijos

  • „Digital Trends“ „Tech For Change CES 2023“ apdovanojimai
  • Sparčiai besiplečiančiame kare tarp „deepfake“ ir „deepfake“ detektorių
  • Alexa ir Siri negali suprasti jūsų balso tono, bet Oto gali suprasti
  • Kalifornija imasi griežtų politikos ir pornografijos klastočių
  • Išsaugokite anonimiškumą internete naudodami „deepfake“ technologiją, kuri jums sukuria visiškai naują veidą