Project Gucciberg: Deepfaked lydbøger fra Gucci Mane

"Gucci Mane er sindssyg, jeg vil måske trække op på en zebra/lande på toppen af ​​en ørn, ryge en joint af reefa."

Indhold

  • Onde genier
  • Deepfake-A-Thon

Det er en Gucci Mane-tekst fra hans 2010-nummer "It's Gucci Time" fra albummet Appellen: Georgiens mest eftersøgte.

Anbefalede videoer

"Det er en alment anerkendt sandhed/, at en enkelt mand, der er i besiddelse af en lykke, må mangle en kone." Det er nu også en Gucci-bar, omend en oprindelig skrevet af Jane Austen i hendes roman om manerer fra 1813, Stolthed og fordom, selvom Gucci gennemsyrer den med et niveau af trap-rap-swagger, der ikke helt kommer til udtryk i andre læsninger af den klassiske engelske tekst. (Til sammenligning, toppen Hørbar bidraget til den samme roman læses af den deciderede non-trap rap-superstjerne Rosamund Pike.)

Gucci, som det viser sig, har haft travlt - mere travlt end han havde i perioden 2010-2015, da han udsendte mixtapes med en svimlende hastighed på omkring et om måneden. I dag debuterede den 41-årige rapper stemmelæsninger af sig selv, mens han læste et udvalg af klassiske romaner under den noget geniale titel "

Projekt Gucciberg." En del af romanerne omfatter Alices eventyr i Eventyrland, Små Kvinder, Et beskedent forslag, Dracula, og Vigtigheden af ​​at være seriøs.

Bare det gjorde han ikke. Nå, ikke ligefrem.

MSCHF

Det er mere deepfake audio wizardry, denne gang høflighed af folkene i New York-baserede digital arts collective MSCHF. Frisk fra deres sidste projekt - hvor de knyttet en paintball-pistol til en af ​​Boston Dynamics' Spot-robotter, og gav brugerne mulighed for at fjernstyre det over internettet - holdet har lånt deres knap-trykkende, teknologikyndige mærke af prankster-irreverence til et projekt, hvor rapperen født Radric Delantic Davis selv er fjernstyret (i hvert fald er hans ord) for at fortælle en masse vintage romaner.

Onde genier

MSCHFs Daniel Greenberg fortalte Digital Trends: "Gucci Mane er en af ​​de mest indflydelsesrige musikere i raphistorien. Project Gutenberg er en af ​​de sidste bastioner af public domain-tekster på internettet. Ved at kombinere de to ved at bruge kraften fra A.I. teknologi, har vi skabt de mest virkningsfulde rapper-læste lydbøger i det offentlige domæne i internettets historie."

At skabe deres (totalt uautoriserede) litteraturelskende A.I. rapper, lavede holdet et træningsdatasæt på omkring seks timer Guccis tale, hentet fra interviews, podcasts og hvilke andre offentligt tilgængelige lydoptagelser, de kunne fange fra Youtube. Dette kildemateriale blev derefter redigeret, trimmet ned i 10-sekunders segmenter, EQ'd, transskriberet og mærket.

MSCHF

"Derudover byggede vores team en Gucci-udtalenøgle/ordbog for bedre at fange idiosynkrasiet af Gucci Manes særlige argot," sagde Greenberg. Han tilføjede: "Seriøst, denne ting svarer til en lingvistisk afhandling."

Datasættet blev derefter brugt til at træne en A.I. model, gentagne gange masseret, så det forbedrede output, og derefter forstærket med menneskelige berøringer for at tilføje flair som gravide pauser i teksten, hvor påkrævet.

"Det kan lyde, som om Gucci til tider taler ind i en ødelagt mikrofon eller på en dårlig lydstream - fordi han var i meget af vores kildemateriale," indrømmede Greenberg. "Men bortset fra disse miljømæssige faktorer, føler vi, at den faktiske stemmeemulering er ekstremt vellykket. Det er både fantastisk og skræmmende, hvor god denne teknologi er til at få nogen til at sige, hvad du vil.”

MSCHF

Den rigtige Gucci Mane reagerede ikke på en anmodning om kommentar. Dette er dog, som Greenberg erkendte, noget af en "gråzone", når det kommer til ophavsret. "De ophavsretlige implikationer af deepfakes er endnu ikke blevet lovgivet," sagde han. "Alle de lydeksempler, vi trænede vores model på, var offentligt tilgængelige gennem interviews. I sidste ende har vi en stemme, der ikke er vores, læser offentlig ejendomstekst, som vi ikke har skrevet, men vi skaber vores 'egne' lydbøger."

Deepfake-A-Thon

Sidste år, Jay-Zs Roc Nation LLC underholdningsbureau tog et problem med en audio deepfaker der brugte rapperens stemme til at udstøde volapyk som Navy Seal Copypasta på YouTube. Det var, som jeg bemærkede dengang, en hjernepirrende gåde for en rapper, der engang rappede linjen "I sampled your voice, you was usin' it wrong" under hans tidlige 2000'er-beef med Nas. Men Roc Nation kom ikke ind i sagens ironiske kompleksitet. De var bare irriterede over, at nogen "ulovligt [bruger] en A.I. at efterligne vores klients stemme."

Det er ikke svært at se, hvorfor en kunstner kan blive forstyrret af sådan noget. Ligesom visuelle deepfakes at placere skuespillere i film, hvor de aldrig optrådte (eller, som det er gået runderne for nylig, Tom Cruise i en række hyperaktive TikTok-videoer), en lyd-deepfake af en kunstner tager deres mest værdifulde aktiv - deres stemme, i dette tilfælde - og bruger den til at skabe noget, de aldrig har givet samtykke til at udføre i. Der er både etiske og økonomiske spørgsmål på spil.

MSCHF

"Rappens historie er historien om selvreference," fastholdt Greenberg. "Gennem hele traditionens kanon, i hele kroppen af ​​en given kunstners værk. Når du kigger under motorhjelmen på en A.I. læringsmodel, sker der en uhyggeligt lignende proces - en slags hyper-selv-reference. Skråt som det kan virke, falder det hele ganske fint sammen."

Bør vi være bekymrede for risikoen for lyd-deepfakes i en verden, hvor ægte og falsk kan blive sløret i en overraskende grad?

"Absolut, men alarm vil ikke forhindre deepfakes i at blive mere og mere mainstream," sagde han. "Denne teknologi er kommet for at blive - vi burde være så heldige, hvis den kun bliver brugt for sjov. Måske vil det at gøre sjove ting med det hjælpe med at holde os i det område. Vi har nået et vendepunkt, hvor sandhed og fiktion er ved at blive umulige at gennemskue på internettet. Derfor indså vi, at det var afgørende, at vi dulmer vores ører med Gucci Manes blide A.I.-genererede læsestemme."

Mens sirenesange for at føre os ind på Skynets klipper, er Gucci måske ikke så slem, som det sker. Især hvis det kunne være Gucci fra 2009-æraen, ca Staten vs. Radric Davis.

Redaktørens anbefalinger

  • Denne startup ønsker at deepfake-klone din stemme og sælge den til højestbydende
  • Er deepfakes en farlig teknologi? Skabere og regulatorer er uenige