"Gucci Mane is gek, ik zou misschien een zebra kunnen aanhouden/ bovenop een adelaar kunnen landen en een joint reefa kunnen roken."
Inhoud
- Kwaadaardige genieën
- Deepfake-A-Thon
Dat is een tekst van Gucci Mane uit zijn nummer 'It's Gucci Time' uit 2010 van het album De oproep: Georgia's Most Wanted.
Aanbevolen video's
“Het is een universeel erkende waarheid dat een enkele man die over een fortuin beschikt, er behoefte aan moet hebben vrouw." Dat is nu ook een Gucci-bar, zij het oorspronkelijk geschreven door Jane Austen in haar roman over manieren uit 1813, Trots en vooroordeel, hoewel Gucci het doordrenkt met een niveau van trap-rap-branie dat niet helemaal overkomt in andere lezingen van de klassieke Engelse tekst. (Ter vergelijking: de bovenkant Hoorbaar inzending voor dezelfde roman wordt voorgelezen door de beslist non-trap rap-superster Rosamund Pike.)
Het blijkt dat Gucci het druk heeft gehad – nog drukker dan in de periode 2010-2015, toen hij mixtapes uitgaf met een duizelingwekkend tempo van ongeveer één per maand. Vandaag debuteerde de 41-jarige rapper met gesproken lezingen van zichzelf terwijl hij een assortiment klassieke romans las onder de ietwat briljante titel '
Project Gucciberg.” Een paar romans omvatten Alice's avonturen in wonderland, Kleine vrouwen, Een bescheiden voorstel, Dracula, En The Importance of Being Earnest.Alleen dat deed hij niet. Nou ja, niet precies.
Het is meer deepfake audio-tovenarij, dit keer met dank aan de mensen van het in New York gevestigde digitale kunstcollectief MSCHF. Vers van hun laatste project – waarin ze bevestigde een paintballgeweer aan een van de Spot-robots van Boston Dynamics, en stelde gebruikers in staat het op afstand te bedienen via internet – het team heeft hun op knoppen drukkende, technisch onderlegde merk van grappenmakers oneerbiedigheid geleend aan een project waarin de geboren rapper Radric Delantic Davis zelf op afstand wordt bestuurd (tenminste, dat zijn zijn woorden) om een hele reeks vintage verhalen te vertellen romans.
Kwaadaardige genieën
Daniel Greenberg van MSCHF vertelde Digital Trends: “Gucci Mane is een van de meest impactvolle muzikanten in de geschiedenis van de rap. Project Gutenberg is een van de laatste bastions van teksten in het publieke domein op internet. Door de twee te combineren en gebruik te maken van de kracht van A.I. technologie hebben we de meest impactvolle door rappers gelezen audioboeken in het publieke domein in de geschiedenis van het internet gemaakt.”
Om hun (totaal ongeautoriseerde) literatuurminnende A.I. rapper heeft het team een trainingsdataset van ongeveer zes uur gemaakt Gucci’s toespraak, ontleend aan interviews, podcasts en andere openbaar toegankelijke audiobeelden waar ze uit konden putten YouTube. Dit bronmateriaal werd vervolgens bewerkt, ingekort tot segmenten van 10 seconden, EQ's, getranscribeerd en geëtiketteerd.
“Bovendien heeft ons team een Gucci-uitspraaksleutel/woordenboek ontwikkeld om de eigenaardigheden van Gucci Mane’s specifieke argument beter weer te geven”, aldus Greenberg. Hij voegde eraan toe: ‘Serieus, dit ding is het equivalent van een taalkundige scriptie.’
De dataset werd vervolgens gebruikt om een A.I. model, herhaaldelijk gemasseerd zodat het de uitvoer, en vervolgens aangevuld met menselijke accenten om flair, zoals zwangere pauzes, aan de tekst toe te voegen vereist.
“Het klinkt misschien alsof Gucci soms in een kapotte microfoon spreekt, of in een slechte audiostream – omdat hij in veel van ons bronmateriaal zat”, gaf Greenberg toe. “Afgezien van deze omgevingsfactoren zijn we echter van mening dat de daadwerkelijke stememulatie buitengewoon succesvol is. Het is zowel verbazingwekkend als beangstigend hoe goed deze technologie is om iedereen te laten zeggen wat je maar wilt.”
De echte Gucci Mane reageerde niet op een verzoek om commentaar. Dit is echter, zoals Greenberg erkende, een soort ‘grijs gebied’ als het om auteursrecht gaat. “De implicaties voor het auteursrecht van deepfakes zijn nog niet wettelijk vastgelegd”, zei hij. “Alle audiofragmenten waarop we ons model hebben getraind, waren openbaar beschikbaar via interviews. Uiteindelijk hebben we een stem die niet de onze is: we lezen tekst uit het publieke domein die we niet hebben geschreven, maar we creëren onze ‘eigen’ audioboeken.”
Deepfake-A-Thon
Vorig jaar, het entertainmentbureau Roc Nation LLC van Jay-Z ging in discussie met een audio-deepfaker die de stem van de rapper gebruikte om wartaal zoals de Navy Seal Copypasta op YouTube te spuien. Het was, zoals ik destijds opmerkte, een hersenkrakend raadsel voor een rapper die ooit tijdens zijn ruzie met Nas begin jaren 2000 de zin 'Ik heb je stem gesampled, je gebruikte het verkeerd' klopte. Maar Roc Nation ging niet in op de ironische complexiteit van de zaak. Ze waren gewoon geïrriteerd omdat iemand ‘op onrechtmatige wijze een AI gebruikte’. om de stem van onze cliënt na te bootsen.”
Het is niet moeilijk te begrijpen waarom een kunstenaar zich door zoiets zou kunnen storen. Zoals de visuele deepfakes die acteurs in films plaatsen waarin ze nooit zijn verschenen (of zoals ze zijn). de laatste tijd de ronde doet, Tom Cruise in een reeks hyperactieve TikTok-video's), een audio-deepfake van een artiest haalt het meeste uit waardevol bezit – in dit geval hun stem – en gebruikt deze om iets te creëren waar ze nooit toestemming voor hebben gegeven in. Er staan zowel ethische als financiële kwesties op het spel.
“De geschiedenis van rap is de geschiedenis van zelfreferentie”, beweerde Greenberg. “Door de hele canon van de traditie, door het hele werk van een bepaalde uitvoerder. Als je onder de motorkap van een A.I. In het leermodel vindt er een griezelig soortgelijk proces plaats: een soort hyper-zelfreferentie. Hoe schuin het ook mag lijken, dit sluit allemaal heel mooi aan.”
Moeten we ons zorgen maken over het risico van deepfakes in audio in een wereld waar echt en nep op verrassende wijze kunnen vervagen?
“Absoluut, maar alarm zal er niet voor zorgen dat deepfakes steeds meer mainstream worden”, zei hij. “Deze technologie is een blijvertje – we zouden zoveel geluk moeten hebben als het alleen maar voor de lol wordt gebruikt. Misschien helpt het om er leuke dingen mee te doen om ons in dat rijk te houden. We hebben een keerpunt bereikt waarop waarheid en fictie onmogelijk te onderscheiden zijn op internet. Daarom beseften we dat het cruciaal was dat we onze oren zouden kalmeren met de zachte, door AI gegenereerde leesstem van Gucci Mane.”
Zoals de sireneliederen ons naar de rotsen van Skynet leiden, is Gucci misschien nog niet zo slecht. Vooral als het Gucci uit 2009 zou kunnen zijn, circa De staat versus Radric Davis.
Aanbevelingen van de redactie
- Deze startup wil je stem deepfaken en verkopen aan de hoogste bieder
- Zijn deepfakes een gevaarlijke technologie? Makers en toezichthouders zijn het daar niet mee eens