Projet Gucciberg: livres audio truqués de Gucci Mane

"Gucci Mane est fou, je pourrais m'arrêter sur un zèbre/Atterrir sur un aigle, fumer un joint de récif."

Contenu

  • Génies maléfiques
  • Deepfake-A-Thon

Ce sont des paroles de Gucci Mane tirées de son morceau de 2010 "It's Gucci Time" de l'album. L’appel: les personnes les plus recherchées de Géorgie.

Vidéos recommandées

« C'est une vérité universellement reconnue qu'un seul homme en possession d'une bonne fortune doit avoir besoin d'un épouse." C'est aussi, maintenant, un bar Gucci, bien qu'il ait été écrit à l'origine par Jane Austen dans son roman de 1813 sur les bonnes manières, Orgueil et préjugés, bien que Gucci lui confère un niveau de fanfaronnade trap rap qui ne se retrouve pas tout à fait dans d’autres lectures du texte anglais classique. (En comparaison, le haut Audible l'entrée du même roman est lue par la superstar du rap résolument non-trap, Rosamund Pike.)

Il s'avère que Gucci a été occupé – encore plus occupé qu'au cours de la période 2010-2015, lorsqu'il publiait des mixtapes à un rythme vertigineux d'environ une par mois. Aujourd'hui, le rappeur de 41 ans a débuté ses lectures vocales de lui-même en train de lire un assortiment de romans classiques sous le titre quelque peu brillant «

Projet Gucciberg.» Une poignée de romans comprennent Les aventures d'Alice au Pays des Merveilles, Petite femme, Une proposition modeste, Dracula, et L’importance d’être sérieux.

Seulement, il ne l’a pas fait. Eh bien, pas exactement.

MSCHF

C'est plus magie audio deepfake, cette fois grâce aux gens du collectif d'arts numériques basé à New York MSCHF. Fraîchement sortis de leur dernier projet - dans lequel ils attaché un pistolet de paintball à l’un des robots Spot de Boston Dynamics, et a permis aux utilisateurs de le contrôler à distance via Internet - l'équipe a prêté son irrévérence de farceur en appuyant sur des boutons et en technologie à un projet dans lequel le rappeur né Radric Delantic Davis est lui-même télécommandé (du moins, ses mots le sont) pour raconter une flopée de vintage des romans.

Génies maléfiques

Daniel Greenberg de MSCHF a déclaré à Digital Trends: « Gucci Mane est l’un des musiciens les plus marquants de l’histoire du rap. Le projet Gutenberg est l’un des derniers bastions des textes du domaine public sur Internet. En combinant les deux, en utilisant la puissance de l'IA. technologie, nous avons créé les livres audio du domaine public lus par des rappeurs les plus percutants de l’histoire d’Internet.

Pour créer leur IA (totalement non autorisée) passionnée de littérature. rappeur, l'équipe a créé un ensemble de données de formation d'environ six heures de Le discours de Gucci, tiré d'interviews, de podcasts et de toute autre séquence audio accessible au public dont ils pourraient récupérer Youtube. Ce matériel source a ensuite été édité, découpé en segments de 10 secondes, égalisé, transcrit et étiqueté.

MSCHF

"De plus, notre équipe a créé une clé/dictionnaire de prononciation Gucci pour mieux capturer les particularités de l'argot particulier de Gucci Mane", a déclaré Greenberg. Il a ajouté: « Sérieusement, cette chose est l’équivalent d’une thèse de linguistique. »

L’ensemble de données a ensuite été utilisé pour former une IA. modèle, massé à plusieurs reprises pour améliorer la sortie, puis augmentée de touches humaines pour ajouter du style comme des pauses enceintes dans le texte où requis.

"Il peut parfois sembler que Gucci parle dans un microphone cassé, ou sur un mauvais flux audio - parce qu'il figurait dans une grande partie de nos sources", a admis Greenberg. « Cependant, en dehors de ces facteurs environnementaux, nous pensons que l’émulation vocale est extrêmement réussie. Il est à la fois étonnant et effrayant de constater à quel point cette technologie permet à n’importe qui de dire ce qu’il veut.

MSCHF

Le vrai Gucci Mane n'a pas répondu à une demande de commentaire. Cependant, comme Greenberg l’a reconnu, il s’agit en quelque sorte d’une « zone grise » en matière de droit d’auteur. "Les implications des deepfakes en matière de droits d'auteur n'ont pas encore été légiférées", a-t-il déclaré. «Tous les échantillons audio sur lesquels nous avons formé notre modèle étaient accessibles au public via des entretiens. En fin de compte, nous avons une voix qui n’est pas la nôtre, lisant des textes du domaine public que nous n’avons pas écrits, mais nous créons nos « propres » livres audio.

Deepfake-A-Thon

L'année dernière, l'agence de divertissement Roc Nation LLC de Jay-Z a eu un problème avec un deepfaker audio qui a utilisé la voix du rappeur pour débiter du charabia comme le Navy Seal Copypasta sur YouTube. C’était, comme je l’ai noté à l’époque, une énigme casse-tête pour un rappeur qui avait un jour rappé la phrase « J’ai échantillonné ta voix, tu l’utilisais mal » lors de son bœuf du début des années 2000 avec Nas. Mais Roc Nation n’entrait pas dans la complexité ironique de l’affaire. Ils étaient simplement ennuyés par le fait que quelqu’un « utilise illégalement une IA ». pour usurper l’identité de la voix de notre client.

Il n’est pas difficile de comprendre pourquoi un artiste pourrait être perturbé par une telle chose. Comme le contrefaçons visuelles qui placent les acteurs dans des films dans lesquels ils ne sont jamais apparus (ou, comme c'est le cas fait le tour récemment, Tom Cruise dans une série de vidéos hyperactives sur TikTok), un deepfake audio d'un artiste prend le dessus un atout précieux - leur voix, dans ce cas - et l'utilise pour créer quelque chose qu'ils n'ont jamais consenti à réaliser dans. Des enjeux à la fois éthiques et financiers sont en jeu.

MSCHF

« L’histoire du rap est l’histoire de l’autoréférence », a soutenu Greenberg. « Dans tout le canon de la tradition, dans tout le corpus de l’œuvre d’un interprète donné. Lorsque vous jetez un coup d’œil sous le capot d’un I.A. modèle d’apprentissage, un processus étrangement similaire se produit – une sorte d’hyper-auto-référence. Aussi oblique que cela puisse paraître, tout cela s’accorde assez bien.

Devons-nous nous inquiéter du risque de deepfakes audio dans un monde où le réel et le faux peuvent être flous à un degré surprenant ?

"Absolument, mais l'alarme n'empêchera pas les deepfakes de devenir de plus en plus courants", a-t-il déclaré. « Cette technologie est là pour rester – nous devrions avoir autant de chance si elle n’est utilisée que pour le plaisir. Peut-être que faire des choses amusantes avec cela nous aidera à rester dans ce domaine. Nous avons atteint un point d’inflexion où la vérité et la fiction deviennent impossibles à discerner sur Internet. Ainsi, nous avons réalisé qu’il était crucial d’apaiser nos oreilles avec la douce voix de lecture générée par l’IA de Gucci Mane.

Alors que les chants des sirènes nous conduisent sur les rochers de Skynet, peut-être que Gucci n'est pas si mal, en l'occurrence. Surtout s'il s'agissait de Gucci de 2009, vers L'État contre Radric Davis.

Recommandations des rédacteurs

  • Cette startup veut falsifier votre voix et la vendre au plus offrant
  • Les deepfakes sont-ils une technologie dangereuse? Les créateurs et les régulateurs ne sont pas d'accord