“Gucci Mane louco, eu poderia parar em uma zebra / pousar em cima de uma águia, fumar um baseado de reefa.”
Conteúdo
- Gênios do mal
- Deepfake-A-Thon
Essa é uma letra de Gucci Mane de sua faixa de 2010 “It’s Gucci Time” do álbum O apelo: os mais procurados da Geórgia.
Vídeos recomendados
“É uma verdade universalmente reconhecida/ que um homem solteiro, possuidor de uma boa fortuna, deve estar carente de uma esposa." Agora também é um bar Gucci, embora originalmente escrito por Jane Austen em seu romance de boas maneiras de 1813, Orgulho e Preconceito, embora Gucci o imbua com um nível de arrogância do trap rap que não aparece em outras leituras do texto clássico em inglês. (Em comparação, o topo Audível a entrada para o mesmo romance é lida pela superestrela do rap Rosamund Pike.)
Acontece que a Gucci tem estado ocupada - mais ocupada ainda do que durante o período de 2010-2015, quando lançou mixtapes a uma taxa vertiginosa de cerca de uma por mês. Hoje, o rapper de 41 anos estreou leituras de voz de si mesmo lendo uma variedade de romances clássicos sob o título um tanto brilhante “
Projeto Gucciberg.” Um punhado de romances inclui Alice no País das Maravilhas, Pequenas Mulheres, Uma proposta modesta, Drácula, e A importância de ser sincero.Só que ele não fez isso. Bem, não exatamente.
É mais magia de áudio deepfake, desta vez cortesia do pessoal do coletivo de artes digitais com sede em Nova York MSCHF. Recém-saídos de seu último projeto - no qual eles anexou uma arma de paintball a um dos robôs Spot da Boston Dynamics, e permitiu que os usuários o controlassem remotamente pela Internet - a equipe emprestou sua marca de irreverência brincalhona e com tecnologia de apertar botões para um projeto no qual o rapper nascido Radric Delantic Davis é, ele mesmo, controlado remotamente (pelo menos, são suas palavras) para narrar uma série de músicas vintage romances.
Gênios do mal
Daniel Greenberg do MSCHF disse ao Digital Trends: “Gucci Mane é um dos músicos mais impactantes da história do rap. O Project Gutenberg é um dos últimos bastiões de textos de domínio público na internet. Ao combinar os dois, usando o poder da IA. tecnologia, criamos os audiolivros de domínio público lidos por rappers mais impactantes da história da Internet.
Para criar sua IA (totalmente não autorizada) amante da literatura. rapper, a equipe elaborou um conjunto de dados de treinamento de cerca de seis horas de O discurso de Gucci, retirado de entrevistas, podcasts e quaisquer outras imagens de áudio acessíveis ao público que eles pudessem extrair YouTube. Este material de origem foi então editado, reduzido em segmentos de 10 segundos, equalizado, transcrito e rotulado.
“Além disso, nossa equipe criou uma chave/dicionário de pronúncia da Gucci para capturar melhor as idiossincrasias do jargão específico de Gucci Mane”, disse Greenberg. Ele acrescentou: “Sério, isso equivale a uma tese linguística”.
O conjunto de dados foi então usado para treinar um I.A. modelo, massageado repetidamente para melhorar o saída e, em seguida, aumentado com toques humanos para adicionar um toque como pausas grávidas ao texto onde obrigatório.
“Às vezes pode parecer que Gucci está falando em um microfone quebrado ou em um fluxo de áudio ruim – porque ele estava em grande parte do nosso material de origem”, admitiu Greenberg. “No entanto, exceto esses fatores ambientais, sentimos que a emulação de voz real é extremamente bem-sucedida. É incrível e assustador como essa tecnologia é boa para fazer qualquer pessoa dizer o que quiser.”
O verdadeiro Gucci Mane não respondeu a um pedido de comentário. No entanto, esta é, como reconheceu Greenberg, uma espécie de “área cinzenta” quando se trata de direitos de autor. “As implicações de direitos autorais dos deepfakes ainda não foram legisladas”, disse ele. “Todas as amostras de áudio nas quais treinamos nosso modelo foram disponibilizadas publicamente por meio de entrevistas. No final das contas, temos uma voz que não é a nossa, lendo textos de domínio público que não escrevemos, mas estamos criando nossos ‘próprios’ audiolivros.”
Deepfake-A-Thon
No ano passado, a agência de entretenimento Roc Nation LLC de Jay-Z teve problemas com um deepfaker de áudio que usou a voz do rapper para falar bobagens como o Navy Seal Copypasta no YouTube. Foi, como observei na época, um enigma desafiador para um rapper que uma vez cantou a frase “Eu experimentei sua voz, você estava usando errado” durante sua briga com Nas no início dos anos 2000. Mas a Roc Nation não estava entrando na complexidade irônica do caso. Eles estavam apenas irritados com alguém “[usando] ilegalmente uma IA. para personificar a voz do nosso cliente.
Não é difícil perceber por que um artista pode ficar perturbado com tal coisa. Como o deepfakes visuais que colocam atores em filmes nos quais eles nunca apareceram (ou, como é circulando recentemente, Tom Cruise em uma série de vídeos hiperativos do TikTok), um deepfake de áudio de um artista leva o máximo ativo valioso – sua voz, neste caso – e a usa para criar algo que eles nunca consentiram em realizar em. Há questões éticas e financeiras em jogo.
“A história do rap é a história da autorreferência”, afirmou Greenberg. “Ao longo de todo o cânone da tradição, ao longo de todo o corpo da obra de um determinado intérprete. Quando você espia sob o capô de um A.I. modelo de aprendizagem, ocorre um processo estranhamente semelhante - uma espécie de hiperauto-referência. Por mais oblíquo que possa parecer, tudo isso se encaixa muito bem.”
Deveríamos nos preocupar com o risco de deepfakes de áudio em um mundo onde o real e o falso podem ser confundidos em um grau surpreendente?
“Com certeza, mas o alarme não impedirá que os deepfakes se tornem cada vez mais populares”, disse ele. “Essa tecnologia veio para ficar – deveríamos ter muita sorte se ela fosse usada apenas para diversão. Talvez fazer coisas divertidas com ele ajude a nos manter nesse reino. Chegamos a um ponto de inflexão em que a verdade e a ficção estão se tornando impossíveis de discernir na Internet. Assim, percebemos que era crucial acalmar nossos ouvidos com a voz suave de leitura gerada por IA de Gucci Mane.
No que diz respeito ao canto da sereia para nos levar às rochas da Skynet, talvez a Gucci não seja tão ruim, na verdade. Especialmente se pudesse ser a Gucci da era 2009, por volta O Estado vs. Radric Davis.
Recomendações dos Editores
- Esta startup quer clonar sua voz e vendê-la ao licitante com lance mais alto
- Os deepfakes são uma tecnologia perigosa? Criadores e reguladores discordam