Проект Gucciberg: Deepfaked аудиокниги от Gucci Mane

„Gucci Mane луд, може да се кача на зебра/ да кацна на върха на орел, да изпуша джойнт рифа.“

Съдържание

  • Зли гении
  • Deepfake-A-Thon

Това е текст на Gucci Mane от неговата песен от 2010 г. „It’s Gucci Time“ от албума Призивът: Най-търсеният в Грузия.

Препоръчани видеоклипове

„Всеобщопризната истина е, че един човек, който притежава добро състояние, трябва да има нужда от съпруга." Това вече също е бар Gucci, макар и първоначално написан от Джейн Остин в нейния роман за нрави от 1813 г. Гордост и предразсъдъци, въпреки че Gucci го пропити с ниво на трап рап перчене, което не се среща съвсем в други четения на класическия английски текст. (За сравнение, горната част Звуков запис за същия роман е прочетен от определено не-трап рап суперзвездата Розамунд Пайк.)

Gucci, както се оказва, е бил зает – по-зает дори от периода 2010-2015 г., когато издаваше микстейпи с шеметна скорост от приблизително един на месец. Днес 41-годишният рапър дебютира с гласови четения на себе си, четейки набор от класически романи под донякъде брилянтното заглавие „

Проект Gucciberg.” Някои от романите включват Приключенията на Алиса в страната на чудесата, Малка жена, Скромно предложение, Дракула, и Колко е важно да бъдем искрени.

Само той не го направи. Е, не точно.

MSCHF

Това е повече deepfake audio wizardry, този път с любезното съдействие на хората от базирания в Ню Йорк колектив за дигитални изкуства MSCHF. Прясно от последния им проект — в който те прикрепи пистолет за пейнтбол към един от роботите Spot на Boston Dynamics, и позволи на потребителите да го контролират от разстояние през интернет – екипът е отдал своята натискаща бутони, разбираема в технологиите марка непочтителност на майтапчиите проект, в който самият рапър, роден като Радрик Делантик Дейвис, се управлява дистанционно (поне думите му са такива), за да разкаже купчина реколта романи.

Зли гении

Daniel Greenberg от MSCHF каза пред Digital Trends: „Gucci Mane е един от най-въздействащите музиканти в историята на рапа. Проектът Гутенберг е един от последните бастиони на текстове, които са обществено достояние в интернет. Чрез комбиниране на двете, използвайки силата на ИИ. технология, ние създадохме най-въздействащите аудиокниги, четени от рапъри, обществено достояние в историята на интернет.“

За да създадат своя (напълно неоторизиран) любител на литературата И.И. рапър, екипът изработи набор от данни за обучение от около шест часа Речта на Gucci, извлечена от интервюта, подкасти и каквито и да било други публично достъпни аудиозаписи, от които биха могли да изчистят YouTube. След това този изходен материал беше редактиран, съкратен на сегменти от 10 секунди, EQ’d, транскрибиран и етикетиран.

MSCHF

„Освен това нашият екип изгради ключ/речник за произношение на Gucci, за да улови по-добре особеностите на конкретното арго на Gucci Mane“, каза Грийнбърг. Той добави: „Сериозно, това нещо е еквивалент на дипломна работа по лингвистика.“

След това наборът от данни беше използван за обучение на A.I. модел, многократно масажиран, така че да подобри изход и след това допълнен с човешки докосвания, за да добави усет като бременни паузи в текста, където изисква се.

„Може да звучи сякаш Gucci говори в счупен микрофон на моменти или на лош аудио поток – защото той беше в много от нашия изходен материал“, призна Грийнбърг. „Въпреки това, като изключим тези фактори на околната среда, смятаме, че действителната гласова емулация е изключително успешна. Едновременно е удивително и плашещо колко добра е тази технология, за да накара всеки да каже каквото си поиска.”

MSCHF

Истинската Gucci Mane не отговори на искане за коментар. Въпреки това, както Грийнбърг призна, това е нещо като „сива зона“, когато става дума за авторско право. „Последиците за авторското право на deepfakes все още не са законодателни“, каза той. „Всички аудио проби, върху които обучихме нашия модел, бяха публично достъпни чрез интервюта. В края на краищата имаме глас, който не е наш, четейки обществено достояние текст, който не сме написали, но ние създаваме наши „собствени“ аудиокниги.“

Deepfake-A-Thon

Миналата година развлекателната агенция на Jay-Z Roc Nation LLC възникна проблем с аудио deepfaker който използва гласа на рапъра, за да бълва безсмислици като Navy Seal Copypasta в YouTube. Това беше, както отбелязах по онова време, главоблъсканица за един рапър, който веднъж рапира репликата „Изпробвах гласа ви, използвахте го погрешно“ по време на битката му с Nas в началото на 2000-те. Но Roc Nation не навлизаше в ироничната сложност на случая. Те просто бяха раздразнени от това, че някой „незаконно [използва] ИИ. да се представя за гласа на нашия клиент.

Не е трудно да се разбере защо един художник може да бъде обезпокоен от подобно нещо. Подобно на визуални дълбоки фалшификации които поставят актьори във филми, в които те никога не са се появявали (или както е правя обиколки наскоро, Том Круз в поредица от хиперактивни видеоклипове в TikTok), аудио дийпфейк на изпълнител взема най-много ценен актив - гласът им, в този случай - и го използва, за да създаде нещо, което никога не са се съгласявали да изпълнят в. Заложени са както етични, така и финансови въпроси.

MSCHF

„Историята на рапа е история на самопозоваването“, поддържа Грийнбърг. „В целия канон на традицията, в цялото произведение на даден изпълнител. Когато надникнете под капака на A.I. модел на учене, протича необичайно подобен процес - един вид хипер-самореференция. Колкото и наклонено да изглежда, всичко това си пасва доста добре.“

Трябва ли да се тревожим за риска от дълбоки аудио фалшификации в свят, в който истинското и фалшивото могат да бъдат замъглени до стряскаща степен?

„Абсолютно, но алармата няма да попречи на deepfakes да стават все по-масови“, каза той. „Тази технология е тук, за да остане – трябва да сме толкова щастливи, ако се използва само за забавление. Може би правенето на забавни неща с него ще ни помогне да останем в това царство. Достигнахме инфлексна точка, в която истината и измислицата стават невъзможни за разграничаване в интернет. Така осъзнахме, че е от решаващо значение да успокоим ушите си с нежния глас за четене на Gucci Mane, генериран от AI.“

Тъй като песните на сирената ни въвеждат в скалите на Skynet, може би Gucci не е толкова лош, както се случва. Особено ако може да е Gucci от ерата на 2009 г., около Държавата vs. Радрик Дейвис.

Препоръки на редакторите

  • Този стартиращ бизнес иска да фалшифицира гласа ви и да го продаде на предложилия най-висока цена
  • Deepfakes опасна технология ли са? Създателите и регулаторите не са съгласни