प्रोजेक्ट गुच्चीबर्ग: गुच्ची माने से डीपफेक्ड ऑडियोबुक

"गुच्ची माने पागल, मैं एक ज़ेबरा को खींच सकता हूं/एक चील के ऊपर लैंड कर सकता हूं, रीफा के जोड़ को धूम्रपान कर सकता हूं।"

अंतर्वस्तु

  • दुष्ट प्रतिभाशाली आदमी
  • डीपफेक-ए-थॉन

यह उनके 2010 के एल्बम "इट्स गुच्ची टाइम" ट्रैक का गुच्ची माने गीत है अपील: जॉर्जिया का मोस्ट वांटेड.

अनुशंसित वीडियो

“यह सार्वभौमिक रूप से स्वीकृत सत्य है/ कि एक भी व्यक्ति जिसके पास अच्छी किस्मत है, उसे अवश्य ही इसकी कमी होगी पत्नी।" वह भी, अब, एक गुच्ची बार है, हालांकि मूल रूप से जेन ऑस्टेन ने अपने 1813 के शिष्टाचार उपन्यास में लिखा था, प्राइड एंड प्रीजूडिस, हालाँकि गुच्ची ने इसे ट्रैप रैप स्वैगर के स्तर से भर दिया है जो कि क्लासिक अंग्रेजी पाठ के अन्य पाठों में बिल्कुल नहीं आता है। (तुलनात्मक रूप से, शीर्ष सुनाई देने योग्य उसी उपन्यास की प्रविष्टि निश्चित रूप से नॉन-ट्रैप रैप सुपरस्टार रोसमंड पाइक द्वारा पढ़ी जाती है।)

गुच्ची, जैसा कि यह पता चला है, व्यस्त रहा है - 2010-2015 की अवधि की तुलना में भी अधिक व्यस्त, जब वह प्रति माह लगभग एक की चक्करदार दर से मिक्सटेप जारी कर रहा था। आज, 41 वर्षीय रैपर ने कुछ हद तक शानदार शीर्षक के तहत क्लासिक उपन्यासों की एक श्रृंखला को पढ़ते हुए अपनी आवाज में शुरुआत की।

प्रोजेक्ट गुच्चिबर्ग।” बहुत सारे उपन्यास शामिल हैं एलिस के एडवेंचर इन वंडरलैंड, लिटल वुमन, एक मामूली प्रस्ताव, ड्रेकुला, और गंभीर होने का महत्व.

केवल उसने ऐसा नहीं किया। ख़ैर, बिल्कुल नहीं.

MSCHF

यह ज्यादा है डीपफेक ऑडियो विजार्ड्री, इस बार न्यूयॉर्क स्थित डिजिटल आर्ट्स कलेक्टिव के लोगों के सौजन्य से MSCHF. अपने आखिरी प्रोजेक्ट को ताज़ा करें - जिसमें वे बोस्टन डायनेमिक्स के स्पॉट रोबोटों में से एक में एक पेंटबॉल गन संलग्न की गई, और उपयोगकर्ताओं को इसे इंटरनेट पर दूर से नियंत्रित करने की अनुमति दी - टीम ने अपने बटन-पुश, तकनीक-प्रेमी ब्रांड के प्रैंकस्टर को अनादर दिया है एक प्रोजेक्ट जिसमें रैपर रैड्रिक डेलैंटिक डेविस का जन्म हुआ, वह स्वयं, रिमोट-नियंत्रित है (कम से कम, उसके शब्द हैं) विंटेज का वर्णन करने के लिए उपन्यास.

दुष्ट प्रतिभाशाली आदमी

MSCHF के डैनियल ग्रीनबर्ग ने डिजिटल ट्रेंड्स को बताया: “गुच्ची माने रैप के इतिहास में सबसे प्रभावशाली संगीतकारों में से एक है। प्रोजेक्ट गुटेनबर्ग इंटरनेट पर सार्वजनिक डोमेन टेक्स्ट के अंतिम गढ़ों में से एक है। दोनों को मिलाकर, ए.आई. की शक्ति का उपयोग करके। प्रौद्योगिकी, हमने इंटरनेट के इतिहास में सबसे प्रभावशाली रैपर द्वारा पढ़ी जाने वाली सार्वजनिक डोमेन ऑडियोबुक बनाई है।

उनके (पूरी तरह से अनधिकृत) साहित्य-प्रेमी ए.आई. बनाने के लिए। रैपर, टीम ने लगभग छह घंटे का एक प्रशिक्षण डेटासेट तैयार किया गुच्ची का भाषण, साक्षात्कारों, पॉडकास्ट और अन्य सार्वजनिक रूप से सुलभ ऑडियो फ़ुटेज से लिया गया जिसे वे प्राप्त कर सकते थे यूट्यूब। इस स्रोत सामग्री को फिर संपादित किया गया, 10 सेकंड के खंडों में काटा गया, EQ'd किया गया, प्रतिलेखित किया गया और लेबल किया गया।

MSCHF

ग्रीनबर्ग ने कहा, "इसके अतिरिक्त, हमारी टीम ने गुच्ची माने के विशेष तर्क की विशिष्टताओं को बेहतर ढंग से पकड़ने के लिए गुच्ची उच्चारण कुंजी/शब्दकोश का निर्माण किया।" उन्होंने आगे कहा, "गंभीरता से, यह बात भाषाविज्ञान थीसिस के बराबर है।"

डेटासेट का उपयोग तब A.I को प्रशिक्षित करने के लिए किया जाता था। मॉडल की बार-बार मालिश की गई ताकि उसमें सुधार हो सके आउटपुट, और फिर पाठ में गर्भवती ठहराव जैसी भावना जोड़ने के लिए मानवीय स्पर्शों के साथ संवर्धित किया गया आवश्यक।

ग्रीनबर्ग ने स्वीकार किया, "ऐसा लग सकता है जैसे गुच्ची कभी-कभी टूटे हुए माइक्रोफोन में या खराब ऑडियो स्ट्रीम पर बोल रहा है - क्योंकि वह हमारी बहुत सारी स्रोत सामग्री में था।" “हालांकि, इन पर्यावरणीय कारकों को छोड़कर, हमें लगता है कि वास्तविक आवाज अनुकरण बेहद सफल है। यह आश्चर्यजनक भी है और डरावना भी कि यह तकनीक कितनी अच्छी है कि कोई भी कुछ भी कह सके।”

MSCHF

असली गुच्ची माने ने टिप्पणी के अनुरोध का जवाब नहीं दिया। हालाँकि, जैसा कि ग्रीनबर्ग ने स्वीकार किया, जब कॉपीराइट की बात आती है तो यह एक "ग्रे एरिया" जैसा कुछ है। उन्होंने कहा, "डीपफेक के कॉपीराइट निहितार्थों पर अभी तक कानून नहीं बनाया गया है।" “जिन ऑडियो नमूनों पर हमने अपने मॉडल को प्रशिक्षित किया, वे सभी साक्षात्कार के माध्यम से सार्वजनिक रूप से उपलब्ध थे। दिन के अंत में, हमारे पास एक आवाज़ है जो हमारी नहीं है, सार्वजनिक डोमेन पाठ को पढ़ रही है जिसे हमने नहीं लिखा है, लेकिन हम अपनी 'स्वयं' ऑडियोबुक बना रहे हैं।

डीपफेक-ए-थॉन

पिछले साल, जे-जेड की रॉक नेशन एलएलसी मनोरंजन एजेंसी एक ऑडियो डीपफ़ेकर के साथ मुद्दा उठाया जिसने रैपर की आवाज का इस्तेमाल यूट्यूब पर नेवी सील कॉपिपास्टा जैसी अस्पष्ट बातें बोलने के लिए किया। यह, जैसा कि मैंने उस समय नोट किया था, एक रैपर के लिए एक मस्तिष्क-चिढ़ाने वाली पहेली थी, जिसने 2000 के दशक की शुरुआत में एनएएस के साथ बीफ के दौरान "मैंने आपकी आवाज का नमूना लिया था, आप इसे गलत इस्तेमाल कर रहे थे" पंक्ति का रैप किया था। लेकिन रॉक नेशन मामले की विडंबनापूर्ण जटिलता में नहीं पड़ रहा था। वे बस इस बात से नाराज थे कि कोई "गैरकानूनी तरीके से ए.आई. का उपयोग कर रहा है।" हमारे ग्राहक की आवाज़ का प्रतिरूपण करने के लिए।"

यह समझना मुश्किल नहीं है कि एक कलाकार ऐसी चीज़ से परेशान क्यों हो सकता है। की तरह दृश्य डीपफेक वह अभिनेताओं को उन फिल्मों में स्थान देता है जिनमें वे कभी दिखाई नहीं दिए (या, जैसे हैं)। हाल ही में घूम रहा है, हाइपरएक्टिव टिकटॉक वीडियो की एक श्रृंखला में टॉम क्रूज़), एक कलाकार का ऑडियो डीपफेक उनका सबसे अधिक समय लेता है मूल्यवान संपत्ति - उनकी आवाज़, इस मामले में - और इसका उपयोग कुछ ऐसा बनाने के लिए करती है जिसे करने के लिए उन्होंने कभी सहमति नहीं दी में। नैतिक और वित्तीय दोनों मुद्दे दांव पर हैं।

MSCHF

ग्रीनबर्ग ने कहा, "रैप का इतिहास आत्म-संदर्भ का इतिहास है।" “परंपरा के संपूर्ण सिद्धांत में, किसी कलाकार के संपूर्ण कार्य में। जब आप ए.आई. के हुड के नीचे झाँकते हैं। सीखने के मॉडल में, एक अजीब तरह की समान प्रक्रिया घटित हो रही है - एक प्रकार का हाइपर-सेल्फ-रेफरेंस। यह भले ही तिरछा प्रतीत हो, लेकिन यह सब काफी अच्छी तरह से मेल खाता है।''

क्या हमें ऐसी दुनिया में ऑडियो डीपफेक के खतरे के बारे में चिंतित होना चाहिए जहां असली और नकली को चौंकाने वाली हद तक धुंधला किया जा सकता है?

"बिल्कुल, लेकिन अलार्म डीपफेक को अधिक से अधिक मुख्यधारा बनने से नहीं रोकेगा," उन्होंने कहा। “यह तकनीक यहाँ रहने के लिए है - हमें बहुत भाग्यशाली होना चाहिए अगर इसका उपयोग केवल मनोरंजन के लिए किया जाता है। शायद इसके साथ मज़ेदार चीज़ें करने से हमें उस दायरे में बने रहने में मदद मिलेगी। हम एक ऐसे मोड़ पर पहुंच गए हैं जहां इंटरनेट पर सच्चाई और कल्पना को पहचानना असंभव होता जा रहा है। इस प्रकार, हमने महसूस किया कि यह महत्वपूर्ण है कि हम गुच्ची माने की सौम्य ए.आई.-जनित पढ़ने वाली आवाज से अपने कानों को शांत करें।

जैसे सायरन गाने हमें स्काईनेट की चट्टानों पर ले जाते हैं, शायद गुच्ची इतनी बुरी नहीं है, जैसा कि होता है। विशेषकर यदि यह लगभग 2009-युग की गुच्ची हो राज्य बनाम. रैड्रिक डेविस.

संपादकों की सिफ़ारिशें

  • यह स्टार्टअप आपकी आवाज का डीपफेक क्लोन बनाकर सबसे ऊंची बोली लगाने वाले को बेचना चाहता है
  • क्या डीपफेक एक खतरनाक तकनीक है? निर्माता और नियामक असहमत हैं

श्रेणियाँ

हाल का

वीडियो गेम का मालिक होना 2022 की तुलना में कहीं अधिक कठिन है

वीडियो गेम का मालिक होना 2022 की तुलना में कहीं अधिक कठिन है

गेम ख़रीदना आसान है. रखना 2022 में यह और अधिक क...

डेवलपर्स के अनुसार AR, VR से बड़ा क्यों होगा?

डेवलपर्स के अनुसार AR, VR से बड़ा क्यों होगा?

आभासी वास्तविकता ने तकनीक की दुनिया में तूफान ल...