Project Gucciberg: Deepfaked Audiobooks από την Gucci Mane

"Gucci Mane τρελό, μπορεί να σηκώσω μια ζέβρα/ να προσγειωθώ πάνω σε έναν αετό, να καπνίσω μια άρθρωση ρέφα."

Περιεχόμενα

  • Κακές ιδιοφυΐες
  • Deepfake-A-Thon

Αυτός είναι ένας στίχος του Gucci Mane από το κομμάτι του 2010 "It's Gucci Time" από το άλμπουμ The Appeal: Georgia’s Most Wanted.

Προτεινόμενα βίντεο

«Είναι μια αλήθεια παγκοσμίως αναγνωρισμένη/ ότι ένας ανύπαντρος που έχει μια καλή τύχη, πρέπει να έχει γυναίκα." Αυτό είναι επίσης, τώρα, ένα μπαρ Gucci, αν και αρχικά γράφτηκε από την Jane Austen στο μυθιστόρημά της με τρόπους του 1813, Περηφάνεια και προκατάληψη, παρόλο που ο Gucci το διαποτίζει με ένα επίπεδο ραπ ραπ που δεν συναντάμε σε άλλες αναγνώσεις του κλασικού αγγλικού κειμένου. (Συγκριτικά, η κορυφή Ακουστός Η καταχώρηση για το ίδιο μυθιστόρημα διαβάζεται από την αναμφισβήτητα μη τραπ σούπερ σταρ της ραπ Ρόζαμουντ Πάικ.)

Ο Gucci, όπως αποδεικνύεται, ήταν απασχολημένος — πιο απασχολημένος ακόμα και από ό, τι ήταν κατά την περίοδο 2010-2015, όταν έβγαζε mixtapes με ιλιγγιώδη ρυθμό, περίπου ένα το μήνα. Σήμερα, ο 41χρονος ράπερ έκανε το ντεμπούτο του φωνητικές αναγνώσεις του εαυτού του διαβάζοντας μια ποικιλία από κλασικά μυθιστορήματα με τον κάπως λαμπρό τίτλο "

Έργο Gucciberg.» Ένα μικρό μέρος των μυθιστορημάτων περιλαμβάνει Η Αλίκη στη χώρα των θαυμάτων, Μικρές γυναίκες, Μια λιτή πρόταση, Δράκουλας, και Η σημασία του να είναι κανείς σοβαρός.

Μόνο που δεν το έκανε. Λοιπόν, όχι ακριβώς.

MSCHF

Είναι περισσότερο Deepfake audio wizardry, αυτή τη φορά ευγενική προσφορά των ανθρώπων της συλλογικής ψηφιακών τεχνών με έδρα τη Νέα Υόρκη MSCHF. Φρέσκο ​​από το τελευταίο τους έργο — στο οποίο προσάρτησε ένα πιστόλι paintball σε ένα από τα ρομπότ Spot της Boston Dynamics, και επέτρεψε στους χρήστες να το ελέγχουν εξ αποστάσεως μέσω του Διαδικτύου — η ομάδα έχει δανείσει την ασέβεια της φάρσας που πατάει τα κουμπιά, με γνώσεις τεχνολογίας ένα έργο στο οποίο ο ράπερ γεννημένος Radric Delantic Davis είναι, ο ίδιος, τηλεκατευθυνόμενος (τουλάχιστον, τα λόγια του είναι) για να αφηγηθεί μια σειρά από vintage μυθιστορήματα.

Κακές ιδιοφυΐες

Ο Daniel Greenberg του MSCHF είπε στο Digital Trends: «Ο Gucci Mane είναι ένας από τους πιο εντυπωσιακούς μουσικούς στην ιστορία της ραπ. Το Project Gutenberg είναι ένα από τα τελευταία προπύργια κειμένων δημόσιου τομέα στο διαδίκτυο. Συνδυάζοντας τα δύο, χρησιμοποιώντας τη δύναμη του A.I. τεχνολογία, έχουμε δημιουργήσει τα πιο εντυπωσιακά ηχητικά βιβλία που διαβάζονται από τον ράπερ στην ιστορία του Διαδικτύου».

Να δημιουργήσουν την (εντελώς μη εξουσιοδοτημένη) φιλοτεχνική A.I. ράπερ, η ομάδα δημιούργησε ένα σύνολο δεδομένων εκπαίδευσης περίπου έξι ωρών Η ομιλία του Gucci, προερχόμενη από συνεντεύξεις, podcast και ό, τι άλλο δημοσίως προσβάσιμο ηχητικό υλικό από το οποίο θα μπορούσαν να συλλέξουν YouTube. Αυτό το πηγαίο υλικό στη συνέχεια επεξεργάστηκε, περικόπηκε σε τμήματα 10 δευτερολέπτων, εξισορροπήθηκε, μεταγράφηκε και επισημάνθηκε.

MSCHF

«Επιπλέον, η ομάδα μας κατασκεύασε ένα κλειδί/λεξικό προφοράς Gucci για να αποτυπώσει καλύτερα τις ιδιοσυγκρασίες της ιδιαίτερης αγελάδας του Gucci Mane», είπε ο Greenberg. Και πρόσθεσε, «Σοβαρά, αυτό το πράγμα είναι ισοδύναμο μιας γλωσσολογικής διατριβής».

Στη συνέχεια, το σύνολο δεδομένων χρησιμοποιήθηκε για την εκπαίδευση ενός A.I. μοντέλο, επανειλημμένα μασάζ έτσι ώστε να βελτιωθεί η εξόδου, και στη συνέχεια επαυξήθηκε με ανθρώπινες πινελιές για να προσθέσει αίσθηση σαν εγκυμονούσες παύσεις στο κείμενο όπου απαιτείται.

«Μπορεί να ακούγεται σαν ο Gucci να μιλάει σε ένα σπασμένο μικρόφωνο κατά καιρούς ή σε μια κακή ροή ήχου - επειδή ήταν σε μεγάλο μέρος του υλικού μας πηγής», παραδέχτηκε ο Greenberg. «Ωστόσο, εκτός αυτών των περιβαλλοντικών παραγόντων, πιστεύουμε ότι η πραγματική εξομοίωση φωνής είναι εξαιρετικά επιτυχημένη. Είναι εκπληκτικό και τρομακτικό πόσο καλή είναι αυτή η τεχνολογία για να κάνει οποιονδήποτε να λέει ό, τι θέλεις».

MSCHF

Ο πραγματικός Gucci Mane δεν απάντησε σε αίτημα για σχόλιο. Ωστόσο, αυτό είναι, όπως αναγνώρισε ο Greenberg, κάτι σαν μια «γκρίζα ζώνη» όσον αφορά τα πνευματικά δικαιώματα. «Οι επιπτώσεις των πνευματικών δικαιωμάτων των deepfakes δεν έχουν ακόμη νομοθετηθεί», είπε. «Όλα τα ηχητικά δείγματα στα οποία εκπαιδεύσαμε το μοντέλο μας ήταν διαθέσιμα στο κοινό μέσω συνεντεύξεων. Στο τέλος της ημέρας, έχουμε μια φωνή που δεν είναι δική μας, διαβάζοντας κείμενο δημόσιου τομέα που δεν γράψαμε εμείς, αλλά δημιουργούμε τα «δικά μας» ηχητικά βιβλία».

Deepfake-A-Thon

Πέρυσι, το πρακτορείο ψυχαγωγίας του Jay-Z's Roc Nation LLC αντιμετώπισε πρόβλημα με ένα audio deepfaker ο οποίος χρησιμοποίησε τη φωνή του ράπερ για να εκτοξεύσει ασυναρτησίες όπως το Navy Seal Copypasta στο YouTube. Ήταν, όπως σημείωσα εκείνη την εποχή, ένα αίνιγμα εγκεφαλικού πειράγματος για έναν ράπερ που κάποτε έκανε ραπ με τη σειρά "I tested your voice, you wasin' it usin' it wrong" κατά τη διάρκεια των αρχών του 2000 με τον Nas. Αλλά το Roc Nation δεν έμπαινε στην ειρωνική πολυπλοκότητα της υπόθεσης. Απλώς ενοχλήθηκαν για κάποιον «παράνομα [χρησιμοποιώντας] ένα A.I. να υποδυόμαστε τη φωνή του πελάτη μας».

Δεν είναι δύσκολο να καταλάβει κανείς γιατί ένας καλλιτέχνης μπορεί να ενοχληθεί από κάτι τέτοιο. Σαν το οπτικά deepfakes που τοποθετούν ηθοποιούς σε ταινίες στις οποίες δεν εμφανίστηκαν ποτέ (ή, όπως είναι κάνει τον γύρο πρόσφατα, ο Tom Cruise σε μια σειρά από υπερκινητικά βίντεο TikTok), ένα ακουστικό deepfake ενός καλλιτέχνη παίρνει τα μέγιστα πολύτιμο περιουσιακό στοιχείο - η φωνή τους, σε αυτήν την περίπτωση - και το χρησιμοποιεί για να δημιουργήσει κάτι που ποτέ δεν συναίνεσαν να εκτελέσουν σε. Διακυβεύονται τόσο ηθικά όσο και οικονομικά ζητήματα.

MSCHF

«Η ιστορία της ραπ είναι η ιστορία της αυτοαναφοράς», υποστήριξε ο Greenberg. «Σε ολόκληρο τον κανόνα της παράδοσης, σε όλο το σώμα του έργου ενός δεδομένου ερμηνευτή. Όταν κρυφοκοιτάζεις κάτω από την κουκούλα ενός A.I. μοντέλο μάθησης, υπάρχει μια ασυνήθιστα παρόμοια διαδικασία - ένα είδος υπερ-αυτοαναφοράς. Όσο λοξό κι αν φαίνεται, όλα αυτά πέφτουν πολύ όμορφα».

Θα πρέπει να ανησυχούμε για τον κίνδυνο των deepfakes ήχου σε έναν κόσμο όπου το πραγματικό και το ψεύτικο μπορεί να θολωθούν σε εκπληκτικό βαθμό;

«Απολύτως, αλλά ο συναγερμός δεν θα εμποδίσει τα deepfakes να γίνονται όλο και πιο mainstream», είπε. «Αυτή η τεχνολογία είναι εδώ για να μείνει – θα πρέπει να είμαστε τόσο τυχεροί αν χρησιμοποιείται μόνο για διασκέδαση. Ίσως το να κάνουμε διασκεδαστικά πράγματα με αυτό θα μας βοηθήσει να κρατήσουμε σε αυτό το βασίλειο. Έχουμε φτάσει σε ένα σημείο καμπής όπου η αλήθεια και η μυθοπλασία είναι αδύνατο να διακριθούν στο διαδίκτυο. Έτσι, συνειδητοποιήσαμε ότι ήταν ζωτικής σημασίας να απαλύνουμε τα αυτιά μας με την απαλή αναγνωστική φωνή του Gucci Mane που δημιουργήθηκε από A.I.».

Καθώς τα τραγούδια των σειρήνων μας οδηγούν στους βράχους του Skynet, ίσως το Gucci να μην είναι τόσο κακό, όπως συμβαίνει. Ειδικά αν θα μπορούσε να είναι η Gucci της εποχής του 2009, περίπου Το κράτος vs. Ράντρικ Ντέιβις.

Συστάσεις των συντακτών

  • Αυτή η startup θέλει να κλωνοποιήσει τη φωνή σας και να την πουλήσει στον πλειοδότη
  • Είναι τα deepfakes επικίνδυνη τεχνολογία; Οι δημιουργοί και οι ρυθμιστές διαφωνούν