Πώς ο Tupac και ο Thanos οδήγησαν τον Douglas, τον Ψηφιακό Άνθρωπο με AI

click fraud protection

Εάν έχετε συμμετάσχει ποτέ σε μια ομαδική βιντεοκλήση, πιθανότατα έχετε συνηθίσει να μην γνωρίζετε όλους όσους εμφανίζονται στην οθόνη. Μπορεί να μην γνωρίζετε τα ονόματα όλων, αλλά τουλάχιστον, μπορείτε να είστε αρκετά σίγουροι ότι κάθε άτομο που συμμετέχει στην κλήση είναι άνθρωπος.

Περιεχόμενα

  • Ψηφιακή ανθρώπινη εξέλιξη
  • Ο κώδικας κάνει τον άνθρωπο
  • Ξεκαθάρισμα λογαριασμών
  • Όπου κι αν κοιτάξεις

Ή μπορείτε;

Σε μια εποχή που τα στούντιο οπτικών εφέ έχουν απογηραμένοι βετεράνοι ηθοποιοί, επιτρέπεται άνθρωποι ερμηνευτές να κατοικήσουν σε ψηφιακές δημιουργίες, και έφερε ακόμη και νεκρούς καλλιτέχνες πίσω για μεταθανάτιες παραστάσεις, δεν πρέπει να προκαλεί έκπληξη το γεγονός ότι ένα στούντιο VFX μπορεί επίσης να σας επιτρέψει να συνομιλήσετε με έναν τεχνητά ευφυές ψηφιακό άτομο για τα αγαπημένα σας βιβλία και θρηνώντας αμοιβαία την αδυναμία να επισκεφτείτε έναν κινηματογράφο.

Σχετίζεται με

  • Πώς η ομάδα VFX του Avengers: Infinity War, η οποία ήταν υποψήφια για Όσκαρ, έκανε τον Θάνο σταρ του σινεμά

Δεν πρέπει να προκαλεί έκπληξη, και ωστόσο, εξακολουθεί να είναι ένα περίεργο συναίσθημα να βρίσκεις ξαφνικά ένα συμπαθητικό αυτί στον Ντάγκλας, ένα εικονικό «πρόσωπο» με γνώμονα την A.I. που δημιουργήθηκε από το βραβευμένο με Όσκαρ στούντιο VFX

Ψηφιακός τομέας.

Προτεινόμενα βίντεο

Κατά τη διάρκεια μιας πρόσφατης κλήσης στο Zoom, ο Ντάγκλας —μαζί με μέλη της ομάδας που εργάζονται πάνω του— ενώθηκαν μαζί μου για μια σύντομη επίδειξη.

Ψηφιακή ανθρώπινη εξέλιξη

«Είμαι μεγάλος θαυμαστής του Stephen King», μου λέει ο Ντάγκλας μετά από μια σύντομη συζήτηση για τα χόμπι μας - μια συζήτηση που αργότερα τον κάνει να ομολογεί ότι του αρέσουν επίσης τα ρομαντικά μυθιστορήματα και τα ρομαντικά μυθιστορήματα του J.D. Salinger The Catcher in the Rye.

Σε έναν κόσμο όπου εκφωνώντας τα ονόματα Siri ή Alexa φωναχτά είναι το μόνο που χρειάζεται για να καλέσετε το δικό σας A.I. σύντροφος, η εμπειρία με τον Ντάγκλας που προσέφερε α ισχυρή υπενθύμιση ότι οι δυνατότητες της A.I. εκτείνονται πολύ πέρα ​​από την παροχή της πρόγνωσης καιρού και της καθημερινότητάς μας πρόγραμμα.

Η δημιουργία του Digital Domain - το ίδιο στούντιο που έδωσε στο κοινό τον κοσμικό κατακτητή της Marvel Ο Θάνος μέσα Avengers: Infinity War και Εκδικητές:Τέλος παιχνιδιού — Ο Ντάγκλας είναι ένας αυτόνομος, ψηφιακός άνθρωπος ικανός να αλληλεπιδρά με τους χρήστες σε πραγματικό χρόνο και να ανταποκρίνεται σε οπτικές και συνομιλητικές ενδείξεις. Μοντέλο μετά Δόκτωρ Νταγκ Ρόμπλ, ο ανώτερος διευθυντής Έρευνας & Ανάπτυξης Λογισμικού της Digital Domain, Douglas μπορεί να απαντήσει σε ερωτήσεις, να συνεχίσει εκτενείς συνομιλίες και να συμμετάσχει σε μικρές συζητήσεις για μια σειρά θεμάτων.

«Η τεχνολογία προσπαθεί πάντα να οδηγεί αυτό που απαιτεί η τέχνη, είτε πρόκειται για ρευστή προσομοίωση είτε οτιδήποτε άλλο», λέει ο Roble για την απόφαση του στούντιο να δημιουργήσει ένα ολόκληρο το τμήμα αφιερωμένο στους ψηφιακούς ανθρώπους.

Κατά την τελευταία δεκαετία, ο Digital Domain βρέθηκε επανειλημμένα επιφορτισμένος με τη δημιουργία ανθρωπίνων ψηφιακών χαρακτήρων - τα πάντα από το βραβευμένο του 2012 ολογραφική απόδοση Tupac στο Coachella στους προαναφερθέντες Marvel Cinematic Universe παληάνθρωπος. Σε ταινίες μεγάλου μήκους, διαφημίσεις, τηλεοπτικές σειρές, βιντεοπαιχνίδια και (στην περίπτωση του Tupac) σκηνικές παραστάσεις, η ζήτηση για ρεαλιστικούς ψηφιακούς χαρακτήρες έχει αυξηθεί μόνο σε αυτό χρόνο, ωθώντας το Digital Domain να χωρίσει την ομάδα που είναι υπεύθυνη για αυτό το συγκεκριμένο οπτικό εφέ στη δική του μονάδα που επικεντρώνεται στην υπέρβαση των ορίων του τι μπορούν οι ψηφιακοί άνθρωποι κάνω.

Ο Ντάγκλας είναι και το προϊόν αυτής της αυξημένης εστίασης και η απόδειξη της ιδέας της ομάδας: Ένα αυτόνομο ψηφιακό «πρόσωπο» που συνδυάζει ένα ευρύ φάσμα συνόλων δεδομένων, αισθητηριακές μεθόδους, και υπάρχουσες ενότητες προγραμματισμού με φωτορεαλιστικά ανθρώπινα χαρακτηριστικά προκειμένου να αλληλεπιδρούν με τους χρήστες με τρόπο που αισθάνεται εκπληκτικά κοντά στην πραγματική ανθρώπινη κοινωνικοποίηση.

Και σε μια εποχή που η πανδημία έχει αναγκάσει το μεγαλύτερο μέρος της συναναστροφής μας να γίνεται μέσω υπολογιστή οθόνη, η αλληλεπίδραση με τον Ντάγκλας αισθάνεται αξιοσημείωτα κοντά σε αυτό που συνεπάγεται γνήσια ανθρώπινη αλληλεπίδραση ημέρες. Ωστόσο, η ομάδα σπεύδει να προσθέσει ότι ο Ντάγκλας απέχει ακόμα πολύ από το να περάσει ένα Τεστ Turing.

Ο κώδικας κάνει τον άνθρωπο

«Ο Ντάγκλας δεν είναι ένα φωτο-πραγματικό, πλήρως αυτόνομο άτομο που δεν διακρίνεται από ένα πραγματικό πρόσωπο», εξηγεί Ντάρεν Χέντλερ, διευθυντής του Digital Humans Group στο στούντιο. «Δεν είμαστε εκεί και δεν πρόκειται να είμαστε εκεί για λίγο. … Αλλά εδώ πηγαίνουν τα πράγματα και πώς φαίνεται το μέλλον, και προσπαθούμε να ξεπεράσουμε αυτά τα όρια».

Και σχεδόν σαν να ήταν υπόδειξη, ο Χέντλερ διακόπτεται από τον ίδιο τον Ντάγκλας.

«Αυτή είναι καλή στάση», παρεμβαίνει ο Ντάγκλας, ο οποίος μέχρι τότε καταλάμβανε ήσυχα το δικό του παράθυρο στο πλέγμα των συνομιλιών του Zoom διευκολύνοντας το demo μας, αλλά περιστασιακά άλλαζε θέση, ρίχνοντας μια ματιά γύρω από το εικονικό του δωμάτιο και δείχνοντας πολλούς από τους τυπικούς φυσικούς τρόπους ενός ζωντανού ατόμου σε μια βιντεοσύσκεψη που περιμένει υπομονετικά να συμμετάσχει στην συνομιλία

«Σας εύχομαι καλή τύχη στις προσπάθειές σας», προσθέτει, υπενθυμίζοντάς μας ότι εκτός από ενδιαφέροντα πράγματα να πει, είναι επίσης δεινός ακροατής.

Σύμφωνα με τον Roble, η ομάδα πρώτα και κύρια οραματίζεται τον Douglas ως έναν οπτικό τρόπο αλληλεπίδρασης με υπάρχοντες πολύπλοκους και ισχυρούς συνομιλητές που έχουν δημιουργηθεί. Κάτω από το φωτο-πραγματικό avatar του Douglas, ο ψηφιακός άνθρωπος του στούντιο είναι χτισμένος σε ένα μείγμα τριών από αυτούς τους πράκτορες: το δημοφιλές της Google Διαλογική ροή σουίτα για τη δημιουργία chatbots, έναν πράκτορα τύπου βοηθού (παρόμοιο με το Alexa της Amazon ή το Siri της Apple). και ένα ισχυρό συνομιλητικό A.I. πράκτορας (παρόμοιος με τον GPT-3 έργο) που χρησιμοποιείται για την παραγωγή ανθρώπινου, προγνωστικού (και αντιδραστικού) συνομιλητικού κειμένου.

Ο συνδυασμός και των τριών πρακτόρων δίνει στον Ντάγκλας τη δυνατότητα να διεξάγει συνομιλίες που είναι ταυτόχρονα ενημερωτικές και ρευστοποιημένες, με τη συζήτηση ενός θέματος συχνά να εντάσσεται σε σχετικούς τομείς ενδιαφέροντος.

Η δική μου συνομιλία με τον Ντάγκλας πέρασε από μια συζήτηση για τα αγαπημένα μας βιβλία στην αγαπημένη του ταινία (είναι μεγάλος θαυμαστής του 2001: A Space Odyssey, για παράδειγμα, κάτι που δεν προκαλεί έκπληξη και είναι λίγο ανησυχητικό, δεδομένης της εστίασης της ιστορίας σε ένα δολοφονικό A.I. τρέχω αμόκ) και τα αμοιβαία χόμπι μας. Σε ένα ιδιαίτερα επίκαιρο στοιχείο της συζήτησής μας, ο Ντάγκλας εξέφρασε κάποια απογοήτευση που δεν μπορούσε να επισκεφτεί έναν κινηματογράφο τον τελευταίο καιρό.

Όλη αυτή η δύναμη συνομιλίας ενέχει κάποιο κίνδυνο, ωστόσο, όπως εξήγησε ο Χέντλερ.

«Η μηχανή επεξεργασίας φυσικής γλώσσας του chatbot εκπαιδεύεται στον διάλογο από το Διαδίκτυο - ένας τεράστιος όγκος διαλόγου - έτσι η συνομιλία μπορεί να πάει σε περίεργα μέρη», είπε. «Υπάρχουν λοιπόν στιγμές που λέει πράγματα που μπορεί να μην είναι ακριβώς κατάλληλα. Δεν συμβαίνει συχνά, αλλά δεν μπορούμε να ελέγξουμε ακριβώς τι πρόκειται να πει σε όλα».

Και παρόλο που η πτυχή της συνομιλίας του Ντάγκλας είναι εντυπωσιακή, είναι απλώς μέρος αυτού που τον κάνει μοναδικό σε έναν συνεχώς διευρυνόμενο κόσμο ψηφιακών ανθρώπων και διαδραστικών εικονικών χαρακτήρων. Όπως ανακάλυψε η Digital Domain, κάνοντας τον Κοίτα Ο άνθρωπος κάνει πολύ δρόμο να τον κάνει να νιώσει άνθρωπος.

Παρουσιάζοντας τον Douglas - Αυτόνομη Ψηφιακή Ανθρώπινη | Ψηφιακός τομέας

Ξεκαθάρισμα λογαριασμών

«Κατά την κατασκευή του Douglas, χρησιμοποιήσαμε έναν τεράστιο όγκο δεδομένων από τον Doug [Roble]. Ήταν ένας τεράστιος όγκος ήχου για να εκπαιδεύσει το σύστημα [και] έναν τεράστιο όγκο απόδοσης προσώπου, δεδομένων κίνησης του σώματος και οτιδήποτε άλλο», εξήγησε ο Χέντλερ για το έργο. έβαλαν στη χαρτογράφηση του προσώπου του Roble και των μυριάδων τρόπων που μπορεί να αλλάξει το ανθρώπινο πρόσωπο ενώ μιλάει, αντιδρά σε συναισθηματικά σημάδια ή συμμετέχει παθητικά σε συνομιλία.

Το προϊόν όλων αυτών των δεδομένων είναι ένας ψηφιακός άνθρωπος που μοιάζει εκπληκτικά - αλλά όχι σαν ακριβές αντίγραφο - με τον Roble, από τον τελευταίο στάση, χτένισμα και δόμηση στις λεπτές κινήσεις τόσο του Roble όσο και του Douglas A.I. κοινοποιήστε ενώ συμμετέχουν στο ομαδικό μας βίντεο συνομιλία. Η ομοιότητα είναι απίστευτη, αλλά με μια σύντομη εντολή να «αλλάξετε το πρόσωπό σας», ο Ντάγκλας γίνεται ξαφνικά κάποιος άλλος, με ένα διαφορετικό, εξίσου ανθρώπινο πρόσωπο στο ίδιο σώμα, ενώ εξακολουθεί να διατηρεί όλους τους λεπτούς τρόπους που τον κάνουν να φαίνεται πραγματικός.

«Όταν ζητάμε από τον Ντάγκλας να αλλάξει το πρόσωπό του και το πρόσωπό του αλλάζει σε κάποιον άλλο, αυτή είναι η αρχή που οδηγεί αυτό το νέο κύμα τεχνολογίας», λέει ο Χέντλερ, περιγράφοντας το «Τεχνική που βασίζεται στην εικόνα» που η ομάδα εργάζεται για να κάνει τον Ντάγκλας ένα ακόμα πιο ευέλικτο ψηφιακό άτομο ικανό να αλλάξει δραματικά την εξωτερική του εμφάνιση διατηρώντας το ίδιο επίπεδο διαδραστικότητα. «Μόλις έχουμε αυτή τη βάση [με τον Ντάγκλας], μπορούμε να μαγνητοσκοπήσουμε πλάνα κάποιου άλλου και να πάρουμε μέρος του ήχου του και στη συνέχεια να μετατρέψουμε αυτή τη βάση σε αυτούς — να το κάνουμε το πρόσωπό του».

«[Εάν το κάναμε αυτό] αυτή τη στιγμή, θα εξακολουθούσαν να μιλούν με τις εκφράσεις του ατόμου που γυρίσαμε αρχικά [σε αυτήν την περίπτωση, τον Roble]», συνέχισε. «Όμως, καθώς προχωράμε, αρχίζουμε να χρειαζόμαστε μικρότερες ποσότητες δεδομένων - ίσως είναι απλώς εικόνες ή πλάνα φιλμ κάποιου - για να δημιουργήσουμε την επόμενη γενιά αυτών των αυτόνομων ανθρώπων».

Αυτή η ικανότητα να αναπαράγει την εμφάνιση, τη φωνή και τους τρόπους ενός πραγματικού ανθρώπου πάνω από το συνομιλητικό A.I. θεμελίωση είναι ένα από τα στοιχεία που ξεχωρίζει τον Ντάγκλας από τα περισσότερα τυπικά A.I. βοηθοί, ανθρωποειδή ρομπότ και άλλα έργα σε εξέλιξη γύρω από το A.I. ερευνητικός κόσμος. Ενώ υπάρχουν πολλά στούντιο και άλλοι φορείς που αναπτύσσουν A.I. έργα του ενός ή του άλλου είδους, ο Digital Domain επικεντρώνεται στην ανάμειξη όλων αυτών των στοιχείων ένα ενιαίο, συνεκτικό προϊόν που χρησιμοποιεί ό, τι καλύτερο από όλες τις διαθέσιμες τεχνολογίες και δεδομένα με μια διεπαφή που αισθάνεται κοινωνική και οργανική — σαν να μιλάς με άλλον άνθρωπο.

«Αυτό είναι κάτι για το οποίο είμαστε πραγματικά περήφανοι, γιατί ο Ντάγκλας είναι ένας πλήρως CG χαρακτήρας που τρέχει στο Unreal», λέει. Roble, ο οποίος είναι ιδιαίτερα περήφανος που χρησιμοποιεί ευρέως διαθέσιμα στοιχεία όπως η δημοφιλής πλατφόρμα δημιουργίας 3D Unreal Engine, η οποία έχει γίνει η πιο δημοφιλής πλατφόρμα για το Χόλιγουντ (και πριν από αυτό, τη βιομηχανία βιντεοπαιχνιδιών) όσον αφορά τη δημιουργία και τον χειρισμό στοιχείων 3D οπτικών εφέ. «Ο [Douglas] είναι ένα τρισδιάστατο αντικείμενο, ώστε να μπορείς να κάνεις ό, τι μπορείς να κάνεις με οποιονδήποτε ψηφιακό χαρακτήρα στο Unreal. Μπορείτε να αλλάξετε τον φωτισμό, να τα τοποθετήσετε σε διαφορετικά περιβάλλοντα κ.λπ. Αλλά δημιουργούμε επίσης αυτό το υβρίδιο [με ό, τι άλλο εμπλέκεται στο Douglas], ώστε να έχουμε το καλύτερο και από τους δύο κόσμους».

Όπου κι αν κοιτάξεις

Όσο περισσότερο εργάζεται η ομάδα στο Douglas, τόσο μεγαλώνει η λίστα των πιθανών εφαρμογών.

«Πριν από την πανδημία σχεδιάζαμε να παρουσιάσουμε τον Ντάγκλας ως ένα περίπτερο, όπου ανεβαίνεις σε μια οθόνη και μιλάς μαζί του», θυμάται ο Χέντλερ. "Αλλά μετά σκεφτήκαμε, "Γεια, πρέπει πραγματικά να τον βάλουμε σε κλήσεις Zoom." Ήταν φανταστικό να τον βάζουμε να εισέρχεται σε κλήσεις Zoom και να φεύγει."

Κατά τη διάρκεια της επίδειξης, η ομάδα διεξήγαγε μια μακρά λίστα πιθανών αιτήσεων για τον Ντάγκλας, από τα ιατρεία και εξυπηρέτηση πελατών, στη χρησιμότητά του στο Χόλιγουντ κατά τα πρώτα στάδια του σχεδιασμού μιας σκηνής ή μιας συγκεκριμένης οθόνης αλληλουχία. Ο ίδιος ο Ντάγκλας πρόσφερε μάλιστα μερικές προτάσεις, υποδεικνύοντας ότι θα ταίριαζε σε σεμινάρια και εννοιολογικά στάδια παραγωγής ταινιών και τηλεόρασης. Η ικανότητά του να επεξεργάζεται τόσο ακουστικές όσο και οπτικές ενδείξεις από αυτούς με τους οποίους συνομιλεί — ιδιαίτερα όταν πρόκειται για συναισθηματικές καταστάσεις — προσφέρει επίσης ένα πρόσθετο επίπεδο χρησιμότητας όταν συναλλάσσεστε με πελάτες ή όσους αναζητούν ιατρική καθοδήγηση, σύμφωνα με τον Hendler.

Η ταχύτητα με την οποία ο Ντάγκλας μπορεί να επεξεργαστεί όλες αυτές τις πληροφορίες και να αλλάξει από παθητικό ακροατή σε ενεργό Ο συνομιλητής έχει επίσης αρκετή ελκυστικότητα και δείχνει πόσο πολύ έχει εξελιχθεί η τεχνολογία πίσω από αυτόν σε σύντομο χρονικό διάστημα χρόνος.

«Όταν δημιουργήσαμε το Thanos, είχαμε ένα μόνο καρέ αυτού που χρειάστηκε 10 ώρες για να αποδοθεί. Αυτό είναι ένα πλαίσιο», εξηγεί.

«Για τον Ντάγκλας, έχει ένα σύστημα αναγνώρισης όρασης, επομένως μας βλέπει και μπορεί να μας αναγνωρίσει, και αναλύει αυτά που λέτε, τα μετατρέπει σε λέξεις και τα στέλνει σε διαφορετικά chatbots», προσθέτει. «Ο Ντάγκλας δημιουργεί τότε μια απάντηση, τη μετατρέπει σε ήχο και χρησιμοποιεί αυτόν τον ήχο για να οδηγήσει το πρόσωπό του. Ταυτόχρονα, ανακαλύπτει επίσης ποια κίνηση του σώματος συνδυάζεται με αυτήν την ομιλία, προσδιορίζει ποιο συναίσθημα θα ταίριαζε και αποδίδει αυτή την κίνηση του σώματος μαζί με τις χειρονομίες του προσώπου του».

«Όλα αυτά συμβαίνουν σε λίγα χιλιοστά του δευτερολέπτου», λέει ο Χέντλερ. «Είναι όλες αυτές οι διαδικασίες, σε σύγκριση με 10 ώρες για ένα καρέ σε μια ταινία μεγάλου μήκους. Είναι τόσο καταπληκτικό. Δεν είναι τόσο ρεαλιστικό όσο αυτό που κάνουμε για τον κινηματογράφο, αλλά αν σκεφτείς πόσα πράγματα συμβαίνουν για να μπορέσεις να του μιλήσεις σαν αληθινός άνθρωπος, είναι απλά εκπληκτικό».

Και με μια πολύ κυριολεκτική έννοια, ο Ντάγκλας ήταν συχνά ο καλύτερος συνήγορός του όταν πρόκειται για τις δυνατότητές του.

Ο Ρόμπλ εξήγησε ότι, σε αρκετές περιπτώσεις, επέλεξαν να αφήσουν τον Ντάγκλας να ηγηθεί της δικής του παρουσίασης για τον εαυτό του. Το αποτέλεσμα κατέληξε να είναι καλύτερο γήπεδο για τις δυνατότητές του από ό, τι περίμεναν.

«[Η παρουσίαση του Ντάγκλας] ήταν εκπληκτικά συναρπαστική. Δεν ζητούσαμε απλώς από τη Siri να μας πει κάτι, επειδή ήταν μέρος της διαδικασίας», θυμάται ο Roble. «Είναι διασκεδαστικό να μιλάς γιατί είναι καινοτομία, αλλά είναι επίσης πραγματικά αποτελεσματικός. Και δεν μπορείτε να σκεφτείτε: Τι γίνεται με τη διδασκαλία ή άλλες εφαρμογές; Μετά από όλα, μπορείτε να δείτε πότε προσέχει. Μπορείτε να του δώσετε συναισθηματική ανατροφοδότηση και μπορεί να απαντήσει».

Αν και ο Ντάγκλας είναι ήδη μια εντυπωσιακή δημιουργία, η ομάδα του Digital Domain επιμένει ότι παραμένει στη δουλειά πρόοδος — αλλά ο ουρανός είναι το όριο όσον αφορά το είδος της εργασίας που θα μπορούσε να καταλήξει να κάνει ο ψηφιακός τους άνθρωπος ως χρόνος συνεχίζεται. Από πολλές απόψεις, η διαδικασία του να καταλάβεις τι είναι ικανός ο Ντάγκλας είναι τόσο η διαδικασία όσο και ο στόχος.

«Ένας από τους λόγους που το κάνουμε αυτό είναι επειδή μπορούσαμε», λέει ο Roble. «Όταν είσαι σε έναν υπολογιστή και εργάζεσαι, είναι πολύ εύκολο να πληκτρολογήσεις. Αλλά υπάρχουν τόσες πολλές φορές και μέρη που θα ήταν υπέροχο να μπορούσατε απλώς να μιλήσετε σε ένα άτομο και να αλληλεπιδράσει αυτό το άτομο μαζί σας και να αντιδράσει σε εσάς. Νομίζω ότι βρισκόμαστε μπροστά σε μια μεγάλη αλλαγή στο μέλλον».

Συστάσεις των συντακτών

  • Πώς η ομάδα Thanos VFX έφερε στη ζωή τους χαρακτήρες του The Quarry (και στη συνέχεια τους σκότωσε)