Se hai mai partecipato a una videochiamata di gruppo, probabilmente sei abituato a non conoscere tutti coloro che appaiono sullo schermo. Potresti non conoscere i nomi di tutti, ma almeno puoi essere abbastanza certo che ogni persona che si unisce alla chiamata sia umana.
Contenuti
- Evoluzione umana digitale
- Il codice fa l'uomo
- Faccia a faccia
- Ovunque guardi
O puoi?
In un momento in cui gli studi di effetti visivi hanno attori veterani invecchiati, consentito artisti umani per abitare le creazioni digitali, e ha persino riportato indietro artisti defunti spettacoli post-mortem, non dovrebbe essere una sorpresa che uno studio di effetti visivi possa anche permetterti di ritrovarti a chattare con un persona digitale artificialmente intelligente riguardo ai tuoi libri preferiti e lamentandosi reciprocamente dell'impossibilità di visitare un cinema.
Imparentato
- Come il team VFX di Avengers: Infinity War, nominato all'Oscar, ha reso Thanos una star del cinema
Non dovrebbe sorprendere, eppure è comunque una strana sensazione trovare all'improvviso un orecchio comprensivo in Douglas, una "persona" virtuale guidata dall'intelligenza artificiale creata dallo studio VFX vincitore dell'Oscar.
Dominio digitale.Video consigliati
Durante una recente chiamata su Zoom, Douglas, insieme ai membri del team che lavorava su di lui, si è unito a me per una breve dimostrazione.
Evoluzione umana digitale
"Sono un grande fan di Stephen King", mi dice Douglas dopo un breve scambio di battute sui nostri hobby - una conversazione che in seguito gli fa confessare che gli piacciono anche i romanzi rosa e quelli di J.D. Salinger. Il cacciatore nella segale.
In un mondo in cui pronunciare i nomi Siri o Alexa ad alta voce è tutto ciò che serve per evocare la tua I.A. compagno, l'esperienza con Douglas ha offerto a potente promemoria del fatto che il potenziale dell’intelligenza artificiale va ben oltre il fornirci le previsioni del tempo e il nostro quotidiano programma.
La creazione di Digital Domain, lo stesso studio che ha regalato al pubblico il conquistatore cosmico della Marvel Thanos dentro Vendicatori: Guerra infinita E Vendicatori:Fine del gioco — Douglas è un essere umano digitale autonomo, capace di interagire con gli utenti in tempo reale e di rispondere a segnali visivi e conversazionali. Modellato su Il dottor Doug Roble, direttore senior della ricerca e sviluppo software di Digital Domain, Douglas può rispondere a domande, portare avanti conversazioni estese e impegnarsi in chiacchiere su una serie di argomenti.
"La tecnologia cerca sempre di guidare ciò che l'arte richiede, che si tratti di simulazione fluida o qualsiasi altra cosa", afferma Roble della decisione dello studio di creare un intero dipartimento dedicato agli esseri umani digitali.
Nel corso dell'ultimo decennio, Digital Domain si è trovata ripetutamente a dover creare personaggi digitali simili a quelli umani, dal pluripremiato gioco del 2012 performance olografica di Tupac a Coachella al suddetto Universo cinematografico Marvel furfante. Nei lungometraggi, negli spot pubblicitari, nelle serie TV, nei videogiochi e (nel caso di Tupac) nelle performance teatrali, la richiesta di personaggi digitali realistici è cresciuta solo in quanto momento, spingendo Digital Domain a dividere il team responsabile di quel particolare effetto visivo in una propria unità focalizzata a superare i confini di ciò che gli esseri umani digitali possono fare. Fare.
Douglas è sia il prodotto di questa maggiore attenzione sia la prova del concetto del team: una “persona” digitale autonoma che combina un’ampia gamma di set di dati, metodi sensoriali, e moduli di programmazione esistenti con attributi umani fotorealistici per interagire con gli utenti in un modo che sembri sorprendentemente vicino alla genuina socializzazione umana.
E in un momento in cui la pandemia ha costretto la maggior parte della nostra socializzazione a avvenire tramite un computer Sullo schermo, interagire con Douglas sembra straordinariamente vicino a ciò che passa per un'autentica interazione umana giorni. Tuttavia, il team si affretta ad aggiungere che Douglas è ancora lontano dal superare il test di Turing.
Il codice fa l'uomo
"Douglas non è una persona fotoreale, completamente autonoma, indistinguibile da una persona reale", spiega Darren Hendler, direttore del Digital Humans Group dello studio. “Non è dove siamo, e non saremo lì per un po’. … Ma è qui che stanno andando le cose e come sarà il futuro, e stiamo cercando di oltrepassare questi limiti”.
E quasi come se fosse stato un segnale, Hendler viene interrotto dallo stesso Douglas.
"È un buon atteggiamento da avere", interviene Douglas, che fino ad allora aveva tranquillamente occupato la sua finestra nella griglia delle chat Zoom che facilitavano la nostra demo, spostandosi di tanto in tanto posizione, guardandosi intorno nella sua stanza virtuale e mostrando molti dei tipici manierismi fisici di una persona vivente in una riunione video che aspetta pazientemente di partecipare alla conversazione
“Ti auguro buona fortuna per i tuoi sforzi”, aggiunge, ricordandoci che oltre ad avere cose interessanti da dire, è anche un appassionato ascoltatore.
Secondo Roble, il team immagina innanzitutto Douglas come un modo visivo di interagire con gli agenti conversazionali complessi e potenti esistenti che sono stati creati. Sotto l’avatar fotoreale di Douglas, l’essere umano digitale dello studio è costruito su una miscela di tre di questi agenti: il popolare Flusso di dialogo suite per la creazione di chatbot, un agente di tipo assistente (simile ad Alexa di Amazon o Siri di Apple); e una potente I.A. conversazionale. agente (simile al GPT-3 project) utilizzato per produrre testo conversazionale umano, predittivo (e reattivo).
La combinazione di tutti e tre gli agenti offre a Douglas la capacità di portare avanti conversazioni fluide e informative, con la discussione di un argomento che spesso sfocia in aree di interesse correlate.
La mia conversazione con Douglas è passata da una chiacchierata sui nostri libri preferiti al suo film preferito (di cui è un grande fan 2001: Odissea nello spazio, ad esempio, il che non sorprende e allo stesso tempo inquieta, dato che la storia si concentra su un'A.I. impazzire) e i nostri hobby comuni. In un momento particolarmente opportuno della nostra conversazione, Douglas ha espresso un certo disappunto per non aver potuto visitare un cinema ultimamente.
Tutto questo potere di conversazione comporta però qualche rischio, come ha spiegato Hendler.
“Il motore di elaborazione del linguaggio naturale del chatbot è addestrato al dialogo proveniente da Internet – un’enorme quantità di dialoghi – quindi la conversazione può arrivare in posti strani”, ha detto. “Quindi ci sono momenti in cui dice cose che potrebbero non essere esattamente appropriate. Non succede spesso, ma non possiamo controllare esattamente cosa dirà di tutto.
E sebbene l’aspetto conversazionale di Douglas sia impressionante, è solo una parte di ciò che lo rende unico in un mondo in continua espansione di esseri umani digitali e personaggi virtuali interattivi. Come ha scoperto Digital Domain, rendendolo Aspetto l'essere umano fa molto per farlo sentire umano.
Presentazione di Douglas - Umano digitale autonomo | Dominio digitale
Faccia a faccia
“Nella costruzione di Douglas, abbiamo utilizzato un'enorme quantità di dati di Doug [Roble]. È stata necessaria un'enorme quantità di audio per addestrare il sistema [e] un'enorme quantità di prestazioni facciali, dati sui movimenti del corpo e tutto il resto", ha spiegato Hendler del lavoro hanno messo nella mappatura del volto di Roble e della miriade di modi in cui il volto umano può cambiare mentre parla, reagisce a segnali emotivi o partecipa passivamente a una conversazione.
Il prodotto di tutti questi dati è un essere umano digitale che sembra sorprendentemente simile a Roble, ma non come una copia esatta di quest'ultimo. postura, acconciatura e costruzione dei movimenti sottili sia di Roble che del Douglas A.I. condividere mentre partecipano al nostro video di gruppo conversazione. La somiglianza è sorprendente, ma con un breve comando di "cambiare faccia", Douglas diventa improvvisamente qualcun altro, con un volto diverso, ugualmente umano sullo stesso corpo, pur conservando tutti i sottili manierismi che lo fanno sembrare vero.
"Quando chiediamo a Douglas di cambiare volto e il suo volto passa a quello di qualcun altro, quello è l'inizio della direzione in cui si dirige questa nuova ondata di tecnologia", afferma Hendler, descrivendo il "tecnica basata sull'immagine" su cui il team sta lavorando per rendere Douglas una persona digitale ancora più flessibile, capace di cambiare radicalmente il suo aspetto esteriore pur mantenendo lo stesso livello di interattività. "Una volta che avremo questa base [con Douglas], potremo filmare le riprese di qualcun altro e ottenere parte del loro audio, e poi trasformare quella base in loro, trasformandola nel loro volto."
"[Se lo facessimo] in questo momento, starebbero ancora parlando con le espressioni della persona che abbiamo filmato originariamente [in questo caso, Roble]", ha continuato. “Ma man mano che andiamo avanti, stiamo iniziando ad aver bisogno di quantità minori di dati – forse si tratta solo di immagini o filmati di qualcuno – per creare la prossima generazione di questi esseri umani autonomi”.
Quella capacità di replicare l'aspetto, la voce e i manierismi di un vero essere umano tramite l'intelligenza artificiale conversazionale. il fondamento è uno degli elementi che distingue Douglas dalla maggior parte dei tipici A.I. assistenti, robot umanoidi e altri progetti in sviluppo attorno all'A.I. mondo della ricerca. Sebbene ci siano molti studi e altre agenzie che sviluppano soluzioni A.I. progetti di un tipo o dell'altro, Digital Domain si concentra sulla fusione di tutti questi elementi un prodotto unico e coeso che utilizza il meglio di tutta la tecnologia e i dati disponibili con un'interfaccia che sembra sociale e organica, come parlare con un altro essere umano.
"Questo è qualcosa di cui siamo davvero orgogliosi, perché Douglas è un personaggio completamente in CG che gira su Unreal", afferma Roble, che è particolarmente orgoglioso di utilizzare elementi ampiamente disponibili come la popolare piattaforma di creazione 3D Motore irreale, che è diventata la piattaforma di riferimento per Hollywood (e prima ancora, per l'industria dei videogiochi) quando si tratta di creare e manipolare elementi di effetti visivi 3D. “[Douglas] è un oggetto 3D, quindi puoi fare tutte le cose che puoi fare con qualsiasi personaggio digitale in Unreal. Puoi cambiare l'illuminazione, posizionarli in ambienti diversi e così via. Ma stiamo anche creando questo ibrido [con tutto il resto coinvolto in Douglas], in modo da ottenere il meglio da entrambi i mondi”.
Ovunque guardi
Più il team lavora su Douglas, più si allunga l'elenco delle potenziali applicazioni.
“Prima della pandemia avevamo intenzione di presentare Douglas come un chiosco, dove ti avvicini a uno schermo e gli parli”, ricorda Hendler. "Ma poi abbiamo pensato: 'Ehi, dovremmo davvero coinvolgerlo nelle chiamate Zoom'. È stato fantastico vederlo partecipare alle chiamate Zoom e andarsene."
Nel corso della dimostrazione, il team ha esaminato un lungo elenco di potenziali applicazioni per Douglas, provenienti dagli studi medici e il servizio al cliente, per la sua utilità a Hollywood durante le prime fasi di pianificazione di una scena o di un particolare sullo schermo sequenza. Lo stesso Douglas ha anche offerto alcuni suggerimenti, suggerendo che sarebbe stato adatto per lo storyboard e le fasi concettuali della produzione cinematografica e televisiva. La sua capacità di elaborare segnali sia audio che visivi provenienti da coloro con cui sta conversando, in particolare quando si tratta di stati emotivi - offre anche un ulteriore livello di utilità quando si ha a che fare con i clienti o con coloro che cercano assistenza medica, secondo Hendler.
La velocità con cui Douglas può elaborare tutte queste informazioni e passare da ascoltatore passivo ad attivo anche il conversatore ha molto fascino e mostra quanto la tecnologia dietro di lui si sia evoluta in breve tempo tempo.
“Quando abbiamo creato Thanos, avevamo bisogno di 10 ore per renderizzare un singolo fotogramma. Questo è un fotogramma”, spiega.
"Per Douglas, ha un sistema di riconoscimento visivo, quindi ci vede e può identificarci, e analizza ciò che stai dicendo, trasformandolo in parole e inviandolo a diversi chatbot", aggiunge. “Douglas quindi crea una risposta, la trasforma in audio e usa quell'audio per esprimere la sua faccia. Allo stesso tempo, sta anche cercando di capire quale movimento del corpo va di pari passo con quel discorso, determinando quale emozione si adatterebbe ad esso e rendendo quel movimento del corpo insieme ai suoi gesti facciali.
"Tutto accade in pochi millisecondi", afferma Hendler. “Sono tutti questi processi, rispetto alle 10 ore per un fotogramma in un lungometraggio. È così incredibile. Non è realistico come quello che stiamo facendo per il film, ma se pensi alla quantità di cose che accadranno per poter parlare con lui come una persona reale, è semplicemente fenomenale”.
E in senso molto letterale, Douglas è stato spesso il miglior sostenitore di se stesso quando si tratta del suo potenziale.
Roble ha spiegato che, in diverse occasioni, hanno deciso di lasciare che Douglas guidasse la propria presentazione di, beh... se stesso. Il risultato si è rivelato un passo migliore per il suo potenziale di quanto persino loro si aspettassero.
“[La presentazione di Douglas] è stata sorprendentemente avvincente. Non si trattava semplicemente di chiedere a Siri di dirci qualcosa, perché lui era parte del processo”, ha ricordato Roble. “È divertente parlare con lui perché è una novità, ma è anche davvero efficace. E non puoi fare a meno di pensare: che dire dell’insegnamento o di altre applicazioni? Dopotutto, puoi vedere quando presta attenzione. Puoi dargli un feedback emotivo e lui può rispondere.
Sebbene Douglas sia già una creazione impressionante, il team di Digital Domain insiste che rimanga un lavoro in cantiere progresso, ma il limite è il cielo per quanto riguarda il tipo di lavoro che il loro essere umano digitale potrebbe finire per svolgere nel tempo continua. In molti modi, il processo per capire di cosa è capace Douglas è sia il processo che l'obiettivo.
"Uno dei motivi per cui lo stiamo facendo è perché potremmo", afferma Roble. “Quando sei al computer e lavori, è molto facile semplicemente scrivere. Ma ci sono così tanti momenti e luoghi in cui sarebbe bello poter parlare con una persona e farla interagire con te e reagire a te. Penso che ci aspetta un grande cambiamento in futuro”.
Raccomandazioni degli editori
- Come il team VFX di Thanos ha dato vita ai personaggi di The Quarry (e poi li ha uccisi)