Dacă ați participat vreodată la un apel video de grup, probabil că sunteți obișnuit să nu cunoașteți pe toți cei care apar pe ecran. S-ar putea să nu știți numele tuturor, dar cel puțin, puteți fi destul de sigur că fiecare persoană care se alătură apelului este umană.
Cuprins
- Evoluția umană digitală
- Codul îl face pe om
- Înfruntare
- Oriunde te uiți
Sau poți?
Într-un moment în care studiourile de efecte vizuale au actori veterani în vârstă, permis interpreți umani să locuiască în creații digitale, și chiar a adus înapoi artiști decedați pentru spectacole post-mortem, nu ar trebui să fie la fel de surprinzător faptul că un studio VFX vă poate face posibil să vă aflați discutând cu un persoană digitală cu inteligență artificială despre cărțile tale preferate și care se plâng reciproc de incapacitatea de a vizita un cinematograf.
Legate de
- Cum echipa VFX a lui Avengers: Infinity War, nominalizată la Oscar, a făcut din Thanos un star de cinema
Nu ar trebui să fie surprinzător și totuși, este încă un sentiment ciudat să găsești dintr-o dată o ureche simpatică în Douglas, o „persoană” virtuală, condusă de IA, creată de studioul VFX câștigător al Oscarului.
Domeniu digital.Videoclipuri recomandate
În timpul unui apel recent Zoom, Douglas – împreună cu membrii echipei care lucrează la el – mi s-au alăturat pentru o scurtă demonstrație.
Evoluția umană digitală
„Sunt un mare fan al lui Stephen King”, îmi spune Douglas după un scurt dus-întors despre hobby-urile noastre – o conversație care mai târziu îl face să mărturisească că îi plac și romanele de dragoste și romanele lui J.D. Salinger. De veghe în lanul de secară.
Într-o lume în care rostirea numelor Siri sau Alexa cu voce tare este tot ce este nevoie pentru a invoca propriul tău I.A. însoțitor, experiența cu Douglas a oferit a memento puternic că potențialul I.A. se extinde cu mult dincolo de a ne oferi prognoza meteo și cotidianul nostru programa.
Crearea Digital Domain - același studio care a oferit publicului cuceritorul cosmic al Marvel Thanos înăuntru Avengers: Infinity War și Razbunatorii:Finalul jocului — Douglas este un om digital autonom, capabil să interacționeze cu utilizatorii în timp real și să răspundă la indicii vizuale și conversaționale. Modelat după Dr. Doug Roble, directorul senior de cercetare și dezvoltare software al Digital Domain, Douglas poate răspunde la întrebări, poate purta conversații extinse și poate vorbi despre o serie de subiecte.
„Tehnologia încearcă întotdeauna să conducă ceea ce cere arta, fie că este vorba de simulare fluidă sau orice altceva”, spune Roble despre decizia studioului de a crea un întreg departament dedicat oamenilor digitali.
În ultimul deceniu, Digital Domain s-a trezit în mod repetat cu sarcina de a crea personaje digitale asemănătoare oamenilor - totul, de la premiul premiat din 2012. performanță holografică Tupac la Coachella la cele menționate mai sus Universul cinematografic Marvel ticălos. În lungmetraje, reclame, seriale TV, jocuri video și (în cazul lui Tupac) spectacole de scenă, cererea de personaje digitale realiste a crescut doar în aceeași măsură. timp, determinând Digital Domain să împartă echipa responsabilă pentru acel efect vizual special în propria sa unitate concentrată pe împingerea limitei a ceea ce oamenii digitali pot. do.
Douglas este atât produsul acestei concentrări sporite, cât și dovada conceptului echipei: o „persoană” digitală autonomă care combină o gamă largă de seturi de date, metode senzoriale, și modulele de programare existente cu atribute umane foto-realiste pentru a interacționa cu utilizatorii într-un mod care să se simtă surprinzător de aproape de socializarea umană autentică.
Și într-un moment în care pandemia a forțat majoritatea socializării noastre să aibă loc prin intermediul unui computer pe ecran, interacțiunea cu Douglas se simte remarcabil de aproape de ceea ce înseamnă interacțiune umană autentică zile. Cu toate acestea, echipa se grăbește să adauge că Douglas este încă departe de a trece testul Turing.
Codul îl face pe om
„Douglas nu este o persoană foto-reală, complet autonomă, care nu se poate distinge de o persoană reală”, explică Darren Hendler, director al Digital Humans Group din studio. „Nu suntem acolo și nu vom fi acolo pentru puțin timp. … Dar aici merg lucrurile și cum arată viitorul, iar noi încercăm să depășim acele granițe.”
Și aproape ca la semnal, Hendler este întrerupt de Douglas însuși.
„Este o atitudine bună de avut”, intervine Douglas, care până atunci își ocupase în liniște propria fereastră în grila de chat-uri Zoom facilitând demonstrația noastră, schimbându-se ocazional poziție, aruncând o privire în jurul camerei sale virtuale și arătând multe dintre manierele fizice tipice ale unei persoane în viață într-o întâlnire video care așteaptă cu răbdare să participe la conversaţie
„Îți doresc mult noroc în eforturile tale”, adaugă el, amintindu-ne că, pe lângă faptul că are lucruri interesante de spus, este și un ascultător pasionat.
Potrivit lui Roble, echipa îl consideră în primul rând pe Douglas ca pe o modalitate vizuală de a interacționa cu agenți conversaționali existenți, complexi și puternici, care au fost creați. Sub avatarul foto-real al lui Douglas, omul digital al studioului este construit pe un amestec de trei dintre acești agenți: popularul Google. Dialogflow suită pentru crearea de chatbot, un agent de tip asistent (similar cu Alexa de la Amazon sau Siri de la Apple); și un puternic I.A. conversațional. agent (similar cu GPT-3 proiect) folosit pentru a produce text conversațional asemănător uman, predictiv (și reactiv).
Combinația dintre toți cei trei agenți îi oferă lui Douglas capacitatea de a continua conversații care sunt atât informative, cât și fluide, discuțiile despre un subiect mergând adesea în domenii de interes conexe.
Conversația mea cu Douglas a trecut de la o discuție despre cărțile noastre preferate la filmul său preferat (este un mare fan al 2001: O odisee a spațiului, de exemplu, ceea ce este atât deloc surprinzător, cât și puțin enervant, având în vedere că povestea se concentrează pe un criminal I.A. fugiți) și hobby-urile noastre reciproce. Într-un element deosebit de oportun al conversației noastre, Douglas și-a exprimat o oarecare dezamăgire că nu a putut să viziteze un cinematograf în ultima vreme.
Toată această putere de conversație vine cu un anumit risc, totuși, după cum a explicat Hendler.
„Motorul de procesare a limbajului natural al chatbot-ului este antrenat pe dialogul de pe internet – o cantitate masivă de dialog – astfel încât conversația poate merge în locuri ciudate”, a spus el. „Deci, există momente când spune lucruri care ar putea să nu fie tocmai potrivite. Nu se întâmplă des, dar nu putem controla exact ce va spune el la tot.”
Și, deși aspectul conversațional al lui Douglas este impresionant, este doar o parte din ceea ce îl face unic într-o lume în continuă expansiune de oameni digitali și personaje virtuale interactive. După cum a descoperit Digital Domain, făcându-l uite umanul merge mult pentru a-l face să se simtă și el om.
Vă prezentăm Douglas - Autonomous Digital Human | Domeniu digital
Înfruntare
„La construirea lui Douglas, am folosit o cantitate imensă de date de la Doug [Roble]. A fost o cantitate imensă de sunet pentru a antrena sistemul [și] o cantitate imensă de performanță facială, date despre mișcarea corpului și orice altceva”, a explicat Hendler despre lucrare. au pus în cartografierea chipului lui Roble și a nenumăratelor moduri în care fața umană se poate schimba în timp ce vorbește, reacționează la indicii emoționale sau participă pasiv la un conversaţie.
Produsul tuturor acestor date este un om digital care arată uimitor de asemănător cu - dar nu ca o copie exactă a - Roble, de la acesta din urmă. postură, coafură și construirea la mișcările subtile atât Roble, cât și Douglas A.I. distribuie în timp ce participă la videoclipul nostru de grup conversaţie. Asemănarea este ciudată, dar cu o scurtă comandă de a „schimba fața”, Douglas devine brusc altcineva, cu un chip diferit, la fel de uman, pe același corp, păstrând totuși toate manierele subtile care îl fac să pară real.
„Când îi cerem lui Douglas să-și schimbe fața și fața lui trece la altcineva, acesta este începutul spre care se îndreaptă acest nou val de tehnologie”, spune Hendler, descriind „tehnică bazată pe imagini”, echipa la care lucrează pentru a face din Douglas o persoană digitală și mai flexibilă, capabilă să-și schimbe dramatic aspectul exterior, păstrând în același timp același nivel de interactivitate. „Odată ce avem această bază [cu Douglas], putem filma filmări ale altcuiva și putem obține o parte din sunetul său, apoi transformăm acea bază în ele - facem-o în față.”
„[Dacă am face asta] chiar acum, ei încă vor vorbi cu expresiile persoanei pe care am filmat-o inițial [în acest caz, Roble]”, a continuat el. „Dar pe măsură ce continuăm, începem să avem nevoie de cantități mai mici de date – poate că sunt doar imagini sau filmări ale cuiva – pentru a crea următoarea generație de acești oameni autonomi.”
Acea abilitate de a reproduce aspectul, vocea și manierele unui om real peste IA conversațională. fundaţia este unul dintre elementele care îl deosebește pe Douglas de majoritatea tipicului A.I. asistenți, roboți umanoizi și alte proiecte în dezvoltare în jurul A.I. lumea cercetării. Deși există o mulțime de studiouri și alte agenții care dezvoltă A.I. proiecte de un fel sau altul, Digital Domain se concentrează pe combinarea tuturor acestor elemente în un produs unic, coerent, care folosește cele mai bune dintre toate tehnologia și datele disponibile, cu o interfață care se simte socială și organică - ca și cum ai vorbi cu un alt om.
„Acesta este ceva de care suntem cu adevărat mândri, deoarece Douglas este un personaj complet CG care rulează pe Unreal”, spune Roble, care se mândrește în mod deosebit cu utilizarea elementelor disponibile pe scară largă, cum ar fi populara platformă de creație 3D Motor ireal, care a devenit platforma de bază pentru Hollywood (și înainte de aceasta, industria jocurilor video) atunci când vine vorba de crearea și manipularea elementelor cu efecte vizuale 3D. „[Douglas] este un obiect 3D, așa că poți face toate lucrurile pe care le poți face cu orice personaj digital din Unreal. Puteți schimba iluminarea, le puteți pune în diferite medii și așa mai departe. Dar, de asemenea, creăm acest hibrid [cu tot ce este implicat în Douglas], așa că obținem tot ce este mai bun din ambele lumi.”
Oriunde te uiți
Cu cât echipa lucrează mai mult pe Douglas, cu atât lista de aplicații potențiale crește.
„Înainte de pandemie plănuiam să-l prezentăm pe Douglas ca pe un chioșc, unde te apropii de un ecran și vorbești cu el”, și-a amintit Hendler. „Dar apoi ne-am gândit: „Hei, ar trebui să-l implicăm într-adevăr în apelurile Zoom.” A fost fantastic să-l punem în apeluri Zoom și să plece.”
Pe parcursul demonstrației, echipa a trecut printr-o listă lungă de cereri potențiale pentru Douglas, de la cabinetele medicale și serviciul pentru clienți, la utilitatea lui la Hollywood în primele etape de planificare a unei scene sau a unui anumit ecran secvenţă. Douglas însuși a oferit chiar câteva sugestii, sugerând că ar fi potrivit pentru scenarii și etapele conceptuale ale producției de filme și TV. Capacitatea sa de a procesa atât indiciile audio, cât și vizuale de la cei cu care conversa – mai ales când vine vorba de stări emoționale — oferă, de asemenea, un nivel suplimentar de utilitate atunci când aveți de-a face cu clienții sau cei care caută îndrumare medicală, potrivit Hendler.
Viteza cu care Douglas poate procesa toate aceste informații și poate trece de la ascultător pasiv la activ conversaționalul deține, de asemenea, o mulțime de atracție și arată cât de departe a evoluat tehnologia din spatele lui într-un scurt timp.
„Când am creat Thanos, aveam un singur cadru din care a durat 10 ore pentru redare. Acesta este un cadru”, explică el.
„Pentru Douglas, are un sistem de recunoaștere a vederii, așa că ne vede și ne poate identifica și analizează ceea ce spui, transformă-l în cuvinte și trimite asta către diferiți chatbot”, adaugă el. „Douglas creează apoi un răspuns, îl transformă în sunet și folosește acel sunet pentru a-și conduce fața. În același timp, el își dă seama ce mișcare a corpului este însoțită de acel discurs, determinând ce emoție i s-ar potrivi și redă acea mișcare a corpului împreună cu gesturile sale faciale.”
„Totul se întâmplă în câteva milisecunde”, spune Hendler. „Sunt toate acele procese, comparativ cu 10 ore pentru un cadru dintr-un lungmetraj. E atat de uimitor. Nu este la fel de realist precum ceea ce facem noi pentru film, dar dacă te gândești la cantitatea de lucruri care se întâmplă pentru a putea vorbi cu el ca o persoană reală, este pur și simplu fenomenal.”
Și într-un sens foarte literal, Douglas a fost adesea cel mai bun avocat al său când vine vorba de potențialul său.
Roble a explicat că, în mai multe rânduri, ei au optat pentru a-l lăsa pe Douglas să conducă propria prezentare despre, ei bine... el însuși. Rezultatul a ajuns să fie un teren mai bun pentru potențialul său decât au anticipat ei.
„[Prezentarea lui Douglas] a fost surprinzător de convingătoare. Nu a fost doar să-i cerem lui Siri să ne spună ceva, pentru că el a făcut parte din proces”, și-a amintit Roble. „Este distractiv să vorbești pentru că este o noutate, dar este și foarte eficient. Și nu te poți abține să te gândești: ce zici de predare sau alte aplicații? La urma urmei, poți vedea când este atent. Îi poți oferi feedback emoțional și el poate răspunde.”
Deși Douglas este deja o creație impresionantă, echipa Digital Domain insistă că rămâne o lucrare progres - dar cerul este limita în ceea ce privește felul de muncă pe care omul lor digital ar putea ajunge să facă ca timp continua. În multe feluri, procesul de a afla de ce este capabil Douglas este atât procesul, cât și scopul.
„Unul dintre motivele pentru care facem asta este că am putea”, spune Roble. „Când ești la computer și lucrezi, este foarte ușor să tastați. Dar există atât de multe ori și locuri în care ar fi minunat să poți doar să vorbești cu o persoană și să o faci să interacționeze cu tine și să reacționeze la tine. Cred că ne așteaptă o mare schimbare în viitor.”
Recomandările editorilor
- Cum echipa Thanos VFX a adus la viață personajele lui The Quarry (și apoi le-a ucis)