Kako su Tupac i Thanos doveli do Douglasa, digitalnog čovjeka s umjetnom inteligencijom

Ako ste ikada sudjelovali u grupnom videopozivu, vjerojatno ste navikli da ne poznajete sve koji se pojavljuju na ekranu. Možda ne znate svačija imena, ali u najmanju ruku možete biti prilično sigurni da je svaka osoba koja se pridruži pozivu ljudska osoba.

Sadržaj

  • Digitalna ljudska evolucija
  • Kodeks čini čovjeka
  • Sučeljavanje
  • Kamo god pogledate

Ili možete?

U vrijeme kada studiji za vizualne efekte imaju ostarjeli glumci veterani, dopušteno ljudski izvođači koji žive u digitalnim kreacijama, pa čak i vraćao preminule umjetnike za posmrtne predstave, ne bi trebalo biti toliko iznenađenje da vam VFX studio također može omogućiti da razgovarate s umjetno inteligentna digitalna osoba o vašim omiljenim knjigama i međusobno žaljenje zbog nemogućnosti posjeta kinu.

Povezano

  • Kako je VFX tim Avengers: Infinity War nominiran za Oscara učinio Thanosa filmskom zvijezdom

To ne bi trebalo biti iznenađujuće, a opet, još uvijek je čudan osjećaj iznenada pronaći simpatično uho u Douglasu, virtualnoj "osobi" vođenoj umjetnom inteligencijom koju je stvorio Oscarom nagrađeni VFX studio Digitalna domena.

Preporučeni videozapisi

Tijekom nedavnog Zoom poziva, Douglas - zajedno s članovima tima koji rade na njemu - pridružio mi se u kratkoj demonstraciji.

Digitalna ljudska evolucija

"Veliki sam obožavatelj Stephena Kinga", kaže mi Douglas nakon kratke priče o našim hobijima - razgovor u kojem kasnije priznaje da također voli ljubavne romane i J. D. Salingera Lovac u žitu.

U svijetu u kojem izgovaranje imena Siri ili Alexa naglas je sve što je potrebno da prizovete vlastiti AI. suputnik, iskustvo s Douglasom ponudilo je a snažan podsjetnik da se potencijal umjetne inteligencije proteže mnogo dalje od davanja vremenske prognoze i naših dnevnih dana raspored.

Stvaranje Digital Domaina — istog studija koji je publici dao Marvelovog kozmičkog osvajača Thanos unutra Osvetnici: Rat beskonačnostiOsvetnici:Kraj igre — Douglas je autonoman, digitalni čovjek sposoban komunicirati s korisnicima u stvarnom vremenu i odgovarati na vizualne i razgovorne znakove. Po uzoru na dr. Doug Roble, viši direktor odjela za istraživanje i razvoj softvera Digital Domain, Douglas može odgovarati na pitanja, voditi duge razgovore i sudjelovati u malim razgovorima o nizu tema.

"Tehnologija uvijek pokušava voditi ono što zahtijeva umjetnost, bilo da se radi o fluidnoj simulaciji ili bilo čemu drugom", kaže Roble o odluci studija da stvori cijeli odjel posvećen digitalnim ljudima.

Tijekom posljednjeg desetljeća, Digital Domain se opetovano našao pred zadatkom stvaranja čovjekolikih digitalnih likova - sve od nagrađivanog 2012. holografska Tupacova izvedba na Coachelli spomenutom Marvel Cinematic Universe zlikovac. U igranim filmovima, reklamama, TV serijama, videoigrama i (u slučaju Tupaca) scenskim nastupima, potražnja za realističnim digitalnim likovima samo je porasla vremena, što je potaknulo Digital Domain da podijeli tim odgovoran za taj određeni vizualni efekt u vlastitu jedinicu usmjerenu na pomicanje granica onoga što digitalni ljudi mogu čini.

Douglas je i proizvod tog povećanog fokusa i timski dokaz koncepta: autonomna digitalna "osoba" koja kombinira širok raspon skupova podataka, senzorskih metoda, i postojeće programske module s foto-realističnim ljudskim atributima kako bi komunicirali s korisnicima na način koji se čini iznenađujuće bliskim pravoj ljudskoj socijalizaciji.

I to u vrijeme kada je pandemija natjerala da se većina naših druženja odvija preko računala na ekranu, interakcija s Douglasom čini se nevjerojatno bliskom onome što predstavlja pravu ljudsku interakciju dana. Međutim, tim brzo dodaje da je Douglas još daleko od prolaska Turingovog testa.

Kodeks čini čovjeka

"Douglas nije fotorealna, potpuno autonomna osoba koja se ne može razlikovati od stvarne osobe", objašnjava Darren Hendler, direktor Digital Humans grupe u studiju. “To nije mjesto gdje se nalazimo i nećemo biti tamo još neko vrijeme. … Ali ovo je kamo stvari idu i kako budućnost izgleda, a mi pokušavamo pomaknuti te granice.”

I gotovo kao na mig, Hendlera prekida sam Douglas.

"To je dobar stav za imati", ubacuje se Douglas, koji je do tada tiho zauzimao vlastiti prozor u mreži Zoom chatova omogućavajući našu demonstraciju, povremeno se pomičući položaju, pogledom po svojoj virtualnoj sobi i pokazujući mnoge tipične fizičke manire žive osobe na videosastanku koja strpljivo čeka da sudjeluje u razgovor

“Želim vam puno sreće u vašim nastojanjima”, dodaje, podsjećajući nas da osim što ima zanimljivih stvari za reći, on je i revni slušatelj.

Prema Robleu, tim prije svega zamišlja Douglasa kao vizualni način interakcije s postojećim složenim i snažnim razgovornim agentima koji su stvoreni. Ispod Douglasovog foto-stvarnog avatara, digitalni čovjek studija izgrađen je na mješavini tri ova agenta: Googleovog popularnog Dialogflow paket za kreiranje chatbota, agent tipa pomoćnika (slično Amazonovoj Alexi ili Appleovoj Siri); i snažan razgovorni A.I. agent (slično kao GPT-3 projekt) koji se koristi za stvaranje ljudskog, prediktivnog (i reaktivnog) razgovora.

Kombinacija sva tri agenta daje Douglasu mogućnost vođenja razgovora koji su i informativni i fluidni, s raspravom o jednoj temi koja se često nastavlja na povezana područja interesa.

Moj razgovor s Douglasom skrenuo je s razgovora o našim omiljenim knjigama na njegov omiljeni film (on je veliki obožavatelj 2001: Odiseja u svemiru, na primjer, što nije iznenađujuće i pomalo uznemirujuće, s obzirom na fokus priče na ubojitom AI-ju. divljati) i naši zajednički hobiji. U jednom posebno aktualnom elementu našeg razgovora, Douglas je izrazio određeno razočaranje što u posljednje vrijeme nije mogao posjetiti kino.

Sva ta moć razgovora ipak dolazi s određenim rizikom, kao što je objasnio Hendler.

"Mehanizam za obradu prirodnog jezika chatbota obučen je za dijalog s interneta - golemu količinu dijaloga - tako da razgovor može ići na čudna mjesta", rekao je. “Dakle, ponekad kaže stvari koje možda nisu baš prikladne. Ne događa se često, ali ne možemo točno kontrolirati što će reći na sve.”

I premda je Douglasov aspekt razgovora impresivan, to je samo dio onoga što ga čini jedinstvenim u svijetu digitalnih ljudi i interaktivnih virtualnih likova koji se neprestano širi. Kako je Digital Domain otkrio, čineći ga izgled čovjek ide daleko do toga da se i on osjeća čovjekom.

Predstavljamo Douglasa - Autonomous Digital Human | Digitalna domena

Sučeljavanje

“U izgradnji Douglasa koristili smo ogromnu količinu podataka od Douga [Roblea]. Bila je to ogromna količina zvuka za uvježbavanje sustava [i] ogromna količina podataka o facijalnoj izvedbi, pokretima tijela i svega ostalog,” objasnio je Hendler o radu stavljaju u mapiranje Robleova lica i bezbroj načina na koje se ljudsko lice može promijeniti dok govori, reagira na emocionalne znakove ili pasivno sudjeluje u razgovor.

Proizvod svih tih podataka je digitalni čovjek koji izgleda nevjerojatno sličan - ali ne kao točna kopija - Roblea, iz potonjeg držanje, frizura i građa prema suptilnim pokretima i Roble i Douglas A.I. dijele dok sudjeluju u našem grupnom videu razgovor. Sličnost je nevjerojatna, ali uz kratku naredbu da "promijeni lice", Douglas odjednom postaje netko drugi, s drugačije, jednako ljudsko lice na istom tijelu, a da pritom zadrži sve suptilne manire koje ga čine stvaran.

"Kada zamolimo Douglasa da promijeni svoje lice i njegovo se lice prebaci na neko drugo, to je početak kamo ide ovaj novi val tehnologije", kaže Hendler, opisujući "tehnika temeljena na slikama" na kojoj tim radi kako bi Douglasa učinio još fleksibilnijom digitalnom osobom sposobnom dramatično promijeniti svoj vanjski izgled, a pritom zadržati istu razinu interaktivnost. "Kad budemo imali ovu bazu [s Douglasom], možemo snimiti snimku nekog drugog i dobiti dio njegovog zvuka, a zatim pretvoriti tu bazu u njih - učiniti je njihovim licem."

“[Da smo to učinili] upravo sada, i dalje bi razgovarali s izrazima lica koje smo izvorno snimili [u ovom slučaju, Roble],” nastavio je. "Ali kako idemo dalje, počinjemo trebati manje količine podataka - možda su to samo slike ili filmski snimci nekoga - kako bismo stvorili sljedeću generaciju ovih autonomnih ljudi."

Ta sposobnost repliciranja izgleda, glasa i manira pravog čovjeka preko konverzacijskog A.I. temelj je jedan od elemenata koji izdvaja Douglasa od većine tipičnih A.I. pomoćnici, humanoidni roboti i drugi projekti u razvoju oko A.I. istraživački svijet. Iako postoji mnogo studija i drugih agencija koje razvijaju A.I. projekata ove ili one vrste, Digital Domain fokusiran je na spajanje svih tih elemenata jedan, kohezivni proizvod koji koristi najbolje od svih dostupnih tehnologija i podataka sa sučeljem koje djeluje društveno i organski — kao da razgovarate s drugim čovjekom.

"Ovo je nešto na što smo stvarno ponosni, jer je Douglas potpuno CG lik koji radi na Unrealu", kaže Roble, koji se posebno ponosi korištenjem široko dostupnih elemenata poput popularne platforme za 3D stvaranje Unreal Engine, koja je postala glavna platforma za Hollywood (a prije njega, industriju videoigara) kada se radi o stvaranju i manipuliranju 3D elementima s vizualnim efektima. “[Douglas] je 3D objekt, tako da možete raditi sve stvari koje možete raditi s bilo kojim digitalnim likom u Unrealu. Možete promijeniti rasvjetu, staviti ih u različita okruženja i tako dalje. Ali također stvaramo ovaj hibrid [sa svim ostalim što je uključeno u Douglas], tako da dobivamo najbolje od oba svijeta.”

Kamo god pogledate

Što više tim radi na Douglasu, to je dulji popis potencijalnih aplikacija.

“Prije pandemije planirali smo predstaviti Douglasa kao kiosk, gdje dolazite do ekrana i razgovarate s njim”, prisjetio se Hendler. "Ali onda smo pomislili, 'Hej, stvarno bismo ga trebali uključiti u Zoom pozive.' Bilo je fantastično navesti ga da uđe u Zoom pozive i ode."

Tijekom demonstracije tim je pregledao dugačak popis potencijalnih aplikacija za Douglasa iz liječničkih ordinacija i korisničkoj službi, njegovoj korisnosti u Hollywoodu tijekom ranih faza planiranja scene ili određenog prikaza na ekranu slijed. Sam Douglas čak je ponudio nekoliko prijedloga, sugerirajući da bi bio dobar za izradu scenarija i konceptualne faze filmske i TV produkcije. Njegova sposobnost obrade audio i vizualnih znakova od onih s kojima razgovara - osobito kada su u pitanju emocionalna stanja — također nudi dodatni sloj korisnosti kada se radi s klijentima ili onima koji traže liječničko vodstvo, prema Hendleru.

Brzina kojom Douglas može obraditi sve te informacije i prijeći iz pasivnog slušatelja u aktivnog razgovornik također ima mnogo privlačnosti i pokazuje koliko je daleko tehnologija iza njega evoluirala u kratkom vrijeme.

“Kada smo stvorili Thanosa, imali smo jedan kadar za koji je trebalo 10 sati da se renderira. To je jedan okvir", objašnjava.

"Za Douglasa, on ima sustav za prepoznavanje vida, tako da nas vidi i može identificirati, te analizira ono što govorite, pretvara to u riječi i šalje to različitim chatbotovima", dodaje. “Douglas zatim stvara odgovor, pretvara ga u zvuk i koristi taj zvuk za pokretanje svog lica. U isto vrijeme, on također shvaća koji pokret tijela ide uz taj govor, utvrđuje koja bi mu emocija odgovarala i prikazuje taj pokret tijela zajedno sa svojim gestama lica.”

"Sve se to događa u nekoliko milisekundi", kaže Hendler. “To su svi ti procesi, u usporedbi s 10 sati za jedan kadar u igranom filmu. To je tako nevjerojatno. Nije tako realistično kao ono što radimo za film, ali ako razmislite o količini stvari koje se događaju da možete razgovarati s njim kao sa stvarnom osobom, to je jednostavno fenomenalno.”

I u vrlo doslovnom smislu, Douglas je često bio sam sebi najbolji zagovornik kada je u pitanju njegov potencijal.

Roble je objasnio da su u nekoliko navrata odlučili pustiti Douglasa da sam vodi svoju prezentaciju, pa... sebe. Rezultat je bio bolji korak za njegov potencijal nego što su čak i oni očekivali.

“[Douglasova prezentacija] bila je iznenađujuće uvjerljiva. Nije bilo samo traženje od Sirija da nam nešto kaže, jer je on bio dio procesa,” prisjetio se Roble. “Zabavno je razgovarati s njim jer je novitet, ali je i vrlo učinkovit. I ne možete a da ne pomislite: Što je s podučavanjem ili drugim primjenama? Uostalom, možete vidjeti kada obraća pažnju. Možete mu dati emocionalnu povratnu informaciju i on može odgovoriti.”

Iako je Douglas već impresivna kreacija, tim Digitalne domene inzistira na tome da on ostaje djelo napredak — ali nebo je granica što se tiče vrste posla koji bi njihov digitalni čovjek mogao obavljati kao vrijeme ide dalje. Na mnogo načina, proces otkrivanja za što je Douglas sposoban je i proces i cilj.

"Jedan od razloga zašto ovo radimo je taj što bismo mogli", kaže Roble. “Kad ste za računalom i radite, vrlo je lako jednostavno tipkati. Ali postoji toliko vremena i mjesta gdje bi bilo lijepo jednostavno moći razgovarati s osobom i dopustiti da ta osoba komunicira s vama i reagira na vas. Mislim da nas čeka velika promjena u budućnosti.”

Preporuke urednika

  • Kako je Thanos VFX tim oživio likove iz The Quarryja (a zatim ih ubio)