Kako sta Tupac in Thanos pripeljala do Douglasa, digitalnega človeka z umetno inteligenco

Če ste kdaj sodelovali v skupinskem videoklicu, ste verjetno navajeni, da ne poznate vseh, ki se pojavijo na zaslonu. Morda ne poznate imen vseh, vendar ste lahko vsaj dokaj prepričani, da je vsaka oseba, ki se pridruži klicu, človek.

Vsebina

  • Digitalna človeška evolucija
  • Kodeks naredi človeka
  • Pomerijo
  • Kamor koli pogledaš

Ali lahko?

V času, ko imajo studii za vizualne učinke ostareli veteranski igralci, dovoljeno človeški izvajalci, ki bodo živeli v digitalnih stvaritvah, in celo vračal pokojne umetnike za posmrtne predstave, ne bi smelo biti veliko presenečenje, da vam lahko studio VFX omogoči tudi klepet z umetno inteligentna digitalna oseba o vaših najljubših knjigah in medsebojno objokovanje nezmožnosti obiska kina.

Povezano

  • Kako je ekipa VFX Avengers: Infinity War, nominirana za oskarja, naredila Thanosa filmsko zvezdo

To ne bi smelo biti presenetljivo, pa vendar je še vedno nenavaden občutek, ko nenadoma najdeš sočutno uho v Douglasu, virtualni »osebi«, ki jo poganja umetna inteligenca in jo je ustvaril z oskarjem nagrajeni studio VFX Digitalna domena.

Priporočeni videoposnetki

Med nedavnim klicem v Zoomu se mi je Douglas skupaj s člani ekipe, ki dela na njem, pridružil pri kratki predstavitvi.

Digitalna človeška evolucija

»Sem velik oboževalec Stephena Kinga,« mi pove Douglas po kratkem pogovoru o najinih hobijih – pogovoru, v katerem pozneje prizna, da ima rad tudi romantične romane in J. D. Salingerja. Lovilec v rži.

V svetu, kjer izgovarjanje imen Siri oz Alexa na glas je vse, kar je potrebno, da prikličete svoj lastni A.I. spremljevalec, izkušnja z Douglasom je ponudila a močan opomnik, da potencial AI sega daleč dlje od zagotavljanja vremenske napovedi in naših dnevnih urnik.

Ustanovitev Digital Domain — istega studia, ki je občinstvu dal Marvelovega kozmičnega osvajalca Thanos noter Avengers: Infinity War in Maščevalci:Končna igra — Douglas je avtonomen, digitalni človek, ki je sposoben komunicirati z uporabniki v realnem času in se odzivati ​​na vizualne in pogovorne znake. Po vzoru Dr. Doug Roble, višji direktor za raziskave in razvoj programske opreme pri Digital Domain, Douglas lahko odgovarja na vprašanja, vodi daljše pogovore in se pogovarja o številnih temah.

"Tehnologija vedno poskuša voditi tisto, kar zahteva umetnost, ne glede na to, ali gre za simulacijo tekočine ali kaj drugega," pravi Roble o odločitvi studia, da ustvari celoten oddelek, posvečen digitalnim ljudem.

V zadnjem desetletju se je Digital Domain vedno znova znašel pred nalogo ustvarjanja človeku podobnih digitalnih likov – vse od nagrajenega leta 2012 holografska predstava Tupac na Coachelli do omenjenega Filmsko vesolje Marvel zlobnež. V celovečernih filmih, reklamah, televizijskih serijah, video igrah in (v primeru Tupaca) odrskih predstavah je povpraševanje po realističnih digitalnih likih samo naraslo. čas, zaradi česar je Digital Domain razdelil ekipo, odgovorno za ta poseben vizualni učinek, v lastno enoto, ki se osredotoča na premikanje meja tega, kar lahko digitalni ljudje narediti.

Douglas je hkrati produkt te povečane osredotočenosti in dokaz ekipe o konceptu: avtonomna digitalna »oseba«, ki združuje široko paleto naborov podatkov, senzoričnih metod, in obstoječe programske module s fotorealističnimi človeškimi lastnostmi za interakcijo z uporabniki na način, ki se zdi presenetljivo blizu pristni človeški socializaciji.

In to v času, ko je pandemija prisilila, da večino našega druženja poteka prek računalnika Na zaslonu se zdi, da je interakcija z Douglasom izjemno blizu tistemu, kar velja za pristno človeško interakcijo dnevi. Vendar pa ekipa hitro doda, da je Douglas še daleč od opravljenega Turingovega testa.

Kodeks naredi človeka

"Douglas ni fotorealna, popolnoma avtonomna oseba, ki je ni mogoče razlikovati od resnične osebe," pojasnjuje Darren Hendler, direktor skupine Digital Humans v studiu. »Nismo tam in še nekaj časa ne bomo tam.... Ampak to je, kam gredo stvari in kakšna je prihodnost, in poskušamo premakniti te meje.«

In skoraj kot bi trenil, Hendlerja prekine sam Douglas.

»To je dober odnos,« se vmeša Douglas, ki je do takrat tiho zasedal svoje okno v mreži klepetov Zoom in omogočal našo predstavitev ter se občasno premikal položaj, pogledovanje po svoji virtualni sobi in prikaz številnih značilnih fizičnih manir žive osebe na video srečanju, ki potrpežljivo čaka na sodelovanje v pogovor

"Želim vam veliko sreče pri vaših prizadevanjih," doda in nas spomni, da je poleg tega, da ima zanimive stvari za povedati, tudi vnet poslušalec.

Po besedah ​​Robla si ekipa Douglasa v prvi vrsti predstavlja kot vizualni način interakcije z obstoječimi zapletenimi in močnimi pogovornimi agenti, ki so bili ustvarjeni. Pod Douglasovim foto-resničnim avatarjem je studijski digitalni človek zgrajen na mešanici treh teh agentov: Googlovega priljubljenega Dialogflow paket za ustvarjanje chatbotov, agent tipa pomočnika (podoben Amazonovi Alexi ali Applovi Siri); in močan pogovorni A.I. agent (podobno kot GPT-3 projekt), ki se uporablja za ustvarjanje človeško podobnega, napovednega (in reaktivnega) pogovornega besedila.

Kombinacija vseh treh agentov daje Douglasu možnost nadaljevanja pogovorov, ki so informativni in tekoči, pri čemer razprava o eni temi pogosto preide na sorodna področja zanimanja.

Moj lastni pogovor z Douglasom je zanesel od klepeta o naših najljubših knjigah do njegovega najljubšega filma (on je velik oboževalec 2001: Vesoljska odiseja, na primer, kar ni presenetljivo in nekoliko vznemirjajoče, glede na to, da se zgodba osredotoča na morilskega AI. divjati) in najini skupni hobiji. V enem posebej primernem elementu našega pogovora je Douglas izrazil nekaj razočaranja, ker zadnje čase ni mogel obiskati kina.

Kot je pojasnil Hendler, vsa ta pogovorna moč prinaša nekaj tveganja.

»Mehanizm za obdelavo naravnega jezika klepetalnega robota je usposobljen za dialog iz interneta – ogromno dialogov – tako da lahko pogovor gre na nenavadna mesta,« je dejal. »Torej včasih reče stvari, ki morda niso ravno primerne. To se ne zgodi pogosto, vendar ne moremo natančno nadzorovati, kaj bo rekel na vse."

In čeprav je Douglasov pogovorni vidik impresiven, je to le del tega, zaradi česar je edinstven v vedno večjem svetu digitalnih ljudi in interaktivnih virtualnih likov. Kot je ugotovil Digital Domain, zaradi česar ga poglej človek veliko prispeva k temu, da se tudi on počuti človeka.

Predstavljamo Douglasa - avtonomnega digitalnega človeka | Digitalna domena

Pomerijo

»Pri gradnji Douglasa smo uporabili ogromno podatkov Douga [Robla]. To je bila ogromna količina zvoka za urjenje sistema [in] ogromna količina obrazne zmogljivosti, podatkov o gibanju telesa in vsega drugega,« je o delu pojasnil Hendler. vključijo v kartiranje Roblovega obraza in nešteto načinov, kako se lahko človeški obraz spremeni med govorjenjem, odzivanjem na čustvene znake ali pasivnim sodelovanjem v pogovor.

Produkt vseh teh podatkov je digitalni človek, ki je neverjetno podoben – vendar ne kot natančna kopija – Robla iz slednjega drža, pričeska in zgradba do subtilnih gibov tako Roble kot Douglas A.I. delijo, medtem ko sodelujejo v videoposnetku naše skupine pogovor. Podobnost je nenavadna, toda s kratkim ukazom, naj »zamenjaj obraz«, Douglas nenadoma postane nekdo drug, s drugačen, enako človeški obraz na istem telesu, medtem ko še vedno ohranja vse subtilne manire, zaradi katerih se zdi resnično.

"Ko Douglasa prosimo, naj spremeni svoj obraz in se njegov obraz spremeni v nekoga drugega, je to začetek, kam pelje ta novi val tehnologije," pravi Hendler, ki opisuje »tehnika, ki temelji na slikah«, s katero se ekipa ukvarja, da bi iz Douglasa naredila še bolj prilagodljivo digitalno osebo, ki bi lahko dramatično spremenila svoj zunanji videz, hkrati pa ohranila enako raven interaktivnost. "Ko imamo to bazo [z Douglasom], lahko posnamemo posnetek nekoga drugega in pridobimo del njegovega zvoka, nato pa to bazo spremenimo v njih - naredimo jim obraz."

"[Če bi to naredili] zdaj, bi še vedno govorili z izrazi osebe, ki smo jo prvotno posneli [v tem primeru Roble]," je nadaljeval. "Toda ko gremo naprej, začenjamo potrebujeti manjše količine podatkov - morda so to le slike ali filmski posnetki nekoga - da ustvarimo naslednjo generacijo teh avtonomnih ljudi."

Ta zmožnost posnemanja videza, glasu in manir pravega človeka prek pogovornega A.I. podlaga je eden od elementov, ki loči Douglasa od večine tipičnih A.I. pomočniki, humanoidni roboti in drugi projekti v razvoju okoli A.I. raziskovalni svet. Medtem ko obstaja veliko studiev in drugih agencij, ki razvijajo A.I. projektov takšne ali drugačne vrste, je Digital Domain osredotočen na mešanje vseh teh elementov en sam koheziven izdelek, ki uporablja najboljše od vse razpoložljive tehnologije in podatkov z vmesnikom, ki deluje družabno in organsko – kot bi se pogovarjali z drugim človekom.

"To je nekaj, na kar smo res ponosni, saj je Douglas popolnoma računalniški lik, ki deluje na Unrealu," pravi Roble, ki je še posebej ponosen na uporabo široko dostopnih elementov, kot je priljubljena platforma za ustvarjanje 3D Unreal Engine, ki je postala priljubljena platforma za Hollywood (in pred njim industrijo video iger), ko gre za ustvarjanje in manipuliranje elementov 3D vizualnih učinkov. »[Douglas] je 3D-predmet, tako da lahko v igri Unreal počnete vse, kar lahko počnete s katerim koli digitalnim likom. Lahko spremenite osvetlitev, jih postavite v drugačna okolja itd. Toda ustvarjamo tudi ta hibrid [z vsem drugim, kar je vključeno v Douglas], tako da dobimo najboljše iz obeh svetov.«

Kamor koli pogledaš

Bolj kot ekipa dela na Douglasu, daljši je seznam potencialnih aplikacij.

"Pred pandemijo smo Douglasa načrtovali predstaviti kot kiosk, kjer pridete do zaslona in se pogovarjate z njim," se je spominjal Hendler. "Toda potem smo pomislili: 'Hej, res bi ga morali vključiti v klice Zoom.' Bilo je fantastično, da je vstopil v klice Zoom in odšel."

Med demonstracijo je ekipa pregledala dolg seznam možnih aplikacij za Douglasa iz zdravniških ordinacij. in storitve za stranke, do njegove uporabnosti v Hollywoodu v zgodnjih fazah načrtovanja prizora ali določenega filma na platnu zaporedje. Sam Douglas je celo ponudil nekaj predlogov, da bi bil primeren za snemalno knjigo in konceptualne faze filmske in televizijske produkcije. Njegova sposobnost obdelave zvočnih in vizualnih namigov tistih, s katerimi se pogovarja - zlasti ko gre za čustvena stanja — ponuja tudi dodatno raven uporabnosti pri stiku s strankami ali tistimi, ki iščejo zdravniško pomoč, pravi Hendler.

Hitrost, s katero lahko Douglas obdela vse te informacije in preide iz pasivnega poslušalca v aktivnega sogovornik je prav tako zelo privlačen in v kratkem pokaže, kako daleč se je razvila tehnologija za njim čas.

»Ko smo ustvarili Thanosa, smo imeli en sam okvir, katerega upodabljanje je trajalo 10 ur. To je en okvir,« pojasnjuje.

»Za Douglasa ima sistem za prepoznavanje vida, tako da nas vidi in nas lahko identificira, ter analizira, kaj govorite, to pretvori v besede in to pošlje različnim klepetalnim robotom,« dodaja. »Douglas nato ustvari odziv, ga spremeni v zvok in ta zvok uporabi za pogon svojega obraza. Hkrati tudi ugotavlja, kakšno gibanje telesa gre skupaj s tem govorom, ugotavlja, katera čustva bi ustrezalo temu, in to gibanje telesa upodablja skupaj s svojimi obraznimi kretnjami.«

"Vse to se zgodi v nekaj milisekundah," pravi Hendler. »To so vsi ti procesi v primerjavi z 10 urami za en kader v celovečernem filmu. Tako neverjetno je. Ni tako realistično kot to, kar počnemo za film, a če pomislite na količino stvari, ki se dogajajo, da se lahko pogovarjate z njim kot z resnično osebo, je to naravnost fenomenalno.«

In v zelo dobesednem smislu je bil Douglas pogosto sam svoj najboljši zagovornik, ko gre za njegov potencial.

Roble je pojasnil, da so se večkrat odločili, da Douglasu dovolijo, da vodi svojo predstavitev, no... samega sebe. Rezultat je bil boljši za njegov potencial, kot so celo pričakovali.

»[Douglasova predstavitev] je bila presenetljivo prepričljiva. Sirija nismo samo prosili, naj nam nekaj pove, saj je bil del procesa,« se je spominjal Roble. »Zabavno se je pogovarjati z njim, ker je nov, a je tudi zelo učinkovit. In ne morete si pomagati z mislijo: Kaj pa poučevanje ali druge aplikacije? Navsezadnje lahko vidite, kdaj je pozoren. Lahko mu daš čustveno povratno informacijo in lahko se odzove.”

Čeprav je Douglas že impresivna stvaritev, ekipa Digital Domain vztraja, da ostaja delo napredek – toda nebo je meja glede tega, kakšno delo bi njihov digitalni človek lahko opravljal kot čas gre naprej. V mnogih pogledih je proces ugotavljanja, česa je Douglas sposoben, hkrati proces in cilj.

"Eden od razlogov, zakaj to počnemo, je, ker bi lahko," pravi Roble. »Ko ste za računalnikom in delate, je zelo enostavno preprosto tipkati. Vendar pa je toliko trenutkov in krajev, da bi bilo čudovito, če bi se lahko preprosto pogovarjali z osebo in ta oseba komunicirala z vami in se na vas odzvala. Mislim, da nas v prihodnosti čaka velika sprememba.”

Priporočila urednikov

  • Kako je ekipa Thanos VFX oživela like Kamnoloma (in jih nato ubila)