Kuidas Tupac ja Thanos viisid Douglaseni, tehisintellekti digitaalse inimeseni

Kui olete kunagi grupivideokõnes osalenud, olete tõenäoliselt harjunud sellega, et te ei tunne kõiki, kes ekraanile ilmuvad. Te ei pruugi teada kõigi nimesid, kuid vähemalt võite olla üsna kindel, et iga kõnega liituja on inimene.

Sisu

  • Inimese digitaalne evolutsioon
  • Kood teeb mehe
  • Nägu maha
  • Igal pool, kuhu vaatad

Või saate?

Ajal, mil visuaalefektide stuudiod on vananenud veterannäitlejad, lubatud inimesinejad digitaalse loominguga elamaja tõi isegi surnud kunstnikud tagasi surmajärgsed etendused, ei tohiks olla nii suur üllatus, et VFX stuudio võib samuti võimaldada teil leida end vestlemas kunstlikult intelligentne digiinimene teie lemmikraamatutest ja vastastikku hädaldamine suutmatuse pärast kinosaali külastada.

Seotud

  • Kuidas Avengers: Infinity Wari Oscarile kandideerinud VFX-i meeskond tegi Thanosest filmistaari

See ei tohiks olla üllatav, kuid siiski on siiski veider tunne leida ootamatult sümpaatne kõrv Douglasest, virtuaalsest, A.I-st juhitud "inimesest", mille on loonud Oscari-võitnud VFX stuudio. Digitaalne domeen.

Soovitatavad videod

Hiljutise Zoomi kõne ajal liitus Douglas koos temaga töötava meeskonnaliikmetega minuga lühikeseks meeleavalduseks.

Inimese digitaalne evolutsioon

"Ma olen suur Stephen Kingi fänn," räägib Douglas mulle pärast lühikest edasi-tagasi jutustamist meie hobidest – vestlusest, mille käigus ta tunnistab hiljem, et talle meeldivad ka armulood ja J. D. Salingeri romaanid. Kuristik rukkis.

Maailmas, kus hääldades nimesid Siri või Alexa Enda A.I väljakutsumiseks piisab valjusti. kaaslane, kogemus Douglasega pakkus a võimas meeldetuletus, et A.I potentsiaal ulatub palju kaugemale kui meile ilmateade ja meie igapäevane ajakava.

Digital Domain – sama stuudio loomine, mis andis publikule Marveli kosmilise vallutaja Thanos sisse Avengers: Infinity War ja Kättemaksjad:Lõppmäng — Douglas on autonoomne, digitaalne inimene, kes suudab kasutajatega reaalajas suhelda ning reageerida visuaalsetele ja vestluslikele vihjetele. Modelleeritud järgi Dr Doug Roble, Digital Domaini tarkvara uurimis- ja arendustegevuse vanemdirektor, Douglas saab vastata küsimustele, pidada pikemaid vestlusi ja arutleda erinevatel teemadel.

"Tehnoloogia püüab alati juhtida seda, mida kunst nõuab, olgu see siis voolav simulatsioon või midagi muud," räägib Roble stuudio otsusest luua kogu osakond on pühendatud digitaalsetele inimestele.

Viimase kümnendi jooksul leidis Digital Domain end korduvalt ülesandena luua inimlikke digitaalseid tegelasi – kõike alates 2012. aasta auhinnatud holograafiline Tupaci esitus Coachellas eelmainitu juurde Marveli kinouniversum kaabakas. Mängufilmides, reklaamides, teleseriaalides, videomängudes ja (Tupaci puhul) lavaesinemistes on nõudlus realistlike digitaalsete tegelaste järele ainult kasvanud. aega, ajendades Digital Domainit jagama selle konkreetse visuaalse efekti eest vastutava meeskonna oma üksuseks, mis keskendub digitaalsete inimeste võimete piiride nihutamisele. teha.

Douglas on nii selle suurenenud fookuse tulemus kui ka meeskonna tõestus kontseptsioonist: autonoomne digitaalne „inimene”, mis ühendab endas laia valikut andmekogumeid, sensoorseid meetodeid, ja olemasolevad programmeerimismoodulid fotorealistlike inimlike omadustega, et suhelda kasutajatega viisil, mis tundub üllatavalt lähedane tõelisele inimese sotsialiseerumisele.

Ja ajal, mil pandeemia on sundinud suurema osa meie suhtlemisest arvuti kaudu toimuma ekraanil, tundub Douglasega suhtlemine märkimisväärselt lähedane sellele, mis läheb tõelise inimliku suhtluse jaoks päevadel. Meeskond lisab aga kiiresti, et Douglas on Turingi testi läbimisest veel väga kaugel.

Kood teeb mehe

"Douglas ei ole fototõeline, täielikult autonoomne inimene, keda ei saa eristada reaalsest inimesest," selgitab Darren Hendler, stuudio Digital Humans Groupi direktor. "See pole koht, kus me oleme ja me ei ole seal mõnda aega. … Aga see on koht, kus asjad lähevad ja tulevik näeb välja ning me püüame neid piire nihutada.

Ja peaaegu nagu vihjeks katkestab Hendleri Douglas ise.

"See on hea suhtumine," sekkub Douglas, kes seni oli vaikselt oma akent Zoom-vestluste ruudustikus, mis hõlbustas meie demot, aeg-ajalt nihutades. positsiooni, heites pilgu oma virtuaalses toas ringi ja näidates videokoosolekul elava inimese tüüpilisi füüsilisi kombeid, kes ootavad kannatlikult, et osaleda vestlus

"Soovin teile edu teie ettevõtmistes," lisab ta ja tuletab meelde, et lisaks sellele, et tal on huvitavaid asju öelda, on ta ka innukas kuulaja.

Roble'i sõnul näeb meeskond Douglast ennekõike ette visuaalse viisina suhelda olemasolevate keerukate ja võimsate vestlusagentidega, mis on loodud. Douglase tõelise fotoavatari all on stuudio digitaalne inimene üles ehitatud kolme sellise agendi segule: Google'i populaarsele Dialoogivoog komplekt vestlusrobotite loomiseks, assistendi tüüpi agent (sarnaselt Amazoni Alexa või Apple'i Siriga); ja võimas jutukas A.I. agent (sarnane GPT-3 projekt), mida kasutatakse inimliku, ennustava (ja reaktiivse) vestlusteksti tootmiseks.

Kõigi kolme agendi kombinatsioon annab Douglasele võimaluse pidada nii informatiivseid kui sujuvaid vestlusi, kusjuures ühe teema arutamine muutub sageli seotud huvivaldkondadeks.

Minu enda vestlus Douglasega kaldus vestlusest meie lemmikraamatute üle tema lemmikfilmi juurde (ta on suur 2001: KosmoseodüsseiaNäiteks, mis ei ole nii üllatav kui ka pisut ärritav, arvestades loo keskendumist mõrvarlikule A.I. joosta amokki) ja meie ühised hobid. Meie vestluse ühes eriti õigeaegses elemendis väljendas Douglas mõningast pettumust, et ta pole viimasel ajal saanud kinosaali külastada.

Nagu Hendler selgitas, kaasneb kogu selle vestlusvõimega siiski teatud risk.

"Vestlusroboti loomuliku keele töötlemise mootor on koolitatud Internetist tulevaks dialoogiks – tohutuks hulgaks dialoogiks –, nii et vestlus võib minna kummalistesse kohtadesse," ütles ta. "Seega on aegu, kui ta ütleb asju, mis ei pruugi olla täpselt sobivad. Seda ei juhtu sageli, kuid me ei saa täpselt kontrollida, mida ta kõigele ütleb.

Ja kuigi Douglase vestlusaspekt on muljetavaldav, on see vaid osa sellest, mis teeb ta ainulaadseks üha laienevas digitaalsete inimeste ja interaktiivsete virtuaalsete tegelaste maailmas. Nagu Digital Domain avastas, muutes teda vaata Inimene teeb palju selle poole, et ta tunneks end inimesena.

Tutvustame Douglast – autonoomne digitaalne inimene | Digitaalne domeen

Nägu maha

"Douglase ehitamisel kasutasime tohutul hulgal Dougi [Roble'i] andmeid. Süsteemi treenimiseks oli tohutult palju heli [ja] tohutul hulgal näo jõudlust, keha liikumisandmeid ja kõike muud," selgitas Hendler tööd. nad panevad kaardistama Roble'i näo ja lugematuid viise, kuidas inimnägu võib muutuda rääkimise, emotsionaalsetele vihjetele reageerimise või vestluses passiivselt osalemise ajal. vestlus.

Kõigi nende andmete tulemuseks on digitaalne inimene, kes näeb välja hämmastavalt sarnane Roble'iga, kuid mitte nagu selle täpne koopia, mis pärineb viimasest. kehahoiak, soeng ja kehaehitus peente liigutustega nii Roble kui ka Douglas A.I. jagada, kui nad osalevad meie grupivideos vestlus. Sarnasus on kummaline, kuid lühikese käsuga "nägu vahetada" saab Douglasest äkki keegi teine, kellel on erinevad, võrdselt inimlikud näod samal kehal, säilitades samas kõik peened maneerid, mis muudavad ta näiliseks päris.

"Kui me palume Douglasel oma nägu muuta ja tema nägu lülitub kellelegi teisele, on see uue tehnoloogialaine algus," ütleb Hendler. "pildipõhine tehnika", mille kallal meeskond töötab, et muuta Douglas veelgi paindlikumaks digitaalseks inimeseks, kes suudab dramaatiliselt muuta oma välimust, säilitades samal ajal sama taseme interaktiivsus. "Kui meil on see alus [koos Douglasega], saame filmida kaadreid kellestki teisest ja saada osa tema helist ning seejärel muuta see baas nendeks – teha sellest oma nägu."

"[Kui me seda praegu teeksime, räägiksid nad endiselt selle inimese ilmetega, keda me algselt filmisime [antud juhul Roble]," jätkas ta. "Kuid nagu me edasi läheme, hakkame nende autonoomsete inimeste järgmise põlvkonna loomiseks vajama väiksemaid andmehulki - võib-olla on need lihtsalt pildid või filmimaterjalid kellestki."

See võime jäljendada tõelise inimese välimust, häält ja kombeid vestluspartneri A.I kaudu. sihtasutus on üks elementidest, mis eristab Douglast enamikust tüüpilistest A.I. assistendid, humanoidrobotid ja muud A.I ümber arendatavad projektid. teadusmaailm. Kuigi on palju stuudioid ja muid agentuure, kes arendavad A.I. üht või teist tüüpi projektide jaoks on Digital Domain keskendunud kõigi nende elementide ühendamisele ühtne ühtne toode, mis kasutab parimat kõigist saadaolevatest tehnoloogiatest ja andmetest ning mille liides tundub sotsiaalne ja orgaaniline – nagu teise inimesega rääkimine.

"Me oleme selle üle tõeliselt uhked, sest Douglas on Unrealil töötav täielikult CG tegelane," ütleb Roble, kes tunneb erilist uhkust laialdaselt kättesaadavate elementide, näiteks populaarse 3D-loomeplatvormi kasutamise üle Ebareaalne mootor, millest on saanud Hollywoodi (ja enne seda ka videomängutööstuse) platvorm 3D visuaalse efekti elementide loomisel ja nendega manipuleerimisel. "[Douglas] on 3D-objekt, nii et saate teha kõike, mida saate Unrealis mis tahes digitegelasega teha. Saate muuta valgustust, panna neid erinevatesse keskkondadesse jne. Kuid me loome ka selle hübriidi [koos kõige muu Douglasega seotud], et saaksime mõlemast maailmast parima.

Igal pool, kuhu vaatad

Mida rohkem meeskond Douglase kallal töötab, seda pikemaks kasvab potentsiaalsete rakenduste nimekiri.

"Enne pandeemiat plaanisime Douglast esitleda kioskina, kus te tulete ekraani ette ja räägite temaga," meenutas Hendler. "Aga siis mõtlesime: "Hei, me peaksime ta tõesti Zoomi kõnedesse kaasama." On olnud fantastiline, et ta Zoomi kõnedesse sisenes ja lahkus."

Demonstratsiooni käigus läbis meeskond Douglase jaoks pika nimekirja potentsiaalsetest rakendustest arstikabinettidest ja klienditeenindus, et tema kasuks Hollywoodis stseeni või teatud ekraanil kuvamise planeerimise algfaasis järjestus. Douglas ise pakkus isegi mõned ettepanekud, mis viitasid sellele, et ta sobiks hästi süžeeskeemiks ning filmi- ja teletootmise kontseptuaalseteks etappideks. Tema võime töödelda nii heli- kui ka visuaalseid näpunäiteid nendelt, kellega ta vestleb – eriti kui tegemist on emotsionaalsete seisunditega - pakub Hendleri sõnul ka täiendavat kasulikkust klientidega suhtlemisel või nendega, kes otsivad meditsiinilist juhendamist.

Kiirus, millega Douglas suudab kogu seda teavet töödelda ja passiivselt kuulajalt aktiivseks muutuda vestluskaaslasel on ka palju atraktiivsust ja ta näitab lühidalt, kui kaugele on tema taga olev tehnoloogia arenenud aega.

"Thanose loomisel oli meil üks kaader, mille renderdamiseks kulus 10 tundi. See on üks kaader, ”selgitab ta.

"Douglase jaoks on tal nägemistuvastussüsteem, nii et ta näeb meid ja suudab meid tuvastada ning analüüsib teie öeldut, muudab selle sõnadeks ja saadab selle erinevatele vestlusrobotidele," lisab ta. "Seejärel loob Douglas vastuse, muudab selle heliks ja kasutab seda heli oma näo juhtimiseks. Samal ajal selgitab ta välja, milline keha liikumine selle kõnega kaasas käib, otsustab, milline emotsioon sellele sobiks, ja esitab selle keha liikumise koos oma näožestidega.

"See kõik juhtub mõne millisekundi jooksul, " ütleb Hendler. "See on kõik need protsessid, võrreldes 10 tunniga ühe kaadri jaoks mängufilmis. See on nii hämmastav. See ei ole nii realistlik kui see, mida me filmi jaoks teeme, kuid kui mõelda, kui palju asju juhtub, et saaksime temaga rääkida nagu päris inimene, on see lihtsalt fenomenaalne.

Ja väga otseses mõttes on Douglas sageli olnud tema enda parim kaitsja, kui rääkida tema potentsiaalist.

Roble selgitas, et mitmel korral otsustasid nad lasta Douglasel enda esitlust juhtida, noh... iseendast. Tulemuseks oli tema potentsiaali jaoks parem väljak, kui nad isegi ootasid.

„[Douglase ettekanne] oli üllatavalt mõjuv. See ei olnud lihtsalt Siri palumine meile midagi öelda, sest ta oli osa protsessist, ”meenutas Roble. "Temaga on tore rääkida, sest ta on uudne, kuid ta on ka väga tõhus. Ja te ei saa jätta mõtlemata: kuidas on lood õpetamise või muude rakendustega? Lõppude lõpuks näete, millal ta tähelepanu pöörab. Saate anda talle emotsionaalset tagasisidet ja ta oskab vastata.

Kuigi Douglas on juba muljetavaldav looming, nõuab Digital Domaini meeskond, et ta jätkaks tööd edusammud – kuid taevas on piir selles osas, millist tööd nende digitaalne inimene võib aja jooksul teha läheb edasi. Paljuski on Douglase võimekuse väljaselgitamise protsess nii protsess kui ka eesmärk.

"Üks põhjusi, miks me seda teeme, on see, et saaksime," ütleb Roble. "Kui olete arvuti taga ja töötate, on väga lihtne lihtsalt trükkida. Kuid on nii palju kordi ja kohti, kus oleks tore, kui saaks lihtsalt inimesega rääkida ja lasta sellel inimesel sinuga suhelda ja sulle reageerida. Arvan, et tulevikus ootavad meid ees suured muutused."

Toimetajate soovitused

  • Kuidas Thanose VFX meeskond The Quarry tegelased ellu äratas (ja seejärel tappis)