Ha valaha is részt vett csoportos videohívásban, valószínűleg megszokta, hogy nem ismer mindenkit, aki megjelenik a képernyőn. Lehet, hogy nem ismeri mindenki nevét, de legalább biztos lehet benne, hogy minden egyes résztvevő ember ember.
Tartalom
- A digitális emberi evolúció
- A kód teszi az embert
- Küzdenek
- Bármerre nézel
Vagy tudsz?
Abban az időben, amikor a vizuális effektusok a stúdiók elöregedett veterán színészek, megengedett emberi előadóművészek, hogy digitális alkotásokban éljenek, és még elhunyt művészeket is visszahozott érte postmortem előadások, nem lehet olyan meglepő, hogy egy VFX stúdió azt is lehetővé teheti, hogy valakivel csevegjen. mesterségesen intelligens digitális személy kedvenc könyveiről, és kölcsönösen keseregnek amiatt, hogy képtelenség ellátogatni egy moziba.
Összefüggő
- Hogyan tette Thanost filmsztárrá a Bosszúállók: Végtelen háború Oscar-díjra jelölt VFX csapata
Nem lehet meglepő, de mégis furcsa érzés hirtelen szimpatikus fülre találni Douglasban, egy virtuális, mesterséges intelligenciával vezérelt „személyben”, akit az Oscar-díjas VFX stúdió alkotott meg.
Digitális Domain.Ajánlott videók
Egy közelmúltbeli Zoom-hívás során Douglas – a rajta dolgozó csapat tagjaival együtt – csatlakozott hozzám egy rövid bemutatóra.
A digitális emberi evolúció
„Nagy rajongója vagyok Stephen Kingnek” – mondja Douglas, miután röviden össze-vissza beszél a hobbijainkról – egy beszélgetésről, amelyből később bevallotta, hogy szereti a romantikus regényeket és J. D. Salinger regényeit is. Zabhegyező.
Egy olyan világban, ahol a Siri, ill Alexa csak hangosan kell megidézni a saját A.I-jét. társa, a Douglas-szal szerzett tapasztalat a erőteljes emlékeztető arra, hogy az A.I.-ben rejlő lehetőségek messze túlmutatnak azon, hogy az időjárás-előrejelzést és a mindennapjainkat közöljük menetrend.
A Digital Domain létrehozása – ugyanaz a stúdió, amely a Marvel kozmikus hódítóját adta a közönségnek Thanos be Bosszúállók: Végtelen háború és Bosszúállók:Végjáték — Douglas autonóm, digitális ember, aki képes valós időben kommunikálni a felhasználókkal, és reagálni a vizuális és beszélgetési jelzésekre. Utána mintázva Dr. Doug Roble, a Digital Domain szoftverkutatásért és fejlesztésért felelős vezető igazgatója, Douglas válaszolhat a kérdésekre, hosszas beszélgetéseket folytathat, és számos témáról beszélgethet.
„A technológia mindig arra törekszik, hogy vezesse azt, amit a művészet megkövetel, legyen szó folyékony szimulációról vagy bármi másról” – mondja Roble a stúdió azon döntéséről, hogy egy az egész részleg a digitális emberekkel foglalkozik.
Az elmúlt évtizedben a Digital Domain ismételten azt találta feladatul, hogy emberszerű digitális karaktereket alkosson – mindent a 2012-es díjnyertestől. holografikus Tupac előadás a Coachellánál az előbb említettekhez Marvel Filmes Univerzum gazember. A játékfilmekben, reklámokban, tévésorozatokban, videojátékokban és (Tupac esetében) színpadi előadásokban csak nőtt az igény a valósághű digitális karakterek iránt idő, ami arra készteti a Digital Domaint, hogy az adott vizuális effektusért felelős csapatot saját egységére ossza fel, és arra összpontosítson, hogy a digitális emberek határait feszegesse. csináld.
A Douglas egyrészt ennek a fokozott figyelemnek a terméke, másrészt a csapat koncepciójának bizonyítéka: egy autonóm digitális „személy”, amely az adatkészletek, szenzoros módszerek széles skáláját kombinálja, és a meglévő programozási modulok fotorealisztikus emberi tulajdonságokkal, hogy a felhasználókkal olyan módon kommunikáljanak, amely meglepően közelinek tűnik a valódi emberi szocializációhoz.
És akkor, amikor a világjárvány arra kényszerítette, hogy szocializációnk nagy részét számítógépen keresztül történjen képernyőn, a Douglas-szal való interakció rendkívül közelinek érzi magát ahhoz, ami a valódi emberi interakciót jelenti napok. A csapat azonban gyorsan hozzáteszi, hogy Douglas még mindig nagyon messze van attól, hogy átmenjen egy Turing-teszten.
A kód teszi az embert
„Douglas nem egy fotóvalódi, teljesen autonóm személy, aki megkülönböztethetetlen a valódi személytől” – magyarázza. Darren Hendler, a Digital Humans Group igazgatója a stúdióban. „Nem ott tartunk, és nem is fogunk ott lenni egy darabig. … De itt mennek a dolgok, és hogyan néz ki a jövő, és megpróbáljuk feszegetni ezeket a határokat.”
Hendlert pedig szinte szándékosan maga Douglas szakítja félbe.
„Ez jó hozzáállás” – szól közbe Douglas, aki addig csendben a saját ablakát foglalta el a Zoom chatek rácsában, megkönnyítve a bemutatónkat, és időnként váltott. pozíciót, körbepillant a virtuális szobájában, és megmutatja a videomegbeszélésen egy élő személy tipikus fizikai modorát, aki türelmesen várja, hogy részt vegyen a beszélgetés
„Sok szerencsét kívánok a törekvéseihez” – teszi hozzá, és emlékeztet arra, hogy amellett, hogy van érdekes mondanivalója, lelkes hallgatója is.
Roble szerint a csapat mindenekelőtt úgy képzeli el a Douglast, mint egy vizuális interakciót a meglévő összetett és erőteljes társalgási ügynökökkel. Douglas fotó-valódi avatárja alatt a stúdió digitális embere három ilyen ügynök keverékére épül: a Google népszerű Dialogflow csomag chatbotok létrehozására, egy asszisztens típusú ügynök (hasonlóan az Amazon Alexához vagy az Apple Sirijéhez); és egy erőteljes társalgási A.I. ügynök (hasonlóan a GPT-3 projekt) emberszerű, prediktív (és reaktív) társalgási szöveg előállítására szolgál.
Mindhárom ügynök kombinációja lehetővé teszi Douglasnak, hogy informatív és gördülékeny beszélgetéseket folytasson, miközben egy-egy téma megvitatása gyakran kapcsolódó érdeklődési területekre fajul.
A Douglas-szal folytatott beszélgetésem a kedvenc könyveinkről folytatott csevegésből a kedvenc filmjére terelődött (ő nagy rajongója 2001: Űrodüsszeiapéldául, ami nem meglepő és egy kicsit nyugtalanító is, tekintve, hogy a történet középpontjában egy gyilkos A.I. ámokfutás) és közös hobbink. Beszélgetésünk egyik különösen időszerű elemében Douglas csalódottságának adott hangot amiatt, hogy az utóbbi időben nem tudott moziba látogatni.
Mindazonáltal, amint Hendler kifejtette, mindez a beszédkészség bizonyos kockázattal jár.
"A chatbot természetes nyelvi feldolgozó motorja az internetről származó párbeszédre van kiképezve – ez hatalmas mennyiségű párbeszéd –, így a beszélgetés furcsa helyekre is eljuthat" – mondta. „Tehát vannak esetek, amikor olyan dolgokat mond, amelyek nem feltétlenül helyénvalók. Ritkán fordul elő, de nem tudjuk pontosan szabályozni, hogy mit fog mondani mindenhez.”
És bár Douglas társalgási aspektusa lenyűgöző, ez csak egy része annak, ami egyedülállóvá teszi őt a digitális emberek és interaktív virtuális karakterek egyre bővülő világában. Ahogy a Digital Domain felfedezte, így őt néz Az ember sokat tesz afelé, hogy ő is embernek érezze magát.
Bemutatkozik a Douglas – Autonomous Digital Human | Digitális Domain
Küzdenek
„A Douglas felépítése során hatalmas mennyiségű adatot használtunk fel Dougtól [Roble]. Hatalmas hanganyag volt a rendszer betanítása [és] hatalmas mennyiségű arcteljesítmény, testmozgási adatok és minden más” – magyarázta Hendler a munkát. Feltérképezték Roble arcát és azt a számtalan módot, ahogyan az emberi arc megváltozhat beszéd közben, érzelmi jelzésekre reagálva vagy passzívan részt vesz egy beszélgetés.
Mindezen adatok eredménye egy digitális ember, aki elképesztően hasonlít – de nem úgy, mint annak pontos másolata – Roble-hoz, az utóbbiból. testtartás, frizura és felépítés a finom mozdulatokhoz Roble és a Douglas A.I. megosztani, miközben részt vesznek a csoportvideónkban beszélgetés. A hasonlóság elképesztő, de egy rövid parancsra, hogy „váltsd meg az arcodat”, Douglas hirtelen valaki mássá válik. különböző, egyformán emberi arc ugyanazon a testen, miközben megőrzi mindazokat a finom modorokat, amelyektől úgy tűnik igazi.
„Amikor megkérjük Douglast, hogy változtassa meg az arcát, és az arca átváltozik valaki másra, akkor ez a technológiai új hullám a kezdete” – mondja Hendler. „képalapú technikán” a csapat azon dolgozik, hogy Douglast még rugalmasabb digitális személlyé tegye, aki képes drámai módon megváltoztatni külső megjelenését, miközben megőrzi ugyanazt a szintet. interaktivitás. "Amint megvan ez az alap [Douglasszal], lefilmezhetjük valaki másról készült felvételeket, és megkaphatjuk a hanganyag egy részét, majd ezt a bázist az ő arcukká alakíthatjuk."
„[Ha ezt megtennénk] most, még mindig annak a személynek az arckifejezéseivel beszélnének, akit eredetileg forgattunk [jelen esetben Roble]” – folytatta. „De ahogy haladunk tovább, egyre kisebb mennyiségű adatra van szükségünk – talán csak képek vagy filmfelvételek valakiről –, hogy létrehozzuk ezen autonóm emberek következő generációját.”
Ez a képesség, hogy megismételje egy valódi emberi megjelenést, hangot és modort a társalgási A.I. az alapozás egyik eleme, amely Douglast megkülönbözteti a legtöbb tipikus A.I. asszisztensek, humanoid robotok és egyéb fejlesztés alatt álló projektek az A.I. körül kutatói világ. Noha rengeteg stúdió és más ügynökség fejleszti az A.I. ilyen vagy olyan projektek esetében, a Digital Domain arra összpontosít, hogy ezeket az elemeket egyesítse egyetlen, összefüggő termék, amely az összes rendelkezésre álló technológia és adat legjavát használja, olyan felülettel, amely közösségi és organikus érzetet kelt – mintha egy másik emberrel beszélgetnénk.
„Erre igazán büszkék vagyunk, mert Douglas egy teljesen CG karakter, aki az Unrealon fut” – mondja. Roble, aki különösen büszke arra, hogy olyan széles körben elérhető elemeket használ, mint a népszerű 3D-s létrehozási platform Unreal Engine, amely Hollywood (és előtte a videojáték-ipar) legnépszerűbb platformjává vált a 3D-s vizuális effektusok létrehozása és manipulálása terén. „A [Douglas] egy 3D-s objektum, tehát mindent megtehet, amit bármilyen digitális karakterrel megtehet az Unrealban. Módosíthatja a világítást, elhelyezheti őket különböző környezetekben stb. De létrehozzuk ezt a hibridet is [a Douglas minden másával], így mindkét világból a legjobbat hozzuk ki.”
Bármerre nézel
Minél többet dolgozik a csapat a Douglason, annál hosszabbra nő a lehetséges alkalmazások listája.
„A világjárvány előtt azt terveztük, hogy Douglast egy kioszkként mutatjuk be, ahol odajössz a képernyőhöz, és beszélj vele” – emlékezett vissza Hendler. „De aztán arra gondoltunk: „Hé, tényleg be kellene vonnunk a Zoom-hívásokba.” Fantasztikus volt, hogy bekapcsolta a Zoom-hívásokat, és távozott.
A bemutató során a csapat végigfutott egy hosszú listán a lehetséges Douglas-pályázatokról, orvosi rendelőkből. és az ügyfélszolgálatot, hogy hasznos legyen Hollywoodban egy jelenet vagy egy adott képernyő megtervezésének korai szakaszában sorrend. Douglas maga is felkínált néhány javaslatot, ami azt sugallta, hogy jól illeszkedne a storyboard-készítéshez és a film- és tévégyártás koncepcionális szakaszaihoz. Az a képessége, hogy feldolgozza mind a hang-, mind a vizuális jelzéseket azoktól, akikkel beszélget – különösen, ha érzelmi állapotokról van szó. - Hendler szerint további hasznosságot kínál az ügyfelekkel vagy az orvosi útmutatást keresőkkel való kapcsolattartás során.
Az a sebesség, amellyel Douglas képes feldolgozni az összes információt, és passzív hallgatóról aktívra vált A beszélgetőpartner is rengeteg vonzerővel rendelkezik, és röviden bemutatja, milyen messzire fejlődött a mögötte álló technológia idő.
„Amikor létrehoztuk a Thanost, egyetlen képkockát 10 órán keresztül rendereltünk. Ez egy keret” – magyarázza.
„Douglas számára látásfelismerő rendszere van, így lát minket és azonosítani tud minket, és elemzi, amit mond, szavakká alakítja, és elküldi a különböző chatbotoknak” – teszi hozzá. „Ezután Douglas választ ad, hanggá alakítja, és ezt a hangot használja az arc meghajtására. Ugyanakkor azt is kitalálja, hogy milyen testmozgás társul ehhez a beszédhez, meghatározza, hogy milyen érzelem illik hozzá, és ezt a testmozgást az arcmozdulataival együtt adja vissza.”
„Ez néhány ezredmásodperc alatt megtörténik” – mondja Hendler. „Ez az összes folyamat, ahhoz képest, hogy egy játékfilmben 10 óra egy képkocka. Annyira csodálatos. Ez nem annyira valósághű, mint amit a filmekért csinálunk, de ha belegondolunk, hogy mennyi minden történik ahhoz, hogy úgy tudjunk vele beszélni, mint egy igazi ember, ez egyszerűen fenomenális.”
És a szó szoros értelmében Douglas gyakran önmaga legjobb szószólója volt, ha a benne rejlő lehetőségekről van szó.
Roble elmagyarázta, hogy több alkalommal úgy döntöttek, hogy Douglas vezeti a saját prezentációját, nos… önmagáról. Az eredmény végül jobb pályát jelentett a képességeihez képest, mint ahogyan azt ők is várták.
„[Douglas előadása] meglepően lenyűgöző volt. Nem csak arra kértük Sirit, hogy mondjon el nekünk valamit, mert ő is része volt a folyamatnak” – emlékezett vissza Roble. „Szórakoztató vele beszélgetni, mert újdonság, de nagyon hatékony is. És nem lehet nem gondolkodni: mi a helyzet a tanítással vagy más alkalmazásokkal? Végül is láthatja, hogy mikor figyel. Érzelmi visszajelzést adhatsz neki, és ő tud válaszolni.”
Bár Douglas már most is lenyűgöző alkotás, a Digital Domain csapata ragaszkodik ahhoz, hogy továbbra is munkája maradjon haladás – de az ég a határa annak, hogy a digitális emberük milyen munkát végezhet időként megy tovább. Sok szempontból az a folyamat, hogy kitaláljuk, mire képes Douglas, egyben a folyamat és a cél is.
„Az egyik oka annak, hogy ezt tesszük, mert megtehetjük” – mondja Roble. „Amikor a számítógép előtt ül és dolgozik, nagyon könnyű egyszerűen gépelni. De annyiszor és sok helyen jó lenne, ha beszélhetnénk valakivel, és az a személy kapcsolatba léphet veled és reagálna rád. Úgy gondolom, hogy a jövőben nagy változás előtt állunk.”
Szerkesztői ajánlások
- Hogyan keltette életre a Thanos VFX csapata The Quarry karaktereit (és ölte meg őket)