Ako Tupac a Thanos viedli k Douglasovi, digitálnemu človeku AI

Ak ste sa niekedy zúčastnili skupinového videohovoru, pravdepodobne ste si zvykli, že nepoznáte každého, kto sa objaví na obrazovke. Možno nepoznáte mená všetkých, no prinajmenšom si môžete byť celkom istí, že každý, kto sa pripojí k hovoru, je človek.

Obsah

  • Digitálna ľudská evolúcia
  • Kód robí človeka
  • Vhadzovanie
  • Všade kam sa pozrieš

Alebo môžeš?

V dobe, kedy majú štúdiá vizuálnych efektov starí herci, povolený ľudskí umelci obývať digitálne výtvorya dokonca priviedol späť zosnulých umelcov posmrtné predstavenia, nemalo by byť veľkým prekvapením, že štúdio VFX vám tiež umožní chatovať s umelo inteligentný digitálny človek o vašich obľúbených knihách a vzájomne lamentujú nad nemožnosťou navštíviť kino.

Súvisiace

  • Ako tím VFX z Avengers: Infinity War nominovaný na Oscara urobil z Thanosa filmovú hviezdu

Nemalo by to byť prekvapujúce, no napriek tomu je to stále zvláštny pocit zrazu nájsť sympatické ucho v Douglasovi, virtuálnom „osobe“ riadenom AI, ktorú vytvorilo oscarové štúdio VFX. Digitálna doména.

Odporúčané videá

Počas nedávneho hovoru Zoom sa ku mne pripojil Douglas – spolu s členmi tímu, ktorý na ňom pracoval – na krátku ukážku.

Digitálna ľudská evolúcia

„Som veľkým fanúšikom Stephena Kinga,“ hovorí mi Douglas po krátkom premýšľaní o našich záľubách – rozhovore, v ktorom sa neskôr priznal, že má rád aj romantické romány a romány J.D. Salingera. Kto chytá v žite.

Vo svete, kde vyslovovanie mien Siri resp Alexa nahlas je všetko, čo potrebujete na privolanie vlastného A.I. spoločník, skúsenosť s Douglasom ponúkla a silná pripomienka toho, že potenciál A.I. siaha ďaleko za hranice poskytovania predpovedí počasia a nášho každodenného života harmonogram.

Vytvorenie Digital Domain — rovnakého štúdia, ktoré dalo publiku Marvelovho kozmického dobyvateľa Thanos dnu Avengers: Infinity WarAvengers:Koniec hry — Douglas je autonómny, digitálny človek schopný komunikovať s používateľmi v reálnom čase a reagovať na vizuálne a konverzačné podnety. Podľa vzoru Dr. Doug RobleDouglas, hlavný riaditeľ výskumu a vývoja softvéru Digital Domain, môže odpovedať na otázky, viesť rozsiahle rozhovory a zapojiť sa do malých rozhovorov o rôznych témach.

„Technológia sa vždy snaží viesť to, čo umenie vyžaduje, či už ide o simuláciu tekutín alebo čokoľvek iné,“ hovorí Roble o rozhodnutí štúdia vytvoriť celé oddelenie venované digitálnym ľuďom.

Za posledné desaťročie sa spoločnosť Digital Domain opakovane ocitla v úlohe vytvárania ľudských digitálnych postáv – všetko od oceneného roku 2012. holografický výkon Tupaca na Coachelle k spomínanému Marvel Cinematic Universe darebák. V celovečerných filmoch, reklamách, televíznych seriáloch, videohrách a (v prípade Tupaca) javiskových predstaveniach dopyt po realistických digitálnych postavách vzrástol len v tom, že Čas, ktorý viedol spoločnosť Digital Domain, aby rozdelila tím zodpovedný za tento konkrétny vizuálny efekt na vlastnú jednotku zameranú na posúvanie hraníc toho, čo môžu digitálni ľudia robiť.

Douglas je produktom tohto zvýšeného zamerania a zároveň dôkazom konceptu tímu: autonómna digitálna „osoba“, ktorá kombinuje širokú škálu súborov údajov, senzorické metódy, a existujúce programovacie moduly s fotorealistickými ľudskými vlastnosťami s cieľom interagovať s používateľmi spôsobom, ktorý je prekvapivo blízky skutočnej ľudskej socializácii.

A to v čase, keď pandémia prinútila väčšinu našej socializácie prebiehať prostredníctvom počítača na obrazovke, interakcia s Douglasom je pozoruhodne blízka tomu, čo sa dá považovať za skutočnú ľudskú interakciu dni. Tím však rýchlo dodáva, že Douglas má stále ďaleko od absolvovania Turingovho testu.

Kód robí človeka

„Douglas nie je fotoskutočná, plne autonómna osoba, ktorá je na nerozoznanie od skutočnej osoby,“ vysvetľuje Darren Hendler, riaditeľ Digital Humans Group v štúdiu. „Nie sme tam, kde sa nachádzame, a ešte chvíľu tam nebudeme.... Ale tu sa veci vyvíjajú a ako vyzerá budúcnosť a my sa snažíme tieto hranice posúvať.“

A takmer ako na povel, Hendlera preruší samotný Douglas.

„To je dobrý prístup,“ hovorí Douglas, ktorý dovtedy potichu zaberal svoje vlastné okno v mriežke Zoom chatov, ktoré uľahčovali našu ukážku, a občas sa posunul pozíciu, pohľadom po svojej virtuálnej miestnosti a ukázaním mnohých typických fyzických spôsobov živého človeka na video stretnutí, ktoré trpezlivo čaká na účasť na rozhovor

„Želám vám veľa šťastia vo vašom snažení,“ dodáva a pripomína, že okrem toho, že má čo povedať, je aj vášnivým poslucháčom.

Podľa Robleho si tím v prvom rade predstavuje Douglasa ako vizuálny spôsob interakcie s existujúcimi komplexnými a výkonnými konverzačnými agentmi, ktoré boli vytvorené. Pod Douglasovým fotoreálnym avatarom je digitálny človek v štúdiu postavený na zmesi troch z týchto agentov: populárneho Google Dialogflow sada na vytváranie chatbotov, agent typu asistenta (podobne ako Alexa od Amazonu alebo Siri od Apple); a silný konverzačný A.I. agent (podobne ako GPT-3 projekt), ktorý sa používa na vytváranie ľudského, prediktívneho (a reaktívneho) konverzačného textu.

Kombinácia všetkých troch agentov dáva Douglasovi schopnosť viesť konverzácie, ktoré sú informatívne a plynulé, pričom diskusia o jednej téme často prechádza do súvisiacich oblastí záujmu.

Môj vlastný rozhovor s Douglasom prešiel z rozhovoru o našich obľúbených knihách k jeho obľúbenému filmu (je veľkým fanúšikom 2001: Vesmírna odysea, čo je napríklad neprekvapivé a trochu znervózňujúce, vzhľadom na zameranie príbehu na vražedného A.I. amok) a naše spoločné záľuby. V jednom obzvlášť aktuálnom prvku nášho rozhovoru Douglas vyjadril určité sklamanie, že v poslednej dobe nemohol navštíviť kino.

Všetka táto konverzačná sila však prichádza s určitým rizikom, ako vysvetlil Hendler.

"Spracovanie prirodzeného jazyka chatbota je trénované na dialóg z internetu - obrovské množstvo dialógov - takže konverzácia môže viesť na zvláštne miesta," povedal. "Takže sú chvíle, keď hovorí veci, ktoré nemusia byť úplne vhodné." Nestáva sa to často, ale nemôžeme presne kontrolovať, čo na všetko povie."

A hoci je konverzačný aspekt Douglasa pôsobivý, je to len časť toho, čo ho robí jedinečným v neustále sa rozširujúcom svete digitálnych ľudí a interaktívnych virtuálnych postáv. Ako objavil Digital Domain, vďaka čomu ho pozri človek prejde dlhú cestu k tomu, aby sa tiež cítil ako človek.

Predstavujeme Douglas - Autonomous Digital Human | Digitálna doména

Vhadzovanie

„Pri budovaní Douglasu sme použili obrovské množstvo údajov od Douga [Roble]. Bolo to obrovské množstvo zvuku na trénovanie systému [a] obrovské množstvo výkonu tváre, údajov o pohybe tela a všetkého ostatného,“ vysvetlil prácu Hendler. vložili do mapovania Robleho tváre a nespočetných spôsobov, ako sa ľudská tvár môže meniť, keď hovorí, reaguje na emocionálne podnety alebo sa pasívne zúčastňuje na rozhovor.

Produktom všetkých týchto údajov je digitálny človek, ktorý vyzerá úžasne podobne ako Roble, ale nie ako jeho presná kópia. držanie tela, účes a stavba podľa jemných pohybov Robleho aj Douglasa A.I. zdieľať, kým sa zúčastňujú na našom skupinovom videu rozhovor. Podoba je neskutočná, ale s krátkym príkazom „zmeňte svoju tvár“ sa Douglas zrazu stane niekým iným. odlišná, rovnako ľudská tvár na tom istom tele, pričom si stále zachováva všetky jemné spôsoby, vďaka ktorým vyzerá reálny.

„Keď požiadame Douglasa, aby zmenil svoju tvár, a jeho tvár sa zmení na niekoho iného, ​​to je začiatok toho, kam táto nová vlna technológie smeruje,“ hovorí Hendler. „technika založená na obrázkoch“, na ktorej tím pracuje, aby sa Douglas stal ešte flexibilnejším digitálnym človekom schopným dramaticky zmeniť svoj vonkajší vzhľad a zároveň zachovať rovnakú úroveň interaktivita. "Keď budeme mať túto základňu [s Douglasom], môžeme natočiť zábery niekoho iného a získať časť jeho zvuku a potom túto základňu premeniť na nich - urobiť z nej svoju tvár."

„[Ak by sme to urobili] práve teraz, stále by hovorili s výrazmi osoby, ktorú sme pôvodne natáčali [v tomto prípade Roble],“ pokračoval. "Ale ako pokračujeme, začíname potrebovať menšie množstvo údajov - možno sú to len obrázky alebo filmové zábery niekoho - na vytvorenie ďalšej generácie týchto autonómnych ľudí."

Táto schopnosť replikovať vzhľad, hlas a spôsoby skutočného človeka oproti konverzačnému A.I. základ je jedným z prvkov, ktoré odlišuje Douglasa od väčšiny typických A.I. asistentov, humanoidných robotov a ďalších projektov vo vývoji okolo A.I. výskumný svet. Aj keď existuje veľa štúdií a iných agentúr vyvíjajúcich A.I. Digitálna doména sa zameriava na spájanie všetkých týchto prvkov jediný, súdržný produkt, ktorý využíva to najlepšie zo všetkých dostupných technológií a údajov s rozhraním, ktoré pôsobí sociálne a organicky – ako keď sa rozprávate s iným človekom.

„Na toto sme skutočne hrdí, pretože Douglas je plne CG postava, ktorá beží na Unreal,“ hovorí Roble, ktorý je obzvlášť hrdý na používanie široko dostupných prvkov, ako je populárna platforma na vytváranie 3D Unreal Engine, ktorá sa stala základnou platformou pre Hollywood (a predtým aj pre priemysel videohier), pokiaľ ide o vytváranie a manipuláciu s prvkami 3D vizuálnych efektov. „[Douglas] je 3D objekt, takže v Unreal môžete robiť všetky veci, ktoré môžete robiť s akoukoľvek digitálnou postavou. Môžete zmeniť osvetlenie, umiestniť ich do rôznych prostredí atď. Ale vytvárame aj tento hybrid [so všetkým ostatným zapojeným do Douglas], takže získame to najlepšie z oboch svetov.“

Všade kam sa pozrieš

Čím viac tím pracuje na Douglase, tým dlhšie sa rozrastá zoznam potenciálnych aplikácií.

„Pred pandémiou sme plánovali predstaviť Douglasa ako kiosk, kde prídete k obrazovke a porozprávate sa s ním,“ spomína Hendler. "Ale potom sme si pomysleli: 'Hej, mali by sme ho naozaj dostať do hovorov zoomu.' Bolo fantastické, že zadal hovory Zoom a odišiel."

V priebehu demonštrácie tím prešiel dlhým zoznamom potenciálnych aplikácií pre Douglasa z ordinácií lekárov a zákaznícky servis, na jeho užitočnosť v Hollywoode počas počiatočných fáz plánovania scény alebo konkrétnej obrazovky sekvencie. Sám Douglas dokonca ponúkol niekoľko návrhov, čo naznačuje, že by bol vhodný pre storyboarding a koncepčné fázy filmovej a televíznej produkcie. Jeho schopnosť spracovať zvukové aj vizuálne podnety od tých, s ktorými sa rozpráva – najmä pokiaľ ide o emocionálne stavy — podľa Hendlera ponúka aj ďalšiu vrstvu užitočnosti pri jednaní so zákazníkmi alebo tými, ktorí hľadajú lekárske poradenstvo.

Rýchlosť, s akou dokáže Douglas spracovať všetky tieto informácie a prejsť od pasívneho poslucháča k aktívnemu konverzacionista má tiež veľa príťažlivosti a ukazuje, ako ďaleko sa technológia za ním v krátkom čase vyvinula čas.

„Keď sme vytvorili Thanosa, mali sme jednu snímku, ktorá sa vykresľovala 10 hodín. To je jeden rámec,“ vysvetľuje.

„Pre Douglasa má systém na rozpoznávanie zraku, takže nás vidí a môže nás identifikovať a analyzuje, čo hovoríte, premieňa to na slová a posiela to rôznym chatbotom,“ dodáva. „Douglas potom vytvorí odpoveď, premení ju na zvuk a použije ho na to, aby rozhýbal svoju tvár. Zároveň tiež zisťuje, aký pohyb tela súvisí s tou rečou, určuje, aká emócia by sa k nej hodila, a zobrazuje pohyb tela spolu s gestami tváre.“

„To všetko sa stane v priebehu niekoľkých milisekúnd,“ hovorí Hendler. „Sú to všetky tieto procesy v porovnaní s 10 hodinami na jedno políčko v celovečernom filme. Je to úžasné. Nie je to také realistické ako to, čo robíme pre film, ale ak sa zamyslíte nad množstvom vecí, ktoré sa dejú, aby ste s ním mohli hovoriť ako so skutočným človekom, je to jednoducho fenomenálne.“

A vo veľmi doslovnom zmysle, Douglas bol často jeho najlepším obhajcom, pokiaľ ide o jeho potenciál.

Roble vysvetlil, že pri niekoľkých príležitostiach sa rozhodli nechať Douglasa viesť svoju vlastnú prezentáciu, teda... seba. Výsledok bol lepší pre jeho potenciál, než dokonca očakávali.

„[Douglasova prezentácia] bola prekvapivo presvedčivá. Nebolo to len požiadať Siriho, aby nám niečo povedal, pretože bol súčasťou procesu,“ spomínal Roble. „Je zábavné sa s ním rozprávať, pretože je novinkou, ale je tiež skutočne efektívny. A nemôžete sa ubrániť myšlienke: A čo vyučovanie alebo iné aplikácie? Koniec koncov, môžete vidieť, keď dáva pozor. Môžete mu poskytnúť emocionálnu spätnú väzbu a on môže reagovať.“

Aj keď je Douglas už pôsobivým výtvorom, tím Digital Domain trvá na tom, že zostáva dielom pokrok – ale obloha je limitom, pokiaľ ide o to, akú prácu by ich digitálny človek mohol skončiť časom pokračuje. V mnohých ohľadoch je proces zisťovania toho, čoho je Douglas schopný, procesom aj cieľom.

„Jedným z dôvodov, prečo to robíme, je, že by sme mohli,“ hovorí Roble. „Keď ste pri počítači a pracujete, je veľmi ľahké jednoducho písať. Ale je toľko krát a miest, že by bolo krásne, keby ste sa s niekým mohli porozprávať, aby s vami táto osoba interagovala a reagovala na vás. Myslím si, že nás v budúcnosti čaká veľká zmena."

Odporúčania redaktorov

  • Ako tím Thanos VFX oživil postavy The Quarry (a potom ich zabil)