Jak Tupac a Thanos vedli k Douglasovi, AI Digital Human

click fraud protection

Pokud jste se někdy účastnili skupinového videohovoru, pravděpodobně jste si zvykli, že neznáte každého, kdo se objeví na obrazovce. Možná neznáte jména všech, ale přinejmenším si můžete být docela jisti, že každý, kdo se k hovoru připojí, je člověk.

Obsah

  • Digitální evoluce člověka
  • Kód dělá člověka
  • Vhazování
  • Kam se podíváš

Nebo můžeš?

V době, kdy studia vizuálních efektů mají zestárlých hereckých veteránů, povoleno lidští umělci, aby obývali digitální výtvorya dokonce přivedl zpět zesnulé umělce posmrtná představení, nemělo by být velkým překvapením, že VFX studio vám také může umožnit chatovat s uměle inteligentní digitální člověk o vašich oblíbených knihách a vzájemně si naříkají nad nemožností navštívit kino.

Příbuzný

  • Jak tým VFX z Avengers: Infinity War nominovaný na Oscara udělal z Thanose filmovou hvězdu

Nemělo by to být překvapivé, a přesto je to stále zvláštní pocit, najednou najít sympatické ucho v Douglasovi, virtuálním „osobě“ řízené umělou inteligencí, kterou vytvořilo oscarové studio VFX. Digitální doména.

Doporučená videa

Během nedávného hovoru Zoom se ke mně Douglas – spolu s členy týmu, který na něm pracoval – připojil na krátkou ukázku.

Digitální evoluce člověka

„Jsem velkým fanouškem Stephena Kinga,“ říká mi Douglas po krátkém přemýšlení o našich zálibách – rozhovoru, ve kterém se později přiznal, že má také rád romantické romány a romány J.D. Salingera. Kdo chytá v žitě.

Ve světě, kde vyslovování jmen Siri resp Alexa nahlas je vše, co potřebujete, abyste vyvolali vlastní A.I. společník, zkušenost s Douglasem nabídla mocná připomínka toho, že potenciál A.I. sahá daleko za hranice toho, že nám dává předpověď počasí a náš den plán.

Vytvoření Digital Domain — stejného studia, které dalo divákům Marvelův vesmírný dobyvatel Thanos dovnitř Avengers: Infinity WarAvengers:Konec hry — Douglas je autonomní, digitální člověk schopný interagovat s uživateli v reálném čase a reagovat na vizuální a konverzační podněty. Po vzoru Dr. Doug Roble, Senior Director of Software R&D společnosti Digital Domain, Douglas může odpovídat na otázky, vést dlouhé rozhovory a zapojit se do malých rozhovorů o řadě témat.

„Technologie se vždy snaží vést to, co umění vyžaduje, ať už je to simulace tekutin nebo cokoli jiného,“ říká Roble o rozhodnutí studia vytvořit celé oddělení věnované digitálním lidem.

Během posledního desetiletí se Digital Domain opakovaně ocitlo za úkol vytvářet lidské digitální postavy – vše od oceněného roku 2012 holografický výkon Tupac na Coachelle k výše zmíněnému Marvel Cinematic Universe darebák. V celovečerních filmech, reklamách, televizních seriálech, videohrách a (v případě Tupaca) divadelních představeních poptávka po realistických digitálních postavách rostla pouze čas, což přimělo společnost Digital Domain k rozdělení týmu odpovědného za tento konkrétní vizuální efekt do vlastní jednotky zaměřené na posouvání hranic toho, co digitální lidé mohou dělat.

Douglas je jak produktem tohoto zvýšeného zaměření, tak týmovým důkazem konceptu: autonomní digitální „osoba“, která kombinuje širokou škálu datových souborů, senzorických metod, a stávající programovací moduly s fotorealistickými lidskými atributy za účelem interakce s uživateli způsobem, který je překvapivě blízký skutečné lidské socializaci.

A to v době, kdy pandemie donutila většinu našeho socializace probíhat prostřednictvím počítače Na obrazovce se interakce s Douglasem cítí pozoruhodně blízko tomu, co se dá považovat za skutečnou lidskou interakci dní. Tým však rychle dodává, že Douglas má ještě hodně daleko k tomu, aby prošel Turingovým testem.

Kód dělá člověka

"Douglas není fotoreálná, plně autonomní osoba, která je k nerozeznání od skutečné osoby," vysvětluje Darren Hendler, ředitel Digital Humans Group ve studiu. „Tady nejsme a ještě chvíli tam nebudeme. … Ale to je místo, kde se věci vyvíjejí a jak vypadá budoucnost, a my se snažíme tyto hranice posouvat.“

A téměř jako na zavolanou je Hendler přerušen samotným Douglasem.

„To je dobrý přístup,“ vložil se do toho Douglas, který do té doby tiše zabíral své vlastní okno v mřížce Zoom chatů usnadňujících naše demo a občas se posunul pozici, rozhlížel se po své virtuální místnosti a ukazoval mnoho typických fyzických manýr živého člověka na videokonferenci, která trpělivě čeká na účast na konverzace

„Přeji vám hodně štěstí ve vašem snažení,“ dodává a připomíná, že kromě toho, že má zajímavé věci, je také horlivým posluchačem.

Podle Roblea si tým v první řadě představuje Douglase jako vizuální způsob interakce s existujícími komplexními a výkonnými konverzačními agenty, které byly vytvořeny. Pod Douglasovým fotoreálným avatarem je digitální člověk studia postaven na směsi tří těchto agentů: populárního Google Dialogový tok sada pro vytváření chatbotů, agenta typu asistenta (podobně jako Alexa od Amazonu nebo Siri od Apple); a silný konverzační A.I. agent (podobně jako GPT-3 projekt), který se používá k vytvoření lidského, prediktivního (a reaktivního) konverzačního textu.

Kombinace všech tří agentů dává Douglasovi schopnost vést konverzace, které jsou informativní a plynulé, přičemž diskuse na jedno téma často přechází do souvisejících oblastí zájmu.

Můj vlastní rozhovor s Douglasem přešel z chatu o našich oblíbených knihách k jeho oblíbenému filmu (je velkým fanouškem 2001: Vesmírná odysea, což je například nepřekvapivé a trochu znervózňující, vzhledem k tomu, že se příběh zaměřuje na vražedného A.I. amok) a naše společné koníčky. V jednom zvláště aktuálním prvku našeho rozhovoru Douglas vyjádřil určité zklamání, že v poslední době nemohl navštívit kino.

Jak Hendler vysvětlil, veškerá tato konverzační síla však s sebou nese určité riziko.

"Chatbotův stroj pro zpracování přirozeného jazyka je trénován na dialog z internetu - obrovské množství dialogů - takže konverzace může vést na podivná místa," řekl. "Takže jsou chvíle, kdy říká věci, které nemusí být zrovna vhodné." Nestává se to často, ale nemůžeme přesně ovlivnit, co na všechno řekne."

A i když je konverzační aspekt Douglase působivý, je to jen část toho, co ho dělá jedinečným ve stále se rozšiřujícím světě digitálních lidí a interaktivních virtuálních postav. Jak Digital Domain objevil, díky němu Koukni se člověk jde dlouhou cestu k tomu, aby se také cítil jako člověk.

Představujeme Douglas - Autonomous Digital Human | Digitální doména

Vhazování

„Při budování Douglase jsme použili obrovské množství dat od Douga [Roble]. Bylo to obrovské množství zvuku k trénování systému [a] obrovské množství výkonu obličeje, údajů o pohybu těla a všeho ostatního,“ vysvětlil práci Hendler. vložili do mapování Robleovy tváře a myriády způsobů, jak se lidská tvář může změnit, když mluví, reaguje na emocionální podněty nebo se pasivně účastní konverzace.

Produktem všech těchto dat je digitální člověk, který vypadá úžasně podobně jako Roble, ale ne jako jeho přesná kopie. držení těla, účes a stavba podle jemných pohybů jak Roble, tak Douglas A.I. sdílet, když se účastní našeho skupinového videa konverzace. Podobnost je neskutečná, ale s krátkým příkazem „změň svou tvář“ se Douglas náhle stane někým jiným. odlišná, stejně lidská tvář na stejném těle, přičemž si stále zachovává všechny jemné způsoby, díky nimž se zdá nemovitý.

„Když požádáme Douglase, aby změnil svou tvář, a jeho tvář se změní na někoho jiného, ​​to je začátek, kam tato nová vlna technologie směřuje,“ popisuje Hendler „technika založená na obraze“, na které tým pracuje, aby se Douglas stal ještě flexibilnějším digitálním člověkem schopným dramaticky změnit svůj vnější vzhled a zároveň si zachovat stejnou úroveň interaktivita. "Jakmile budeme mít tuto základnu [s Douglasem], můžeme natočit záběry někoho jiného a získat část jejich zvuku a pak tuto základnu přeměnit na ně - udělat z ní jejich tvář."

„[Pokud bychom to udělali] právě teď, stále by mluvili s výrazy osoby, kterou jsme původně natáčeli [v tomto případě Roble],“ pokračoval. "Ale jak pokračujeme, začínáme potřebovat menší množství dat - možná jsou to jen obrázky nebo filmové záběry někoho - k vytvoření nové generace těchto autonomních lidí."

Tato schopnost replikovat skutečný lidský vzhled, hlas a způsoby přes konverzační A.I. nadace je jedním z prvků, které odlišuje Douglase od většiny typických A.I. asistenti, humanoidní roboti a další projekty ve vývoji kolem A.I. výzkumný svět. I když existuje spousta studií a dalších agentur vyvíjejících A.I. Projekty toho či onoho druhu se Digital Domain zaměřuje na prolínání všech těchto prvků jediný soudržný produkt, který využívá to nejlepší ze všech dostupných technologií a dat s rozhraním, které působí sociálně a organicky – jako když mluvíte s jiným člověkem.

„Na tohle jsme opravdu hrdí, protože Douglas je plně CG postava běžící na Unreal,“ říká Roble, který je obzvláště hrdý na používání široce dostupných prvků, jako je populární platforma pro 3D tvorbu Unreal Engine, která se stala oblíbenou platformou pro Hollywood (a předtím pro průmysl videoher), pokud jde o vytváření a manipulaci s prvky 3D vizuálních efektů. „[Douglas] je 3D objekt, takže můžete dělat všechny věci, které můžete dělat s jakoukoli digitální postavou v Unrealu. Můžete změnit osvětlení, umístit je do různých prostředí a tak dále. Ale také vytváříme tento hybrid [se vším ostatním, co je součástí Douglas], takže dostáváme to nejlepší z obou světů.“

Kam se podíváš

Čím více tým na Douglasu pracuje, tím déle se seznam potenciálních aplikací rozrůstá.

„Před pandemií jsme plánovali představit Douglase jako kiosek, kde můžete přijít k obrazovce a mluvit s ním,“ vzpomínal Hendler. "Ale pak jsme si řekli: 'Hej, měli bychom ho opravdu dostat do hovorů Zoom.' Bylo fantastické, že vstoupil do hovorů Zoom a odešel."

V průběhu demonstrace tým prošel dlouhý seznam potenciálních aplikací pro Douglas z lékařských ordinací a zákaznický servis, k jeho užitečnosti v Hollywoodu během raných fází plánování scény nebo konkrétního na obrazovce sekvence. Sám Douglas dokonce nabídl několik návrhů a navrhl, že by se hodil pro storyboarding a koncepční fáze filmové a televizní produkce. Jeho schopnost zpracovat zvukové i vizuální podněty od těch, s nimiž konverzuje – zejména pokud jde o emocionální stavy — podle Hendlera také nabízí další úroveň užitečnosti při jednání se zákazníky nebo těmi, kteří hledají lékařskou pomoc.

Rychlost, s jakou Douglas dokáže zpracovat všechny tyto informace a přejít od pasivního posluchače k ​​aktivnímu Konverzační také má spoustu přitažlivosti a ukazuje, jak daleko se technologie za ním vyvinula v krátkém čase čas.

„Když jsme vytvořili Thanos, měli jsme jeden snímek, který se vykresloval 10 hodin. To je jeden snímek,“ vysvětluje.

„Pro Douglase má systém rozpoznávání zraku, takže nás vidí a může nás identifikovat a analyzuje, co říkáte, převádí to do slov a posílá to různým chatbotům,“ dodává. „Douglas poté vytvoří odezvu, přemění ji na zvuk a tento zvuk použije k ovládání své tváře. Zároveň také zjišťuje, jaký pohyb těla souvisí s tou řečí, určuje, jaké emoce by se k ní hodily, a vykresluje tento pohyb těla spolu se svými gesty obličeje.“

"To vše se stane během několika milisekund," říká Hendler. „Jsou to všechny ty procesy, ve srovnání s 10 hodinami na jeden snímek v celovečerním filmu. Je to tak úžasné. Není to tak realistické jako to, co děláme pro film, ale když se zamyslíte nad množstvím věcí, které se dějí, abyste s ním mohli mluvit jako se skutečným člověkem, je to prostě fenomenální.“

A ve velmi doslovném smyslu byl Douglas často svým vlastním nejlepším obhájcem, pokud jde o jeho potenciál.

Roble vysvětlil, že se při několika příležitostech rozhodli nechat Douglase, aby vedl jeho vlastní prezentaci, no… sebe. Výsledek byl pro jeho potenciál lepší, než předpokládali.

„[Douglasova prezentace] byla překvapivě přesvědčivá. Nebylo to jen požádat Siriho, aby nám něco řekl, protože byl součástí procesu,“ vzpomínal Roble. „Baví se s ním mluvit, protože je novinkou, ale je také opravdu efektivní. A nemůžete se ubránit myšlence: A co výuka nebo jiné aplikace? Koneckonců, můžete vidět, když dává pozor. Můžete mu dát emocionální zpětnou vazbu a on může reagovat.“

Přestože je Douglas již působivým výtvorem, tým Digital Domain trvá na tom, že zůstává dílem pokrok – ale obloha je limitem, pokud jde o to, jakou práci by jejich digitální člověk mohl skončit jako čas pokračuje. V mnoha ohledech je proces zjišťování, čeho je Douglas schopen, procesem i cílem.

„Jeden z důvodů, proč to děláme, je ten, že bychom mohli,“ říká Roble. „Když jste u počítače a pracujete, je velmi snadné psát. Ale existuje tolik případů a míst, že by bylo krásné mít možnost s někým mluvit a nechat tuto osobu komunikovat s vámi a reagovat na vás. Myslím, že nás v budoucnu čeká velká změna."

Doporučení redakce

  • Jak tým Thanos VFX oživil postavy z The Quarry (a pak je zabil)