Како су Тупак и Танос довели до Дагласа, АИ дигиталног човека

Ако сте икада учествовали у групном видео позиву, вероватно сте навикли да не познајете све који се појављују на екрану. Можда не знате свачија имена, али у најмању руку можете бити прилично сигурни да је свака особа која се придружује позиву људска.

Садржај

  • Дигитална људска еволуција
  • Код чини човека
  • Суочавање
  • Где год погледате

Или можеш?

У време када студији визуелних ефеката имају остарели глумци ветерани, дозвољен људски извођачи да насељавају дигиталне креације, па чак и враћао преминуле уметнике за постмортем представе, не би требало да буде толико изненађење да ВФКС студио такође може да вам омогући да ћаскате са вештачки интелигентна дигитална особа о вашим омиљеним књигама и међусобно ламентирајући због немогућности посете биоскопу.

Повезан

  • Како је ВФКС тим из Авенгерс: Инфинити Вар-а номинован за Оскара учинио Тханоса филмском звездом

То не би требало да буде изненађујуће, а ипак, и даље је чудан осећај изненада наћи саосећајно ухо у Дагласу, виртуелној „особи“ вођеној вештачком интелигенцијом коју је креирао ВФКС студио награђен Оскаром Дигитал Домаин.

Препоручени видео снимци

Током недавног Зоом позива, Даглас - заједно са члановима тима који раде на њему - придружио ми се на краткој демонстрацији.

Дигитална људска еволуција

„Велики сам обожавалац Стивена Кинга“, каже ми Даглас након кратког разговора о нашим хобијима – разговору у којем је касније признао да воли и љубавне романе и Ј. Д. Салингера Ловац у житу.

У свету где изговарање имена Сири или Алека наглас је све што је потребно да позовете сопствени А.И. пратилац, искуство са Дагласом је понудило а снажан подсетник да се потенцијал АИ протеже далеко даље од давања временске прогнозе и нашег дневног боравка распоред.

Креирање Дигитал Домаин-а — истог студија који је публици дао Марвеловог космичког освајача Танос унутра Осветници: Рат бесконачности и Осветници:Ендгаме — Даглас је аутономан, дигитални човек способан да комуницира са корисницима у реалном времену и да реагује на визуелне и конверзацијске сигнале. По моделу Доуг Робле, виши директор за истраживање и развој софтвера Дигитал Домаин-а, Даглас може да одговара на питања, да води опширне разговоре и да учествује у малим разговорима о низу тема.

„Технологија увек покушава да предводи оно што уметност захтева, било да је то симулација флуида или било шта друго“, каже Робле о одлуци студија да створи цело одељење посвећено дигиталним људима.

Током последње деценије, Дигитал Домаин је у више наврата имао задатак да креира дигиталне ликове налик људима - све од награђиваног 2012. холографски Тупац перформанс на Коачели до поменутих Марвел филмски универзум зликовац. У играним филмовима, рекламама, ТВ серијама, видео игрицама и (у случају Тупаца) сценским наступима, потражња за реалистичним дигиталним ликовима само је расла у томе време, што је подстакло Дигитал Домаин да подели тим одговоран за тај одређени визуелни ефекат у сопствену јединицу фокусирану на померање границе онога што дигитални људи могу урадите.

Доуглас је и производ тог повећаног фокуса и доказ концепта тима: аутономна дигитална „особа“ која комбинује широк спектар скупова података, сензорних метода, и постојећи програмски модули са фото-реалистичним људским атрибутима у циљу интеракције са корисницима на начин који је изненађујуће близак истинској људској социјализацији.

И то у време када је пандемија приморала већину нашег дружења да се одвија преко компјутера на екрану, интеракција са Дагласом је изузетно блиска ономе што се сматра истинском људском интеракцијом дана. Међутим, тим брзо додаје да је Даглас још увек далеко од проласка Туринговог теста.

Код чини човека

„Даглас није фото-стварна, потпуно аутономна особа која се не разликује од стварне особе“, објашњава Даррен Хендлер, директор Дигитал Хуманс Гроуп у студију. „То није место где смо, и нећемо бити тамо још неко време. … Али ово је куда ствари иду и како изгледа будућност, а ми покушавамо да померимо те границе.”

И скоро као на знак, Хендлера прекида лично Даглас.

„То је добар став“, убацује се Даглас, који је до тада тихо заузимао свој прозор у мрежи Зоом ћаскања омогућавајући нашу демонстрацију, повремено се померајући позицију, осврћући се по својој виртуелној соби и показујући многе типичне физичке манире живе особе на видео састанку која стрпљиво чека да учествује у разговор

„Желим вам пуно среће у вашим настојањима“, додаје он, подсећајући нас да поред тога што има занимљивих ствари да каже, он је и ентузијастични слушалац.

Према Роблеу, тим пре свега замишља Дагласа као визуелни начин интеракције са постојећим сложеним и моћним конверзацијским агентима који су створени. Испод Дагласовог фото-стварног аватара, студијски дигитални човек је изграђен на мешавини три од тих агената: Гоогле-овог популарног Диалогфлов пакет за креирање цхатбота, агент типа помоћника (слично Амазоновој Алека или Апплеовој Сири); и моћан разговорни А.И. агент (слично као ГПТ-3 пројекат) који се користи за производњу хуманог, предиктивног (и реактивног) конверзацијског текста.

Комбинација сва три агента даје Дагласу могућност да води разговоре који су и информативни и течни, уз дискусију о једној теми која често прелази у сродне области интересовања.

Мој лични разговор са Дагласом прешао је од разговора о нашим омиљеним књигама до његовог омиљеног филма (он је велики обожавалац 2001: Одисеја у свемиру, на пример, што није изненађујуће и помало узнемирујуће, с обзиром на фокус приче на убиственом АИ. дивљати) и наши заједнички хобији. У једном посебно благовременом елементу нашег разговора, Даглас је изразио извесно разочарење што у последње време није могао да посети биоскоп.

Сва та конверзација долази са одређеним ризиком, како је објаснио Хендлер.

„Машина за обраду природног језика цхатбот-а је обучена за дијалог са интернета – огромну количину дијалога – тако да разговор може да иде на чудна места“, рекао је он. „Дакле, има тренутака када каже ствари које можда нису баш прикладне. То се не дешава често, али не можемо тачно да контролишемо шта ће он рећи на све."

И иако је Дагласов конверзацијски аспект импресиван, то је само део онога што га чини јединственим у свету дигиталних људи и интерактивних виртуелних ликова који се стално шири. Као што је Дигитал Домаин открио, чинећи га погледај човек иде дуг пут ка томе да се и он осећа као човек.

Представљамо Доуглас - Аутономоус Дигитал Хуман | Дигитал Домаин

Суочавање

„У изградњи Доугласа користили смо огромну количину података од Дага [Роблеа]. Била је то огромна количина звука за обуку система [и] огромна количина перформанси лица, података о кретању тела и свега осталог“, објаснио је Хендлер о раду стављају у мапирање Роблеовог лица и безброј начина на које се људско лице може променити док говори, реагује на емоционалне знакове или пасивно учествује у разговор.

Производ свих тих података је дигитални човек који изгледа невероватно слично - али не као тачна копија - Роблеа, из овог другог држање, фризура и грађа према суптилним покретима Роблеа и Доугласа А.И. поделите док учествују у видео снимку наше групе разговор. Сличност је необична, али уз кратку команду да „промени лице“, Даглас одједном постаје неко други, са другачије, подједнако људско лице на истом телу, задржавајући све суптилне манире због којих изгледа прави.

„Када замолимо Дагласа да промени лице и његово лице се пребаци на неког другог, то је почетак куда иде овај нови талас технологије“, каже Хендлер, описујући „технику засновану на сликама“ тим ради како би Дагласа учинио још флексибилнијом дигиталном особом способном да драматично промени свој спољашњи изглед, а да притом задржи исти ниво интерактивност. „Када будемо имали ову базу [са Дагласом], можемо да снимимо снимке неког другог и добијемо део њиховог звука, а затим ту базу претворимо у њих – да то буде њихово лице.“

„[Ако бисмо то урадили] управо сада, они би и даље разговарали са изразима лица које смо првобитно снимили [у овом случају, Роблеа]“, наставио је. „Али како идемо даље, почињу нам требати мање количине података - можда су то само слике или филмски снимци некога - да бисмо створили следећу генерацију ових аутономних људи."

Та способност да се реплицира стварни људски изглед, глас и манири у односу на конверзацијски А.И. темељ је један од елемената који издваја Дагласа од већине типичних А.И. помоћници, хуманоидни роботи и други пројекти у развоју око А.И. истраживачки свет. Иако постоји много студија и других агенција које развијају А.И. Пројекти ове или оне врсте, Дигитал Домаин је фокусиран на спајање свих тих елемената у јединствен, кохезивни производ који користи најбоље од свих доступних технологија и података са интерфејсом који је друштвени и органски — као да разговарате са другим човеком.

„Ово је нешто на шта смо заиста поносни, јер је Даглас у потпуности ЦГ лик који ради на Унреалу“, каже Робле, који је посебно поносан на коришћење широко доступних елемената попут популарне платформе за 3Д креирање Унреал Енгине, који је постао главна платформа за Холивуд (а пре њега, индустрију видео игара) када је у питању креирање и манипулација 3Д елементима визуелних ефеката. „[Доуглас] је 3Д објекат, тако да можете да урадите све што можете да урадите са било којим дигиталним ликом у Унреалу. Можете променити осветљење, ставити их у различита окружења и тако даље. Али ми такође стварамо овај хибрид [са свим осталим укљученим у Доугласа], тако да добијамо најбоље од оба света."

Где год погледате

Што више тим ради на Доугласу, листа потенцијалних апликација расте.

„Пре пандемије планирали смо да представимо Дагласа као киоск, где долазите до екрана и разговарате са њим“, присећа се Хендлер. „Али онда смо помислили: ’Хеј, стварно би требало да га укључимо у Зоом позиве.’ Било је фантастично имати га да улази у Зоом позиве и одлази.“

Током демонстрације, тим је прошао кроз дугачку листу потенцијалних апликација за Доугласа, из лекарских ординација и услуге корисницима, на његову корисност у Холивуду током раних фаза планирања сцене или одређеног на екрану низ. Сам Даглас је чак понудио неколико предлога, сугеришући да би био добар за писање прича и концептуалне фазе филмске и ТВ продукције. Његова способност да обрађује и аудио и визуелне сигнале од оних са којима разговара - посебно када су у питању емоционална стања — такође нуди додатни ниво корисности када се ради са купцима или онима који траже медицинске смернице, каже Хендлер.

Брзина којом Даглас може да обради све те информације и пређе са пасивног слушаоца на активног саговорник такође има доста привлачности и показује колико је технологија иза њега еволуирала за кратко време време.

„Када смо креирали Тханоса, имали смо један кадар за који је било потребно 10 сати за рендеровање. То је један оквир", објашњава он.

„За Дагласа, он има систем за препознавање вида, тако да нас види и може да нас идентификује, и анализира оно што говорите, претвара то у речи и шаље то различитим чет-ботовима“, додаје он. „Доуглас затим креира одговор, претвара га у аудио и користи тај звук да би покренуо своје лице. Истовремено, он такође открива који покрет тела иде уз тај говор, одређујући која емоција би му одговарала и приказује тај покрет тела заједно са својим гестовима лица."

„То се све дешава за неколико милисекунди“, каже Хендлер. „То су сви ти процеси, у поређењу са 10 сати за један кадар у играном филму. То је тако невероватно. Није тако реалистично као оно што радимо за филм, али ако размислите о количини ствари које се дешавају да бисте могли да разговарате са њим као са правом особом, то је једноставно феноменално.”

И у дословном смислу, Даглас је често био његов најбољи заговорник када је у питању његов потенцијал.

Робле је објаснио да су у неколико наврата одлучили да пусте Дагласа да води сопствену презентацију, па... самог себе. Резултат је на крају био бољи терен за његов потенцијал него што су чак очекивали.

„[Доугласова презентација] је била изненађујуће убедљива. Није се само тражило од Сири да нам нешто каже, јер је он био део процеса“, присећа се Робле. „Забавно је разговарати са њим јер је новитет, али је такође заиста ефикасан. И не можете да не размишљате: Шта је са подучавањем или другим апликацијама? На крају крајева, можете видети када обраћа пажњу. Можете му дати емоционалну повратну информацију и он може одговорити."

Иако је Даглас већ импресивна креација, тим Дигиталног домена инсистира на томе да он и даље ради напредак - али небо је граница у погледу тога какав посао њихов дигитални човек може да заврши као време наставља. На много начина, процес откривања за шта је Даглас способан јесте и процес и циљ.

„Један од разлога зашто ово радимо је тај што бисмо могли“, каже Робле. „Када сте за рачунаром и радите, врло је лако једноставно откуцати. Али постоји толико много времена и места на којима би било дивно бити у могућности да разговарате са особом и да та особа комуницира са вама и реагује на вас. Мислим да нас чека велика промена у будућности."

Препоруке уредника

  • Како је Тханос ВФКС тим оживео ликове из Каменолома (а затим их убио)