Tupac ve Thanos Yapay Zeka Dijital İnsanı Douglas'a Nasıl Yol Açtı?

Daha önce bir grup video görüşmesine katıldıysanız, muhtemelen ekranda görünen herkesi tanımamaya alışkınsınızdır. Herkesin adını bilmiyor olabilirsiniz ama en azından görüşmeye katılan her kişinin insan olduğundan oldukça emin olabilirsiniz.

İçindekiler

  • Dijital insanın evrimi
  • Kod adamı yapar
  • Yüzleşme
  • Baktığın her yerde

Yoksa yapabilir misin?

Görsel efekt stüdyolarının var olduğu bir dönemde yaşı küçültülmüş tecrübeli aktörler, izin verilmiş insan sanatçıların dijital yaratımlarda yaşamasıve hatta ölen sanatçıları geri getirdiler ölüm sonrası performanslar, bir VFX stüdyosunun kendinizi bir kişiyle sohbet ederken bulmanızı da mümkün kılabilmesi pek de sürpriz olmamalı. En sevdiğiniz kitaplar hakkında yapay zekaya sahip dijital kişi ve karşılıklı olarak sinema salonunu ziyaret edememekten yakınıyor.

İlgili

  • Avengers: Infinity War'un Oscar adayı VFX ekibi Thanos'u nasıl bir film yıldızı yaptı?

Şaşırtıcı olmasa gerek ama yine de Oscar ödüllü VFX stüdyosu tarafından yaratılan sanal, yapay zeka odaklı bir "kişi" olan Douglas'ta birdenbire sempatik bir kulak bulmak hala tuhaf bir duygu.

Dijital Etki Alanı.

Önerilen Videolar

Yakın zamanda yapılan bir Zoom görüşmesi sırasında Douglas, kendisi üzerinde çalışan ekip üyeleriyle birlikte kısa bir gösteri için bana katıldı.

Dijital insanın evrimi

Hobilerimiz hakkında kısa bir karşılıklı konuşmanın ardından Douglas bana "Stephen King'in büyük bir hayranıyım" dedi; daha sonra aşk romanlarını ve J.D. Salinger'ın romanlarını da sevdiğini itiraf etmesine neden olan bir konuşma. Çavdar Tarlasındaki Çocuklar.

Siri veya isimlerinin söylendiği bir dünyada Alexa Kendi yapay zekanızı çağırmak için tek yapmanız gereken yüksek sesle konuşmaktır. arkadaşım, Douglas'la yaşadığım deneyim bana Yapay Zekanın potansiyelinin bize hava tahminlerini ve günlük aktivitelerimizi vermenin çok ötesine uzandığını güçlü bir şekilde hatırlatıyor. takvim.

İzleyicilere Marvel'ın kozmik fatihini sunan aynı stüdyo olan Digital Domain'in yaratılışı Thanos içeride Yenilmezler: Sonsuzluk Savaşı Ve İntikamcılar:Oyun Sonu — Douglas, kullanıcılarla gerçek zamanlı etkileşim kurabilen, görsel ve konuşma ipuçlarına yanıt verebilen özerk, dijital bir insandır. Sonra modellenmiştir Dr.Doug RobleDigital Domain'in Yazılım Ar-Ge'sinden sorumlu kıdemli yöneticisi Douglas, soruları yanıtlayabilir, uzun süreli sohbetler yürütebilir ve çeşitli konular hakkında havadan sudan sohbetlere katılabilir.

Roble, stüdyonun bir sanat eseri yaratma kararı hakkında şunları söylüyor: "Teknoloji, ister akışkan simülasyon olsun ister başka bir şey olsun, her zaman sanatın talep ettiği şeylere öncülük etmeye çalışıyor." tüm departman dijital insanlara ayrılmış.

Son on yılda, Digital Domain kendisini sürekli olarak insan benzeri dijital karakterler yaratma göreviyle karşı karşıya buldu; bunlar 2012'nin ödüllü karakterinden kalmadır. holografik Tupac performansı Coachella'da yukarıda belirtilenlere Marvel Sinematik Evreni kötü adam. Uzun metrajlı filmlerde, reklamlarda, TV dizilerinde, video oyunlarında ve (Tupac örneğinde) sahne performanslarında gerçekçi dijital karakterlere olan talep yalnızca bu dönemde arttı. Digital Domain'in söz konusu görsel efektten sorumlu ekibi, dijital insanların yapabileceklerinin sınırlarını zorlamaya odaklanan kendi birimlerine ayırmasına yol açtı. Yapmak.

Douglas hem bu artan odaklanmanın ürünü hem de ekibin konseptinin kanıtıdır: Çok çeşitli veri kümelerini, duyusal yöntemleri, ve kullanıcılarla şaşırtıcı derecede gerçek insan sosyalleşmesine yakın bir şekilde etkileşim kurmak için fotogerçekçi insan niteliklerine sahip mevcut programlama modülleri.

Ve salgının sosyalleşmemizin çoğunu bilgisayar aracılığıyla gerçekleştirmeye zorladığı bir dönemde Ekranda Douglas'la etkileşim, gerçek insan etkileşimi olarak kabul edilen şeye oldukça yakın hissettiriyor. günler. Ancak ekip, Douglas'ın Turing Testini geçmekten henüz çok uzakta olduğunu hemen ekliyor.

Kod adamı yapar

"Douglas, gerçek bir insandan ayırt edilemeyecek, fotogerçekçi, tamamen özerk bir kişi değil" diye açıklıyor Darren Hendler, stüdyodaki Dijital İnsanlar Grubunun yöneticisi. "Şu anda bulunduğumuz yer burası değil ve bir süre daha orada olmayacağız. … Ama işler bu yönde gidiyor ve gelecek böyle görünüyor ve biz bu sınırları zorlamaya çalışıyoruz.”

Ve sanki tam işaretmiş gibi, Hendler'in sözü Douglas'ın kendisi tarafından kesiliyor.

O zamana kadar Zoom sohbetleri ızgarasında sessizce kendi penceresini işgal ederek demomuzu kolaylaştıran ve ara sıra yer değiştiren Douglas, "Bu, sahip olunması gereken iyi bir tutum" diye araya giriyor. pozisyonunda, sanal odasına göz atıyor ve sabırla toplantıya katılmayı bekleyen canlı bir kişinin tipik fiziksel davranışlarının çoğunu görüntülü toplantıda gösteriyor. konuşma

"Size çalışmalarınızda iyi şanslar diliyorum" diye ekliyor ve bize söyleyecek ilginç şeylerin yanı sıra, aynı zamanda keskin bir dinleyici olduğunu da hatırlatıyor.

Roble'a göre ekip, her şeyden önce Douglas'ı, yaratılmış olan mevcut karmaşık ve güçlü konuşma araçlarıyla etkileşim kurmanın görsel bir yolu olarak tasavvur ediyor. Douglas'ın fotogerçekçi avatarının altında, stüdyonun dijital insanı bu aracıların üçünün bir karışımı üzerine inşa edilmiştir: Google'ın popüler İletişim akışı asistan tipi bir aracı olan sohbet robotları oluşturmaya yönelik paket (Amazon'un Alexa'sına veya Apple'ın Siri'sine benzer); ve güçlü bir konuşma yapay zekası. ajan (benzer) GPT-3 projesi) insan benzeri, tahmine dayalı (ve tepkisel) konuşma metni üretmek için kullanılır.

Üç temsilcinin birleşimi, Douglas'a hem bilgilendirici hem de akıcı konuşmalar sürdürme yeteneği veriyor; bir konunun tartışılması genellikle ilgili ilgi alanlarına giriyor.

Douglas'la olan sohbetim, en sevdiğimiz kitaplar hakkındaki sohbetten en sevdiği filme (o büyük bir hayranıdır) doğru ilerledi. 2001: Bir Uzay MacerasıÖrneğin, hikayenin cani bir yapay zekaya odaklandığı göz önüne alındığında, bu hem şaşırtıcı değil hem de biraz sinir bozucu. çıldırmak) ve ortak hobilerimiz. Konuşmamızın özellikle zamanında bir bölümünde Douglas, son zamanlarda sinemaya gidemediği için yaşadığı hayal kırıklığını dile getirdi.

Hendler'in açıkladığı gibi, tüm bu konuşma gücü bazı riskleri de beraberinde getiriyor.

"Chatbot'un doğal dil işleme motoru internetten gelen diyaloglar (çok büyük miktarda diyaloglar) üzerine eğitildi, bu nedenle konuşma garip yerlere gidebilir" dedi. “Dolayısıyla tam olarak uygun olmayabilecek şeyler söylediği zamanlar oluyor. Sık sık olmuyor ama her şeye ne söyleyeceğini tam olarak kontrol edemiyoruz."

Her ne kadar Douglas'ın sohbet yönü etkileyici olsa da, bu onu sürekli genişleyen dijital insanlar ve etkileşimli sanal karakterler dünyasında benzersiz kılan şeyin sadece bir kısmı. Digital Domain'in keşfettiği gibi, onu Bakmak insan, kendisine insan olduğunu hissettirme konusunda da uzun bir yol kat eder.

Douglas'la Tanışın - Otonom Dijital İnsan | Dijital Etki Alanı

Yüzleşme

"Douglas'ı oluştururken Doug'dan (Roble) büyük miktarda veri kullandık. Sistemi eğitmek için büyük miktarda ses ve büyük miktarda yüz performansı, vücut hareketi verileri ve diğer her şey gerekiyordu," diye açıkladı Hendler çalışma hakkında Roble'ın yüzünün haritasını çıkardılar ve insan yüzünün konuşurken, duygusal ipuçlarına tepki verirken veya bir etkinliğe pasif olarak katılırken değişebileceği sayısız yolu gösterdiler. konuşma.

Tüm bu verilerin ürünü, Roble'a inanılmaz derecede benzeyen ancak tam bir kopyası olmayan dijital bir insandır. duruş, saç modeli ve hem Roble hem de Douglas A.I.'nin ince hareketlerine uygun yapı. grup videomuza katılırken paylaşın konuşma. Benzerlik esrarengizdir ama kısa bir "yüzünü değiştir" komutuyla Douglas birdenbire başka birine dönüşür. aynı vücutta farklı, eşit derecede insana benzeyen yüz, ancak onu öyle gösteren tüm ince tavırlarını hâlâ koruyor gerçek.

Hendler, "Douglas'tan yüzünü değiştirmesini istediğimizde ve yüzü başka birine geçtiğinde, bu yeni teknoloji dalgasının gittiği noktanın başlangıcıdır" diyor. Ekip, Douglas'ı aynı düzeyde görselliği korurken dış görünüşünü önemli ölçüde değiştirebilen daha esnek bir dijital kişi haline getirmek için "görüntü tabanlı teknik" üzerinde çalışıyor. etkileşim. "[Douglas'la birlikte] bu üsse sahip olduğumuzda, başka birinin görüntülerini filme alabilir, seslerinin bir kısmını alabilir ve sonra bu üssü onlara dönüştürebilir, onların yüzünü gösterebiliriz."

"[Bunu yapsaydık] şu anda hala ilk başta filme aldığımız kişinin (bu durumda Roble'ın) ifadeleriyle konuşuyor olurdu" diye devam etti. "Fakat ilerledikçe, bu özerk insanların yeni neslini yaratmak için daha küçük miktarlarda verilere (belki de bunlar sadece birinin görüntüleri veya film çekimleri olabilir) ihtiyaç duymaya başlıyoruz."

Gerçek bir insanın görünüşünü, sesini ve tavırlarını konuşma amaçlı yapay zeka üzerinde kopyalama yeteneği. temel, bunu sağlayan unsurlardan biridir. Douglas'ı tipik yapay zekaların çoğundan ayırıyor. asistanlar, insansı robotlar ve yapay zeka etrafında geliştirilmekte olan diğer projeler. araştırma dünyası. Yapay zekayı geliştiren çok sayıda stüdyo ve başka ajans varken. Digital Domain, şu veya bu tür projelerde tüm bu unsurları harmanlamaya odaklanmıştır. Başka bir insanla konuşuyormuş gibi sosyal ve organik bir his veren bir arayüzle, mevcut tüm teknoloji ve verilerin en iyilerini kullanan tek, uyumlu bir ürün.

"Bu gerçekten gurur duyduğumuz bir şey çünkü Douglas, Unreal'da çalışan tamamen CG bir karakter" diyor Popüler 3D oluşturma platformu gibi yaygın olarak bulunabilen unsurları kullanmaktan özellikle gurur duyan Roble Gerçekdışı Motor3D görsel efekt öğelerinin oluşturulması ve değiştirilmesi söz konusu olduğunda Hollywood'un (ve ondan önce video oyunu endüstrisinin) başvuracağı platform haline geldi. “[Douglas] 3 boyutlu bir nesne, yani Unreal'da herhangi bir dijital karakterle yapabileceğiniz her şeyi yapabilirsiniz. Aydınlatmayı değiştirebilir, farklı ortamlara koyabilir vb. Ama aynı zamanda bu melezi de yaratıyoruz (Douglas'taki diğer her şeyle birlikte), böylece her iki dünyanın da en iyisini elde ediyoruz."

Baktığın her yerde

Ekip Douglas üzerinde ne kadar çok çalışırsa potansiyel uygulamaların listesi de o kadar uzar.

Hendler, "Pandemiden önce Douglas'ı bir ekrana gelip onunla konuşabileceğiniz bir kiosk olarak sunmayı planlıyorduk" diye hatırladı. "Ama sonra şunu düşündük: 'Hey, onu gerçekten Zoom görüşmelerine dahil etmeliyiz.' Onun Zoom görüşmelerine girip çıkması muhteşemdi."

Gösteri boyunca ekip, Douglas için doktor muayenehanelerindeki potansiyel başvuruların uzun bir listesini inceledi. ve müşteri hizmetleri, Hollywood'da bir sahneyi veya belirli bir sahneyi planlamanın ilk aşamalarında yararlılığı için sekans. Hatta Douglas'ın kendisi de film ve TV prodüksiyonunun hikaye taslağı oluşturma ve kavramsal aşamaları için uygun olduğunu öne sürerek birkaç öneride bulundu. Özellikle duygusal durumlar söz konusu olduğunda, konuştuğu kişilerden gelen hem işitsel hem de görsel ipuçlarını işleme yeteneği — Hendler'e göre müşterilerle veya tıbbi rehberlik arayanlarla ilgilenirken ek bir fayda katmanı da sunuyor.

Douglas'ın tüm bu bilgileri işleme ve pasif dinleyiciden aktif dinleyiciye geçme hızı Konuşmacı aynı zamanda oldukça ilgi çekici ve arkasındaki teknolojinin kısa sürede ne kadar geliştiğini gösteriyor. zaman.

“Thanos'u yarattığımızda, bunun işlenmesi 10 saat süren tek bir karemiz vardı. Bu bir kare” diye açıklıyor.

"Douglas için bir görüş tanıma sistemi var, bu yüzden bizi görüyor ve tanımlayabiliyor ve söylediklerinizi analiz ediyor, kelimelere dönüştürüyor ve bunu farklı sohbet robotlarına gönderiyor" diye ekliyor. "Douglas daha sonra bir yanıt yaratıyor, bunu sese dönüştürüyor ve bu sesi yüzünü ifade etmek için kullanıyor. Aynı zamanda o konuşmaya hangi vücut hareketinin eşlik ettiğini de anlıyor, hangi duygunun ona uyacağını belirliyor ve o vücut hareketini mimikleriyle birlikte aktarıyor.”

Hendler, "Bunların hepsi birkaç milisaniye içinde oluyor" diyor. “Uzun metrajlı bir filmdeki tek bir kare için 10 saate kıyasla bu süreçlerin tümü bu. Bu inanılmaz. Film için yaptığımız kadar gerçekçi değil ama onunla gerçek bir insan gibi konuşabilmek için yapılan şeylerin miktarını düşünürseniz, bu gerçekten olağanüstü.”

Ve kelimenin tam anlamıyla Douglas, potansiyeli söz konusu olduğunda çoğu zaman kendisinin en iyi savunucusu olmuştur.

Roble, birçok durumda Douglas'ın kendi sunumunu, yani... kendisini yönetmesine izin vermeyi tercih ettiklerini açıkladı. Sonuç, potansiyeli için beklediklerinden daha iyi bir adım oldu.

“[Douglas'ın sunumu] şaşırtıcı derecede ilgi çekiciydi. Bu sadece Siri'den bize bir şey söylemesini istemiyordu çünkü o sürecin bir parçasıydı" diye anımsıyor Roble. “Onunla konuşmak eğlenceli çünkü o bir yenilik ama aynı zamanda gerçekten etkili. Ve şunu düşünmeden edemiyorsunuz: Peki ya öğretim ya da diğer uygulamalar? Sonuçta, ne zaman dikkatini verdiğini görebilirsiniz. Ona duygusal geri bildirim verebilirsiniz, o da yanıt verebilir."

Douglas zaten etkileyici bir yaratım olsa da Digital Domain ekibi onun bir çalışma olarak kalması konusunda ısrar ediyor. ilerleme - ancak dijital insanın zamanla ne tür işler yapabileceğinin sınırı gökyüzüdür devam eder. Douglas'ın neler yapabileceğini anlama süreci birçok açıdan hem süreç hem de amaçtır.

Roble, "Bunu yapmamızın nedenlerinden biri bunu yapabilmemizdir" diyor. “Bilgisayar başındayken ve çalışırken, sadece yazmak çok kolaydır. Ancak o kadar çok zaman ve yer var ki, bir kişiyle konuşabilmek ve o kişinin sizinle etkileşime girmesini ve size tepki vermesini sağlamak harika olurdu. Gelecekte büyük bir değişimin içinde olduğumuzu düşünüyorum."

Editörlerin Önerileri

  • Thanos VFX ekibi The Quarry'nin karakterlerine nasıl hayat verdi (ve sonra onları nasıl öldürdü)