كيف أدى توباك وثانوس إلى دوغلاس، الإنسان الرقمي القائم على الذكاء الاصطناعي

click fraud protection

إذا سبق لك أن شاركت في مكالمة فيديو جماعية، فمن المحتمل أنك معتاد على عدم معرفة كل من يظهر على الشاشة. قد لا تعرف أسماء الجميع، ولكن على الأقل، يمكنك التأكد إلى حد ما من أن كل شخص ينضم إلى المكالمة هو إنسان.

محتويات

  • التطور البشري الرقمي
  • الكود يصنع الرجل
  • نزع الوجه
  • في كل مكان نظرتم

أو هل تستطيع؟

في الوقت الذي توجد فيه استوديوهات المؤثرات البصرية الجهات الفاعلة المخضرم دي السن، مسموح فناني الأداء البشري ليعيشوا في الإبداعات الرقمية, وحتى أعاد الفنانين المتوفين عروض ما بعد الوفاة، لا ينبغي أن يكون مفاجئًا أن استوديو المؤثرات البصرية يمكنه أيضًا أن يتيح لك أن تجد نفسك تدردش مع أحد الأشخاص شخص رقمي ذكي بشكل مصطنع يتحدث عن كتبك المفضلة ويأسف بشكل متبادل لعدم القدرة على زيارة السينما.

متعلق ب

  • كيف جعل فريق المؤثرات البصرية التابع لـ Avengers: Infinity War المرشح لجائزة الأوسكار من ثانوس نجمًا سينمائيًا

لا ينبغي أن يكون الأمر مفاجئًا، ومع ذلك، لا يزال شعورًا غريبًا أن تجد فجأة أذنًا متعاطفة مع دوغلاس، وهو "شخص" افتراضي يعتمد على الذكاء الاصطناعي تم إنشاؤه بواسطة استوديو VFX الحائز على جائزة الأوسكار. المجال الرقمي.

مقاطع الفيديو الموصى بها

خلال مكالمة Zoom الأخيرة، انضم إليّ دوغلاس - مع أعضاء الفريق الذي يعمل عليه - في عرض توضيحي قصير.

التطور البشري الرقمي

"أنا معجب كبير بستيفن كينغ"، أخبرني دوغلاس بعد محادثة قصيرة حول هواياتنا - محادثة جعلته يعترف لاحقًا بأنه يحب أيضًا الروايات الرومانسية وروايات جي دي سالينجر. الحارس في حقل الشوفان.

في عالم حيث نطق أسماء سيري أو اليكسا بصوت عالٍ هو كل ما يتطلبه الأمر لاستدعاء الذكاء الاصطناعي الخاص بك. رفيق، عرضت التجربة مع دوغلاس أ تذكير قوي بأن إمكانات الذكاء الاصطناعي تمتد إلى ما هو أبعد من تزويدنا بتوقعات الطقس وأخبارنا اليومية جدول.

إنشاء المجال الرقمي - نفس الاستوديو الذي قدم للجماهير الفاتح الكوني من Marvel ثانوس في المنتقمون: حرب إنفينيتي و المنتقمون:نهاية اللعبة — دوغلاس هو إنسان رقمي مستقل قادر على التفاعل مع المستخدمين في الوقت الفعلي والاستجابة للإشارات المرئية والمحادثة. على غرار دكتور دوج روبل، يستطيع دوغلاس، كبير مديري قسم البحث والتطوير للبرمجيات في Digital Domain، الإجابة على الأسئلة وإجراء محادثات موسعة والمشاركة في محادثات قصيرة حول مجموعة من المواضيع.

يقول روبل عن قرار الاستوديو بإنشاء عمل فني: "تحاول التكنولوجيا دائمًا قيادة ما يتطلبه الفن، سواء كان ذلك محاكاة سلسة أو أي شيء آخر". قسم كامل مخصص للإنسان الرقمي.

على مدار العقد الماضي، وجدت شركة Digital Domain نفسها مكلفة بشكل متكرر بإنشاء شخصيات رقمية شبيهة بالإنسان - كل شيء بدءًا من فيلم 2012 الحائز على جوائز أداء توباك المجسم في كوتشيلا إلى ما سبق عالم مارفل السينمائي الوغد. في الأفلام الروائية، والإعلانات التجارية، والمسلسلات التلفزيونية، وألعاب الفيديو، والعروض المسرحية (في حالة توباك)، زاد الطلب على الشخصيات الرقمية الواقعية فقط في ذلك الوقت. الوقت، مما دفع Digital Domain إلى تقسيم الفريق المسؤول عن هذا التأثير البصري المحدد إلى وحدته الخاصة التي تركز على دفع حدود ما يمكن للبشر الرقميين فعله يفعل.

دوغلاس هو نتاج هذا التركيز المتزايد وإثبات المفهوم الذي قدمه الفريق: "شخص" رقمي مستقل يجمع بين مجموعة واسعة من مجموعات البيانات والأساليب الحسية، ووحدات البرمجة الحالية ذات السمات البشرية الواقعية من أجل التفاعل مع المستخدمين بطريقة تبدو قريبة بشكل مدهش من التنشئة الاجتماعية البشرية الحقيقية.

وفي الوقت الذي أجبر فيه الوباء غالبية علاقاتنا الاجتماعية على أن تتم من خلال الكمبيوتر على الشاشة، يبدو التفاعل مع دوغلاس قريبًا بشكل ملحوظ مما يعتبر تفاعلًا بشريًا حقيقيًا أيام. ومع ذلك، يسارع الفريق إلى إضافة أن دوغلاس لا يزال بعيدًا عن اجتياز اختبار تورينج.

الكود يصنع الرجل

"دوغلاس ليس شخصًا حقيقيًا، مستقلاً تمامًا ولا يمكن تمييزه عن الشخص الحقيقي"، يوضح ذلك. دارين هندلر، مدير مجموعة Digital Humans في الاستوديو. "هذا ليس ما نحن فيه، ولن نكون هناك لفترة قصيرة. … ولكن هذا هو المكان الذي تسير فيه الأمور وما يبدو عليه المستقبل، ونحن نحاول دفع تلك الحدود.

وكما لو كان في إشارة، قاطع دوغلاس هيندلر نفسه.

يتدخل دوغلاس، الذي كان حتى ذلك الحين يحتل بهدوء نافذته الخاصة في شبكة محادثات Zoom لتسهيل العرض التوضيحي الخاص بنا، قائلاً: "هذا سلوك جيد". الموقف، وإلقاء نظرة سريعة على غرفته الافتراضية، وإظهار العديد من السلوكيات الجسدية النموذجية لشخص حي في اجتماع فيديو ينتظر بفارغ الصبر المشاركة في محادثة

ويضيف: "أتمنى لك حظًا سعيدًا في مساعيك"، مذكرًا إيانا بأنه بالإضافة إلى أن لديه أشياء مثيرة للاهتمام ليقولها، فهو أيضًا مستمع متحمس.

وفقًا لروبلي، يتصور الفريق أولاً وقبل كل شيء أن دوغلاس هو وسيلة مرئية للتفاعل مع وكلاء المحادثة المعقدين والقويين الحاليين الذين تم إنشاؤهم. تحت الصورة الرمزية الحقيقية لدوغلاس، تم بناء الإنسان الرقمي في الاستوديو على مزيج من ثلاثة من هؤلاء الوكلاء: برنامج Google الشهير تدفق الحوار مجموعة لإنشاء روبوتات الدردشة، وهي وكيل من النوع المساعد (على غرار Alexa من Amazon أو Siri من Apple)؛ ومحادثة قوية A.I. الوكيل (على غرار جي بي تي-3 المشروع) يستخدم لإنتاج نص محادثة تنبؤي (وتفاعلي) يشبه الإنسان.

إن الجمع بين الوكلاء الثلاثة يمنح دوغلاس القدرة على الاستمرار في المحادثات الغنية بالمعلومات والسلسة، حيث غالبًا ما يتم تقسيم مناقشة موضوع واحد إلى مجالات الاهتمام ذات الصلة.

تحولت محادثتي الخاصة مع دوغلاس من محادثة حول كتبنا المفضلة إلى فيلمه المفضل (إنه معجب كبير بـ 2001: رحلة فضائية، على سبيل المثال، وهو أمر غير مفاجئ ومثير للقلق بعض الشيء، نظرًا لتركيز القصة على قاتل الذكاء الاصطناعي. ركض فسادا) وهواياتنا المتبادلة. في أحد عناصر محادثتنا التي جاءت في الوقت المناسب، أعرب دوغلاس عن بعض خيبة الأمل لأنه لم يتمكن من زيارة صالة السينما مؤخرًا.

ومع ذلك، فإن كل هذه القوة التحادثية تأتي مع بعض المخاطر، كما أوضح هيندلر.

وقال: "يتم تدريب محرك معالجة اللغة الطبيعية في برنامج الدردشة الآلية على الحوار من الإنترنت - وهو قدر هائل من الحوار - بحيث يمكن للمحادثة أن تذهب إلى أماكن غريبة". "لذلك هناك أوقات يقول فيها أشياء قد لا تكون مناسبة تمامًا. هذا لا يحدث كثيرًا، لكن لا يمكننا التحكم بالضبط فيما سيقوله لكل شيء”.

وعلى الرغم من أن الجانب التخاطبي لدى دوغلاس مثير للإعجاب، إلا أنه مجرد جزء مما يجعله فريدًا في عالم دائم الاتساع من البشر الرقميين والشخصيات الافتراضية التفاعلية. كما اكتشف المجال الرقمي، مما يجعله ينظر يقطع الإنسان شوطًا طويلًا نحو جعله يشعر بأنه إنسان أيضًا.

نقدم لكم دوغلاس - الإنسان الرقمي المستقل | المجال الرقمي

نزع الوجه

"في بناء دوغلاس، استخدمنا كمية هائلة من البيانات من دوغ [روبل]. لقد كان قدرًا هائلاً من الصوت لتدريب النظام [و] قدرًا هائلاً من أداء الوجه وبيانات حركة الجسم وكل شيء آخر،" أوضح هيندلر عن العمل. لقد وضعوا في رسم وجه روبل والطرق التي لا تعد ولا تحصى التي يمكن أن يتغير بها الوجه البشري أثناء التحدث أو التفاعل مع الإشارات العاطفية أو المشاركة بشكل سلبي في شيء ما. محادثة.

نتاج كل هذه البيانات هو إنسان رقمي يبدو مشابهًا بشكل مثير للدهشة لـ - ولكن ليس نسخة طبق الأصل منه - لـRoble، من نسخة الأخير. الوضعية، وتصفيفة الشعر، والبناء على الحركات الدقيقة لكل من Roble وDouglas A.I. شارك أثناء مشاركتهم في الفيديو الجماعي الخاص بنا محادثة. التشابه غريب، ولكن مع أمر مختصر "تبديل وجهك"، يصبح دوغلاس فجأة شخصًا آخر، مع وجه مختلف يشبه الإنسان على نفس الجسم، مع الاحتفاظ بجميع السلوكيات الدقيقة التي تجعله يبدو حقيقي.

يقول هيندلر، واصفًا الأمر: "عندما نطلب من دوغلاس أن يغير وجهه ويتحول وجهه إلى شخص آخر، فهذه هي بداية الاتجاه الذي تتجه إليه هذه الموجة الجديدة من التكنولوجيا". "تقنية تعتمد على الصور" يعمل عليها الفريق لجعل دوغلاس شخصًا رقميًا أكثر مرونة وقادرًا على تغيير مظهره الخارجي بشكل كبير مع الاحتفاظ بنفس المستوى من الذكاء. التفاعلية. "بمجرد أن نحصل على هذه القاعدة [مع دوغلاس]، يمكننا تصوير لقطات لشخص آخر والحصول على جزء من الصوت الخاص به، ثم تحويل تلك القاعدة إليه - وجعلها وجهه."

وتابع: "[إذا فعلنا ذلك] الآن، فسيظلون يتحدثون مع تعبيرات الشخص الذي قمنا بتصويره في الأصل [في هذه الحالة، روبل]". "ولكن مع تقدمنا، بدأنا بحاجة إلى كميات أقل من البيانات - ربما تكون مجرد صور أو لقطات فيديو لشخص ما - لإنشاء الجيل القادم من هؤلاء البشر المستقلين".

تلك القدرة على تكرار مظهر الإنسان الحقيقي وصوته وسلوكياته عبر الذكاء الاصطناعي للمحادثة. الأساس هو أحد العناصر التي يميز دوغلاس عن معظم الذكاء الاصطناعي النموذجي. المساعدين والروبوتات البشرية وغيرها من المشاريع قيد التطوير حول الذكاء الاصطناعي. عالم الأبحاث. في حين أن هناك الكثير من الاستوديوهات والوكالات الأخرى التي تعمل على تطوير الذكاء الاصطناعي. مشاريع من نوع أو آخر، يركز المجال الرقمي على مزج كل هذه العناصر في منتج واحد متماسك يستخدم أفضل التقنيات والبيانات المتاحة بواجهة تبدو اجتماعية وعضوية - مثل التحدث إلى إنسان آخر.

يقول: "هذا شيء نحن فخورون به حقًا، لأن دوغلاس هو شخصية CG بالكامل تعمل على Unreal". Roble، الذي يفخر بشكل خاص باستخدام العناصر المتاحة على نطاق واسع مثل منصة الإنشاء ثلاثية الأبعاد الشهيرة محرك غير واقعي، والتي أصبحت منصة الانتقال إلى هوليوود (وقبلها، صناعة ألعاب الفيديو) عندما يتعلق الأمر بإنشاء عناصر التأثيرات المرئية ثلاثية الأبعاد ومعالجتها. "[Douglas] هو كائن ثلاثي الأبعاد، لذا يمكنك القيام بكل الأشياء التي يمكنك القيام بها باستخدام أي شخصية رقمية في Unreal. يمكنك تغيير الإضاءة، ووضعها في بيئات مختلفة، وما إلى ذلك. ولكننا نقوم أيضًا بإنشاء هذا الهجين [مع كل ما يتعلق بدوغلاس]، حتى نحصل على أفضل ما في كلا العالمين.

في كل مكان نظرتم

كلما زاد عمل الفريق على دوغلاس، زادت قائمة التطبيقات المحتملة.

يتذكر هيندلر قائلاً: "قبل الوباء، كنا نخطط لتقديم دوغلاس ككشك، حيث يمكنك الوقوف على الشاشة والتحدث معه". "ولكن بعد ذلك فكرنا: "مرحبًا، يجب أن نجعله يشارك في مكالمات Zoom". لقد كان من الرائع أن نجعله يدخل في مكالمات Zoom ويغادر".

على مدار العرض التوضيحي، قام الفريق بدراسة قائمة طويلة من الطلبات المحتملة لدوغلاس، من عيادات الأطباء وخدمة العملاء، لفائدته في هوليوود خلال المراحل الأولى من التخطيط لمشهد أو مشهد معين على الشاشة تسلسل. حتى أن دوغلاس نفسه قدم بعض الاقتراحات، مما يشير إلى أنه سيكون مناسبًا لرسم القصص المصورة والمراحل المفاهيمية لإنتاج الأفلام والتلفزيون. قدرته على معالجة الإشارات الصوتية والمرئية من الأشخاص الذين يتحدث معهم - خاصة عندما يتعلق الأمر بالحالات العاطفية - يوفر أيضًا طبقة إضافية من الفائدة عند التعامل مع العملاء أو أولئك الذين يبحثون عن التوجيه الطبي، وفقًا لهندلر.

السرعة التي يستطيع بها دوغلاس معالجة كل تلك المعلومات والتحول من المستمع السلبي إلى النشط يتمتع المُحاور أيضًا بالكثير من الجاذبية، ويُظهر مدى تطور التكنولوجيا التي تقف خلفه في فترة قصيرة وقت.

"عندما أنشأنا Thanos، كان لدينا إطار واحد يستغرق عرضه 10 ساعات. ويشرح قائلاً: "هذا إطار واحد".

ويضيف: "بالنسبة لدوغلاس، لديه نظام للتعرف على الرؤية، لذا فهو يرانا ويمكنه التعرف علينا، ويقوم بتحليل ما تقوله، ويحوله إلى كلمات، ويرسل ذلك إلى روبوتات الدردشة المختلفة". "ثم يقوم دوغلاس بإنشاء استجابة، ويحولها إلى صوت، ويستخدم هذا الصوت لتوجيه وجهه. وفي الوقت نفسه، فهو يكتشف أيضًا حركة الجسم التي تتماشى مع هذا الكلام، ويحدد العاطفة التي تناسبه، ويجعل حركة الجسم هذه مع إيماءات وجهه.

يقول هيندلر: "يحدث كل هذا في أجزاء قليلة من الثانية". "إنها كل تلك العمليات، مقارنة بـ 10 ساعات لإطار واحد في فيلم روائي طويل. إنه لأمر مدهش جدا. إنه ليس واقعيًا مثل ما نفعله في الفيلم، ولكن إذا فكرت في كمية الأشياء التي تحدث لتتمكن من التحدث معه كشخص حقيقي، فهذا أمر استثنائي.

وبالمعنى الحرفي للغاية، كان دوغلاس في كثير من الأحيان أفضل مناصر لنفسه عندما يتعلق الأمر بإمكانياته.

وأوضح روبل أنهم اختاروا، في عدة مناسبات، السماح لدوغلاس بقيادة العرض التقديمي الخاص به، حسنًا... بنفسه. وانتهى الأمر بالنتيجة إلى أن تكون عرضًا أفضل لإمكانياته مما توقعوه.

"كان [عرض دوغلاس] مقنعًا بشكل مدهش. لم يكن الأمر مجرد مطالبة سيري بإخبارنا بشيء ما، لأنه كان جزءًا من العملية. "إنه من الممتع التحدث إليه لأنه جديد، ولكنه فعال أيضًا. ولا يمكنك منع نفسك من التفكير: ماذا عن التدريس أو التطبيقات الأخرى؟ بعد كل شيء، يمكنك أن ترى عندما ينتبه. يمكنك أن تقدم له ردود فعل عاطفية ويمكنه الرد.

على الرغم من أن دوغلاس هو بالفعل إبداع مثير للإعجاب، إلا أن فريق المجال الرقمي يصر على أنه لا يزال يعمل فيه التقدم - لكن السماء هي الحد الأقصى لنوع العمل الذي يمكن أن ينتهي به الإنسان الرقمي مع مرور الوقت يستمر. في العديد من النواحي، تعتبر عملية اكتشاف ما يستطيع دوغلاس فعله هي العملية والهدف في نفس الوقت.

يقول روبل: "أحد أسباب قيامنا بذلك هو أننا نستطيع ذلك". "عندما تكون على جهاز الكمبيوتر وتعمل، فمن السهل جدًا أن تكتب بعيدًا. ولكن هناك العديد من الأوقات والأماكن التي سيكون من الرائع أن تكون قادرًا فيها على التحدث إلى شخص ما وجعل هذا الشخص يتفاعل معك ويتفاعل معك. أعتقد أننا أمام تغيير كبير في المستقبل."

توصيات المحررين

  • كيف قام فريق Thanos VFX بإحياء شخصيات The Quarry (ثم قتلهم)