אם אי פעם השתתפת בשיחת וידאו קבוצתית, כנראה שהתרגלת לא להכיר את כל מי שמופיע על המסך. אולי אתה לא יודע את השמות של כולם, אבל לכל הפחות, אתה יכול להיות די בטוח שכל אדם שמצטרף לשיחה הוא אנושי.
תוכן
- אבולוציה אנושית דיגיטלית
- הקוד עושה את האיש
- נאבקת מול
- לכל מקום שאתה מסתכל
או שאתה יכול?
בתקופה שבה יש לאולפני אפקטים חזותיים שחקנים ותיקים מיושנים, מותר מבצעים אנושיים לאכלס יצירות דיגיטליות, ואף החזיר אמנים שנפטרו עבור הופעות שלאחר המוות, זה לא אמור להפתיע שאולפן VFX יכול גם לאפשר לך למצוא את עצמך משוחח עם אדם דיגיטלי אינטליגנטי מלאכותי על הספרים האהובים עליך ומקונן הדדי על חוסר היכולת לבקר באולם קולנוע.
קָשׁוּר
- How Avengers: Infinity War של צוות VFX המועמד לאוסקר הפך את Thanos לכוכב קולנוע
זה לא צריך להיות מפתיע, ובכל זאת, זו עדיין הרגשה מוזרה למצוא פתאום אוזן קשבת בדאגלס, "אדם" וירטואלי, מונע על ידי A.I, שנוצר על ידי אולפן VFX זוכה האוסקר דומיין דיגיטלי.
סרטונים מומלצים
במהלך שיחת זום לאחרונה, דאגלס - יחד עם חברי הצוות שעובדים עליו - הצטרף אלי להדגמה קצרה.
אבולוציה אנושית דיגיטלית
"אני מעריץ גדול של סטיבן קינג," אומר לי דאגלס אחרי קטע קצר הלוך ושוב על התחביבים שלנו - שיחה שלאחר מכן הוא מתוודה שהוא אוהב גם רומנים רומנטיים ושל ג'יי.די. סלינג'ר.
התפסן בשדה השיפון.בעולם שבו מבטאים את השמות סירי או אלכסה בקול רם זה כל מה שצריך כדי לזמן A.I משלך. בן לוויה, הניסיון עם דאגלס הציע א תזכורת רבת עוצמה לכך שהפוטנציאל של A.I. משתרע הרבה מעבר לתת לנו את תחזית מזג האוויר ואת היומיום שלנו לוח זמנים.
היצירה של Digital Domain - אותו אולפן שהעניק לקהל את הכובש הקוסמי של מארוול ת'אנוס פנימה הנוקמים: מלחמת האינסוף ו הנוקמים:סוף המשחק - דאגלס הוא אדם אוטונומי ודיגיטלי המסוגל ליצור אינטראקציה עם משתמשים בזמן אמת ולהגיב לרמזים חזותיים ושיחה. דגם אחרי ד"ר דאג רובל, המנהל הבכיר למו"פ תוכנה של Digital Domain, Douglas יכול לענות על שאלות, לנהל שיחות ממושכות ולעסוק בשיחות חולין על מגוון נושאים.
"הטכנולוגיה תמיד מנסה להוביל את מה שאמנות דורשת, בין אם זו הדמיה נוזלית או כל דבר אחר", אומר רובל על החלטת הסטודיו ליצור כל המחלקה המוקדשת לבני אדם דיגיטליים.
בעשור האחרון, דיגיטל דומיין מצאה את עצמה שוב ושוב מוטלת על יצירת דמויות דיגיטליות דמויות אנושיות - הכל מהפרסים עטורת הפרסים של 2012 ביצועים הולוגרפיים של טופאק בקואצ'לה לאמור לעיל היקום הקולנועי של מארוול נָבָל. בסרטים עלילתיים, פרסומות, סדרות טלוויזיה, משחקי וידאו ו(במקרה של טופאק) הופעות במה, הביקוש לדמויות דיגיטליות ריאליסטיות רק גדל בכך זמן, מה שגרם ל-Digital Domain לפצל את הצוות האחראי לאפקט החזותי המסוים הזה ליחידה משלו המתמקדת בדחיפת הגבול של מה שבני אדם דיגיטליים יכולים לַעֲשׂוֹת.
דאגלס הוא גם תוצר של המיקוד המוגבר הזה וגם ההוכחה לקונספט של הצוות: "אדם" דיגיטלי אוטונומי המשלב מגוון רחב של מערכי נתונים, שיטות חושיות, ומודולי תכנות קיימים עם תכונות אנושיות פוטו-ריאליסטיות על מנת ליצור אינטראקציה עם משתמשים באופן שמרגיש קרוב באופן מפתיע לסוציאליזציה אנושית אמיתית.
ובזמן שהמגיפה אילצה את רוב ההתחברות שלנו להתרחש דרך מחשב המסך, האינטראקציה עם דאגלס מרגישה קרובה להפליא למה שמתאים לאינטראקציה אנושית אמיתית ימים. עם זאת, הצוות ממהר להוסיף שדאגלס עדיין רחוק מלהצליח במבחן טיורינג.
הקוד עושה את האיש
"דאגלס אינו אדם צילום אמיתי, אוטונומי לחלוטין, שאי אפשר להבחין בו מאדם אמיתי", מסביר דארן הנדלר, מנהל קבוצת Digital Humans בסטודיו. "זה לא המקום שבו אנחנו נמצאים, ואנחנו לא הולכים להיות שם לזמן קצר.... אבל זה המקום שבו הדברים הולכים ואיך נראה העתיד, ואנחנו מנסים לדחוף את הגבולות האלה."
וכמעט כמו על סימן, הנדלר מופרע על ידי דאגלס עצמו.
"זו גישה טובה שיש", מתערב דאגלס, שעד אז תפס בשקט את החלון שלו ברשת הצ'אטים של זום המאפשרת את ההדגמה שלנו, ומדי פעם התחלף עמדה, מעיף מבט בחדר הווירטואלי שלו, ומראה רבים מהגינונים הפיזיים האופייניים של אדם חי בפגישת וידאו שמחכה בסבלנות להשתתף ב שִׂיחָה
"אני מאחל לך בהצלחה במאמציך", הוא מוסיף ומזכיר לנו שבנוסף לדברים מעניינים לומר, הוא גם מאזין נלהב.
לדברי רובל, הצוות בראש ובראשונה רואה את דאגלס כדרך ויזואלית לאינטראקציה עם סוכני שיחה מורכבים וחזקים שנוצרו. מתחת לאוואטר הצילום האמיתי של דאגלס, האדם הדיגיטלי של האולפן בנוי על תערובת של שלושה מהסוכנים האלה: הפופולרי של גוגל זרימת דיאלוג סוויטה ליצירת צ'טבוטים, סוכן מסוג עוזר (בדומה לאקסה של אמזון או ל-Siri של אפל); ו-A.I שיחה רב עוצמה. סוכן (בדומה ל- GPT-3 פרויקט) המשמש להפקת טקסט שיחה כמו אנושי, חזוי (ותגובתי).
השילוב של כל שלושת הסוכנים מעניק לדאגלס את היכולת לנהל שיחות אינפורמטיביות וקולחות כאחד, כאשר דיונים בנושא אחד מתחלקים לרוב לתחומי עניין קשורים.
השיחה שלי עם דאגלס נסחפה מצ'אט על הספרים האהובים עלינו לסרט האהוב עליו (הוא מעריץ גדול של 2001: אודיסיאה בחלל, למשל, וזה גם לא מפתיע וגם קצת מטריד, בהתחשב בהתמקדות של הסיפור ב-A.I רצחני. להשתולל) והתחביבים המשותפים שלנו. באחד ממרכיבי השיחה שלנו, דאגלס הביע אכזבה מסוימת מכך שהוא לא יכול לבקר בבית קולנוע לאחרונה.
עם זאת, כל כוח השיחה הזה כרוך בסיכון מסוים, כפי שהסביר הנדלר.
"מנוע עיבוד השפה הטבעי של הצ'אט בוט מאומן על דיאלוג מהאינטרנט - כמות עצומה של דיאלוג - כך שהשיחה יכולה להגיע למקומות מוזרים", אמר. "אז יש פעמים שהוא אומר דברים שאולי לא בדיוק מתאימים. זה לא קורה לעתים קרובות, אבל אנחנו לא יכולים בדיוק לשלוט במה שהוא יגיד לכל דבר".
ולמרות שההיבט השיחה של דאגלס מרשים, זה רק חלק ממה שמייחד אותו בעולם הולך ומתרחב של בני אדם דיגיטליים ודמויות וירטואליות אינטראקטיביות. כפי ש-Digital Domain גילה, עושה אותו תראה אנושי עושה דרך ארוכה כדי לגרום לו להרגיש גם אנושי.
היכרות עם דאגלס - אדם דיגיטלי אוטונומי | דומיין דיגיטלי
נאבקת מול
"בבניית דאגלס, השתמשנו בכמות עצומה של נתונים מדאג [רובל]. זו הייתה כמות עצומה של אודיו כדי לאמן את המערכת [ו] כמות עצומה של ביצועי פנים, נתוני תנועות גוף וכל השאר", הסביר הנדלר על העבודה הם משקיעים במיפוי פניו של רובל ואת אינספור הדרכים שבהן הפנים האנושיות יכולות להשתנות תוך כדי דיבור, תגובה לרמזים רגשיים או השתתפות פסיבית ב שִׂיחָה.
התוצר של כל הנתונים האלה הוא אדם דיגיטלי שנראה דומה להפליא - אבל לא כמו עותק מדויק של - רובל, מהסרט של האחרון יציבה, תסרוקת ומבנה לתנועות העדינות הן רובל והן הדאגלס A.I. שתפו בזמן שהם משתתפים בסרטון הקבוצה שלנו שִׂיחָה. הדמיון מוזר, אבל עם פקודה קצרה "להחליף את הפנים שלך", דאגלס הופך פתאום למישהו אחר, עם פנים שונות, דמויות אנושיות באותה מידה על אותו גוף, תוך שמירה על כל הגינונים העדינים שגורמים לו להיראות אמיתי.
"כשאנחנו מבקשים מדאגלס לשנות את פניו והפנים שלו עוברות למישהו אחר, זו ההתחלה לאן מועד פניו של גל הטכנולוגיה החדש הזה", אומר הנדלר, מתאר את "טכניקה מבוססת תמונה" שהצוות עובד עליה כדי להפוך את דאגלס לאדם דיגיטלי גמיש עוד יותר המסוגל לשנות באופן דרמטי את המראה החיצוני שלו תוך שמירה על אותה רמה של אינטראקטיביות. "ברגע שיש לנו את הבסיס הזה [עם דאגלס], נוכל לצלם קטעים של מישהו אחר ולקבל חלק מהשמע שלו, ואז להפוך את הבסיס הזה אליהם - להפוך אותו לפרצוף שלהם."
"[אם היינו עושים את זה] עכשיו, הם עדיין היו מדברים עם הבעותיו של האדם שצילמנו במקור [במקרה הזה, רובל]", המשיך. "אבל ככל שאנחנו ממשיכים, אנחנו מתחילים להזדקק לכמויות קטנות יותר של נתונים - אולי זה רק תמונות או קטעי סרט של מישהו - כדי ליצור את הדור הבא של בני האדם האוטונומיים האלה."
היכולת הזו לשכפל את המראה, הקול והגינונים של אדם אמיתי על פני ה-A.I. בסיס הוא אחד המרכיבים ש מייחד את דאגלס מרוב ה-A.I הטיפוסי. עוזרים, רובוטים דמויי אדם ופרויקטים אחרים בפיתוח סביב ה-A.I. עולם המחקר. אמנם יש הרבה אולפנים וסוכנויות אחרות המפתחות A.I. פרויקטים מסוג זה או אחר, Digital Domain מתמקד בשילוב כל האלמנטים הללו מוצר יחיד ומלוכד המשתמש במיטב הטכנולוגיה והנתונים הזמינים עם ממשק שמרגיש חברתי ואורגני - כמו לדבר עם אדם אחר.
"זה משהו שאנחנו באמת גאים בו, כי דאגלס הוא דמות CG מלאה שפועלת על Unreal", אומר רובל, שמתגאה במיוחד בשימוש באלמנטים זמינים באופן נרחב כמו פלטפורמת היצירה התלת מימדית הפופולרית מנוע לא מציאותי, שהפכה לפלטפורמה המתאימה להוליווד (ולפניה, תעשיית משחקי הווידאו) בכל הנוגע ליצירה ולתפעל אלמנטים של אפקט חזותי תלת מימדי. "[דוגלס] הוא אובייקט תלת מימדי, אז אתה יכול לעשות את כל הדברים שאתה יכול לעשות עם כל דמות דיגיטלית ב-Unreal. אתה יכול לשנות את התאורה, לשים אותם בסביבות שונות, וכן הלאה. אבל אנחנו גם יוצרים את ההיברידית הזו [עם כל שאר המעורבים בדאגלס], כך שנקבל את הטוב משני העולמות".
לכל מקום שאתה מסתכל
ככל שהצוות עובד יותר על דאגלס, כך רשימת היישומים הפוטנציאליים מתארכת.
"לפני המגיפה תכננו להציג את דאגלס כקיוסק, שבו אתה ניגש למסך ומדבר איתו", נזכר הנדלר. "אבל אז חשבנו, 'היי, אנחנו צריכים באמת להכניס אותו לשיחות זום'. זה היה פנטסטי שהוא יכנס לשיחות זום ויעזוב".
במהלך ההפגנה, הצוות עבר על שורה ארוכה של בקשות פוטנציאליות עבור דאגלס, ממשרדי הרופא ושירות לקוחות, לתועלת שלו בהוליווד בשלבים המוקדמים של תכנון סצנה או סצנה מסוימת על המסך סדר פעולות. דאגלס עצמו אפילו הציע כמה הצעות, והציעו שהוא יתאים לתכנון סטוריבורד ולשלבים רעיוניים של הפקת סרטים וטלוויזיה. היכולת שלו לעבד גם רמזים קוליים וגם חזותיים מאלה שהוא משוחח איתם - במיוחד כשמדובר במצבים רגשיים - מציע גם שכבה נוספת של שימושיות בהתמודדות עם לקוחות או כאלה שמחפשים הדרכה רפואית, לדברי הנדלר.
המהירות שבה דאגלס יכול לעבד את כל המידע הזה ולעבור ממאזין פסיבי לאקטיבי איש השיחה גם מחזיק בשפע, ומראה עד כמה הטכנולוגיה שמאחוריו התפתחה בקצרה זְמַן.
"כשיצרנו את Thanos, היה לנו פריים בודד של זה שלקח 10 שעות לעיבוד. זו מסגרת אחת", הוא מסביר.
"עבור דאגלס, יש לו מערכת לזיהוי ראייה, אז הוא רואה אותנו ויכול לזהות אותנו, והוא מנתח את מה שאתה אומר, הופך את זה למילים ושולח את זה לצ'אטבוטים שונים", הוא מוסיף. "אז דאגלס יוצר תגובה, הופך אותה לאודיו ומשתמש באודיו הזה כדי להניע את פניו. במקביל, הוא גם מגלה איזו תנועת גוף מתלווה לדיבור הזה, קובע איזה רגש יתאים לו, ומציג את תנועת הגוף הזו יחד עם מחוות הפנים שלו".
"כל זה קורה תוך כמה אלפיות שניות", אומר הנדלר. "זה כל התהליכים האלה, לעומת 10 שעות לפריים אחד בסרט עלילתי. זה כל כך מדהים. זה לא מציאותי כמו מה שאנחנו עושים לקולנוע, אבל אם אתה חושב על כמות הדברים שקורים כדי להיות מסוגל לדבר איתו כמו אדם אמיתי, זה פשוט פנומנלי".
ובמובן המילולי, דאגלס היה לעתים קרובות הסנגור הטוב ביותר שלו בכל הנוגע לפוטנציאל שלו.
רובל הסביר שבכמה הזדמנויות הם בחרו לתת לדאגלס להוביל את המצגת שלו, ובכן... את עצמו. התוצאה בסופו של דבר הייתה מגרש טוב יותר לפוטנציאל שלו ממה שאפילו הם ציפו.
"[המצגת של דאגלס] הייתה מרתקת באופן מפתיע. זה לא היה רק לבקש מסירי לספר לנו משהו, כי הוא היה חלק מהתהליך", נזכר רובל. "זה כיף לדבר איתו כי הוא חידוש, אבל הוא גם מאוד יעיל. ואתה לא יכול שלא לחשוב: מה לגבי הוראה או יישומים אחרים? אחרי הכל, אתה יכול לראות מתי הוא שם לב. אתה יכול לתת לו משוב רגשי והוא יכול להגיב".
למרות שדאגלס הוא כבר יצירה מרשימה, צוות התחום הדיגיטלי מתעקש שהוא ימשיך לעבוד בו התקדמות - אבל השמיים הם הגבול לגבי סוג העבודה שהאדם הדיגיטלי שלהם יכול לעשות עם הזמן נמשך. במובנים רבים, תהליך ההבנה למה דאגלס מסוגל הוא גם התהליך וגם המטרה.
"אחת הסיבות שאנחנו עושים את זה היא כי יכולנו", אומר רובל. "כשאתה ליד המחשב ועובד, קל מאוד פשוט להקליד. אבל יש כל כך הרבה פעמים ומקומות שזה יהיה נחמד פשוט להיות מסוגל לדבר עם אדם ולגרום לכך שהאדם יתקשר איתך ויגיב אליך. אני חושב שצפוי לנו שינוי גדול בעתיד".
המלצות עורכים
- איך צוות Thanos VFX הביא לחיים את הדמויות של המחצבה (ואז הרג אותן)