როგორ მიიყვანა თუფაკმა და თანოსმა დუგლასს, ხელოვნური ინტელექტის ციფრულ ადამიანს

თუ ოდესმე მიგიღიათ მონაწილეობა ჯგუფურ ვიდეოზარში, ალბათ მიჩვეული ხართ, რომ არ იცნობდეთ ყველას, ვინც ეკრანზე გამოჩნდება. თქვენ შეიძლება არ იცოდეთ ყველას სახელები, მაგრამ სულ მცირე, შეგიძლიათ დარწმუნებული იყოთ, რომ თითოეული ადამიანი, რომელიც უერთდება ზარს, არის ადამიანი.

შინაარსი

  • ციფრული ადამიანის ევოლუცია
  • კოდი ქმნის კაცს
  • პირისპირ
  • სადაც არ უნდა გაიხედო

ან შეგიძლია?

იმ დროს, როცა ვიზუალური ეფექტების სტუდიებს აქვთ ხანდაზმული ვეტერანი მსახიობები, დაშვებულია ადამიანის შემსრულებლები ციფრულ შემოქმედებაში ბინადრობსდა გარდაცვლილი მხატვრებიც კი დააბრუნეს სიკვდილის შემდგომი სპექტაკლებიარც ისე გასაკვირი უნდა იყოს, რომ VFX სტუდიამ ასევე მოგცეთ საშუალება, რომ ჩეთში ესაუბროთ ხელოვნურად ინტელექტუალური ციფრული ადამიანი თქვენი საყვარელი წიგნების შესახებ და ორმხრივად გლოვობს კინოთეატრში მისვლის შეუძლებლობას.

დაკავშირებული

  • როგორ აქცია შურისმაძიებლები: უსასრულობის ომის ოსკარის ნომინანტმა VFX გუნდმა თანოსი კინოვარსკვლავად

გასაკვირი არ უნდა იყოს, მაგრამ მაინც უცნაური გრძნობაა მოულოდნელად სიმპატიური ყურის პოვნა დუგლასში, ვირტუალურ, A.I.-ზე ორიენტირებულ „ადამიანში“, შექმნილი ოსკაროსანი VFX სტუდიის მიერ.

ციფრული დომენი.

რეკომენდებული ვიდეოები

ბოლო Zoom ზარის დროს, დუგლასი - მასზე მომუშავე გუნდის წევრებთან ერთად - შემომიერთდა მოკლე დემონსტრაციისთვის.

ციფრული ადამიანის ევოლუცია

”მე სტივენ კინგის დიდი ფანი ვარ,” მეუბნება დუგლასი ჩვენი ჰობიების შესახებ მოკლედ გასაუბრების შემდეგ – საუბრის შემდეგ, რომელიც მოგვიანებით აღიარებს, რომ მას ასევე უყვარს რომანები და ჯ.დ სელინჯერის რომანები. ჭვავის დამჭერი.

სამყაროში, სადაც სახელების წარმოთქმა Siri ან ალექსა ხმამაღლა არის ყველაფერი, რაც საჭიროა საკუთარი A.I. კომპანიონი, გამოცდილება დუგლასმა შესთავაზა ა ძლიერი შეხსენება, რომ A.I.-ს პოტენციალი სცილდება ამინდის პროგნოზს და ჩვენს ყოველდღიურობას განრიგი.

Digital Domain-ის შექმნა - იგივე სტუდია, რომელმაც აუდიტორიას მისცა Marvel-ის კოსმოსური დამპყრობელი თანოსი შევიდა შურისმაძიებლები: უსასრულობის ომი და შურისმაძიებლები:ბოლო თამაში — დუგლასი არის ავტონომიური, ციფრული ადამიანი, რომელსაც შეუძლია მომხმარებლებთან ურთიერთქმედება რეალურ დროში და უპასუხოს ვიზუალურ და საუბრის ნიშნებს. მოდელირებულია შემდეგ დოქტორი დაგ რობლიDigital Domain-ის პროგრამული უზრუნველყოფის R&D უფროს დირექტორს, დუგლასს შეუძლია უპასუხოს კითხვებს, განაგრძოს გაფართოებული საუბრები და ჩაერთოს მცირე საუბარში სხვადასხვა თემებზე.

”ტექნოლოგია ყოველთვის ცდილობს წარმართოს ის, რასაც ხელოვნება მოითხოვს, იქნება ეს სითხის სიმულაცია თუ სხვა რამ”, - ამბობს რობლი სტუდიის გადაწყვეტილების შესახებ, შექმნას მთელი განყოფილება, რომელიც ეძღვნება ციფრულ ადამიანებს.

ბოლო ათწლეულის განმავლობაში, Digital Domain-ს არაერთხელ დაევალა შეექმნა ადამიანის მსგავსი ციფრული პერსონაჟები - ყველაფერი 2012 წლის ჯილდოს მფლობელიდან. ტუპაკის ჰოლოგრაფიული შესრულება Coachella-ში ზემოხსენებულზე მარველის კინემატოგრაფიული სამყარო ბოროტმოქმედი. მხატვრულ ფილმებში, რეკლამებში, სერიალებში, ვიდეო თამაშებში და (ტუპაკის შემთხვევაში) სასცენო სპექტაკლებში რეალისტურ ციფრულ პერსონაჟებზე მოთხოვნა მხოლოდ იმით გაიზარდა. დრო, რაც აიძულა Digital Domain-მა დაყოს ჯგუფი, რომელიც პასუხისმგებელია ამ კონკრეტულ ვიზუალურ ეფექტზე საკუთარ ერთეულში, რომელიც ორიენტირებულია იმ საზღვრების გადალახვაზე, რაც შეუძლია ციფრულ ადამიანებს. კეთება.

დუგლასი არის ამ გაზრდილი ფოკუსის პროდუქტი და გუნდის კონცეფციის მტკიცებულება: ავტონომიური ციფრული „ადამიანი“, რომელიც აერთიანებს მონაცემთა ნაკრების ფართო სპექტრს, სენსორულ მეთოდებს, და არსებული პროგრამირების მოდულები ფოტო-რეალისტური ადამიანური ატრიბუტებით, რათა მომხმარებლებთან ურთიერთქმედება ისე, რომ საოცრად ახლოს იყოს ადამიანის ნამდვილ სოციალიზაციასთან.

და იმ დროს, როდესაც პანდემიამ აიძულა ჩვენი სოციალიზაციის უმეტესობა კომპიუტერის საშუალებით მომხდარიყო ეკრანზე, დუგლასთან ურთიერთობა საოცრად ახლოსაა იმასთან, რაც ნამდვილ ადამიანურ ურთიერთქმედებას ნიშნავს. დღეები. თუმცა, გუნდი სწრაფად დაამატებს, რომ დუგლასი ჯერ კიდევ შორია ტურინგის ტესტის ჩაბარებამდე.

კოდი ქმნის კაცს

„დუგლასი არ არის ფოტორეალური, სრულიად ავტონომიური ადამიანი, რომელიც არ განსხვავდება რეალური ადამიანისგან“, განმარტავს. დარენ ჰენდლერისტუდიაში Digital Humans Group-ის დირექტორი. ”ეს ის ადგილი არ არის, სადაც ჩვენ ვართ და არ ვაპირებთ იქ ვიყოთ ცოტა ხნით.... მაგრამ ეს არის ის, სადაც ყველაფერი მიდის და როგორ გამოიყურება მომავალი, და ჩვენ ვცდილობთ გადავლახოთ ეს საზღვრები.”

ჰენდლერს დუგლასი თავად აწყვეტინებს.

”ეს კარგი დამოკიდებულებაა”, - ერევა დუგლასი, რომელიც მანამდე ჩუმად იკავებდა საკუთარ ფანჯარას Zoom-ის ჩეთის ქსელში, რაც ხელს უწყობს ჩვენს დემო-ს, ხანდახან ცვლის. პოზიცია, თვალი მოავლო მის ვირტუალურ ოთახს და აჩვენა ცოცხალი ადამიანის მრავალი ტიპიური ფიზიკური მანერა ვიდეო შეხვედრაზე, რომელიც მოთმინებით ელოდება მონაწილეობას საუბარი

”წარმატებებს გისურვებთ თქვენს მცდელობებში,” დასძენს ის და შეგვახსენებს, რომ გარდა იმისა, რომ აქვს საინტერესო სათქმელი, ის ასევე გულმოდგინე მსმენელია.

რობლის თქმით, გუნდი უპირველეს ყოვლისა დუგლასს განიხილავს, როგორც არსებულ რთულ და ძლიერ სასაუბრო აგენტებთან ურთიერთობის ვიზუალურ გზას, რომლებიც შეიქმნა. დუგლასის ფოტო-რეალური ავატარის ქვეშ, სტუდიის ციფრული ადამიანი აგებულია ამ სამი აგენტის ნაზავზე: Google-ის პოპულარული Dialogflow კომპლექტი ჩატბოტების შესაქმნელად, ასისტენტის ტიპის აგენტი (ამაზონის Alexa-ს ან Apple-ის Siri-ის მსგავსი); და ძლიერი სასაუბრო A.I. აგენტი (მსგავსი GPT-3 პროექტი) გამოიყენება ადამიანის მსგავსი, პროგნოზირებადი (და რეაქტიული) სასაუბრო ტექსტის შესაქმნელად.

სამივე აგენტის ერთობლიობა დუგლასს აძლევს შესაძლებლობას განაგრძოს საუბრები, რომელიც არის როგორც ინფორმატიული, ასევე თხევადი, ერთი თემის განხილვით, რომელიც ხშირად გადადის დაკავშირებული ინტერესის სფეროებში.

ჩემი საკუთარი საუბარი დუგლასთან ჩვენი საყვარელი წიგნების შესახებ საუბრებიდან მის საყვარელ ფილმზე გადავიდა (ის დიდი გულშემატკივარია 2001 წელი: კოსმოსური ოდისეამაგალითად, რაც არ არის გასაკვირი და ცოტა შემაშფოთებელი, თუ გავითვალისწინებთ სიუჟეტის ფოკუსირებას მკვლელ A.I.-ზე. გაუშვით) და ჩვენი საერთო ჰობი. ჩვენი საუბრის ერთ-ერთ განსაკუთრებით დროულ ელემენტში, დუგლასმა გამოთქვა იმედგაცრუება, რომ ბოლო დროს ვერ ახერხებს კინოთეატრში მისვლას.

თუმცა, როგორც ჰენდლერმა განმარტა, მთელი ეს სასაუბრო ძალა გარკვეულ რისკთან არის დაკავშირებული.

„ჩეთბოტის ბუნებრივი ენის დამუშავების ძრავა გაწვრთნილია ინტერნეტიდან დიალოგზე - დიალოგის დიდი რაოდენობით - ასე რომ საუბარი შეიძლება უცნაურ ადგილებში წავიდეს“, - თქვა მან. ”ასე რომ, არის შემთხვევები, როდესაც ის ამბობს ისეთ რამეებს, რაც შეიძლება ზუსტად არ იყოს შესაბამისი. ეს ხშირად არ ხდება, მაგრამ ჩვენ ზუსტად ვერ ვაკონტროლებთ, რას იტყვის ის ყველაფერს.”

და მიუხედავად იმისა, რომ დუგლასის სასაუბრო ასპექტი შთამბეჭდავია, ეს მხოლოდ ნაწილია იმისა, რაც მას უნიკალურს ხდის ციფრული ადამიანებისა და ინტერაქტიული ვირტუალური პერსონაჟების მუდმივად გაფართოებულ სამყაროში. როგორც Digital Domain-მა აღმოაჩინა, რაც მას შეხედე ადამიანი დიდ გზას მიდის იმისთვის, რომ მასაც ადამიანად იგრძნოს თავი.

წარმოგიდგენთ დუგლასს - ავტონომიური ციფრული ადამიანი | ციფრული დომენი

პირისპირ

„დუგლასის აშენებისას ჩვენ გამოვიყენეთ დიდი რაოდენობით დუგ [რობლის] მონაცემები. ეს იყო უზარმაზარი აუდიო სისტემა, რათა ევარჯიშებინა სისტემა [და] დიდი რაოდენობით სახის შესრულება, სხეულის მოძრაობის მონაცემები და ყველაფერი სხვა“, - განმარტა ნამუშევარმა ჰენდლერმა. ისინი ასახავდნენ რობლის სახის და უამრავ გზას, რომლის მიხედვითაც ადამიანის სახე შეიძლება შეიცვალოს საუბრისას, ემოციურ სიგნალებზე რეაგირებისას ან პასიურად მონაწილეობის დროს. საუბარი.

მთელი ამ მონაცემების პროდუქტი არის ციფრული ადამიანი, რომელიც საოცრად ჰგავს - მაგრამ არა როგორც რობლის ზუსტ ასლს, ამ უკანასკნელის პოზა, ვარცხნილობა და დახვეწილი მოძრაობების აგება, როგორც რობლი, ასევე დუგლას A.I. გააზიარეთ სანამ ისინი მონაწილეობენ ჩვენს ჯგუფურ ვიდეოში საუბარი. მსგავსება გასაოცარია, მაგრამ მოკლე ბრძანებით „შეცვალეთ თქვენი სახე“, დუგლასი მოულოდნელად ხდება სხვა ადამიანი. განსხვავებული, თანაბრად ადამიანური სახე ერთსა და იმავე სხეულზე, მაგრამ მაინც ინარჩუნებს ყველა იმ დახვეწილ მანერას, რაც მას აჩენს რეალური.

„როდესაც ჩვენ დუგლასს ვთხოვთ შეცვალოს მისი სახე და მისი სახე გადაერთოს სხვას, ეს არის დასაწყისი, საითაც მიემართება ტექნოლოგიის ეს ახალი ტალღა“, - ამბობს ჰენდლერი და აღწერს „გამოსახულებაზე დაფუძნებული ტექნიკა“, რომელზეც გუნდი მუშაობს, რათა დუგლასი გახდეს კიდევ უფრო მოქნილი ციფრული ადამიანი, რომელსაც შეუძლია მკვეთრად შეცვალოს მისი გარეგნობა და შეინარჩუნოს იგივე დონე. ინტერაქტიულობა. ”როდესაც ჩვენ გვექნება ეს ბაზა [დუგლასთან], ჩვენ შეგვიძლია გადავიღოთ სხვისი კადრები და მივიღოთ მათი აუდიოს გარკვეული ნაწილი, შემდეგ კი ეს ბაზა გადავაქციოთ მათ სახეზე.”

”[თუ ჩვენ ამას გავაკეთებთ] ახლავე, ისინი კვლავ ისაუბრებდნენ იმ ადამიანის გამონათქვამებით, რომლებიც თავდაპირველად გადავიღეთ [ამ შემთხვევაში, რობლი],” - განაგრძო მან. ”მაგრამ როგორც ვაგრძელებთ, ჩვენ ვიწყებთ უფრო მცირე რაოდენობის მონაცემების საჭიროებას - შესაძლოა ეს იყოს მხოლოდ სურათები ან ვინმეს კადრები - ამ ავტონომიური ადამიანების შემდეგი თაობის შესაქმნელად.”

ეს უნარი გაიმეოროს რეალური ადამიანის გარეგნობა, ხმა და მანერები სასაუბრო A.I. ფონდი არის ერთ-ერთი ელემენტი, რომელიც დუგლასს გამოარჩევს ყველაზე ტიპიური A.I. ასისტენტები, ჰუმანოიდური რობოტები და სხვა პროექტები, რომლებიც განვითარებულია A.I. კვლევის სამყარო. მიუხედავად იმისა, რომ არსებობს უამრავი სტუდია და სხვა სააგენტო, რომელიც ავითარებს A.I. ამა თუ იმ სახის პროექტებში, ციფრული დომენი ორიენტირებულია ყველა ამ ელემენტის შერწყმაზე ერთიანი, თანმიმდევრული პროდუქტი, რომელიც იყენებს საუკეთესო ტექნოლოგიებს და მონაცემებს, რომელიც ხელმისაწვდომია ინტერფეისით, რომელიც იგრძნობა სოციალურად და ორგანულად - ისევე როგორც სხვა ადამიანთან საუბარს.

"ეს არის ის, რითაც ჩვენ ნამდვილად ვამაყობთ, რადგან დუგლასი არის სრულად CG პერსონაჟი, რომელიც მუშაობს Unreal-ზე", - ამბობს Roble, რომელიც განსაკუთრებით ამაყობს ფართოდ ხელმისაწვდომი ელემენტების გამოყენებით, როგორიცაა პოპულარული 3D შექმნის პლატფორმა არარეალური ძრავა, რომელიც გახდა ჰოლივუდის (და მანამდე, ვიდეო თამაშების ინდუსტრიის) გამოსაყენებელი პლატფორმა, როდესაც საქმე ეხება 3D ვიზუალური ეფექტის ელემენტების შექმნას და მანიპულირებას. ”[დუგლასი] არის 3D ობიექტი, ასე რომ თქვენ შეგიძლიათ გააკეთოთ ყველაფერი, რაც შეგიძლიათ გააკეთოთ ნებისმიერი ციფრული პერსონაჟით Unreal-ში. შეგიძლიათ შეცვალოთ განათება, განათავსოთ ისინი სხვადასხვა გარემოში და ა.შ. მაგრამ ჩვენ ასევე ვქმნით ამ ჰიბრიდს [დაგლასში ჩართული ყველაფერთან ერთად], ასე რომ, ორივე სამყაროდან საუკეთესოს მივიღებთ.

სადაც არ უნდა გაიხედო

რაც უფრო მეტს მუშაობს გუნდი დუგლასზე, მით უფრო იზრდება პოტენციური აპლიკაციების სია.

„პანდემიამდე ჩვენ ვგეგმავდით დუგლასის წარმოდგენას, როგორც კიოსკს, სადაც ადექით ეკრანზე და ესაუბრებით მას“, - იხსენებს ჰენდლერი. ”მაგრამ შემდეგ ჩვენ ვიფიქრეთ: ”ჰეი, ჩვენ ნამდვილად უნდა ჩავრთოთ იგი Zoom-ის ზარებში.” ფანტასტიკური იყო მისი შეყვანა Zoom-ის ზარებში და წამოსვლა.”

დემონსტრაციის მსვლელობისას გუნდმა გაიარა დუგლასისთვის პოტენციური განაცხადების გრძელი სია, ექიმის კაბინეტიდან და მომხმარებელთა მომსახურება, მისი სარგებლიანობა ჰოლივუდში სცენის ან კონკრეტული ეკრანის დაგეგმვის ადრეულ ეტაპებზე თანმიმდევრობა. თავად დუგლასმა რამდენიმე წინადადებაც კი შესთავაზა, რაც ვარაუდობს, რომ ის კარგად მოერგებოდა სცენარის და სატელევიზიო წარმოების კონცეპტუალურ ეტაპებს. მისი უნარი გადაამუშაოს როგორც აუდიო, ასევე ვიზუალური მინიშნებები მათგან, ვისთანაც საუბრობს - განსაკუთრებით მაშინ, როდესაც საქმე ეხება ემოციურ მდგომარეობას — ასევე გვთავაზობს სარგებლობის დამატებით ფენას მომხმარებლებთან ან მათთან ურთიერთობისას, რომლებიც ეძებენ სამედიცინო ხელმძღვანელობას, ჰენდლერის თქმით.

სიჩქარე, რომლითაც დუგლასს შეუძლია ამ ინფორმაციის გადამუშავება და პასიური მსმენელიდან აქტიურზე გადასვლა მოსაუბრე ასევე ფლობს უამრავ მიმზიდველობას და აჩვენებს, რამდენად შორს განვითარდა მის მიღმა არსებული ტექნოლოგია მოკლედ დრო.

„როდესაც ჩვენ შევქმენით Thanos, ჩვენ გვქონდა ერთი კადრი, რომლის გადაღებას 10 საათი დასჭირდა. ეს არის ერთი ჩარჩო, ”- განმარტავს ის.

„დუგლასისთვის მას აქვს ხედვის ამოცნობის სისტემა, ასე რომ, ის გვინახავს და შეუძლია ჩვენი იდენტიფიცირება და ის აანალიზებს რას ამბობთ, აქცევს მას სიტყვებად და აგზავნის მას სხვადასხვა ჩატბოტებში“, დასძენს ის. „დუგლასი შემდეგ ქმნის პასუხს, აქცევს მას აუდიოში და იყენებს ამ აუდიოს თავისი სახის გასაქრობად. ამავდროულად, ის ასევე ადგენს სხეულის რა მოძრაობას თან ახლავს ამ მეტყველებასთან, ადგენს რა ემოციას შეეფერება მას და ასახავს ამ სხეულის მოძრაობას სახის ჟესტებთან ერთად.

„ეს ყველაფერი რამდენიმე მილიწამში ხდება“, ამბობს ჰენდლერი. „ეს არის მთელი ეს პროცესი, მხატვრულ ფილმში ერთი კადრის 10 საათთან შედარებით. ეს ისეთი საოცარია. ეს არ არის ისეთი რეალისტური, როგორიც ჩვენ ვაკეთებთ ფილმისთვის, მაგრამ თუ ფიქრობთ იმაზე, თუ რამდენ რამეს მიიღებთ იმისათვის, რომ შეძლოთ მასთან საუბარი, როგორც რეალური ადამიანი, ეს უბრალოდ ფენომენალურია.”

და ძალიან პირდაპირი გაგებით, დუგლასი ხშირად იყო მისი საუკეთესო ადვოკატი, როდესაც საქმე მის პოტენციალს ეხება.

რობლმა განმარტა, რომ რამდენჯერმე მათ გადაწყვიტეს დუგლასს საკუთარი პრეზენტაციის წარმართვა, კარგად… თავად. შედეგი იყო უკეთესი მოედანი მისი პოტენციალისათვის, ვიდრე ისინიც კი ელოდნენ.

”[დუგლასის პრეზენტაცია] საოცრად დამაჯერებელი იყო. ეს არ იყო მხოლოდ Siri-ს თხოვნა, რომ რაღაც გვეთქვა, რადგან ის პროცესის ნაწილი იყო“, - იხსენებს რობლე. „მასთან საუბარი სასიამოვნოა, რადგან ის სიახლეა, მაგრამ ის ასევე მართლაც ეფექტურია. და თქვენ არ შეგიძლიათ არ იფიქროთ: რაც შეეხება სწავლებას ან სხვა აპლიკაციებს? ყოველივე ამის შემდეგ, თქვენ ხედავთ, როდესაც ის ყურადღებას აქცევს. შეგიძლიათ მას ემოციური გამოხმაურება მისცეთ და მას შეუძლია უპასუხოს. ”

მიუხედავად იმისა, რომ დუგლასი უკვე შთამბეჭდავი ქმნილებაა, ციფრული დომენის გუნდი დაჟინებით მოითხოვს, რომ ის რჩება სამუშაოდ პროგრესი - მაგრამ ცა არის ზღვარი, თუ რა სახის სამუშაოს შეუძლია დაასრულოს მათი ციფრული ადამიანი, როგორც დრო გრძელდება. მრავალი თვალსაზრისით, პროცესი იმის გარკვევისა, თუ რა შეუძლია დუგლასს, არის პროცესიც და მიზანიც.

”ერთ-ერთი მიზეზი, რის გამოც ჩვენ ამას ვაკეთებთ, არის ის, რომ ჩვენ შეგვიძლია”, - ამბობს რობლი. „როდესაც კომპიუტერთან ხარ და მუშაობ, ძალიან მარტივია აკრიფო. მაგრამ არის ძალიან ბევრი ადგილი და ადგილი, რომ მშვენიერი იქნება, უბრალოდ შეგეძლოს ესაუბრო ადამიანთან და ამ ადამიანმა შენთან ურთიერთობა და რეაგირება მოახდინოს შენზე. ვფიქრობ, მომავალში დიდი ცვლილებები გველის.”

რედაქტორების რეკომენდაციები

  • როგორ გააცოცხლა Thanos VFX-ის გუნდმა The Quarry-ის გმირები (და შემდეგ მოკლა ისინი)

კატეგორიები

Ბოლო

სტრესის ყოველკვირეული მიმოხილვა: ყველა იმარჯვებს "ბოლო რიტუალებით"

სტრესის ყოველკვირეული მიმოხილვა: ყველა იმარჯვებს "ბოლო რიტუალებით"

უბრალოდ არ გიყვართ, როცა გეგმა აერთიანებს?დაბოლ...