აი, როგორ ასწავლა ფეისბუქმა თავის პორტალს A.I. ჰოლივუდის კინორეჟისორივით იფიქრო

Facebook Portal+ მიმოხილვა
დენ ბეიკერი/ციფრული ტენდენციები

როდესაც მარკ ცუკერბერგმა ააგო Facebook-ის პირველი ვერსია თავის კოლეჯის საერთო საცხოვრებელში ჰარვარდის ოთახში, მან წარმოიდგინა ის, როგორც ფანჯარა, რომელიც საშუალებას მისცემს ხალხს თვალი ადევნონ სხვა მომხმარებლების ცხოვრებას. თუ Google იყო ინფორმაციის საძიებო სისტემა, მაშინ Facebook, პირიქით, საძიებო სისტემა იყო ხალხისთვის. თხუთმეტი წლის შემდეგ Facebook-მა ეს ამბიცია შემდეგ დონეზე აიყვანა. Portal-ისა და Portal+-ის, მისი ეკრანით გაუმჯობესებული ჭკვიანი დინამიკების ხაზის შექმნით, რომელიც 2018 წლის ნოემბერში დაიწყო, სოციალური მედიის გიგანტმა შექმნა ბევრად უფრო პირდაპირი ფანჯარა, რომელიც Facebook-ის მომხმარებლებს საშუალებას აძლევს განახორციელონ ვიდეო ზარები ერთთან სხვა.

შინაარსი

  • კამერების უფრო ჭკვიანური
  • ტექნიკური გამოწვევები
  • მზარდი ბაზარი
  • კონფიდენციალურობის გამოწვევები გელით?

პორტალი ჭკვიანი დინამიკები სიტყვასიტყვით ასახავს მეორეს ფეისბუქი ოცნებაც. სადაც Facebook იყო, არსებითად, საძიებო სისტემა ხალხისთვის, პორტალი აკეთებს მოძებნეთ ისინი: მოძრავი 12 მეგაპიქსელიანი კამერით, რომელიც ამაყობს 140 გრადუსიანი ხედვით, რომელიც გამოგყვებათ ოთახში, რათა ნახოთ რას აკეთებთ. როგორც ციფრული ტენდენციები

განათავსეთ იგი ჩვენს მიმოხილვაში, „თუ დაკავებული ხართ სამზარეულოში მოძრაობით და ბებიას ეკითხებით, როგორ მოამზადოს მისი ცნობილი ხორცის ბურთულები, შეგიძლიათ იყოთ დაკავებული მისი საუბრის მოსმენისას“.

რეკომენდებული ვიდეოები

კონკრეტულად რა არის ჭკვიანი ტექნოლოგია, რომელიც მართავს პორტალს? და როგორ ფიქრობს ფეისბუქი, რომ მან გადაჭრა გამოწვევა, რომ რეგულარული ვიდეო ჩატი ისეთივე პიროვნული იყოს, როგორც ნამდვილი საუბრისთვის ჯდომა? პასუხი მოიცავს რამდენიმე შთამბეჭდავ ხელოვნურ ინტელექტს - და დამატებით ადამიანურ შეხებას.

დაკავშირებული

  • ემოციების აღმძვრელი A.I. აქ არის და ეს შეიძლება იყოს თქვენს შემდეგ სამუშაო ინტერვიუში
  • იმის გამო, რომ 2020 წელი საკმარისად გიჟური არ არის, რობოტი პირი მღერის A.I. ლოცვა პარიზში
  • ა.ი. სკალირების გაზრდა ხდის ამ 1896 წლის ფილმს ისე გამოიყურება, თითქოს ის გადაღებულია კაშკაშა 4K-ში
Facebook Portal+ მიმოხილვა
დენ ბეიკერი/ციფრული ტენდენციები

კამერების უფრო ჭკვიანური

თავიდანვე ფეისბუქმა იცოდა, რომ მისი პორტალის გამოცდილების ძირითადი საფუძველი იქნებოდა ეგრეთ წოდებული „ჭკვიანი კამერის“ სისტემა. ჭკვიანი კამერის იდეა იყო გადასულიყო იმ სტატიკური კადრის მიღმა, რომელსაც სკაიპის მსგავსი სერვისები გვთავაზობდა წლების განმავლობაში და ამ პროცესში უფრო შემოქმედებითი როლის შესრულება. ისევე, როგორც კინორეჟისორმა ან კინემატოგრაფისტმა იცის, როდის გამოიყენოს ფართო კადრი ან როდის გაადიდოს ინტიმური ახლო ხედისთვის, ასევე ფეისბუქი დაუპირისპირდა თავის ინჟინრებს, მიებატონ იგივე უნარი პორტალთან ერთად.

იმისათვის, რომ ამ კამერას საჭირო ადამიანური შეხება მიეცეს, ფეისბუქი მუშაობდა კინორეჟისორებთან, რათა გაერკვიათ მათი სიბრძნის მანქანით შესასწავლი შეხედულებების გამოხდის საუკეთესო გზა. ერთ შემთხვევაში, მან სთხოვა მათ ეჩვენებინათ, როგორ გადაეღოთ სცენა, რომელშიც შეუძლებელი იყო ყველა შესაბამისი ინფორმაციის გადაღება ერთი ფიქსირებული კუთხიდან.

პორტალი მოიცავს უკიდურესად ფართო კუთხიან ლინზას, რომელშიც გადაადგილებისა და რედაქტირების ყველა გადაწყვეტილება მიიღება მთლიანად ციფრულად.

მეორეში, Facebook-ის ინჟინრებმა შეხედეს სხვადასხვა ფოტოგრაფიულ ელემენტებს, რომლებსაც კამერის ოპერატორები პრიორიტეტად ანიჭებენ პორტრეტულ და ლანდშაფტის კადრებში. ამ დაკვირვებებმა საფუძველი ჩაუყარა პროგრამულ მოდელებს, რომლებიც ცდილობენ პორტალს გადასცენ გადაწყვეტილების მიღების ზოგიერთი უცნაურობა, რომელსაც ჩვეულებრივ მივაწერთ ადამიანის შემოქმედებითობას.

„ჩვენ გვინდოდა შეგვექმნა უკონტაქტო ვიდეო ზარის გამოცდილება, რომელიც აშორებს ფიზიკურ დისტანციას უფრო ჰგავს ერთად ყოფნისას“, განუმარტა Digital Trends-ს ერიკ ჰვანგმა, პორტალის ერთ-ერთმა ინჟინერმა.

შედეგად მიღებული სისტემა - რომლის ფეისბუქის თქმით, "ორ წელზე ნაკლები" დაჭირდა ნულიდან შექმნას - საშუალებას აძლევს პორტალს მიიღოს გადაწყვეტილებები, რომლებიც შექმნილია საუბრის ნაკადის გასაუმჯობესებლად. Ში ახლად გამოქვეყნებული ბლოგის პოსტი, მასში დეტალურადაა აღწერილი ზოგიერთი ილუსტრაცია, თუ რატომ შეიძლება იყოს ეს საჭირო. მაგალითად, თუ თქვენ ხართ ხალხმრავალ ოთახში, სავსე ადამიანებით, რომლებიც ურთიერთობენ ერთმანეთთან, მან უნდა აირჩიოს, როდის მიჰყვება ინდივიდს კადრიდან მიღმა ან როდის გაადიდებს ახალ საგნებს.

ფეისბუქის პროგრამული უზრუნველყოფის ინჟინრები ერიკ ჰვანგი (თავიდან სავარძელში იჯდა) და არტურ კავალკანტი აჩვენებენ პორტალის კინემატოგრაფიულ კამერის მსგავს თვალთვალის და კადრების დემონსტრირებას.

ანალოგიურად, მან უნდა ისწავლოს რეალურ დროში ცვალებად სიტუაციებთან გამკლავება. რას აკეთებთ, თუ თქვენი სუბიექტი წევს ბნელ ოთახში, ნახევრად დაფარულია საბანით, მაგრამ ფონზე ბავშვები დარბიან და იწვევს მოძრაობის დაბინდვას? პორტალი ყველა ამ ინფორმაციას აწონ-დაწონებს თვალის დახამხამებაში და ცდილობს საუკეთესო შედეგის დადგენას. (თუ გსურთ ხელით გააკონტროლოთ ვისზე აკეთებს აქცენტს, ეს ახლაც შესაძლებელია.)

ტექნიკური გამოწვევები

ტექნიკური თვალსაზრისით, რამდენიმე რამ პორტალის ტექნოლოგიას შთამბეჭდავს ხდის. პირველი ის არის, რომ მას შეუძლია ამ ყველაფრის გაკეთება რეალური მოძრავი კამერის გამოყენების გარეშე. განვითარების პროცესის დასაწყისში, პორტალის ინჟინრებმა სცადეს პროტოტიპები, რომლებიც იყენებდნენ მოტორიზებულ კამერას, რომელიც ტრიალებდა საგნებისკენ. თუმცა, ეს გადაწყდა იმის საფუძველზე, რომ მან გამოიწვია ჩამორჩენა და პოტენციური მექანიკური უკმარისობის წერტილი. ამის ნაცვლად, პორტალი მოიცავს უკიდურესად ფართო კუთხიან ლინზას, რომელშიც გადაადგილებისა და რედაქტირების ყველა გადაწყვეტილება მიიღება მთლიანად ციფრულად.

მეორე, პორტალზე მომუშავე გუნდმა იპოვა გზა, რათა მიაღწიოს გადაწყვეტილების მიღების პროცესს ღრუბლოვან გამოთვლებზე დაყრდნობის გარეშე. ჰვანგის თქმით, გამოთვლითი ცეცხლის ძალა მიიღწევა მოწყობილობაში.

Facebook პორტალის ევოლუცია
პორტალის ადრეული პროტოტიპები ეყრდნობოდნენ ძრავას კამერის ფიზიკურად გადასაადგილებლად.Facebook Engineering

”ვიდეო ჩარჩოში ყველას გადაღება არ არის რთული საინჟინრო პრობლემა, რადგან ბევრ ინჟინერს შეუძლია ამის გაკეთება დღევანდელი კომპიუტერული ხედვის მიღწევებით,” - თქვა მან. „ინოვაცია არის შესაბამისი ადამიანების ან პიროვნების დაჭერა რეალურ დროში, მოწყობილობაზე, მხოლოდ პორტალში არსებული პატარა მობილური ჩიპის გამოყენებით, როგორც გადამამუშავებელი ძალა. ჩვეულებრივ ამ ტიპის A.I. ამოცანები მოითხოვს სპეციალურ, დიდ სერვერებს. [ჩვენ] დავძლიეთ ეს დაბრკოლება კომპიუტერული ხედვის რთული მოდელების შეკუმშვით, სანამ ისინი არ მოერგებოდნენ ჩიპს, რომელსაც ჩვენ ვიყენებთ პორტალისთვის და კვლავ ზუსტად და საიმედოდ მუშაობდნენ.

ამისთვის პორტალი იყენებს Facebook-ის გრძელვადიან ინვესტიციას ხელოვნურ ინტელექტში. ის იყენებს 2D პოზების გამოვლენის სისტემას, რომელიც მუშაობს წამში 30 კადრზე. ამ პოზების მიზანმიმართულობა პორტალს ეხმარება მიიღოს მუდმივი გადაწყვეტილებები იმის შესახებ, თუ რას აკეთებენ მისი სუბიექტები - და როდის შეიძლება დასჭირდეს ციფრული გადატანა ან მასშტაბირება. ის დამატებით იყენებს Facebook Reality Labs-ის მიერ შემუშავებულ ღრმა კამერების კვლევას, როგორც სოციალური მედიის გიგანტის ვირტუალური რეალობის ძალისხმევის ნაწილი.

მზარდი ბაზარი

ფეისბუქი დარწმუნებულია, რომ პორტალზე გამარჯვებულია. ადვილი მისახვედრია, საიდან მოდის მისი ნდობა. ამჟამად, ჭკვიანი დინამიკების ბაზარი ყვავის. მიუხედავად იმისა, რომ დიდწილად დომინირებს ბაზრის ლიდერი Amazon, ის არის იზრდება 100 პროცენტზე მეტი წლიურად. ეს კარგი ამბავია ტექნიკური კომპანიებისთვის, რომლებიც ეძებენ შემდეგ დიდ რამეს გაბრტყელების დროს სმარტფონი გაყიდვების.

Facebook Portal+ მიმოხილვა
დენ ბეიკერი/ციფრული ტენდენციები

მაშინ როცა Facebook იყო ბოლო ოთხი დიდი ტექნიკური გიგანტიდან (Amazon, Alphabet, ფეისბუქი და Apple) გადახტომა ბანდა, ჯერ კიდევ ერთ-ერთი პირველი ჭკვიანი დინამიკების ტალღა, რომელიც ორიენტირებულია ეკრანის გარშემო, როგორც საკომუნიკაციო მოწყობილობა.

„პორტალი ერთადერთი პროდუქტია ბაზარზე“, - თქვა ჰვანგმა. „დღეს ჭკვიანი დინამიკები და ეკრანები აგებულია ინფორმაციისა და კომერციის ირგვლივ. პორტალი შექმნილია იმისთვის, რომ გაადვილოს დაკავშირება ყველაზე მნიშვნელოვან ადამიანებთან: ჩვენს უახლოეს მეგობრებთან და ოჯახთან. და პორტალი ორიენტირებულია ადამიანების დაკავშირებაზე - Facebook-ის მისიის ნაწილი - რომელსაც ამჟამად არ ემსახურება სახლის მოწყობილობების ბაზარი.

კონფიდენციალურობის გამოწვევები გელით?

მაშ, რა აჩერებს Facebook-ს? კარგად, პოტენციურად კონფიდენციალურობა. მომხმარებლებმა დაამტკიცეს, რომ საოცრად მზად არიან მიიღონ „ყოველთვის მოსმენილი“ გაჯეტები ისეთი კომპანიებისგან, როგორიცაა Google, რომლებსაც აქვთ ინტერესი მომხმარებლის მონაცემებით. მაგრამ მოწყობილობა, რომელიც გიყურებს და გისმენს, მაინც უფრო ინვაზიურია. გარდა ამისა, Facebook-ის რეპუტაცია კვლავ იტანჯება გასული წლის Cambridge Analytica-ს სკანდალი.

სმარტების დამატება პორტალის ვიდეო ჩეთის კამერაში (ფეისბუქი)

ამ სტატიის გამოქვეყნებამდე რამდენიმე დღით ადრე, ვაშინგტონ პოსტი იტყობინება რომ Facebook აწარმოებს მოლაპარაკებებს რეკორდულ, მრავალმილიარდ დოლარის ანგარიშსწორებაზე FTC-თან მისი კონფიდენციალურობის დანაშაულისთვის. ბევრი ყოფილი მომხმარებლის მხრიდან მზარდი გამოხმაურებით, ჯერ კიდევ არ არის გამოვლენილი ფეისბუქი აქვს Amazon Echo-ის სტილის ჰიტი – ან Amazon Fire Phone-ის სტილის ფლოპი.

Facebook-მა დაგვარწმუნა, რომ ის არ უსმენს, არ ნახულობს და არ ინახავს პორტალის ვიდეოზარების შინაარსს, რომელიც დამატებით არის დაშიფრული, რათა თავიდან აიცილოს მოსმენა. ის ფაქტი, რომ პორტალის A.I. სმარტები მუშაობს ადგილობრივად მოწყობილობაზე და არა ჩართული ფეისბუქი სერვერები, ასევე ნიშნავს, რომ ეს ინფორმაცია არ ტოვებს თქვენს სახლს. ხმოვანი ბრძანებები კომპანიას ეგზავნება მხოლოდ მას შემდეგ, რაც იტყვით „Hey Portal“ და მომხმარებლებს შეუძლიათ ნებისმიერ დროს წაშალონ ხმოვანი ისტორია Facebook-ის აქტივობის ჟურნალში.

მაგრამ არ არსებობს იმის გარკვევა, რომ ჯერ კიდევ არსებობს მონაცემთა შეგროვების ხარისხი. „მიუხედავად იმისა, რომ ჩვენ არ ვუსმენთ, არ ვუყურებთ ან არ ვინახავთ თქვენი პორტალის ვიდეოზარების შინაარსს, ან არ ვიყენებთ ამ ინფორმაციას რეკლამის მიზნებისთვის, ჩვენ დაამუშავეთ ზოგიერთი მოწყობილობის გამოყენების ინფორმაცია, რათა გაიგოთ, თუ როგორ გამოიყენება პორტალი და გააუმჯობესოთ პროდუქტი,” აღნიშნავს Facebook. (პორტალის კონფიდენციალურობის პოლიტიკა შეგიძლიათ წაიკითხოთ აქ.)

პორტალი გთავაზობთ რამდენიმე ძალიან ჭკვიან ტექნოლოგიას, რომელსაც დიდი გავლენა აქვს ვიდეო ჩეთის მომავალზე. ეჭვგარეშეა, რომ კომპანიამ მოახერხა რაღაც ძალიან შთამბეჭდავი ტექნოლოგიური თვალსაზრისით. მაგრამ შეძლებს თუ არა მას დაარწმუნოს პოტენციური მომხმარებლები, რომ ეს არის გამოსავალი, რომელიც მათ ცხოვრებაში სჭირდებათ, საბოლოო ჯამში, რეალური მიღწევა იქნება.

რედაქტორების რეკომენდაციები

  • წაიკითხეთ A.I.-ის საოცრად ლამაზი "სინთეზური წერილი". რომ ფიქრობს, რომ ღმერთია
  • ენის სუპერმოდელი: როგორ ჩუმად ახორციელებს GPT-3 A.I. რევოლუცია
  • ჩვენ გამოვიყენეთ A.I. დიზაინის ინსტრუმენტი ახალი ლოგოს შესაქმნელად. აი რა მოხდა
  • ნეირო-სიმბოლური A.I. არის ხელოვნური ინტელექტის მომავალი. აი, როგორ მუშაობს
  • გადახედეთ A.I.-ს აღზევებას: რამდენად შორს წავიდა ხელოვნური ინტელექტი 2010 წლის შემდეგ?

კატეგორიები

Ბოლო

IMac (2023): ყველაფერი, რისი ხილვა გვინდა შემდეგ მოდელში

IMac (2023): ყველაფერი, რისი ხილვა გვინდა შემდეგ მოდელში

Apple-ის 24 დიუმიანი iMac მიიღო ძირითადი რედიზა...

მე მაწუხებს წითელი iPhone 15 Pro და თქვენც უნდა იყოთ

მე მაწუხებს წითელი iPhone 15 Pro და თქვენც უნდა იყოთ

გაზაფხული ჰაერშია და ის ასევე საუკეთესო დროა iP...