Štai kaip „Facebook“ mokė savo portalą A.I. mąstyti kaip Holivudo filmų kūrėjas

Facebook portalo+ apžvalga
Danas Bakeris / Skaitmeninės tendencijos

Kai Markas Zuckerbergas sukūrė pirmąją „Facebook“ versiją savo kolegijos bendrabučio kambaryje Harvarde, jis įsivaizdavo, kad tai yra langas, leidžiantis žmonėms pažvelgti į kitų vartotojų gyvenimus. Jei „Google“ buvo informacijos paieškos variklis, „Facebook“, priešingai, buvo žmonių paieškos variklis. Po penkiolikos metų „Facebook“ perkėlė šį siekį į kitą lygį. Sukūrę „Portal“ ir „Portal+“ – išmaniųjų garsiakalbių su ekranu seriją, pristatytą 2018 m. lapkritį, Socialinės žiniasklaidos milžinas sukūrė daug pažodinį langą, leidžiantį „Facebook“ vartotojams atlikti vaizdo skambučius kitas.

Turinys

  • Kad fotoaparatai būtų išmanesni
  • Techniniai iššūkiai
  • Auganti rinka
  • Privatumo iššūkiai laukia?

Portalo išmanieji garsiakalbiai įprasmina kitą Facebook svajonė irgi. Kur „Facebook“ iš esmės buvo žmonių paieškos variklis, iš tikrųjų portalas daro Ieškokite jų: su besisukančia 12 megapikselių kamera su 140 laipsnių matymo lauku, kuris seka jus po kambarį ir pamatysite, ką darote. Kaip skaitmeninės tendencijos

įtraukite jį į mūsų apžvalgą, „Jei esate užsiėmę virtuvėje ir klausiate močiutės, kaip jai pagaminti garsiuosius kotletus, galite būti užsiėmę klausydamiesi jos pokalbių“.

Rekomenduojami vaizdo įrašai

Kas tiksliai yra išmanioji technologija, kuri valdo portalą? Ir kaip „Facebook“ mano, kad įveikė iššūkį, kad įprastiniai vaizdo pokalbiai jaustųsi taip pat asmeniški, kaip ir sėdėjimas tikram pokalbiui? Atsakymas apima įspūdingą dirbtinį intelektą ir papildomą žmogaus prisilietimą.

Susijęs

  • Emocijų jutimo A.I. yra čia, ir tai gali būti kitame jūsų darbo pokalbyje
  • Kadangi 2020-ieji nėra pakankamai beprotiški, roboto burna dainuoja A.I. pamaldos Paryžiuje
  • A.I. Padidinus mastelį, šis 1896 m. filmas atrodo taip, lyg būtų nufilmuotas akinančia 4K raiška
Facebook portalo+ apžvalga
Danas Bakeris / Skaitmeninės tendencijos

Kad fotoaparatai būtų išmanesni

Nuo pat pradžių „Facebook“ žinojo, kad jos portalo patirties pagrindas bus vadinamoji „Smart Camera“ sistema. Išmaniosios kameros idėja buvo išeiti už statinio kadro, kurį mums jau daugelį metų siūlo tokios paslaugos kaip „Skype“, ir atlikti kūrybingesnį vaidmenį šiame procese. Kaip filmo režisierius ar operatorius žino, kada naudoti platų kadrą arba kada priartinti, kad būtų intymus planas, taip Facebook metė iššūkį savo inžinieriams mėgdžioti tą patį gebėjimą su portalu.

Siekdama suteikti šiai kamerai būtiną žmogišką ryšį, „Facebook“ bendradarbiavo su filmų kūrėjais, kad išsiaiškintų, kaip geriausiai panaudoti jų išmintį į mašininio mokymosi įžvalgas. Vienu atveju jie paprašė parodyti, kaip jie galėtų nufilmuoti sceną, kurioje neįmanoma užfiksuoti visos svarbios informacijos vienu fiksuotu kampu.

Portalą sudaro itin plataus kampo objektyvas, kuriame visi judėjimo ir redagavimo sprendimai priimami visiškai skaitmeniniu būdu.

Kitame „Facebook“ inžinieriai pažvelgė į skirtingus fotografijos elementus, kuriems fotoaparatų operatoriai teikia pirmenybę portreto ir kraštovaizdžio kadrams. Šie pastebėjimai buvo programinės įrangos modelių, kurie bando įtikti portalui kai kurių sprendimų priėmimo keistenybių, kurias paprastai priskirtume žmogaus kūrybiškumui, pagrindu.

„Norėjome sukurti laisvų rankų vaizdo skambučio patirtį, kuri pašalintų fizinio atstumo jausmą labiau kaip pasibuvimas kartu“, – „Digital Trends“ paaiškino Ericas Hwangas, vienas iš „Portal“ inžinierių.

Sukurta sistema, kurią „Facebook“ teigimu, sukurti nuo nulio prireikė „mažiau nei dvejų metų“, leidžia portalui priimti sprendimus, skirtus pagerinti pokalbio eigą. A naujai paskelbtas tinklaraščio įrašas, jame išsamiai aprašomos kai kurios iliustracijos, kodėl to gali prireikti. Pavyzdžiui, jei esate sausakimšoje patalpoje, kurioje pilna žmonių, bendraujančių vieni su kitais, jis turi pasirinkti, kada sekti asmenį, kuris nėra kadro, arba kada sumažinti mastelį, kad tilptų nauji subjektai.

„Facebook“ programinės įrangos inžinieriai Ericas Hwangas (iš pradžių sėdėjo kėdėje) ir Arthuras Cavalcanti demonstruoja į kinematografinę kamerą panašų portalo stebėjimą ir kadravimą.

Panašiai ji turi išmokti reaguoti į kintančias šviesos situacijas realiuoju laiku. Ką daryti, jei jūsų objektas guli tamsiame kambaryje, pusiau uždengtas antklode, o fone laksto vaikai, sukeliantys judesio susiliejimą? Portalas pasveria visą šią informaciją greičiau nei per akies mirksnį ir bando nustatyti geriausią rezultatą. (Jei norite rankiniu būdu valdyti, kam jis skirtas, tai irgi dabar įmanoma.)

Techniniai iššūkiai

Žvelgiant iš techninės perspektyvos, keli dalykai daro Portalo technologiją įspūdingą. Pirma, visa tai galima padaryti nenaudodama tikros judančios kameros. Kūrimo proceso pradžioje portalo inžinieriai išbandė prototipus, kuriuose buvo naudojama motorizuota kamera, kuri pasukama į objektą. Tačiau buvo nuspręsta to nedaryti, nes tai sukėlė vėlavimą ir galimą mechaninį gedimą. Vietoj to, Portal sudaro itin plataus kampo objektyvas, kuriame visi judėjimo ir redagavimo sprendimai priimami visiškai skaitmeniniu būdu.

Antra, portale dirbanti komanda rado būdą, kaip pasiekti savo sprendimų priėmimo procesus nepasikliaujant debesų kompiuterija. Pasak Hwango, visa skaičiavimo galia pasiekiama įrenginyje.

„Facebook“ portalo evoliucija
Ankstyvieji portalo prototipai rėmėsi varikliu, kad fiziškai perkeltų kamerą.Facebook inžinerija

„Užfiksuoti visus vaizdo įrašo kadre nėra sudėtinga inžinerinė problema, nes daugelis inžinierių gali tai padaryti su šiuolaikinės kompiuterinės vizijos pažanga“, - sakė jis. „Naujovė yra atitinkamų žmonių ar asmenų fiksavimas realiuoju laiku, įrenginyje, naudojant tik nedidelę mobiliąją lustą portale kaip apdorojimo galią. Paprastai tokio tipo A.I. užduotims atlikti reikalingi dideli serveriai. [Mes] įveikėme šią kliūtį suglaudindami sudėtingus kompiuterinio matymo modelius, kol jie tilps į lustą, kurį naudojame portalui, ir vis tiek veiktų tiksliai ir patikimai.

Norėdami tai padaryti, portalas remiasi ilgalaikėmis Facebook investicijomis į dirbtinį intelektą. Jame naudojama 2D pozos aptikimo sistema, kuri veikia 30 kadrų per sekundę greičiu. Šių pozų tikslingumas padeda portalui priimti nuolatinius sprendimus dėl to, ką subjektai veikia ir kada gali prireikti skaitmeniniu panoraminiu vaizdu arba mastelio keitimu. Jame taip pat naudojami giluminių kamerų tyrimai, kuriuos sukūrė „Facebook Reality Labs“ kaip socialinių tinklų milžino virtualios realybės pastangų dalį.

Auganti rinka

„Facebook“ yra įsitikinęs, kad portalas yra nugalėtojas. Nesunku suprasti, iš kur kyla jo pasitikėjimas. Šiuo metu išmaniųjų garsiakalbių rinka klesti. Nors daugiausia dominuoja rinkos lyderis „Amazon“, jis yra per metus auga daugiau nei 100 procentų. Tai gera žinia technologijų įmonėms, ieškančioms kito didelio dalyko susilpnėjimo metu išmanusis telefonas pardavimai.

Facebook portalo+ apžvalga
Danas Bakeris / Skaitmeninės tendencijos

Nors „Facebook“ buvo paskutinis iš keturių didžiųjų technologijų milžinų („Amazon“, „Alphabet“, Facebook ir Apple) įšokti į greitį, vis dar yra vienas pirmųjų išmaniųjų garsiakalbių banga aplink ekraną kaip komunikacijos įrenginys.

„Portalas yra vienintelis tokio pobūdžio produktas rinkoje“, – sakė Hwangas. „Šiandien išmanieji garsiakalbiai ir ekranai yra sukurti remiantis informacija ir prekyba. Portalas sukurtas taip, kad būtų lengviau susisiekti su svarbiausiais žmonėmis: artimiausiais draugais ir šeima. O portalas orientuojasi į žmonių sujungimą – tai yra „Facebook“ misijos dalis – šiuo metu namų įrenginių rinka nėra gerai aptarnaujama.

Privatumo iššūkiai laukia?

Taigi, kas stabdo „Facebook“? Na, galbūt privatumas. Naudotojai stebėtinai nori naudoti „visada besiklausančias“ įtaisus iš tokių įmonių kaip „Google“, kurios labai domisi vartotojų duomenimis. Tačiau įrenginys, kuris jus stebi ir klauso, yra dar labiau invazinis. Be to, „Facebook“ reputacija vis dar kenčia praėjusių metų „Cambridge Analytica“ skandalas.

Portalo vaizdo pokalbių kameros papildymas išmaniosiomis priemonėmis („Facebook“)

Likus kelioms dienoms iki šio straipsnio paskelbimo, Washington Post pranešė kad „Facebook“ derasi dėl rekordinio kelių milijardų dolerių atsiskaitymo su FTC dėl savo privatumo nusižengimų. Didėjant daugelio buvusių vartotojų reakcijai, dar neatskleidžiama, ar Facebook rankose yra „Amazon Echo“ stiliaus hitas arba „Amazon Fire Phone“ stiliaus šnipštas.

„Facebook“ patikino, kad neklauso, nežiūri ir nesaugo Portalo vaizdo skambučių turinio, kuris yra papildomai užšifruotas, kad būtų išvengta pasiklausymo. Tai, kad portalo A.I. išmanieji įrenginiai veikia lokaliai įrenginyje, o ne Facebook serverių, taip pat reiškia, kad ši informacija nepalieka jūsų namų. Balso komandos įmonei siunčiamos tik tada, kai pasakote „Ei, portalas“, o vartotojai gali bet kada ištrinti savo balso istoriją „Facebook“ veiklos žurnale.

Tačiau negalima apeiti fakto, kad vis dar vyksta tam tikras duomenų rinkimas. „Nors neklausome, nežiūrime ir nesaugome jūsų portalo vaizdo skambučių turinio arba nenaudojame šios informacijos skelbimams taikyti, apdorokite tam tikrą įrenginio naudojimo informaciją, kad suprastumėte, kaip naudojamas portalas, ir patobulintumėte produktą“, – pažymi „Facebook“. (Portalo privatumo politika galima paskaityti čia.)

Portalas siūlo keletą labai protingų technologijų, turinčių didžiulį poveikį vaizdo pokalbių ateičiai. Nėra jokių abejonių, kad įmonei pavyko padaryti kažką labai įspūdingo technologiniu požiūriu. Tačiau ar tai gali įtikinti potencialius klientus, kad tai jiems reikalingas sprendimas, galiausiai bus tikras laimėjimas.

Redaktorių rekomendacijos

  • Perskaitykite siaubingai gražų A.I. „sintetinį raštą“. kad mano, kad tai Dievas
  • Kalbos supermodelis: kaip GPT-3 tyliai įveda A.I. revoliucija
  • Mes naudojome A.I. dizaino įrankis naujam logotipui sukurti. Štai kas atsitiko
  • Neuro-simbolinis A.I. yra dirbtinio intelekto ateitis. Štai kaip tai veikia
  • Peržiūrėjimas apie A.I. kilimą: kiek dirbtinis intelektas nuėjo nuo 2010 m.?