Így tanította a Facebook portáljának A.I. hollywoodi filmesként gondolkodni

Facebook Portal+ értékelés
Dan Baker/Digitális trendek

Amikor Mark Zuckerberg megépítette a Facebook első verzióját a harvardi kollégiumi szobájában, úgy képzelte el, mint egy ablakot, amely lehetővé teszi az emberek számára, hogy betekintsenek más felhasználók életébe. Ha a Google információkereső volt, akkor a Facebook ezzel szemben az emberek keresője. Tizenöt évvel később a Facebook ezt az ambíciót a következő szintre emelte. A Portal és a Portal+, a képernyő-bővített intelligens hangszórók 2018 novemberében indított termékcsaládjának létrehozásával a A közösségi média óriása egy sokkal szó szerintibb ablakot hozott létre, lehetővé téve a Facebook-felhasználók számára, hogy videohívásokat kezdeményezzenek egy másik.

Tartalom

  • A kamerák okosabbá tétele
  • Technikai kihívások
  • Egy növekvő piac
  • Adatvédelmi kihívások várnak rád?

A Portal intelligens hangszórói egy másikat írnak le Facebook álom is. Ahol a Facebook lényegében az emberek keresője volt, a Portál tulajdonképpen csinál Keresse meg őket: egy 12 megapixeles, 140 fokos látómezővel büszkélkedő kamerával, amely követi Önt a szobában, hogy lássa, mit csinál. Mint digitális trendek

írd be a véleményünkbe, „Ha a konyhában jársz, miközben megkérdezed a nagymamát, hogyan készítsd el a híres húsgombócokat, akkor elfoglalhatod magad, miközben hallgatod a beszédét.”

Ajánlott videók

Pontosan mi is az az intelligens technológia, amely a Portált vezérli? És hogyan gondolja a Facebook, hogy megbirkózott azzal a kihívással, hogy a rendszeres videocsevegést olyan személyesnek érezze, mintha leülnénk egy valódi beszélgetésre? A válasz néhány lenyűgöző mesterséges intelligencia - és egy hozzáadott emberi érintés.

Összefüggő

  • Érzelemérzékelő A.I. itt van, és ez lehet a következő állásinterjún
  • Mivel 2020 nem elég őrült, egy robotszáj énekli az A.I. imák Párizsban
  • A.I. a felskálázás miatt ez az 1896-os film úgy néz ki, mintha káprázatos 4K-ban forgatták volna
Facebook Portal+ értékelés
Dan Baker/Digitális trendek

A kamerák okosabbá tétele

A Facebook kezdettől fogva tudta, hogy a portálélmény magja az úgynevezett „Smart Camera” rendszer lesz. Az intelligens kamera ötlete az volt, hogy túllépjünk azon a fajta statikus felvételen, amelyet a Skype-hoz hasonló szolgáltatások már évek óta kínálnak nekünk, és kreatívabb szerepet játsszon a folyamatban. Ahogy egy filmrendező vagy operatőr tudja, mikor kell széles felvételt alkalmazni, vagy mikor kell nagyítani egy intim közeli felvételhez, Facebook kihívta mérnökeit, hogy utánozzák ugyanezt a képességet a Portallal.

Annak érdekében, hogy ez a kamera a szükséges emberi érintést biztosítsa, a Facebook filmesekkel együtt dolgozott, hogy kitalálják, hogyan lehet a legjobban lepárolni bölcsességüket géppel tanulható betekintésekké. Egy esetben arra kérte őket, hogy mutassák be, hogyan forgathatnak le egy olyan jelenetet, amelyben lehetetlen az összes lényeges információt egyetlen rögzített szögből rögzíteni.

A Portal egy rendkívül nagy látószögű objektívből áll, amelyben minden mozgási és szerkesztési döntés teljesen digitálisan történik.

Egy másikban a Facebook mérnökei megvizsgálták azokat a különböző fényképészeti elemeket, amelyeket a kamerakezelők előnyben részesítenek a portré és tájképek készítésekor. Ezek a megfigyelések képezték az alapját azoknak a szoftvermodelleknek, amelyek megpróbálják átitatni a Portált néhány olyan döntéshozatali furcsasággal, amelyet általában az emberi kreativitásnak tulajdonítunk.

„Olyan kihangosított videohívási élményt akartunk létrehozni, amely eltávolítja a fizikai távolság érzését inkább együtt lógunk” – magyarázta Eric Hwang, a Portal egyik mérnöke a Digital Trendsnek.

Az így létrejött rendszer – amelyet a Facebook szerint „kevesebb mint két évbe telt” a semmiből való létrehozása – lehetővé teszi a Portalnak, hogy olyan döntéseket hozzon, amelyek célja a beszélgetések menetének javítása. Az a újonnan megjelent blogbejegyzés, részletez néhány illusztrációt arról, hogy miért lehet erre szükség. Például, ha egy zsúfolt szobában tartózkodik, tele emberekkel, akik kommunikálnak egymással, akkor meg kell választania, hogy mikor kövessen egy személyt a kereten kívül, vagy mikor kicsinyítsen, hogy új témákat fogadjon.

A Facebook szoftvermérnökei, Eric Hwang (eleinte a székben ült) és Arthur Cavalcanti bemutatják a Portál moziszerű kameraszerű követését és keretezését.

Hasonlóképpen meg kell tanulnia valós időben kezelni a változó fényhelyzeteket. Mi a teendő, ha az alany egy sötét szobában fekszik, félig takaróval letakarva, de a háttérben gyerekek rohangálnak, ami mozgás közbeni elmosódást okoz? A Portál egy szempillantás alatt mérlegeli az összes információt, és megpróbálja meghatározni a legjobb eredményt. (Ha manuálisan szeretné szabályozni, hogy kire fókuszáljon, most ez is lehetséges.)

Technikai kihívások

Technikai szempontból néhány dolog lenyűgözővé teszi a Portal technológiáját. Az első az, hogy mindezt tényleges mozgó kamera használata nélkül is megteheti. A fejlesztési folyamat korai szakaszában a Portal mérnökei olyan prototípusokat próbáltak ki, amelyek motoros kamerát használtak, amely az alanyok felé fordult. Ez azonban nem döntött, mivel késést és potenciális mechanikai meghibásodást okozott. Ehelyett a Portal egy rendkívül nagy látószögű objektívet tartalmaz, amelyben minden mozgási és szerkesztési döntés teljesen digitálisan történik.

Másodszor, a Portalon dolgozó csapat megtalálta a módját a döntéshozatali folyamatok megvalósításának anélkül, hogy a számítási felhőre kellene hagyatkoznia. Hwang szerint a számítási tűzerőt mind az eszközön belül érik el.

A Facebook portál evolúciója
A Portal korai prototípusai egy motoron alapultak a kamera fizikai mozgatásához.Facebook Engineering

„Mindenkit videókockában rögzíteni nem nehéz mérnöki probléma, hiszen sok mérnök meg tudja csinálni ezt a mai számítógépes látásfejlődéssel” – mondta. „Az innováció abban rejlik, hogy az érintett személyeket vagy személyeket valós időben, az eszközön rögzítik, csupán a Portalon belüli kis mobil chipet használva feldolgozási teljesítményként. Általában az ilyen típusú A.I. feladatok dedikált, nagy szervereket igényelnek. Leküzdöttük ezt az akadályt azáltal, hogy összetett számítógépes látásmodelleket tömörítettünk addig, amíg el nem férnek a Portalhoz használt chipen, és továbbra is pontosan és megbízhatóan futnak.”

Ennek érdekében a Portal a Facebook mesterséges intelligenciába való hosszú távú befektetésére támaszkodik. 2D pózérzékelő rendszert használ, amely másodpercenként 30 képkocka sebességgel fut. Ezeknek a pózoknak a szándékossága segíti a Portált abban, hogy folyamatos döntéseket hozzon arról, hogy mit csinálnak alanyai – és mikor kell ennek következtében digitális pásztázni vagy zoomolni. Ezenkívül a Facebook Reality Labs által a közösségi média óriás virtuális valósággal kapcsolatos erőfeszítéseinek részeként kifejlesztett mélységi kamerákkal kapcsolatos kutatásokat is felhasználja.

Egy növekvő piac

A Facebook meg van győződve arról, hogy a Portallal nyert. Könnyen belátható, honnan ered az önbizalma. Jelenleg az intelligens hangszórók piaca virágzik. Bár nagyrészt a piacvezető Amazon uralja, az évről évre több mint 100 százalékkal nőtt. Ez jó hír azoknak a technológiai cégeknek, amelyek az ellaposodás idején a következő nagy dolgot keresik okostelefon értékesítés.

Facebook Portal+ értékelés
Dan Baker/Digitális trendek

Míg a Facebook volt az utolsó a négy nagy technológiai óriás közül (Amazon, Alphabet, Facebook és az Apple) ugrani a kocsira, még mindig az az elsők egyike intelligens hangszórók hulláma, amelyek kommunikációs eszközként a képernyő körül helyezkednek el.

„A portál az egyetlen ilyen termék a piacon” – mondta Hwang. „Ma az intelligens hangszórók és kijelzők az információ és a kereskedelem köré épülnek. A portál célja, hogy megkönnyítse a kapcsolatot a legfontosabb emberekkel: legközelebbi barátainkkal és családtagjainkkal. A Portal pedig az emberek összekapcsolására összpontosít – a Facebook küldetésének része –, amit jelenleg nem szolgál ki jól az otthoni eszközök piaca.”

Adatvédelmi kihívások várnak rád?

Tehát mi akadályozza meg a Facebookot? Nos, potenciálisan a magánélet. A felhasználók meglepően készségesnek bizonyultak a felhasználói adatok iránt érdeklődő cégek „mindig figyelő” moduljaira, mint a Google. De egy olyan eszköz, amely egyszerre figyel és hallgat, még invazívabb. Ráadásul a Facebook hírneve még mindig szenved a tavalyi Cambridge Analytica botrány.

Okoselemek hozzáadása a portál videocsevegő kamerájához (Facebook)

Néhány nappal a cikk megjelenése előtt, a washingtoni posta jelentették hogy a Facebook rekordot döntõ, több milliárd dolláros egyezségrõl tárgyal az FTC-vel adatvédelmi vétségei miatt. Sok korábbi felhasználó egyre növekvő visszajelzése miatt még nem derült ki, hogy vajon Facebook van egy Amazon Echo-stílusú sláger a kezében – vagy egy Amazon Fire Phone-stílusú flop.

A Facebook biztosított minket arról, hogy nem hallgatja meg, nem nézi meg és nem tartja meg a portál videohívásainak tartalmát, amelyek ráadásul titkosítva vannak a lehallgatás elkerülése érdekében. Az a tény, hogy a Portál A.I. Az okosok lokálisan futnak az eszközön, és nem rajta Facebook szerverek, ez azt is jelenti, hogy ezek az információk nem hagyják el otthonát. A hangutasításokat csak azután küldjük el a vállalatnak, ha Ön kimondja: „Hey Portal”, és a felhasználók bármikor törölhetik hangelőzményeiket a Facebook tevékenységnaplójában.

De nem lehet megkerülni azt a tényt, hogy még mindig zajlik bizonyos fokú adatgyűjtés. „Bár nem hallgatjuk meg, nem nézzük meg vagy őrizzük meg a portálvideohívásainak tartalmát, és nem használjuk fel ezeket az információkat hirdetések célzására, dolgozzon fel néhány eszközhasználati információt, hogy megértse, hogyan használják a Portált, és javítsa a terméket” – jegyzi meg a Facebook. (A portál adatvédelmi szabályzata itt olvasható.)

A portál nagyon intelligens technológiát kínál, amelyek jelentős hatással vannak a videocsevegés jövőjére. Kétségtelen, hogy a cégnek sikerült valami nagyon lenyűgözőt kihoznia technológiai szempontból. De az, hogy meg tudja-e győzni a potenciális ügyfeleket arról, hogy erre a megoldásra van szükségük az életükben, végül az igazi eredménynek bizonyul majd.

Szerkesztői ajánlások

  • Olvassa el egy A.I. kísértetiesen szép „szintetikus szentírását”. aki azt hiszi, hogy Isten
  • Nyelvi szupermodell: Hogyan vezeti be csendesen a GPT-3 az A.I. forradalom
  • Mi egy A.I. tervezési eszköz, amellyel új logót készíthet. Íme, mi történt
  • Neuro-szimbolikus A.I. a mesterséges intelligencia jövője. Íme, hogyan működik
  • Újragondolva az A.I. térnyerését: Meddig jutott a mesterséges intelligencia 2010 óta?