Когато Марк Зукърбърг създаде първата версия на Facebook в своята стая в студентското общежитие в Харвард, той си го представи като прозорец, който ще позволи на хората да надникнат в живота на другите потребители. Ако Google беше търсачка за информация, тогава Facebook, напротив, беше търсачка за хора. Петнадесет години по-късно Facebook издигна тази амбиция на следващото ниво. Чрез създаването на Portal и Portal+, своята линия интелигентни високоговорители с подобрен екран, пусната през ноември 2018 г., гигантът на социалните медии създаде много по-буквален прозорец, позволявайки на потребителите на Facebook да правят видео разговори с един друг.
Съдържание
- Правим камерите по-умни
- Технически предизвикателства
- Разрастващ се пазар
- Предстоят предизвикателства по отношение на поверителността?
Интелигентните високоговорители Portal буквализират друг Facebook мечта също. Когато Facebook беше по същество търсачка за хора, всъщност порталът прави потърсете ги: с подвижна 12-мегапикселова камера, която може да се похвали със 140-градусово зрително поле, която ви следва из стаята, за да видите какво правите. Като цифрови тенденции
поставете го в нашия преглед, „ако сте заети да се движите из кухнята, докато питате баба как да направи нейните известни кюфтета, можете да продължите да работите, докато слушате нейния разговор.“Препоръчани видеоклипове
Каква точно е умната технология, която движи Portal? И как Facebook смята, че е преодолял предизвикателството да направи редовния видео чат толкова личен, колкото сядането за истински разговор? Отговорът включва някакъв впечатляващ изкуствен интелект - и добавено човешко докосване.
Свързани
- Емоционален ИИ е тук и може да бъде на следващото ви интервю за работа
- Тъй като 2020 г. не е достатъчно луда, роботска уста пее A.I. молитви в Париж
- ИИ мащабирането прави този филм от 1896 г. да изглежда сякаш е заснет в ослепително 4K
Правим камерите по-умни
Още от самото начало Facebook знаеше, че ядрото на изживяването на портала ще бъде така наречената система „Smart Camera“. Идеята на Smart Camera беше да премине отвъд статичния кадър, който услуги като Skype ни предлагат от години, и да играе по-креативна роля в процеса. Точно както филмовият режисьор или оператор знае кога да използва широк кадър или кога да увеличи мащаба за интимен близък план, така и
За да придаде на тази камера необходимото човешко докосване, Facebook работи с режисьорите, за да измислят най-добрия начин за дестилиране на тяхната мъдрост в машинно обучаеми прозрения. В един случай ги помоли да демонстрират как могат да заснемат сцена, в която е невъзможно да се улови цялата необходима информация от един фиксиран ъгъл.
Portal се състои от изключително широкоъгълен обектив, в който всички решения за движение и редактиране се правят изцяло цифрово.
В друг инженерите на Facebook разгледаха различните фотографски елементи, които операторите на камери дават приоритет в портретни и пейзажни снимки. Тези наблюдения формират основата на софтуерни модели, които се опитват да вдъхнат на Portal някои от странностите при вземане на решения, които обикновено бихме приписали на човешката креативност.
„Искахме да създадем изживяване при видео разговори със свободни ръце, което премахва усещането за физическо разстояние и е по-скоро като излизане заедно“, обясни Ерик Хуанг, един от инженерите зад Portal, пред Digital Trends.
Получената система – която според Facebook е отнела „по-малко от две години“, за да се създаде от нулата – позволява на Portal да взема решения, предназначени да подобрят потока на разговор. В наскоро публикувана публикация в блога, той подробно описва някои от илюстрациите защо това може да е необходимо. Например, ако сте в претъпкана стая, пълна с хора, взаимодействащи помежду си, той трябва да избере кога да проследи индивид извън кадър или кога да намали мащаба, за да приспособи нови обекти.
По същия начин то трябва да се научи да се справя с променящите се светлинни ситуации в реално време. Какво правите, ако вашият обект лежи в тъмна стая, наполовина покрит с одеяло, но има деца, които тичат на заден план, причинявайки замъгляване на движението? Portal претегля цялата тази информация за по-малко от мигване на око и се опитва да определи най-добрия резултат. (Ако искате ръчно да контролирате върху кого се фокусира, това вече също е възможно.)
Технически предизвикателства
От техническа гледна точка, няколко неща правят технологията на Portal впечатляваща. Първият е, че може да направи всичко това без използването на действителна движеща се камера. В началото на процеса на разработка инженерите на Portal изпробваха прототипи, които използват моторизирана камера, която се завърта, за да се изправи срещу обектите. Това обаче беше решено против въз основа на това, че причинява забавяне и точка на потенциална механична повреда. Вместо това Portal включва изключително широкоъгълен обектив, в който всички решения за движение и редактиране се правят изцяло цифрово.
Второ, екипът, работещ върху Portal, намери начин да постигне своите процеси на вземане на решения, без да се налага да разчита на облачни изчисления. Според Hwang цялата изчислителна огнева мощ се постига в устройството.
„Заснемането на всеки във видеокадър не е труден инженерен проблем, тъй като много инженери могат да направят това с днешния напредък в компютърното зрение“, каза той. „Иновацията е в улавянето на съответните хора или лица в реално време, на устройството, като се използва само малкият мобилен чип в портала като мощност за обработка. Обикновено тези видове ИИ. задачите изискват специални, големи сървъри. [Ние] преодоляхме това препятствие, като компресирахме сложни модели на компютърно зрение, докато успеят да се поберат на чипа, който използваме за Portal, и все още работят точно и надеждно.“
За да направи това, Portal черпи от дългосрочната инвестиция на Facebook в изкуствен интелект. Той използва 2D система за откриване на пози, която работи с 30 кадъра в секунда. Преднамереността на тези пози помага на Portal да взема непрекъснати решения за това какво правят неговите обекти - и кога може да се наложи цифрово панорамиране или мащабиране в резултат на това. Той допълнително използва изследвания на камери за дълбочина, разработени от Facebook Reality Labs като част от усилията на гиганта на социалните медии за виртуална реалност.
Разрастващ се пазар
Facebook е убеден, че е победител с Portal. Лесно е да се види откъде идва увереността му. В момента пазарът на интелигентни високоговорители процъфтява. Въпреки че е доминиран до голяма степен от пазарния лидер Amazon, това е така расте с повече от 100 процента на годишна база. Това е добра новина за технологичните компании, които търсят следващото голямо нещо във време на изравняване смартфон продажби.
Докато Facebook беше последният от четирите големи технологични гиганта (Amazon, Alphabet,
„Порталът е единственият продукт на пазара от този вид“, каза Хуанг. „Днес интелигентните високоговорители и дисплеи са изградени около информацията и търговията. Порталът е създаден, за да улесни свързването с най-важните хора: нашите най-близки приятели и семейство. И Portal е фокусиран върху свързването на хора – част от мисията на Facebook – което в момента не се обслужва добре от пазара на домашни устройства.“
Предстоят предизвикателства по отношение на поверителността?
И така, какво пречи да спре Facebook? Е, потенциално поверителност. Потребителите се оказаха изненадващо склонни да приемат „винаги слушащи“ приспособления от компании като Google с личен интерес към потребителските данни. Но устройство, което едновременно ви наблюдава и слуша, е още по-инвазивно. Освен това репутацията на Facebook все още страда миналогодишният скандал с Cambridge Analytica.
Добавяне на интелигентност към камерата за видео чат на портала (Facebook)
Само дни преди публикуването на тази статия, Вашингтон пост докладвани че Facebook договаря рекордно многомилиардно споразумение с Федералната търговска комисия за своите нарушения на поверителността. С нарастваща реакция от много бивши потребители, все още не е разкрито дали
Facebook ни увери, че не прослушва, преглежда или пази съдържанието на видео разговорите на портала, които са допълнително криптирани, за да се избегне подслушване. Фактът, че ИИ на Portal smarts работят локално на устройството, а не на
Но няма как да заобиколите факта, че все още има известна степен на събиране на данни. „Въпреки че не прослушваме, преглеждаме или съхраняваме съдържанието на вашите видео разговори в портала или използваме тази информация за насочване на реклами, ние обработете информация за използването на устройството, за да разберете как се използва порталът и да подобрите продукта“, отбелязва Facebook. (Политика за поверителност на портала може да се прочете тук.)
Порталът предлага някои много интелигентни технологии с огромни последици за бъдещето на видео чатовете. Няма съмнение, че компанията е успяла да направи нещо много впечатляващо от технологична гледна точка. Но дали може да убеди потенциалните клиенти, че това е решение, от което се нуждаят в живота си, в крайна сметка ще се окаже истинското постижение.
Препоръки на редакторите
- Прочетете зловещо красивото „синтетично писание“ на A.I. който мисли, че е Бог
- Езиков супермодел: Как GPT-3 тихо въвежда A.I. революция
- Използвахме A.I. инструмент за проектиране, за да излезете с ново лого. Ето какво се случи
- Невро-символичен A.I. е бъдещето на изкуствения интелект. Ето как работи
- Преразглеждане на възхода на AI: Докъде е стигнал изкуственият интелект от 2010 г. насам?