Когда Марк Цукерберг создал первую версию Facebook в своей комнате в общежитии колледжа в Гарварде, он представлял ее как окно, которое позволит людям следить за жизнью других пользователей. Если Google был поисковой системой для информации, то Facebook, напротив, был поисковой системой для людей. Пятнадцать лет спустя Facebook поднял эти амбиции на новый уровень. Создав Portal и Portal+, линейку интеллектуальных колонок с улучшенным экраном, выпущенную в ноябре 2018 года, компания гигант социальных сетей создал гораздо более буквальное окно, позволяющее пользователям Facebook совершать видеозвонки одному другой.
Содержание
- Делаем камеры умнее
- Технические проблемы
- Растущий рынок
- Проблемы конфиденциальности впереди?
Умные колонки Portal воплощают в жизнь другое Фейсбук тоже мечтай. Если Facebook был, по сути, поисковой системой для людей, то Portal на самом деле делает Найдите их: с помощью перемещающейся 12-мегапиксельной камеры с углом обзора 140 градусов, которая следует за вами по комнате, чтобы увидеть, что вы делаете. Как цифровые тенденции
поместите это в наш обзор, «если вы заняты перемещением по кухне и спрашиваете бабушку, как приготовить ее знаменитые фрикадельки, вы можете заняться делом, слушая ее разговор».Рекомендуемые видео
Какая именно интеллектуальная технология управляет Portal? И как Facebook думает, что справился с задачей сделать обычный видеочат таким же личным, как и настоящий разговор? Ответ предполагает наличие впечатляющего искусственного интеллекта и дополнительного человеческого участия.
Связанный
- Чувствующий эмоции искусственный интеллект здесь, и это может быть на вашем следующем собеседовании
- Поскольку 2020 год недостаточно сумасшедший, рот робота поет A.I. молитвы в Париже
- А.И. Благодаря апскейлингу этот фильм 1896 года выглядит так, как будто он был снят в великолепном разрешении 4K.
Делаем камеры умнее
С самого начала Facebook знал, что основой его портала станет так называемая система «Умная камера». Идея «умной камеры» заключалась в том, чтобы выйти за рамки статических снимков, которые такие сервисы, как Skype, предлагают нам уже много лет, и сыграть более творческую роль в этом процессе. Точно так же, как кинорежиссер или оператор знает, когда использовать широкий план, а когда увеличить масштаб для интимного крупного плана, так и
Чтобы придать этой камере необходимый человеческий облик, Facebook работал с кинематографистами, чтобы найти лучший способ превратить их мудрость в машинно-обучаемые идеи. В одном случае их попросили продемонстрировать, как можно снять сцену, в которой невозможно уловить всю важную информацию с одного фиксированного угла.
Portal включает в себя чрезвычайно широкоугольный объектив, в котором все решения по перемещению и редактированию принимаются полностью в цифровом виде.
В другом инженеры Facebook рассмотрели различные фотографические элементы, которым операторы камеры отдают приоритет при портретных и пейзажных снимках. Эти наблюдения легли в основу программных моделей, которые пытаются наделить Portal некоторыми особенностями принятия решений, которые мы обычно приписываем человеческому творчеству.
«Мы хотели создать систему видеозвонков без помощи рук, которая устраняла бы чувство физического расстояния и была бы больше похоже на совместное времяпрепровождение», — объяснил Digital Trends Эрик Хван, один из инженеров Portal.
Получившаяся система, на создание которой с нуля, по словам Facebook, ушло «менее двух лет», позволяет Portal принимать решения, направленные на улучшение потока разговора. В недавно опубликованное сообщение в блоге, в нем подробно описаны некоторые иллюстрации того, почему это может быть необходимо. Например, если вы находитесь в переполненной комнате, полной людей, взаимодействующих друг с другом, он должен выбрать, когда следовать за человеком за кадром или когда уменьшить масштаб, чтобы разместить новые объекты.
Точно так же он должен научиться справляться с изменением освещенности в реальном времени. Что делать, если объект съемки лежит в темной комнате, наполовину накрытый одеялом, а на заднем плане бегают дети, вызывая размытость изображения? Портал мгновенно взвешивает всю эту информацию и пытается определить наилучший результат. (Если вы хотите вручную контролировать, на ком фокусируется, теперь это тоже возможно.)
Технические проблемы
С технической точки зрения, несколько вещей делают технологию Portal впечатляющей. Во-первых, все это можно делать без использования движущейся камеры. На раннем этапе разработки инженеры Portal опробовали прототипы, в которых использовалась моторизованная камера, которая поворачивалась к объектам съемки. Однако от этого было решено отказаться на том основании, что это привело к задержке и потенциальному механическому отказу. Вместо этого Portal включает в себя чрезвычайно широкоугольный объектив, в котором все решения по перемещению и редактированию принимаются полностью в цифровом виде.
Во-вторых, команда, работавшая над Portal, нашла способ реализовать процессы принятия решений, не полагаясь на облачные вычисления. По словам Хванга, вся вычислительная мощь достигается внутри устройства.
«Запечатлеть всех в видеокадре не является сложной инженерной задачей, поскольку многие инженеры могут сделать это с помощью современных достижений компьютерного зрения», — сказал он. «Инновация заключается в том, чтобы фиксировать нужных людей или людей в режиме реального времени на устройстве, используя лишь небольшой мобильный чип внутри портала в качестве вычислительной мощности. Обычно эти типы ИИ. задачи требуют выделенных больших серверов. [Мы] преодолели это препятствие, сжимая сложные модели компьютерного зрения до тех пор, пока они не смогут поместиться в чип, который мы используем для Portal, и при этом работать точно и надежно».
Для этого Portal использует долгосрочные инвестиции Facebook в искусственный интеллект. Он использует 2D-систему определения позы, которая работает со скоростью 30 кадров в секунду. Намеренность этих поз помогает Portal принимать непрерывные решения о том, что делают его субъекты, и когда в результате может потребоваться цифровое панорамирование или масштабирование. Он также использует исследования камер глубины, разработанные Facebook Reality Labs в рамках усилий гиганта социальных сетей по виртуальной реальности.
Растущий рынок
Facebook убежден, что с Portal он станет победителем. Легко понять, откуда берется такая уверенность. Сейчас рынок умных колонок переживает бум. Несмотря на то, что в значительной степени доминирует лидер рынка Amazon, растет более чем на 100 процентов в годовом исчислении. Это хорошая новость для технологических компаний, которые ищут новые большие возможности в период сглаживания ситуации. смартфон продажи.
Хотя Facebook был последним из четырех больших технологических гигантов (Amazon, Alphabet,
«Portal — единственный продукт такого рода на рынке», — сказал Хван. «Сегодня умные колонки и дисплеи строятся вокруг информации и коммерции. Портал создан, чтобы облегчить общение с самыми важными людьми: нашими самыми близкими друзьями и семьей. А Portal ориентирован на объединение людей — это часть миссии Facebook, — что в настоящее время не очень хорошо обслуживается рынком домашних устройств».
Проблемы конфиденциальности впереди?
Так что же мешает остановить Facebook? Ну, потенциально конфиденциальность. Пользователи оказались на удивление готовы использовать «всегда слушающие» гаджеты от таких компаний, как Google, которые заинтересованы в пользовательских данных. Но устройство, которое одновременно наблюдает и слушает вас, еще более агрессивно. Кроме того, репутация Facebook все еще страдает после прошлогодний скандал с Cambridge Analytica.
Добавление смартов в камеру видеочата Портала (Facebook)
Всего за несколько дней до публикации этой самой статьи Вашингтон Пост сообщил что Facebook ведет переговоры о рекордном многомиллиардном урегулировании с Федеральной торговой комиссией за нарушения конфиденциальности. Учитывая растущую негативную реакцию со стороны многих бывших пользователей, еще предстоит выяснить, является ли
Facebook заверил нас, что не прослушивает, не просматривает и не хранит содержимое видеозвонков Портала, которое дополнительно шифруется во избежание подслушивания. Тот факт, что ИИ Portal. смарты запускаются локально на устройстве, а не на
Но нельзя обойти стороной тот факт, что определенный сбор данных все еще происходит. «Хотя мы не прослушиваем, не просматриваем и не сохраняем содержимое ваших видеозвонков на Портале, а также не используем эту информацию для таргетинга рекламы, мы обрабатывайте некоторую информацию об использовании устройства, чтобы понять, как используется Portal, и улучшить продукт», — отмечает Facebook. (Политика конфиденциальности Портала можно прочитать здесь.)
Портал предлагает очень умную технологию, имеющую огромное значение для будущего видеочата. Нет никаких сомнений в том, что компании удалось создать нечто очень впечатляющее с технологической точки зрения. Но сможет ли он убедить потенциальных клиентов в том, что это решение, необходимое им в их жизни, в конечном итоге окажется настоящим достижением.
Рекомендации редакции
- Прочтите устрашающе красивое «синтетическое писание» ИИ. который думает, что это Бог
- Языковая супермодель: как GPT-3 незаметно открывает путь искусственному интеллекту революция
- Мы использовали ИИ. инструмент дизайна, позволяющий придумать новый логотип. Вот что произошло
- Нейросимволический А.И. это будущее искусственного интеллекта. Вот как это работает
- Возвращаясь к развитию искусственного интеллекта: как далеко продвинулся искусственный интеллект с 2010 года?