Facebook がポータル AI をどのように教えたかは次のとおりです。 ハリウッド映画監督のように考える

Facebook ポータル+ レビュー
ダン・ベイカー/デジタルトレンド

マーク・ザッカーバーグがハーバード大学の大学寮の部屋で Facebook の最初のバージョンを構築したとき、彼はそれを他のユーザーの生活を覗くための窓として想像しました。 Google が情報の検索エンジンだとすれば、Facebook は対照的に人々の検索エンジンです。 15 年後、Facebook はこの野心を次のレベルに引き上げました。 2018 年 11 月に発売された、画面強化型スマート スピーカーの製品ラインである Portal と Portal+ を作成することにより、 ソーシャルメディアの巨人は、はるかに文字通りのウィンドウを確立し、Facebook ユーザーがビデオ通話できるようにした 別の。

コンテンツ

  • カメラをよりスマートに
  • 技術的な課題
  • 成長する市場
  • プライバシーに関する課題が待ち受けていますか?

Portal スマート スピーカーは、別のものを文字通りに表現します。 フェイスブック 夢も。 Facebook が本質的に人々のための検索エンジンであったのに対し、Portal は実際には する 140 度の視野を誇る 12 メガピクセルの移動カメラを使用して、部屋中を追跡して、何をしているのかを確認します。 デジタルトレンドとして 私たちのレビューに載せてください、「おばあちゃんに有名なミートボールの作り方を聞きながらキッチンを忙しく動き回るなら、彼女の話を聞きながら忙しくしていられます。」

おすすめ動画

Portal を推進するスマート テクノロジーとは一体何ですか? そして、Facebook は、通常のビデオチャットを座って実際に会話しているのと同じくらい個人的なものにするという課題をどのようにして解決したと考えているのでしょうか? その答えには、優れた人工知能と人間味が加わります。

関連している

  • 感情を感知するAI ここにあります。次の面接で取り上げられるかもしれません
  • 2020 年はそれほどクレイジーではないので、ロボットの口が AI を歌っています。 パリでの祈り
  • A.I. アップスケーリングにより、1896 年のこの映画がまばゆいばかりの 4K で撮影されたように見えます
Facebook ポータル+ レビュー
ダン・ベイカー/デジタルトレンド

カメラをよりスマートに

Facebook は当初から、ポータル エクスペリエンスの核となるのはいわゆる「スマート カメラ」システムであることを知っていました。 スマート カメラのアイデアは、Skype などのサービスが長年にわたって私たちに提供してきた一種の静止ショットを超えて、そのプロセスにおいてより創造的な役割を果たすことでした。 映画監督や撮影監督が、いつワイドショットを使用するか、いつズームインして親密なクローズアップを撮影するかを知っているのと同じように、

フェイスブック 同社のエンジニアは、これと同じ機能を Portal で模倣するよう要求しました。

このカメラに必要な人間味を与えるために、Facebook は映画制作者と協力して、彼らの知恵を機械学習可能な洞察に蒸留する最良の方法を見つけ出しました。 あるケースでは、1 つの固定角度からすべての関連情報を捉えることが不可能なシーンをどのように撮影するかをデモンストレーションするよう求められました。

Portal は超広角レンズで構成されており、すべての動きと編集の決定が完全にデジタルで行われます。

別の記事では、Facebook のエンジニアが、ポートレート写真と風景写真でカメラマンが優先するさまざまな写真要素を調査しました。 これらの観察は、通常人間の創造性に起因すると考えられる意思決定の癖の一部を Portal に吹き込むことを試みるソフトウェア モデルの基礎を形成しました。

「私たちは、物理的な距離感を取り除き、快適なハンズフリーのビデオ通話体験を作りたかったのです。 むしろ一緒にぶらぶらしているようなものです」と Portal のエンジニアの 1 人である Eric Hwang 氏は Digital Trends に説明しました。

Facebookによれば、ゼロから作成するのに「2年もかからなかった」という結果のシステムにより、Portalは会話の流れを改善するための意思決定を行うことができるようになった。 で 新しく公開されたブログ投稿では、なぜこれが必要なのかをいくつかの図で詳しく説明します。 たとえば、混雑した部屋にいる場合、互いにやり取りする人でいっぱいの場合、フレーム外の人物をいつ追跡するか、または新しい被写体に対応するためにいつズームアウトするかを選択する必要があります。

Facebook ソフトウェア エンジニアの Eric Hwang (最初は椅子に座っています) と Arthur Cavalcanti が、ポータルの映画のようなカメラのようなトラッキングとフレーミングをデモンストレーションします。

同様に、変化する光の状況にリアルタイムで対処する方法を学ばなければなりません。 被写体が暗い部屋に横たわり、毛布で半分覆われているのに、背景で子供たちが走り回っていてモーション ブラーが発生している場合はどうしますか? Portal はこれらすべての情報を瞬き未満で比較検討し、最良の結果を決定しようとします。 (誰に焦点を当てるかを手動で制御したい場合は、 それも今では可能です.)

技術的な課題

技術的な観点から見ると、Portal のテクノロジーはいくつかの点で優れています。 1 つ目は、実際に移動するカメラを使用せずにこれらすべてを実行できることです。 開発プロセスの初期段階で、Portal のエンジニアは、被写体に向かって回転する電動カメラを使用したプロトタイプを試しました。 しかし、これは遅れを引き起こし、機械的故障の可能性があるという理由で中止されました。 その代わりに、Portal は超広角レンズを備えており、すべての動きと編集の決定が完全にデジタルで行われます。

第 2 に、Portal に取り組んでいるチームは、クラウド コンピューティングに依存せずに意思決定プロセスを実現する方法を見つけました。 Hwang 氏によると、計算能力はすべてデバイス内で実現されます。

Facebook ポータルの進化
初期の Portal プロトタイプは、カメラを物理的に動かすためにモーターに依存していました。フェイスブックエンジニアリング

「ビデオ フレーム内に全員を映すことは、工学的には難しい問題ではありません。今日のコンピューター ビジョンの進歩により、多くのエンジニアがそれを行うことができます。」と彼は言いました。 「革新的な点は、処理能力としてポータル内の小型モバイル チップだけを使用して、関連する人物や個人をデバイス上でリアルタイムにキャプチャすることです。 通常、この種の AI は タスクには専用の大規模サーバーが必要です。 [私たちは] 複雑なコンピューター ビジョン モデルを、ポータルに使用するチップに適合し、正確かつ確実に実行できるようになるまで圧縮することで、その障害を克服しました。」

これを実現するために、Portal は Facebook の人工知能への長期投資を活用しています。 毎秒 30 フレームで動作する 2D 姿勢検出システムを使用します。 これらのポーズの意図性は、Portal が被写体が何をしているのか、そしてその結果としていつデジタル パンやズームが必要になるのかについて継続的に決定するのに役立ちます。 さらに、ソーシャルメディア巨人の仮想現実への取り組みの一環として Facebook Reality Labs が開発した深度カメラの研究も利用しています。

成長する市場

Facebook は、Portal で勝者になれると確信しています。 その自信がどこから来ているかは簡単にわかります。 現在、スマートスピーカー市場は活況を呈しています。 市場リーダーであるAmazonが大部分を独占していますが、 前年比 100% 以上の成長. これは、フラット化が進む中で次の大きなものを探しているテクノロジー企業にとって朗報です。 スマートフォン 販売。

Facebook ポータル+ レビュー
ダン・ベイカー/デジタルトレンド

Facebook は 4 大テクノロジー巨人 (Amazon、Alphabet、 フェイスブック と Apple) が時流に乗ることはまだです 最初のものの一つ コミュニケーションデバイスとしてのスクリーンを中心としたスマートスピーカーの波。

「Portal は、この種の市場で唯一の製品です」とファン氏は言いました。 「今日、スマート スピーカーとディスプレイは情報と商取引を中心に構築されています。 ポータルは、最も重要な人々、つまり親しい友人や家族と簡単につながることができるように構築されています。 そして、Portal は、Facebook の使命の一部である人々を結び付けることに重点を置いていますが、これは現在家庭用デバイス市場では十分に機能していません。」

プライバシーに関する課題が待ち受けていますか?

では、何が Facebook を止めているのでしょうか? まあ、潜在的にプライバシーです。 ユーザーは、ユーザー データに強い関心を持つ Google のような企業が提供する「常時リッスン」ガジェットを驚くほど喜んで受け入れることがわかっています。 しかし、あなたを監視し、聞くことの両方を行うデバイスは、さらに侵襲的です。 さらに、フェイスブックの評判はその後も低迷している。 昨年のケンブリッジ・アナリティカのスキャンダル.

ポータルのビデオ チャット カメラにスマート機能を追加する (Facebook)

この記事が公開される数日前に、 ワシントンポスト 報告 Facebookはプライバシーに関する軽罪に関して、記録的な数十億ドル規模の和解案をFTCと交渉しているとのこと。 多くの元ユーザーからの反発が強まっており、それがどうかはまだ明らかにされていない。 フェイスブック Amazon Echo 風のヒット作もあれば、Amazon Fire Phone 風の失敗作もある。

Facebook は、Portal のビデオ通話の内容を聞いたり、表示したり、保存したりすることはなく、盗聴を避けるためにさらに暗号化されていると保証しました。 Portal の A.I. スマートはデバイス上ではなくローカルで実行されます フェイスブック また、この情報が自宅から出ないことも意味します。 音声コマンドは、「Hey Portal」と言った後にのみ会社に送信され、ユーザーは Facebook のアクティビティ ログにある自分の音声履歴をいつでも削除できます。

しかし、依然としてある程度のデータ収集が行われているという事実を避けることはできません。 「当社は、ポータルのビデオ通話の内容を聞いたり、表示したり、保存したり、この情報を広告のターゲティングに使用したりすることはありませんが、 Portal がどのように使用されているかを理解し、製品を改善するために、一部のデバイス使用状況情報を処理する必要があります」と Facebook は指摘しています。 (ポータルのプライバシーポリシー ここで読むことができます.)

Portal は、ビデオ チャットの将来に多大な影響を与える非常にスマートなテクノロジーを提供します。 同社が技術的な観点から見て非常に素晴らしい成果を上げたことは疑いの余地がありません。 しかし、これが自分たちの生活に必要なソリューションであると潜在的な顧客を納得させることができるかどうかが、最終的には本当の成果となるでしょう。

編集者のおすすめ

  • 不気味に美しい AI の「合成聖典」を読んでください。 それは神だと思っている
  • 言語スーパーモデル: GPT-3 がどのようにして静かに A.I. の到来をもたらしているのか 革命
  • 私たちはAIを使用しました。 新しいロゴを考えるためのデザインツール。 何が起こったのか
  • 神経象徴的な A.I. それは人工知能の未来です。 仕組みは次のとおりです
  • AI の台頭の再考: 2010 年以来、人工知能はどこまで進歩しましたか?