Google レンズのコンピュータ ビジョン テクノロジーは、カメラが映しているものを理解するのに役立ちます

Google レンズのコンピュータ ビジョン テクノロジーを使用すると、カメラが捉えている内容のコンテキストを見つけることができます。
Google IO 2021 で Google ロゴの前に立つサンダー・ピチャイ氏。
このストーリーは Google I/O の完全な報道の一部です

公園を散歩中に出会った花や鳥の名前を知りたいですか? 間もなく、Google アシスタントがカメラと人工知能を使って教えてくれるようになります。

おすすめ動画

Google は 2017 年のスタートを切った I/Oカンファレンス AI と機械学習を中心に、コンピューター ビジョン テクノロジの 1 つとして強調されているのが Google レンズです。 カメラは単に画像をキャプチャするだけではなく、あなたが見ているものについてのより詳細なコンテキストを提供します。

に来ます Googleアシスタント そして GoogleフォトGoogle レンズ技術は「ユーザーが見ているものを理解し、行動を起こすのに役立つ」と Google CEO のサンダー・ピチャイ氏は基調講演で述べた。 たとえば、コンサート会場のマーキーにカメラを向けると、Google アシスタントがその場所について詳しく教えてくれます。 出演者は音楽を再生するだけでなく、ショーのチケットの購入やカレンダーへの追加をすべて 1 つの画面内で行うことができます。 単一のアプリ。

カメラが見慣れない物体に向けられると、Google アシスタントは画像認識を通じてそれが何であるかを教えてくれます。 お店の看板にかざすと、位置情報を使用して、お店に関する有意義な情報を得ることができます。 これらはすべて、ユーザーとアシスタントとの「会話型」音声対話を通じて行うことができます。

「携帯電話をかざせば、面倒な作業は私たちが自動的にやってくれます」とピチャイ氏は語った。

Google レンズを使用すると、 スマートフォン カメラは、あなたが見ているものを見るだけでなく、あなたが行動を起こすのに役立つようにあなたが見ているものを理解します。 #io17pic.twitter.com/viOmWFjqk1

— Google (@Google) 2017 年 5 月 17 日

Google の翻訳アプリを使用している場合は、このテクノロジーがどのように機能するかをすでにご存知でしょう。テキストの上にカメラを置くと、アプリがそれを理解できる言語に翻訳します。 Google アシスタントでは、Google レンズがこれをさらに進化させます。 Google はデモンストレーションで次のことを示しました

Googleアシスタント 外国語のテキストを翻訳するだけでなく、そのテキストが説明している内容の画像も表示して、より多くの情報を提供します。

デモでは、Google アシスタントエンジニアリング担当副社長の Scott Huffman 氏が、Google 内で Google レンズがどのように機能するかをデモしました。 アシスタントは画像の日本語テキストを翻訳できますが、その単語が何であるかについての詳細なコンテキストも提供します。 は。

画像認識テクノロジーは新しいものではありませんが、Google レンズは機械学習がいかに進歩しているかを示しています。 ピチャイ氏は、音声に関する取り組みと同様に、Googleのビジョンにおいても大きな改善が見られると述べた。 コンピューター ビジョン テクノロジは、何かが何であるかを認識するのに役立つだけでなく、画像を修復または強化するのにも役立ちます。 エッフェル塔のぼやけた写真を撮りましたか? コンピューターはオブジェクトを認識し、それがどのように見えるかを知っているため、すでにわかっていることに基づいてその画像を自動的に強化できます。

「私たちは写真の背後にある属性を理解することができます」とピチャイ氏は言う。 「私たちのコンピュータビジョンシステムは現在、画像認識において人間よりもさらに優れています。」

休暇中の写真に何が写っているかを書き留める必要はもうありません。 Google フォト担当副社長 Anil Sabharwal は、Google レンズが写真内のオブジェクトをどのように認識し、それに関する関連情報を表示するかを示しました。

Lens を効果的に機能させるために、Google は次のような高度な計算アーキテクチャを採用しています。 Cloud Tensor Processing Unit (TPU) チップセット。マシンのトレーニングと推論を処理します。 学ぶ。 第 2 世代の TPU テクノロジーは、1 秒あたり 180 兆回の浮動小数点演算を処理できます。 1 台のスーパー コンピューターに 64 枚の TPU ボードを搭載すると、11.5 ペタフロップスを処理できます。 このコンピューティング能力により、新しい TPU はトレーニングと推論の両方を同時に処理できます。 過去には可能でした (以前の TPU は推論作業のみを処理できましたが、より複雑な作業は処理できませんでした) トレーニング)。 機械学習には時間がかかりますが、このハードウェアはその作業を加速するのに役立ちます。

Google レンズは、Google フォトの次のアップデートでも強化されます。 画像認識はすでに写真で顔、場所、物を認識し、整理や検索に役立てるために使用されています。 Google レンズを使用すると、Google フォトで建物の名前や説明など、写真に写っているものに関する詳細な情報を得ることができます。 写真内の電話番号をタップすると電話がかかり、写真で見たアートワークに関する詳細情報が表示されます。 美術館にアクセスしたり、Wi-Fi の背面を撮影した写真から Wi-Fi パスワードを自動的に入力したりすることもできます。 ルーター。

Wi-Fi ネットワークのパスワードを入力するのが嫌いですか? ワイヤレス設定の写真を撮ると、Google フォトを介した Google レンズ テクノロジーによって自動的にその設定が入力されます。

アシスタントと写真は Google レンズを使用する最初のアプリになりますが、他のアプリにも展開される予定です。 また、iOS でのアシスタントのサポートの発表により、iPhone ユーザーは Google レンズ テクノロジーも利用できるようになります。

編集者のおすすめ

  • いいえ、スマートウォッチに Google アシスタントは本当に必要ありません
  • Google I/O 2023 でぜひ見たい 5 つのこと(ただしおそらく開催されないでしょう)
  • Google I/O 2023 は 5 月 10 日に対面イベントで開催されます
  • iPhone 14 Pro vs. Google Pixel 7 Proのカメラ争いは信じられないほど接戦
  • この新しい Google レンズ機能は、まるで SF 映画から飛び出してきたようです

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。