MIT の最新の AI ビデオで何が起こっているかを判断するのが得意です

時間関係ネットワークはそこで何が起こっているかをどのように理解するか

何が起こっているのかを理解するために必要なのは、ストーリーを伝えるほんの数フレームの情報だけです。 結局のところ、これは漫画本の基礎であり、私たちが何が起こったのかを追跡するのに十分な重要なストーリービートを提供します。 残念なことに、コンピュータビジョン技術を搭載したロボットはこれを行うのに苦労しています。 少なくとも今までは、.

おすすめ動画

最近、マサチューセッツ工科大学(MIT)は新しいタイプの人工知能を実証しました ニューラル ネットワークを使用してビデオ フレームの空白を埋め、どのようなアクティビティが行われているかを判断するシステム 場所。 その結果、ビデオ内で何が起こっているかを判断するのに驚くほど優れています。

「新しく開発された時間関係モジュールにより、A.I. いくつかのキー フレームを分析し、時間的フレームを推定するシステム ビデオ内で何が起こっているのかを理解するために、それらの間の関係を理解する必要があります。たとえば、積み上げられた物体が倒されるなどです。」 周博麗、元博士号。 マサチューセッツ工科大学コンピューターサイエンス・人工知能研究所(CSAIL)の学生で、現在は香港中文大学でコンピューターサイエンスの助教授を務める同氏はデジタルトレンドに語った。 「このモデルは、受信ビデオからまばらにサンプリングされたキーフレームを使用して動作するため、処理効率が大幅に向上し、リアルタイムのアクティビティ認識が可能になります。」

A.I. のもう 1 つの興味深い特性です。 このモデルは、ビデオのフレームを表示することで、早い段階で何が起こるかを予測し予測できるということです。 たとえば、ボトルを持っている人を見つけると、アルゴリズムは、その人が飲み物を飲むか、おそらくそれを絞る可能性があると予測します。 このような予測能力は、次のような分野で使用される人工知能には不可欠です。 自動運転、瞬間瞬間に何が起こるかを推測することで、事故を積極的に防ぐことができます。

「事前に物を届けることでユーザーの意図を予測できる家庭用ロボットアシスタントなど、人間の行動を監視するためにも使用できる可能性がある」と周氏は続けた。 「これは、オンライン上の膨大な数のビデオを分析し、ビデオの理解とビデオの検索を改善するために使用される可能性があります。」

プロジェクトの次のステップには、より多くの物体や活動を認識する AI の能力を高めることが含まれます。 同チームはロボット研究者と協力して、この活動認識をロボット システムに導入することも進めている。 その結果、知覚能力と視覚的推論スキルが向上する可能性があります。

編集者のおすすめ

  • AMD の Zen 4 チップを買いたい人はいません — 何が起こっているのでしょうか?
  • ZoomのAI 通話中の感情を検出する技術が批評家を動揺させる
  • 面白い公式: なぜ機械が生成するユーモアが A.I. の聖杯なのか
  • Nvidia は AI への参入障壁を下げます。 フリートコマンドとLaunchPadを使用
  • IBMのA.I. メイフラワー号が大西洋を横断しており、生で見ることができます

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。