MIT の最新の AI ビデオで何が起こっているかを判断するのが得意です

時間関係ネットワークはそこで何が起こっているかをどのように理解するか

何が起こっているのかを理解するために必要なのは、ストーリーを伝えるほんの数フレームの情報だけです。結局のところ、これは漫画本の基礎であり、私たちが何が起こったのかを追跡するのに十分な重要なストーリービートを提供します。残念なことに、コンピュータビジョン技術を搭載したロボットはこれを行うのに苦労しています。少なくとも今までは、.

おすすめ動画

最近、マサチューセッツ工科大学（MIT）は新しいタイプの人工知能を実証しましたニューラルネットワークを使用してビデオフレームの空白を埋め、どのようなアクティビティが行われているかを判断するシステム場所。その結果、ビデオ内で何が起こっているかを判断するのに驚くほど優れています。

「新しく開発された時間関係モジュールにより、A.I. いくつかのキーフレームを分析し、時間的フレームを推定するシステムビデオ内で何が起こっているのかを理解するために、それらの間の関係を理解する必要があります。たとえば、積み上げられた物体が倒されるなどです。」周博麗、元博士号。マサチューセッツ工科大学コンピューターサイエンス・人工知能研究所（CSAIL）の学生で、現在は香港中文大学でコンピューターサイエンスの助教授を務める同氏はデジタルトレンドに語った。「このモデルは、受信ビデオからまばらにサンプリングされたキーフレームを使用して動作するため、処理効率が大幅に向上し、リアルタイムのアクティビティ認識が可能になります。」

A.I. のもう 1 つの興味深い特性です。このモデルは、ビデオのフレームを表示することで、早い段階で何が起こるかを予測し予測できるということです。たとえば、ボトルを持っている人を見つけると、アルゴリズムは、その人が飲み物を飲むか、おそらくそれを絞る可能性があると予測します。このような予測能力は、次のような分野で使用される人工知能には不可欠です。自動運転、瞬間瞬間に何が起こるかを推測することで、事故を積極的に防ぐことができます。

「事前に物を届けることでユーザーの意図を予測できる家庭用ロボットアシスタントなど、人間の行動を監視するためにも使用できる可能性がある」と周氏は続けた。「これは、オンライン上の膨大な数のビデオを分析し、ビデオの理解とビデオの検索を改善するために使用される可能性があります。」

プロジェクトの次のステップには、より多くの物体や活動を認識する AI の能力を高めることが含まれます。同チームはロボット研究者と協力して、この活動認識をロボットシステムに導入することも進めている。その結果、知覚能力と視覚的推論スキルが向上する可能性があります。

編集者のおすすめ

AMD の Zen 4 チップを買いたい人はいません — 何が起こっているのでしょうか?
ZoomのAI 通話中の感情を検出する技術が批評家を動揺させる
面白い公式: なぜ機械が生成するユーモアが A.I. の聖杯なのか
Nvidia は AI への参入障壁を下げます。フリートコマンドとLaunchPadを使用
IBMのA.I. メイフラワー号が大西洋を横断しており、生で見ることができます

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニークピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。

MIT の最新の AI ビデオで何が起こっているかを判断するのが得意です

編集者のおすすめ

カテゴリ

最近

PushSend は中小企業向けの統合プラットフォームを提供します

Appleの新しいiMacはIntel XeonプロセッサとECC RAMを搭載

デジタルトレンドがフリーランスライターを募集: スマートホーム、A/V、コンピューティング

MIT の最新の AI ビデオで何が起こっているかを判断するのが得意です

編集者のおすすめ

カテゴリ

最近

PushSend は中小企業向けの統合プラットフォームを提供します

Appleの新しいiMacはIntel XeonプロセッサとECC RAMを搭載

デジタル トレンドがフリーランス ライターを募集: スマート ホーム、A/V、コンピューティング

デジタルトレンドがフリーランスライターを募集: スマートホーム、A/V、コンピューティング