目の錯覚は新世代の AI の構築に役立つ可能性がある

円形の点のグリッド上の黒い円の画像を見ます。 これは白いメッシュ素材に焼き付けられた穴に似ていますが、実際には画面または紙の上にある平らで静止した画像です。 しかし、あなたの脳はそのようには理解しません。 低レベルの幻覚体験のように、心が暴走します。 静止したイメージを、あなたに向かって進んでいる黒いトンネルの入り口として認識します。

コンテンツ

  • 進化のエッジ
  • マシンビジョンは進化し​​ています
  • マシンビジョンのチューリングテスト
  • あなたの錯覚を利用してください
  • 一般的なビジョンの達成

その影響の真実味に反応して、体は無意識に反応し始めます。つまり、目の瞳孔が拡張して、 あなたが暗闇に落ちそうになったときに、可能な限り最高の状態を確保するために調整するのと同じように、より多くの光が入ります。 ビジョン。

ブラックホールの目の錯覚

問題のエフェクトを作成したのは、 北岡明佳、神戸にある立命館大学の心理学者。 これは、彼が長いキャリアの中で生み出した数十の目の錯覚のうちの 1 つです。 (お気に入りはあるかというデジタルトレンドの質問に答えて、「全部好きです」と彼は答えた。)

おすすめ動画

この新しい幻想は、最近発表された研究の主題でした ジャーナル『Frontiers in Human Neuroscience』に掲載. この論文の焦点は、この新しい効果(私たちの約86パーセントが経験することが判明している)に対する人間の生理学的反応にしっかりと焦点を当てているが、 研究者の一人がデジタル誌に熱心に説明したように、全体的なトピックは機械知能の将来にも大いに関連する可能性があります。 トレンド。

進化のエッジ

フレーザースパイラルとして知られる目の錯覚
一見すると、この画像は中心に向かって渦を巻いているように見えるかもしれません。 しかし、内側に曲がっているように見える線をたどってみると、それがまったく螺旋ではないことがわかるでしょう。

あなたの脳に何か問題があります。 少なくとも、これは人間の脳が目の錯覚を認識する方法から導き出される簡単な結論の 1 つです。 二次元の静止画像が脳によってまったく異なるものとして認識されることについて、他にどのような説明があるでしょうか? 長い間、主流の心理学はまさにそれを考えていました。

「当初、人々は『人間の脳は完璧ではない…常に正しく理解できるわけではない』と考えていました。それは失敗ですよね?」 言った ブルーノ・レン、オスロ大学心理学部の教授であり、前述の研究の筆頭著者です。 「その場合の幻想は、機械の何らかの欠陥を明らかにするので興味深いものでした。」

脳には、そこに何があるのか​​を知る方法がありません。」

心理学者はもはや彼らをそのようには見ていません。 むしろ、このような研究は、視覚システムが単なる単純なカメラではないことを浮き彫りにしています。 「広がる穴の錯覚」の錯視は、目が物理的なエネルギーではなく、知覚された、さらには想像された光と闇に順応していることを明らかにします。

最も重要なことは、私たちが単に視覚システムを使って世界をただ漠然と記録しているのではなく、 代わりに、わずかな進化を得るために一連の科学実験を継続的に実行します。 アドバンテージ。 目標は、提示されたデータを分析し、問題が発生する前に問題に先制的に対処することです。

「脳はそこに(実際に)何があるのか​​を知る方法がありません」とラン氏は言う。 「それがやっているのは、そこに存在する可能性のある一種の仮想現実を構築していることです。 少し推測の余地があります。 この点で、脳は一種の確率機械と考えることができます。 それを呼び出すことができます ベイジアン 必要に応じてマシンを。 事前の仮説を使用して、それが機能するかどうかを常にテストしようとしています。」

レン氏は、たとえそれが雲や頭上の木の葉を通して見えたとしても、私たちの目は太陽からの光の印象にのみ基づいて調整を行っているという例を挙げています。 念のため。

「進化論で重要なのは、それが(その瞬間に)真実であるということではなく、それがあり得るということだ」と彼は続けた。 「瞳孔を収縮させることで、身体は短期間に起こる可能性が非常に高い状況にすでに適応しています。 [突然太陽が出たら]何が起こるかというと、目がくらむということです。 幻惑とは、一時的に無力になることを意味します。 それは、あなたが獲物であるか捕食者であるかにかかわらず、大きな影響を及ぼします。 特定の状況ではほんの一瞬を失うと、生き残れない可能性があります。」

私たちの視覚システムが推測する必要があるのは、光と闇だけではありません。 ボールが高速で移動するテニスのゲームを考えてみましょう。 もし私たちが、視覚システムがその瞬間に受け取っているものに完全に基づいて行動したとしたら、現実から遅れてボールを返すことができなくなるでしょう。 「私たちは過去に囚われているにもかかわらず、現在を認識することができています」とラン氏は語った。 「それを実現する唯一の方法は、未来を予測することです。 ちょっと言葉遊びのように聞こえますが、簡単に言うとそういうことです。」

マシンビジョンは進化し​​ています

顔認識
イズセク/ゲッティイメージズ

では、これはコンピュータビジョンとどのような関係があるのでしょうか? 潜在的にはすべて。 たとえば、ロボットが現実世界で効果的に機能できるようにするには、このような調整をその場で行うことができる必要があります。 コンピューターには、非常に高速な計算を実行できるという利点があります。 彼らにないのは、何百万年にもわたる進化です。

それでも近年、マシンビジョンは大きな進歩を遂げました。 リアルタイムのビデオ ストリームで顔や歩き方を識別できる可能性があり、大勢の人が集まっている場合でも識別できます。 同様の画像分類と技術ツールは、他のオブジェクトの存在も認識できます。 オブジェクト セグメンテーションの画期的な進歩により、さまざまなオブジェクトのコンテンツをより深く理解できるようになりました。 シーン。 2D シーンから 3D 画像を外挿することに関しても大幅な進歩があり、機械がシーンから奥行きなどの 3 次元情報を「読み取る」ことができるようになりました。 これにより、現代のコンピューター ビジョンが人間の画像認識に近づきます。

しかし、最高のマシンビジョンアルゴリズムと、圧倒的多数の人間が幼い頃から実行できるビジョンベースの能力との間には、依然として隔たりが存在します。 私たちはこれらのビジョンに基づいたタスクをどのように実行するかを正確に説明することはできませんが、(ハンガリー系英国の博学者マイケル・ポランニーの言葉を借りれば、「私たちは知ることができます) 「私たちが言うことができる以上のものです」)、それでも私たちは、視力をさまざまなスマートな方法で活用することを可能にする、印象的な一連のタスクを実行することができます。 方法。

マシンビジョンのチューリングテスト

研究者やエンジニアが、視覚的視覚システムと少なくとも同等に動作するコンピュータ ビジョン システムを作成したいと考えている場合、 ウェットウェア脳の処理スキル、目の錯覚を理解できるアルゴリズムの構築は悪いスタートではありません ポイント。 少なくとも、マシンビジョンシステムが私たち自身の脳に対してどの程度うまく機能するかを測定する良い方法であることが証明される可能性があります。 それは神話に対する答えではないかもしれない 汎用人工知能, しかし、それがジェネラル・ビジョンを解く鍵になるかもしれません。

脳を騙して偽の色を認識させる目の錯覚
信じられないかもしれませんが、これらのボールはすべて同じ灰色で、脳はボールを横切る色付きの線の文脈上の手がかりに基づいて、ボールが異なる色であると解釈します。

「ある日、誰かが同じような錯覚的な知覚誤りを犯す人工視覚システムを開発したとしたら、 私たちがそうしているなら、この時点で、彼らが私たちの脳がどのように機能するかをうまくシミュレーションしていることがわかるでしょう」とラン氏 言った。 「それは一種のチューリングテストでしょう。 私たちと同じように幻想にだまされる人工ネットワークがあるなら、私たちは脳自体の基礎となる計算の理解に非常に近づくことになるでしょう。」

ソン・イーゼ英国サリー大学ビジョン音声信号処理センターのコンピューター ビジョンと機械学習の読者である彼も、この仮説に同意しています。 「一般的なトピックとして錯視を理解するよう視覚アルゴリズムに依頼することは、コミュニティにとって非常に価値があります」と彼は Digital Trends に語った。 「これは、限界をさらに押し上げ、機械に推論を求めることによって、機械に[認識]を求めるという現在のコミュニティの焦点を超えています。 この推進は、視覚概念の主観的な解釈に対応する必要がある『一般的なビジョン』に向けた重要な前進となるでしょう。」

あなたの錯覚を利用してください

現在までのところ、この目標に向けた研究は限られていますが、まだ比較的初期の段階にあります。 ナシム・ネマツァデ氏は博士号を取得した研究者です。 人工知能とロボット工学 - 低レベル視覚モデルの分野で、 このトピックに関する出版物.

「私たちは、低レベルの網膜処理および初期段階のガウスカーネルにおける単純なガウス様モデルの役割をさらに探求することにより、[深層ニューラル] ネットワーク]、そして錯覚の喪失の予測は、より正確なコンピューター ビジョン技術とモデルにつながるでしょう」とネマツァデ氏は Digital Trends に語った。 「[これは]深度と動きの処理のより高いレベルのモデルに貢献し、自然画像のコンピューター理解に一般化される可能性があります。」

動かない円が動く(目の錯覚)!

マックス・ウィリアムズ氏はAI研究者で、データセットの作成に貢献した。 何千もの目の錯覚画像 コンピューター ビジョン システムについて、一般視覚と錯視の関係を最も簡潔に述べています。「錯覚が存在するのは、私たちの目と脳が混乱した動作を行っているためです。 私たちがほぼ完全に遮断されている物理世界によって作成された、他の方法では理解できないライトフィールドから視覚的なシーンを抽出するためのアドホックなプロセス」と彼らはDigitalに語った。 トレンド。 「『知覚』とみなされるほど表現力豊かで、かつ幻想のない視覚システムを作ることは不可能だと思います。」

一般的なビジョンの達成

明確にしておきますが、AI が人間レベル (またはそれ以上) の一般視覚を達成するということは、単に標準的な目の錯覚を認識できるように AI を訓練するだけではありません。 たとえば、マジックアイの錯覚を 99.9% の精度で 0.001 秒で解読するという超特殊な能力は、何百万年もの人類の進化に代わるものではありません。

(興味深いことに、マシン ビジョンには敵対的モデルの形で独自の錯視がすでに存在しており、ある憂慮すべき例のように、マシン ビジョンが誤った認識を引き起こす可能性があります。 ライフル用の 3D プリントされたおもちゃのカメ. ただし、これらは人間に作用する目の錯覚と同じ進化上の利点をもたらしません。)

それでも、機械に人間の目の錯覚を理解させ、私たちと同じように反応させることは、非常に有用な研究となる可能性があります。

そして 1 つ確かなことは、General Vision AI が登場するときです。 それを達成しても、私たちと同じ種類の目の錯覚に陥ることになります。 少なくとも、幻想の広がる穴の場合、私たちの 86% はそうします。

編集者のおすすめ

  • Wix は ChatGPT を使用して、ウェブサイト全体を迅速に構築するのに役立ちます
  • OpenAI、超インテリジェント AI の暴走を阻止するための新しいチームを構築
  • これらの独創的なアイデアは、AI の邪悪さを少しでも和らげるのに役立つかもしれません
  • GoogleのAI画像検出ツールは使えそうな気がする
  • 採用一時停止の一環として、IBMの約7,800人の雇用がAIに置き換えられる可能性がある