新しいブレインソーシング技術が AI を訓練します。 脳波を使って

合計 24 個以上の机が部屋にいっぱいあるところを想像してください。 同じ机のそれぞれにコンピューターがあり、その前に人が座って簡単な識別ゲームをプレイしています。 ゲームはユーザーに、どの認識タスクを選択するなど、さまざまな基本的な認識タスクを完了するように求めます。 誰かが笑っている、または黒髪や服を着ている人を描いたシリーズのうちの写真 眼鏡。 プレイヤーは次の絵に進む前に決定を下す必要があります。

コンテンツ

  • 古いアイデアに新たなひねりを加えた
  • ブレインソーシングの世界へ
  • 未来がやってくる

ただ、マウスをクリックしたり、タッチスクリーンをタップしたりすることはしません。 代わりに、彼らはただ考えるだけで正しい答えを選択します。

部屋内の各人には脳波 (EEG) 頭蓋骨キャップが装着されています。 各人から近くの録音装置につながるワイヤーの跡。 モニター 頭皮の電圧活動。 このシーンは、誰もがマトリックスにジャックされたオープンプランのオフィスのように見えます。

関連している

  • アナログAI? クレイジーに聞こえるかもしれないが、それは未来かもしれない
  • Nvidia の最新の A.I. 結果は、ARM がデータセンターに対応できることを証明しています
  • Facebook の「ドロイドレット」AI 音声認識を全く新しいレベルに引き上げる可能性がある
ジョン・マクドゥガル/ゲッティ

「[私たちの研究の]参加者には、[何を探すように求められているか]をただ認識するという単純なタスクがありました。」 トゥッカ・ルオサロ、ヘルシンキ大学の研究員。 最近発表された研究を主導したとデジタルトレンドに語った。 「彼らは他に何もするように求められませんでした。 彼らはただ見せられた画像を眺めただけでした。 次に、脳信号のみに基づいて、ターゲットの特徴を備えた正しい顔を識別できるかどうかを確認するための分類器を構築しました。 参加者が写真を見た瞬間の脳波信号以外には何も使用されていません。」

実験では、合計 30 人のボランティアに、合成された人間の顔の画像を見せました( 参加者の 1 人が、見せられた人物を認識する可能性があり、その結果、画像が歪められる可能性があります。 結果)。 参加者は、見たものに基づいて心の中で顔にラベルを付けるように求められ、探すように求められました。 その脳活動データのみを使用して、 人工知能 アルゴリズムは、金髪の人が画面に現れたときなどの画像を認識することを学習しました。

古いアイデアに新たなひねりを加えた

これは印象的なものですが、特に新しいものではありません。 少なくとも過去 10 年間、研究者たちは、EEG または fMRI によって収集された脳活動データを使用して、ますます印象的な思考読み取りのさまざまなデモンストレーションを実行してきました。 場合によっては、特定の画像やビデオを識別することもあります。たとえば、モスクワのニューロボティクス研究所の研究者らが最近の研究で、どの画像やビデオを識別できるかを示しました。 人々が見ているビデオクリップ 脳の活動を監視することによって。

場合によっては、これらの洞察を使用して特定の応答をトリガーすることもできます。 たとえば、2011 年にセントルイスのワシントン大学の研究者は、人の脳の言語中枢に一時的な電極を配置し、次のことができることを実証しました。 画面上でコンピュータのカーソルを移動する 単純に、どこに動かしたいかを考えてもらうだけです。 さらに他の研究では、脳データを使用してロボットの手足を動かしたり、ドローンをホバリングしたりできることが示されています。

ヘルシンキ大学の最近の研究が斬新で興味深いのは、人間の脳活動がどのように変化するかに焦点を当てていることだ。 グループ 画像を分類するなどの結論を引き出すために、1 人の人物ではなく人数を使用できます。 彼らは、それが機能することを示しただけでなく、少なくともある時点までは、グループに追加する人が増えるほど、データの正確性が高まることを示しました。

クリス・ソー/ゲッティ

「脳データを人々のグループから記録できるように、脳調達プールにさらに多くの人を追加すると、90% をはるかに超える精度のパフォーマンスが達成されます」とルオサロ氏は述べています。 「[それは] [グループに手動で回答にタグ付けするよう依頼する] レベルに近いです。」

これは最初は直観に反して聞こえるかもしれません。 脳のデータにノイズが多い場合、人を追加するとさらにノイズが多くなるのではありませんか? 結局のところ、部屋の中で特に聞き取りにくい音を聞き取りたい場合は、10 人で話し合うよりも 1 人だけの方が話しやすいのです。 あるいは30。 しかし、ビッグデータ革命の歴史や、機械学習の最も注目すべきデモンストレーションの多くは、 問題を解決するために自由に使えるデータが増えれば増えるほど、システムの精度が高まります。 なる。

「EEGやその他の脳画像からの信号には一般的にノイズが多く、参加者や人間は常に100%参加しているわけではありません」とルオサロ氏は説明した。 「自分で写真を見て考えてみてください。 多くのものを見た後、心がさまよってしまうことがあります。 参加者が 1 人の場合でも、研究者はノイズを平均化するために同じ刺激を何度も繰り返すなどのトリックを使用することがよくあります。 ここでは、多くの参加者からの信号を使用します。」

毎回少なくとも何人かの個人が集中している可能性は、たった 1 人の個人に比べて大幅に増加します。 群衆の知恵の概念 (これについては後で詳しく説明します) を追加すると、非常に強力な組み合わせが得られます。

ブレインソーシングの世界へ

Tuukka Ruotsalo 氏と彼のチームは、このグループベースの脳の読書を「ブレインソーシング」と呼んでいます。 クラウドソーシングという言葉のもじりです 1 つの大きなタスクを小さなタスクに分割し、大きなグループに分散して支援できるようにする方法を指します。 解決する。 ここ 2020 年において、クラウドソーシングは Kickstarter などの資金調達プラットフォームと最も同義かもしれません。そこでの「大きな仕事」は 製品を発売するために必要なスタートアップ資金と、分散型群衆ベースの要素では、人々に少額のチップを求めることが含まれます。 お金。

ただし、クラウドソーシングは他のアプリケーションにも応用できます。 Amazon の Mechanical Turk プラットフォームと Apple の ResearchKit は、アンケートへの回答から重要な学術研究の実施に至るまで、さまざまなタスクに群衆の力を活用するクラウドソーシング ツールです。 一方、TaskRabbit や 99designs のような企業は、群衆を活用して、顧客が適切な人物とマッチングできるよう支援しています。 庭仕事や食料品の買い物から、ウェブサイトに最適なロゴやマストヘッドのデザインまで、あらゆるものを提供します。

ブレインソーシング: 協調的なブレイン コンピューター インターフェイスを介したクラウドソーシングの認識タスク (ティーザー)

A.I. クラウドソーシングの恩恵を受けることもできます。 たとえば、次のように考えてみましょう。 GoogleのreCAPTCHAテクノロジー. 私たちのほとんどは、reCAPTCHA を、特定のタスクの実行を許可する前に、Web サイトがボットであるかどうかをチェックできる方法だと考えているでしょう。 reCAPTCHA を完了するには、揺れるテキスト行を読むか、選択範囲内の猫を含むすべての画像をクリックする必要がある場合があります。 しかし、reCAPTCHA は単に私たちが人間であるかどうかをテストするだけではありません。 これらは、Google の画像認識 AI を実現するために使用できるデータを収集する非常に賢い方法でもあります。 より賢い。 reCAPTCHA 画像上の道路標識のテキストの断片を読み取るたびに、たとえば Google の自動運転車の現実世界の認識が少し向上することに貢献している可能性があります。 Google が画像に対する十分な回答を収集すると、Google は画像が正しい回答を持っていると合理的に確信します。

ブレインソーシングがこれらのアイデアに基づいて実際にどのように構築できるかを考えるのは時期尚早です。 「私たちはこれについて自分たちで考えようとしてきました」とルオサロ氏は語った。 「まだアイデアすら出ていないと思います。 これは単なる概念実証にすぎません。 これで、他の人がこれをどの程度効果的に、どのような種類のタスクに、どのような種類の人々のグループに使用できるかを検討できるようになりました。」

未来がやってくる

しかし、可能性は確かにあります。 市販のウェアラブル EEG モニターは現在、次のような形式で入手可能になり始めています。 脳を読み取るヘッドフォンスマートタトゥー. 現時点では、この研究のような脳波検査で測定できるのは、人の脳活動全体のごく一部に過ぎません。 しかし、時間が経つにつれて、この量は増加する可能性があり、収集される情報のバイナリ コレクションが少なくなる可能性があります。 このテクノロジーは、質問に対して単に「はい」または「いいえ」の答えを得るのではなく、より多くのことに対する人々の反応を観察できるようになります。 複雑な質問については、テレビ番組や映画などのメディアへの反応を監視し、集合的な群衆データをそのメディアにフィードバックすることができます。 メーカー。

「従来の評価やいいねボタンを使用する代わりに、単純に曲を聴いたり、番組を見たりすると、脳が 活動だけでも、それに対するあなたの反応を判断するには十分でしょう」と学生で研究助手のキース・デイビスは言う。 プロジェクト、 プレスリリースで述べた 作業に付随して。

何百万人もの人々が脳波追跡ウェアラブルを着用しており、特定のタスクを解決するために数秒かかることと引き換えに、そのうちの一部の人々に 1 日 10 回の少額支払いを提供した場合を想像してください。 空想的ですか? おそらく今もそうですが、ほんの数年前には今日のクラウドソーシング テクノロジーの多くも同様でした。

ゲーム番組で 億万長者になりたい人、出場者が利用できる「ライフライン」の 1 つは、視聴者に特定の質問をするオプションです。 この 1 回限りのライフラインが作動すると、聴衆は座席に取り付けられた投票パッドを使用して、正しいと思われる多肢選択式の質問の答えに投票します。 次に、コンピューターが結果を集計し、出場者にパーセンテージとして表示します。 ジェームズ・スロウィツキの本によれば、 群衆の知恵、聴衆に質問すると、90%以上の確率で正しい答えが得られます。 これは、2 つの不正解を排除する番組の 50/50 オプションや、約 3 分の 2 の確率で正しい答えが得られる友人に電話するオプションよりもはるかに優れています。

ブレインソーシングはテクノロジーの次の素晴らしいアイデアになる可能性があります。 エンターテイメントの改善からより優れた AI のトレーニングまで、あらゆることを支援します。 あらゆる種類の質問に答えるには? 確かに言うには時期尚早です。 しかし、これは間違いなく、今後数か月、数年、数十年でさらによく耳にすることになる用語です。

編集者のおすすめ

  • Nvidia のスーパーコンピューターが ChatGPT の新時代をもたらす可能性がある
  • 面白い公式: なぜ機械が生成するユーモアが A.I. の聖杯なのか
  • Nvidia の新しい音声 A.I. まるで本物の人間のように聞こえる
  • インテルの驚異的なアスリート追跡 AI トレーニングテクノロジーの「聖杯」です
  • クマのための顔認識技術は人間の安全を守ることを目的としている