AR の未来は眼鏡ではなくイヤホンです

人の耳にイヤホンのイラスト
ジュヌヴィエーブ・ポブラノ/デジタル・トレンド・グラフィックス

ロミット・ロイ・チョードリーは耳が大きいです。 でも入ってない それ 方法。 ロイ・チョードリーイリノイ大学アーバナ・シャンペーン校の電気工学およびコンピューターサイエンスの教授は、彼の言うパラダイムを変える可能性を強く信じています。 イヤラブル (いいえ、ウェアラブルではありません) コンピューティング.

コンテンツ

  • 心を読むイヤホン?
  • 耳への負荷を軽減
  • ドーメルの法則
  • ウェアラブルの約束

それは、頭の側面にある 2 つの豪華なリスニングホールを使用して実行されるハードウェアとソフトウェアの膨大な可能性を接続することを意味します。 また、プライバシーやセキュリティのアプリケーションから医療診断に至るまで、あらゆる開発を支援します。 拡張現実の未来に焦点を当てたツールを開発するため、彼は自分を支援する優秀な専門家チームを編成しています。

おすすめ動画

「コンピューターサイエンスや電気工学の分野では、ほぼ誰でも使えます」と彼はデジタルトレンドに語った。 「私のレーダーに映る問題の範囲は膨大です。」

関連している

  • FBI のディープフェイク警告が心配ですか? これらの専門家のヒントに従ってください
  • OpenAI の新しい ChatGPT アプリは iPhone と iPad で無料です
  • ChatGPT AI とビデオチャットできるようになりました - これはどのようなものですか
Apple AirPods Pro と Samsung Galaxy Buds Live
ジャロン・シュナイダー / デジタル トレンド

イヤホンはすでに巨大な市場になっています。 りんご AirPods同社のワイヤレスイヤホンシリーズは、2019 年だけで 6,000 万台を販売しました。 昨年のこの数字は、 8,500万人に増加すると推定されている. 現在、多くの企業がアクティブ ノイズ キャンセリング、A.I. を備えたスマート イヤホンを製造しています。 スマートアシスタントなど。

AirPods の数十年前、1980 年代には、おそらく最初の現代的なウェアラブル技術であるウォークマンがあり、ユーザーはどこにでも音楽を持ち歩くことができました。 ウォークマンはユーザーに、自分が聴いているもの(たとえば、ザ・スミス)を支配するだけでなく、プラスチック製のイヤフォンが耳をふさぐことによって、聴かなかったもの(たとえば、両親)を支配することもできました。 これにより、人々は自分の生活のサウンドトラックを作成し、コントロールできるようになり、私たちに独自の意味のバブルを与えてくれました。 ラジカセは他の人に私たちの音楽を聴かせる、あるいは場合によっては強制するものでしたが、ウォークマンは音楽を聴くことを基本的に個人的で孤立した体験にしました。

フロリアン・シュメッツ/アンスプラッシュ

しかし、ロイ・チョードリーと彼のチームは、それ以上のことを目指しています。 彼らは、今日のイヤホンを、場合によってはイヤホンに手を伸ばす必要性を置き換えることができるまったく新しいコンピューティング プラットフォームに変革しようとしています。 スマートフォン またはコンピューター。 この時代に、ウォークマンが街を歩きながら楽しむ、自分だけのサウンドバブルをすべての人に提供できたら。 よりスマートなテクノロジーとパーソナライゼーションがあれば、同じバブルを新しい、エキサイティングな、そして場合によっては少し奇妙なものに利用できる可能性があります。 方法。

心を読むイヤホン?

「ウェアラブル コンピューティング市場のほとんどは、これまでのところ、下半身、主にポケットや手首、場合によっては靴に装着するデバイスに焦点を当ててきました」とロイ・チョードリー氏は述べています。 「つまり、手、手首、足で何をしているかなど、体の下半身を感じることができるということです。 しかし、上半身、主に頭では多くの情報が生成されます。 聞くこと、話すこと、食べること、顔の感情、医療関連情報の手がかりになる可能性があります。 貴重な。 この最後のフロンティアである聖杯は、もしかしたら 脳信号を感知する 頭の近くから。」

インイヤー デバイスの音声を受動的に聞くだけでなく、話しかけることもできるというアイデアが、Siri のようなスマート アシスタントの基礎となっています。 しかし、今日の AI で使用されているスピーチは、 アシスタントは意図的に浅いです。 写真 (千の言葉に相当) と比較すると、Siri は、天気予報を見つけたり、キッチンでタイマーをセットしたりするなど、情報を素早く大量に届けるときに最も優れています。 しかし、それも限界です。 イアラブル コンピューティングのアイデアは、現在画面を見つめる必要がある他のものの一部をオフロードし、それらを耳の上 (および耳に) 装着する方法を見つけることです。

AIを識別する歌
クリシュナ P. ミヤプラム

「視覚的なスクリーン上でやっているすべてのことには、認知的注意のすべてが注がれています」と彼は言いました。 「本を読むということは、たとえそれが画面上で読むくだらないジョークであっても、他のことに集中することはできません。 読書はあなたの認知的注意を完全に消費します。 私の考えでは、認知的注意を払うに値しないような事柄はたくさんあると思います。 私たちはそれらを視覚領域から引き出し、未開発で独占されていない音声領域に押し込むことができます。そこでは人間の脳は自然に高度に進化しており、 このような音声情報を多重化して…これらの単純なものを、認知的、視覚的認知チャンネルから遠ざけ、音響チャンネルに移してみてはいかがでしょうか。 帯域幅は?」

チームによって行われた最近の実験には、テキストをより有意義に消費できる方法の探求が含まれていました。 可聴 形状。 記事を読んでいると、興味のあるキーワードが見つかり、その時点から読み始めることがあります。 ただし、たとえばポッドキャストを聞いている場合、これを簡単に行う方法はありません。

「私たちの研究室でやろうとしていることの 1 つは、[質問] です。記事を早く聞くことができますか?」 ロイ・チョードリー氏は語った。

耳への負荷を軽減

このグループの概念実証デモンストレーションでは、リスナーは記事内の複数の段落を同時に読み上げます。 この機能を実現するコツは、信号処理を使用して、各段落が別の方向から聞こえているかのように聞こえるようにすることです。座っているのと少し似ています。 レストランで、周囲のテーブルで 4 つの会話が行われていますが、その人があなたと話している人の名前を言ったため、1 つにダイヤルしました。 知る。 この機能を改善するために、チームはイヤホンの慣性測定ユニット (IMU) を利用して、 ユーザーは、頭を少し回すことで特定の声(テキストの一部)を発声できます。 方向。

「私はこのプロジェクトを『音響領域で読む』と呼んでいます。このプロジェクトでは、第 3 段落の声の方向に注目します。すると、その声が大きくなり、他の声が少し暗くなります」と彼は言いました。

スピーチがすべてではありません。 研究チームはまた、イヤホンのマイクと IMU の両方を使用して、顔の信じられないほど微細な振動を拾うことができることも発見しました。 歯を鳴らしている人 あるいは、顔をしかめたり笑ったりする顔の筋肉。 いいえ、スマートフォンを捨ててモールス信号でメッセージを歯でおしゃべりすることはおそらくないでしょう。 しかし、右側の歯を滑らせるなど、顔の微細な歪みが次の目的に利用できるという考えは、 コマンドを実行したり、二要素認証の本人確認として機能したりすることは確かに可能です。 面白い。

「Siri は誰もがよく知っていますが、声を発することができる腹話術師のように、Siri に空間的な次元があれば、どれだけ多くの潜在的な用途が開かれるか想像してみてください。」

これはさらに、医療診断などの長期的なデータを取得するのにも役立つ可能性があります。 たとえば、不安障害は、歯の動きで検出される特定のパターンから診断される場合があります。 ロイ・チョードリー氏はまた、心拍数、血糖値、筋肉活動などを測定するために耳を通る血流を測定するといった問題に取り組んでいる研究者がいることにも言及した。

別の使用法が必要ですか? どうでしょうか 聞こえる拡張現実? 拡張現実は現在、コンピュータで生成されたオブジェクトを現実世界の上に重ねることで最もよく知られています。 しかし、拡張が純粋に視覚スペクトル上で行われなければならない理由はありません。 ロイ・チョードリー氏のチームは、信号処理テクノロジーを使用して特定の音を風景にマッピングできるという見通しに興奮しています。 空港、美術館、またはその他の公共の場所では、「私について来てください」という声に向かって歩く必要があり、その声は向かうべき方向から聞こえてくるように見えます。 で。

シリ

Siri は誰もがよく知っていますが、声を発することができる腹話術師のように、Siri に空間的な次元があれば、どれだけ多くの潜在的な用途が開かれるか想像してみてください。 この空間拡張は、各人の声が特定の場所にマッピングされるため、大規模な仮想会議の改善にも役立ち、誰が話しているのかをすぐに簡単に判断できるようになります。

もちろん、これらすべてが実現するわけではありません。 これらは、広告のアイデアを落書きするコピーライターのエンジニアリング版です。 それらの多くはうまくいかないかもしれませんが、1 つまたは 2 つの例は非常に役立つ可能性があります。

ドーメルの法則

これが、Roy Choudhury が継続的なイヤラブル コンピューティングの可能性、そして現実世界での成功の可能性について熱狂しているもう 1 つの理由です。 どのテクノロジーが普及するかについては、技術者が必ずしも望んでいる以上に社会の反応によって左右されます。 新しいテクノロジーは、定義上、新しいものです。 新しいものは奇妙なものと同じである可能性があります。 私自身の定式化 (後世の人々を刺激するために、これをドーメルの法則と呼びましょう) を使用するには、新しいテクノロジーのすぐに使える有用性が、その使用に内在する危険性を二重に相殺する必要があります。

「完全に形成された技術がほとんど登場しないため、これは問題です。」

人々が家庭で使用していたパーソナル コンピュータは、それを使用することに対する社会的リスクが非常に低かったため、市場に出てから最初の数年間はほとんど使用する余裕がありませんでした。 公共の場で使用されるラップトップの場合は、リスクがわずかに高くなります。 ウェアラブル機器は、体に着用するため特に目立つものですが、ほとんどのテクノロジーよりも明らかに奇妙です。 頭に貼り付けられるテクノロジーの一部は、ボーグドローンのサイバネティックインプラントのように見えますが、 ユーザーが見られることで社会に悪影響を与える価値があると考える場合には、素晴らしいものであり、すぐに役に立ちます。 それを着ています。

ジャロン・シュナイダー / デジタル トレンド

完全に形成されたテクノロジーがほとんど登場しないため、これは問題です。 ほとんどの場合、製品の最初の数世代は欠陥のある約束に基づいて構築され、その後、より魅力的な製品が 3 回目の反復あたりで登場します。 注目度の高い製品が初日から提供できなければ、たとえそれが最終的に良い製品になったとしても、長期的な成功の可能性は失われてしまう可能性があります。 古い技術ファンの場合は、ポータブル Apple Newton デバイスと、その初期の手書き認識機能を検討してください。 若いファンにとっては、ドーメルの法則で Google Glass の失敗が説明されるかもしれません。Google Glass は多大な社会的偏見と偏見を伴いながらも、うまくいきました…ほぼ問題ありませんでした。

ロイ・チョードリー氏が指摘したように、イヤホンは異なります。 かつて彼らをめぐる戦いが存在したとしても、多かれ少なかれすでに勝利を収めています。 「社会はすでにイヤホンを着けている人を受け入れている」と彼は言う。 「…ある意味では、現在アップグレードする必要があるのはアルゴリズム、センサー、ハードウェアだけです。 それは単なる技術的なボトルネックであり、もはや社会的、心理的なボトルネックではありません。」

ウェアラブルの約束

イヤホンが受け入れられたという事実は、リスクを軽減し、即時に二者択一の結果をもたらす必要がなくなることを意味します。 たとえロイ・チョードリー氏が述べた最も崇高な目標が長期間達成されなかったとしても、漸進的な改善によって実証済みのフォームファクターに実用性が追加されるでしょう。

「懸案の果実は、『歯のしぐさから発作を察知できる』とか、『発作の発作を察知できる』といったものです」 顔のジェスチャーでその人の気分を理解できるので、気分を判断する Fitbit のようなものになります」と彼は言いました。 言った。 「しかし、たとえそれが失敗したとしても、製品パイプラインが妨げられることはありません。 しかし、もし成功したとしても、それは製品を素晴らしいものに変えただけです。」

ロイ・チョードリー氏は、イヤラブル・コンピューティングの可能性はほぼ無限であると信じています。 「今後の道は、言葉を超えたところにあると思います」と彼は語った。 「スピーチは最も内側のサークルであり、(このテクノロジーの)核心であると言えます。 その相互作用の外側には音響一般があります。 外部音響には、その他あらゆる種類のセンサーや機能が含まれます。 このプラットフォームの構築をどのように開始するかを考えると、簡単に実現できる成果は次のとおりです。 音声ベースのインタラクション: 「タイマーをセットして」「Hey Siri、今日の天気は?」しかし、それは遠くまで及ぶ可能性があります。 それ以上。"

ロイ・チョードリーとともにウェアラブル・コンピューティングに取り組んでいる他の研究者には、次のような人がいます。 ヤン・ジージャン, ウェイ・ユーリン, ジェイ・プラカシュ、 そして リー・ジユエ.

編集者のおすすめ

  • ChatGPT の iPhone アプリに Bing が組み込まれました
  • Apple は WWDC で Siri を ChatGPT キラーにしなかった - それが私を怖がらせる
  • ChatGPT のことは忘れてください — Siri と Google アシスタントはこれら 4 つのことをより良く実行します
  • Apple、Apple Watch用のAIヘルスコーチを開発、報道によると
  • この奇妙な AI デバイスは将来あなたのスマートフォンに取って代わるかもしれません