未来の AI を実現する 5 つの方法 アシスタントは音声技術を次のレベルに引き上げます

click fraud protection
りんご

2011年にSiriがiPhone 4sでデビューして以来、音声アシスタントは、機能しないギミックから、アメリカの6世帯に1世帯に設置されているスマートスピーカー技術の基礎となった。

コンテンツ

  • 知識が豊富で問題が少なくなる
  • より多くの (そしてより良い) パーソナライゼーション
  • 積極的に行動する
  • すべてはフィードバックです
  • 新しいインタラクション方法

「Siri が登場する前は、私が(自分の仕事の)ことについて話しても、白い目で見られていました」と、イノベーション責任者のトム・ヘブナー氏は述べています。 ニュアンスコミュニケーションズ最先端のA.I.を開発する。 音声テクノロジーについてデジタルトレンドに語った。 「人々はこう言うだろう、『そんな恐ろしい電話システムを作っているのか?』 「私はあなたが大嫌いです。」 それは、あるグループの人々が音声テクノロジーと関わった唯一の出来事でした。」

おすすめ動画

今ではそんなことはありません。 eMarketerの予測によると、ほぼ1億 スマートフォン ユーザーは 2020 年までに音声アシスタントを使用するようになるでしょう。 しかし一方で、A.I. アシスタントはもはや目新しいものではなく、私たちはまだ進化の始まりにいます。 音声アシスタントが製品カテゴリーとしての期待に完全に応えるまでには長い道のりがあります。

ここでは、テクノロジーを改善してよりスマートかつ効率的なものにし、結果として私たちがより生産的な生活を送るのに役立つ 5 つの方法を紹介します。 それらを「予測」または「ウィッシュリスト」と呼びますが、これらは解決する必要がある課題です。

知識が豊富で問題が少なくなる

アレクサ マレーシアのクアラルンプールの天気を教えてください。 720 南アフリカ ランドで得られる米ドルの総額と、「解体主義」の綴り。 しかし 消費者向け AI アシスタントは本質的に、最新の情報の完全なセットを持つ人間とデジタル的に同等です。 百科事典。 (できれば) 正しい情報が得られますが、そこにはプロレベルの専門知識はありません。

「家庭のシステムが抱えている課題は、システムが実行しようとしていることの範囲が非常に広いことです」とヘブナー氏はデジタル トレンドに語った。

これを解決するのは難しい問題ですが、解決できれば状況は大きく変わります。 Nuance は、航空会社の顧客が質問に答えたり、医師がメモを取ったりするのを支援するなど、特定のユースケースを目的とした多くの専門家システムを開発しています。 そうすることは、これらのシステムがドリルダウンしてより詳細な情報を取得できることを意味するだけでなく、より多くのインテリジェンスを組み込むことができることも意味します。 「人々は言葉を理解できるコンピューターに非常に興奮していましたが、その言葉をどう扱えばよいか分からなければ必ずしも問題ではありません」とヘブナー氏は言う。

彼が挙げる例の 1 つは、医師が患者のために使用可能な薬のリストを読み上げるタイミングを理解するだけでなく、潜在的な競合を呼び出すことができる Nuance システムです。 これは、ほとんどのユーザーグレードの AI の能力をはるかに超えています。 アシスタント。

ただし、さまざまなドメインについてのより専門的な詳細な知識があれば、何かが必要になります。 Alexaスキルによるヒント —変革をもたらす可能性があります。 スマート スピーカーに法的または医学的なアドバイスを求めるのは、一見するとクレイジーに聞こえます。 しかし、 法律ボットなどの分野での驚異的な進歩一方、最近公開されたレポートでは、Apple が Siri に次の機能を提供できるようにしたいと考えていることが示唆されています。 2021 年までにユーザーと健康に焦点を当てた会話を行う.

A.I.の専門知識グラフ アシスタントは今のところ SF の夢のようなものですが、 最近の Voicebot.ai レポート 仮想アシスタントのスキルセットがいかに急速に拡大しているかを示しています。 しかし、スキルが専門分野に移行すると、私たちには楽しみが待っています。

より多くの (そしてより良い) パーソナライゼーション

今日のスマート スピーカーのパーソナライゼーションはまだ初期段階にあります。 音声アシスタントのアクセントや表示される性別を変更したり、スキルを追加または削除したり、名前や勤務先などの情報を入力したりできます。 場合によっては、複数の音声プロファイルを設定して、 グーグルホーム あなたの家族の個々のメンバーを認識します。

アマゾンエコーショー

しかし、道のりはまだ長いです。ジュースを搾る価値はあるはずですが。 Mattersight Corporation は、A.I. コールセンター技術と呼ばれる 予測行動ルーティング、発信者の音声パターンを分析し、互換性のある性格タイプを持つ人間の工作員と照合します。 同社によれば、相性の良い性格を持つ相手とマッチングすると、通話が成功するまでの時間は、相反する性格タイプを持つ相手の場合に比べて半分の時間しか続かないという。

同様のアプローチを使用すると、AI が発生する可能性があります。 あなたが望まれる方法であなたに話しかけるアシスタント。 それは、話している相手のアクセントや声の大きさに合わせるといった簡単なことかもしれません。 あるいは、一部のユーザーに対しては、より密度の高い詳細情報を使用するのではなく、より感情的な言葉を使用することで、アイデアへの対処方法を変えることもできるでしょう。 おそらく、音声アシスタントに長々とチャットしてもらいたい人もいるでしょうし、必要な情報を可能な限り簡潔に伝えてほしいだけの人もいるでしょう。 A.I. アシスタントは両方の能力を備えている必要があります。

のようなテクノロジー Google デュプレックス AI によって生成された合成音声と会話がどれほど説得力のある正確さを実現しているかを示します。 AI が曲のリクエストや食事のタイマーを提供するよりも複雑な領域に移行するにつれて、このテクノロジーが重要な役割を果たすことが期待されます。

これは、音声でユーザーを識別する機能の画期的な進歩によって促進される可能性があります。 ヘブナー氏は、ニュアンスのテクノロジーはたった 1 秒間の音声からユーザーを識別できると指摘しています。 「以前は、自分が誰であるかを理解し、正確な信号を受信するのに 10 秒かかりました。」と彼は言いました。 「その力は大きいです。」 音声の小さな断片でユーザーを識別できることで、 パスワードの問題を解決し、より機密性の高い機密情報を扱うために音声アシスタントを使用する機会が開かれます。 情報。

積極的に行動する

優秀なアシスタントは、あなたが頼めば何かをしてくれます。 優れたアシスタントには質問する必要はありません。 今のところ、A.I. アシスタントはまだ最初の段階にいます。 ユーザーは必要な曲や必要なリマインダーを取得できますが、通常は明示的に要求された場合に限られます。 人々が音声アシスタントに慣れてくると、純粋に反応的なデバイスからプロアクティブなデバイスに移行する大きなチャンスが生まれます。

人間が特定の仕事を機械に任せたいかどうかについては、大きな疑問があります。

AIについてどう思いますか? あなたに代わって意思決定を行うアシスタントはいますか? 寒いと言われたときにサーモスタットの温度を上げたり、ランチの予約を変更したりするなど、さまざまなことが考えられます。 遅刻しそうになったから会議する、もっと運動するように促したり、お金を節約するよう促したりするため 給料。 より多くのスマートデバイスが家庭に普及するにつれて、音声アシスタントが命令できることの数は大幅に増加すると考えられます。

この問題の一部は、機械が自らの側で決定を下すことに人々がどの程度安心しているかという社会的な問題です。 人間が特定の仕事を機械に任せたいかどうかについては、大きな疑問があります。 それは、クレジット カードと家の鍵を生身のアシスタントに渡すようなものだと考えてください。ただし、スカイネットをより大量に振りかける必要があります。 欠点は、ある程度の制御を放棄することです。 潜在的な利点は、自由時間が増えることです。 もちろん、技術的には大きな課題があります…

すべてはフィードバックです

Tom Hebner 氏は、プロアクティブ性の問題に関する大きな課題を指摘しました。それは、マシンが正しいことを行っていることをどのようにして知るのでしょうか? 善と善の考えに戻ります。 素晴らしいアシスタント、素晴らしいアシスタントは、大きな会議の前に、あなたが頼まなくてもすべてのファイルを用意してくれるかもしれません。 しかし、それらが間違ったファイルだった場合はどうなるでしょうか? 家庭用AIの開発における大きな問題 アシスタントがより積極的に取り組むべきなのは、現在、取得している情報が正しい情報であるかどうかを明らかにする方法が限られているということです。

A.I. ロボットのペッパーはいいよ
大隅知宏/ゲッティイメージズ

「私が毎日、家に入るときに同じ曲を聞いて、その日家に入るとすぐに曲が流れ始めたら、彼らはどうやって彼らが正しく答えてくれたのかを知ることができるでしょうか?」 ヘブナー氏は語った。 「演奏を止めなければ、それが正しいということですか?」 私が「やめて」と言ったら、それは間違いだったので、二度と同じことをしてはいけないという意味ですか? フィードバック メカニズムは、よりプロアクティブなシステムを実現できない理由の 1 つです。」

これはエンジニアにとって理解するのが難しい問題です。 一つ一つのタスクについてインターンに指示やフィードバックを求めたことがある人なら誰でも、仕事は人に任せるより自分でやったほうが簡単な場合があることを知っています。 A.I. アシスタントはあなたの生活をよりスムーズにするために存在します。 それが正しく機能しているかどうかを確認するために、毎日何十ものミニアンケートを行う必要はありません。 これは、これらのデバイスの使いやすさを損なわない方法で解決する必要があり、システムがユーザーの好みを学習する前に、事前に多くのトレーニングを行う必要はありません。

答えは何ですか? よくわからない。 しかし、スティーブ・ジョブズがかつて言ったように、それを理解するのは顧客の仕事ではありません。

新しいインタラクション方法

というシーンがあります 2001年宇宙の旅 その中で、驚くべきことに今でも最も有名な架空の A.I.である殺人的な HAL 9000 が登場します。 歴史上のアシスタントである彼は、話しかけられた内容を判断するためにマイクを使用するだけではないことを明らかにしました。 2 人の乗組員が、HAL には聞こえないことがわかっている場所で話す場所を選択しようとしましたが、HAL はまだ会話が理解できることを明らかにしました。 彼らの唇の動きを読み取ることに基づいて.

2001年宇宙の旅

映画の怖い瞬間? もちろん。 AI がどのように機能するかの例 アシスタントは将来的に働くことができますか? ええと、確かに!

音声アシスタントは音声に限定されるべきだという考えは、音声アシスタントが私たちと有益に対話できる可能性のある方法の数を減らします。 の台頭とともに 顔認識 そして 感情追跡テクノロジー、ユーザーに関して継続的に収集される生体認証の数は増え続けており、さらには 読心技術が目前に迫っている、A.I.が使用できるさまざまな信号がたくさんあります。 アシスタントが結論を導き出します。

今から 10 年後、私たちは音声だけを使って AI を制御するようになるだろうという考え。 アシスタントは、80 年代初頭の PC を見て、キーボード以上のものを自由に使えるようになることは決してないだろうと考えるようなものです。

編集者のおすすめ

  • 感情を感知するAI ここにあります。次の面接で取り上げられるかもしれません
  • Appleのシアトルの新キャンパスは人工知能Siriにとって大きな意味を持つかもしれない
  • Google は AI を使用する方法を発見しました。 風力エネルギーの有用性を高めるために