音声認識テクノロジーは今日どこにでもありますが、特に注目されているのは A.I. スマートアシスタント AmazonのAlexa、AppleのSiri、Googleのアシスタントなど。 しかし、(実生活で)会話をしたことがある人なら誰でも知っているように、スピーチとは、その人が話す言葉だけではなく、その人が話す声の調子のことです。 これが、オンラインでのテキストベースの会話が悪夢となり得る理由の 1 つです。基本的な単語自体には、相手の意味を常に伝えるのに十分なニュアンスが含まれていないためです。
音声認識への理解をさらに深めようとしているエキサイティングなスタートアップの 1 つが、 オト、名門からのスピンオフ SRIインターナショナル、10年以上前にSiriの生成に貢献しました。 オト氏は、少なくとも初期段階では、コールセンターが発信者と販売代理店の両方の声の感情をよりよく理解できるようにする音声イントネーション技術に取り組んでいます。
おすすめ動画
「Oto の使命は、マシンの共感を解き放つことであり、この目的のために、何百ものマシンで訓練されたディープ ニューラル ネットワークに基づく独自のテクノロジーである DeepTone を開発しました。 何千もの実際の会話を分析して、会話に含まれる感情の小さな変化をスコア化します」と、Oto の共同創設者兼最高技術責任者であるニコラス・ペロニー氏は Digital に語った。 トレンド。
関連している
- おそらく、AMD の Ryzen 9 7950X では最大クロック速度に達することはできません。
- 火星ヘリコプター「インジェニュイティ」が23便目に着陸、止まらない
- この SSD はこれまでに見た中で最も速いものの 1 つですが、おそらく使用できないでしょう
「潜在的な話者の状態」と呼ばれるこれらの小さな変化により、話者の言葉の感情的な調子を 1 秒間に何度もリアルタイムで記録することができます。 このシステムは、200 万件の営業会話から得られた、3,000 人の 100,000 件の発話のデータベースでトレーニングされました。
「イントネーションの応用はほぼ無限です」と共同創設者兼 CEO の Teo Borschberg 氏は述べています。 「私たちは音声ファーストの世界に入りつつあります。 すぐに、車、時計、冷蔵庫、スピーカーなど、あらゆるものと会話できるようになるでしょう。 スピーチのニュアンスを理解することが、有意義な会話を生み出す鍵となります。 現在、私たちはコンタクト センターでの会話における人間性の向上に取り組んでいます。 これまでのところ、テキストのみに基づいて通話の体験の質を判断することは実際には不可能です。 曖昧すぎます。」
オトの技術を利用すると、販売代理店は、顧客に十分な共感を示しながら、通話中に「適切なエネルギー」を注ぐようリアルタイムで促すことができます。 「価値があるのは、コールセンターがエクスペリエンスの質を初めて測定し、その情報に基づいて大規模に行動できるようになり、怒っている顧客の離反を防ぐことができるということです」とボルシュベルグ氏は述べた。
オトが最近発表した 530万ドルのシード資金調達ラウンド. これは、会社のエンジニアリング チームと営業チームを成長させるために使用されます。 また、音声を通じて新しい感情や行動を理解するための技術サービスをさらに拡大するのにも役立ちます。
編集者のおすすめ
- Chrome による Nvidia DLSS のリリースが予定されていますが、まだ使用できません
- Apple の新しい M2 MacBook Pro は熱に耐えられません – それでも購入する必要がありますか?
- Lenovoのクールな新しいゲームフォンがリークされたが、買えない
- 今日、Amazon Echo、Alexa、または Ring が停止していますか? あなたは一人ではありません
- Google、実際には着られないPixel 6のマテリアルユーファッションコレクションを発売
ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。