Facebook でのコミュニケーションは主にテキスト経由で行われるかもしれませんが、それでもソーシャル メディアの巨人は音声コミュニケーションに関する最大の課題のいくつかを解決するのに役立つかもしれません。 に先駆けて7月10日金曜日に発表された。 機械学習に関する国際会議, Facebook が新たに開発した、 最先端の人工知能 同時に話している最大 5 つの声を区別できます。
これは、次世代の補聴器やスマート スピーカーのダイヤルインや特定の音の増幅に至るまで、あらゆるものに変革をもたらす可能性があります。 将来の Zoom スタイルのビデオ会議への声 他の。
おすすめ動画
「これは音声分離のための教師あり学習アプローチです。」 エリヤ・ナフマニ、FAIR の研究助手 (フェイスブック A.I. 研究)テルアビブ、デジタルトレンドに語った。 「単一のマイク録音から 5 つの別々のスピーカーを分離できることを初めて示しました。 また、モデルが録音内の話者の数を検出し、それに応じてプリフォームする方法も示しています。 このモデルはマスクフリーです。これは、他の音声を除去するマスキングを推定しないことを意味します。 代わりに、私たちのモデルは他の声や背景ノイズを除去することを学習します。」
2話者音声分離アニメーションFINAL
この「マスクレス」という要素は重要です。 優れたベンチマークを達成した以前のモデルでは、マスクを使用して他の音声を削除しました。 このアプローチの問題は、話者の数が増加するか不明な場合にモデルが悪化することです。 Facebook のモデルでは依然として話者の数を指定する必要がありますが、いくつかのスマート テクノロジーを使用して、 話している人の数を自動的に計算し、使用するのに最適なモデルを選択します。 その番号。
Nachmani 氏は、この音声分離技術は他の用途にも応用できる可能性があると指摘しました。 音声を分離するだけでなく、他の音を背景ノイズから分類することもできます。 たとえば、これにより次のことが可能になります。 さまざまな楽器を分離する 単一の音声ファイルから。
このテクノロジーのいずれかが近いうちに Facebook 製品に導入されることになるでしょうか? そこまでは明らかではありません。 これは基本的な AI です。 必ずしも将来に焼き付けられるとは限らない研究
このA.I. デモンストレーションは、今週末開幕する機械学習に関する国際会議で Facebook が議論している 30 以上の論文のうちの 1 つにすぎません。
編集者のおすすめ
- Twitter は最も迷惑な問題の 1 つを修正しました
- 任天堂はAIをどのように活用できるのか 4K ゲームを Switch Pro にもたらす
- 賢い新しいA.I. このシステムは、あなたが家を離れている間に犬を訓練することを約束します
- この人間の基本的なスキルは、AI の次の大きなマイルストーンです。
- GTC 2020 総括: Nvidia のロボット向け仮想世界、A.I. ビデオ通話
ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。