この AI はわずか 3 秒後にあなたの声を偽装できます

人工知能(AI)というのは、 今ちょっと時間を過ごしていますそして、マイクロソフトが 3 秒間の短いサンプルを入力すると誰の声も真似できる AI の開発に取り組んでいるというニュースで、風が吹き続けています。

VALL-Eと呼ばれるこの新しいツールは、約6万時間の英語音声データを使ってトレーニングされており、Microsoftによれば、このデータは「既存のシステムの数百倍」であるという。 その知識を利用して、その作成者は、ユーザーの声を複製する方法を理解するためにほんの少しの音声入力だけが必要だと主張しています。

電話に向かって話す男性
フィクス/シャッターストック

さらに驚くべきことに、VALL-E は、他の音声 AI プログラムが苦労してきた、各サンプルに含まれる感情、声のトーン、音響環境を再現できます。 これにより、より現実的な雰囲気が得られ、その結果は本物の人間の音声として通用するものに近づきます。

関連している

  • GPT-4: ChatGPT 顔負けの AI チャットボットの使い方
  • Google Bard は話せるようになりましたが、ChatGPT をかき消すことができるでしょうか?
  • イーロン・マスク氏の新しいAI企業は「宇宙を理解する」ことを目指す

他のテキスト読み上げ (TTS) 競合製品と比較した場合、Microsoft は、VALL-E が「音声の点で最先端のゼロショット TTS システムを大幅に上回っている」と述べています。 自然さと話者の類似性。」 言い換えれば、VALL-E は、トレーニングされていない音声入力に遭遇したライバル AI よりも、はるかに本物の人間に近い音を出します。 の上。

おすすめ動画

GitHub 上で、Microsoft は サンプルの小さなライブラリ VALL-Eを使用して作成されました。 結果はほとんどが非常に印象的で、スピーカーの声の軽やかさとアクセントを再現するサンプルが多数含まれています。 一部の例は説得力が低く、VALL-E が完成品ではない可能性があることを示していますが、全体的には出力は説得力があります。

巨大な可能性とリスク

Windows 11 を実行している Microsoft Surface デバイスでビデオ通話を行っている人。
マイクロソフト/アンスプラッシュ

VALL-Eの紹介記事, Microsoft は、VALL-E は「音声のなりすましなど、モデルの悪用による潜在的なリスクを伴う可能性がある」と説明しています。 特定の発言者を特定したり、なりすましたりすること。」 リアルな音声を生成するためのこのような有能なツールは、 の幽霊

ますます説得力のあるディープフェイク、元恋人から著名な国際的人物まで、あらゆるものを模倣するために使用できます。

この脅威を軽減するために、Microsoft は「オーディオ クリップが VALL-E によって合成されたかどうかを識別する検出モデルを構築することが可能です」と述べています。 同社は独自のものも使用すると述べています AIの原則 作品を開発するとき。 これらの原則は、公平性、安全性、プライバシー、説明責任などの分野をカバーしています。

VALL-E は、Microsoft による AI 実験の最新の例にすぎません。 最近同社が取り組んでいるのは、 ChatGPT を Bing に統合する、AIを使用して Teams 会議の要約、高度なツールを次のようなアプリに移植します Outlook、Word、PowerPoint. Semafor によると、Microsoft は次のことを目指しています。 ChatGPTメーカーOpenAIに100億ドルを投資、すでに多額の資金を注ぎ込んでいる会社です。

明らかなリスクにもかかわらず、VALL-E のようなツールは、たとえば事故後に人々が声を取り戻すのを助けるなど、医療の分野で特に役立つ可能性があります。 このような小さな入力セットで音声を複製できることは、正しく行われれば、このような状況では非常に有望です。 しかし、Microsoft もその他の企業も AI に多額の資金を費やしていることから、AI がすぐになくなるわけではないことは明らかです。

編集者のおすすめ

  • トップクラスの著者がAI企業に作品の使用料を要求
  • 最高の AI ビデオ編集ツール
  • ChatGPTメーカーのOpenAIは消費者保護法を巡りFTCの捜査に直面している
  • AIの画期的な進歩はミツバチの脳を通じてもたらされる可能性があると科学者が語る
  • OpenAI、超インテリジェント AI の暴走を阻止するための新しいチームを構築

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。