Veritone はあなたの声をディープフェイクでクローンしたいと考えています

あります ビデオ 私の YouTube フィードに定期的に表示されます。 これは、ラッパーのスヌープ・ドッグと50セントが、彼らの世代と比較すると、現代のヒップホップ・アーティストは皆、明らかに同じように聞こえるという事実を嘆く会話である。 「人は自分らしくあると決めたとき、他の人にはなれないものを提供するのです」と50セントは言います。 「そう、一度あなたになったら、あなた以外に誰があなたになれるでしょうか?」 スヌープは答える。

コンテンツ

  • 「多くのことを再利用できます」
  • 大衆はどう反応するでしょうか?
  • 将来について考える

スヌープ・ドッグが今日のラッパーのサウンドに似たフローを真似る

このビデオが 2014 年 10 月にアップロードされた時点では、それはおおむね真実だったかもしれません。 しかし、ほんの数年後、それは確かにそうではありません。 音声ディープフェイクの世界では、AI をトレーニングすることが可能です。 他人の何時間もの音声データからなる音声コーパスを供給することで、他人に不気味なほど似ているように聞こえます。 結果は次のとおりです びっくりするほど正確.

おすすめ動画

のような著名人 ラッパーのジェイ・Z そして心理学者のジョーダン・ピーターソンは、人々が音声のディープフェイクを作成し、インターネット上で愚かなことを言わせることで自分の声を悪用しているとすでに苦情を述べている。 "起きろ、" ピーターソンは書いた. 「あなたの声とイメージの神聖さが深刻な危険にさらされています。」 それらはただのいたずらなケースです。 場合によっては、その結果がニュアンスのない犯罪につながる可能性があります。 で 2019年に起こったある事件、犯罪者らは音声ディープフェイクを使用してエネルギー会社のCEOの声になりすまし、電話で部下を説得して24万3000ドルを銀行口座に緊急送金するよう説得した。

Veritone、A.I. エンターテインメント業界向けにメディアにラベルを付けるためのスマート ツールを作成する会社です。 音声ディープフェイクの力を、それを正当に受け取る人々の手に(あるいは、正確には喉に)戻すこと。 所属しています。 今月、同社が発表した マーベルアイ、同社社長のライアン・スティールバーグ氏はデジタル・トレンドに対し、これを「完全なサービスとしての音声ソリューション」と表現しました。 Veritone は有料で AI を構築します。 そのモデル あなたと同じように聞こえる(あるいは、すぐに認識できる声を持つ有名人である可能性が高い)。それは、ハイテク版のように貸し出し可能です。 アリエルの

担保としての声取引 から リトル・マーメイド.

MARVEL.aiによる合成音声

「あなたの声は、あなたが持つ他のコンテンツやブランド属性と同じくらい価値があります」とスティールバーグ氏は言います。 「あなたの名前や肖像、顔、署名、あるいはあなたが書いた曲や作成したコンテンツと同じレベルにあります。」

「多くのことを再利用できます」

もちろん、一部の個人は、コマーシャルやナレーションの録音、歌を歌う、その他数え切れ​​ないほどの収益化の形で自分の声を販売してきました。 しかし、これらの取り組みはすべて、人が実際に言葉を言うことを必要としました。 Veritone のソリューションが約束しているのは、これを個別にスケーラブルにすることです。

たとえば、ケビン・ハートが自分の声を高級ブランドにライセンス供与し、その声をパーソナライズされた広告の作成に使用できるようになったらどうなるでしょうか。 視聴者の名前、最寄りの実店舗の販売店の場所、視聴者が最も購入する可能性が高い特定の製品を特集します。 買う? 文字通り何日もレコーディングブースで過ごすのではなく、A.I. これをもう少し ( 少なくともハートの役割は、彼の声の類似性が上記の3人目に利用されることに同意するために点線に署名するよりも パーティー。 映画の撮影、コメディツアー、休暇中、さらには睡眠中など、彼のデジタル音声はお金をかき集めている可能性があります。

スチールバーグ氏はトレーニングプロセスについて「多くのことを再利用できます」と説明した。 「すでにたくさん話している人、ポッドキャストを制作している人、メディアに出演している人であれば、そこにはたくさんのデータがあります。 彼らがたまたま私たちの顧客であれば、おそらくすでに大量に持っているでしょう。」

「この新しいカテゴリの A.I. について私たちがとても魅力的に感じているのは、 それは拡張性と可変性です。」

Steelberg 氏は、Voice-as-a-Service のアイデアは数年前に Veritone で思いついたと述べました。 しかし、当時彼は、機械学習モデルが彼が探していた非常にリアルな合成音声を作成できるということに確信を持っていませんでした。 これは、問題の話者に実際に会ったことがなくても、私たちがよく知っている声については特に重要です。 結果はある種のものになる可能性があります 可聴 不気味の谷。あらゆる間違った音がリスナーに偽物を聞いているという事実を警告します。 しかし、2021 年のここでは、それが可能になるところまで事態は進んだと彼は確信しています。 したがって、Marvel.ai です。

スティールバーグ氏は、テクノロジーの巨大な可能性について興奮した流行語で語り、その可能性のある膨大な「実行方法」について語ります。 Veritone はテキスト読み上げ用のモデルを作成できます。 また、音声合成のモデルを構築することもでき、声優は音声を読み取ってボーカル パフォーマンスを「駆動」できます。 単語に適切な抑揚を付け、完成した音声をスナップチャットのように最後に重ねます。 フィルター。 同社はまた、各音声のフィンガープリントを実行できるため、どこかで出現する明らかに本物の音声が自社のテクノロジーを使用して作成されたものであるかどうかを知ることができます。

「考えれば考えるほど…文字通り、さらに 50 個以上の [考えられる使用例] が思いつくでしょう」と彼は言いました。 「この新しいカテゴリの A.I. について私たちがとても魅力的に感じているのは、 それは拡張性と可変性です。」

他にもいくつか考えてみましょう。 有名なスポーツ選手はバスケットボール コート上では神かもしれませんが、いざとなると悪魔です 自然に聞こえる方法で台本の行を読む. Veritone のテクノロジーを使用して、ビデオ ゲームのカットシーンでの役割を果たしたり、回想録のオーディオ ブックを読んだりします ( 書いていない可能性もあります) を声優が演じることもでき、それをデジタルで微調整して次のように聞こえます。 アスリート。 別の可能性として、同じ俳優の声で映画を他の国向けに翻訳することもできます。 俳優が実際に話さない場合でも、フランス語、北京語、またはその他の言語のセリフ 彼ら。

大衆はどう反応するでしょうか?

もちろん、これらすべてにかかっている大きな問題は、一般の人々がこのすべてにどう反応するかということです。 これは難しい、予測不可能な部分です。 今日の有名人は複雑な役割を果たさなければなりません。看板に顔を飾るに値する実物よりも大きな人物であると同時に、また、 人間関係に問題を抱え、パジャマでテレビを見ていることをツイートし、熱いものを食べるとおかしな顔をする、共感できる人たち ソース。

では、有名人の朗読セリフを特集するだけでなく、そのようなことがわかっている広告が表示されるとどうなるでしょうか。 出演者は実際にこれらのセリフを言ったことはなく、むしろターゲットを絞った内容を提供するためにプログラムで声を利用したのです。 広告? スティールバーグ氏は、これは有名人がソーシャルメディアの管理権を第三者のアカウントマネージャーに引き渡すのとほとんど変わらないと述べた。 テイラー・スウィフトのツイートを見れば、特にそれが支持や宣伝コンテンツの場合は、テイラー自身がそのメッセージをタップしているわけではない可能性が高いことがわかります。

しかし、声は、まさにより個人的なものであるため、非常に現実的な意味で異なります。 特に、ある程度のパーソナライゼーションを伴う場合は、最も意味のあるユースケースの 1 つです。 真実は、脚本家のウィリアム・ゴールドマンの言葉を借りれば、世間の反応がどうなるかは誰にも分からないということです。まさにこれまで誰も同じことをしたことがないからです。

「それはスペクトルを実行するつもりですよね?」 スティールバーグ氏は語った。 「[一部の]人は、『時間を節約するために、このツールを少し使って一日を充実させようと思う』と言うでしょう。」 「自分のブランドを拡張するためにどこでも自分の声を上げたいので、ライセンスを取得するつもりだ」と本気で言う人もいるだろう 外。'"

同氏の最善の推測は、受け入れはケースバイケースになるだろうということだ。 「聴衆の反応に合わせて、物事がうまくいっているのか、うまくいっていないのかを見極める必要がある」と彼は言う。 「彼らはそれを気に入っているかもしれない。 彼らはこう言うかもしれません。 あなたが合成コンテンツを使ってそれを増強したことは知っていますが、あなたが私に 10 倍以上のコンテンツ、またはより個人的なコンテンツを公開しているという事実が大好きです。 ありがとう。 ありがとう。'"

将来について考える

ベリトーン MARVEL.ai
ベリトン

将来については? スティールバーグ氏は、「私たちはすべての大手芸能事務所と協力したいと考えています。 希少なブランドでお金を稼ぐビジネスに携わっている人は誰でも、自社の音声戦略について考えるべきだと私たちは考えています。」

そして、それが純粋にオーディオに関するものにとどまることを期待しないでください。 「私たちは、従来のコンテンツ制作形式の一部を拡張、強化、または完全に置き換えるために合成コンテンツを使用する可能性に常に魅了されてきました。」と彼は続けました。 「それがオーディオ的な意味であっても、最終的には将来的には、 ビデオセンス.”

そうです。Veritone はオーディオディープフェイクの世界で市場を追い詰めた後、さらに一歩進んで、ディープフェイクの世界に参入する予定です。 完全に実現された仮想アバター 音も見た目も音源と区別がつきません。

突然それらは からのパーソナライズされた広告 マイノリティ・リポート サイエンスフィクションとはかなり違うように思えます。

編集者のおすすめ

  • Digital Trends の Tech For Change CES 2023 アワードを受賞
  • ディープフェイクとディープフェイク検出器の間で急速に激化する戦争の内部
  • Alexa と Siri はあなたの声のトーンを理解できませんが、Oto は理解できます。
  • カリフォルニア州は政治とポルノを目的としたディープフェイクを取り締まっている
  • まったく新しい顔を生成するディープフェイク技術を使用して、オンラインで匿名性を保ちます