このリアルな合成音声はオーディオブックの未来となる可能性があります

click fraud protection

Siri や Alexa が使用するような合成音声は、その日の天気予報や天気予報を伝えるのに適しています。 調理タイマーにはまだ何分も残っていますが、彼らの平坦で単調な口調で読み上げてもらいたいと思いますか? オーディオブック? おそらくそうではありません。だからこそ、私たちのほとんどは、オーディオブックを修正するために Audible のような人間の声によるサービスを利用するのです。 しかし、ロンドンに本拠を置くスタートアップ企業の先駆的な取り組みのせいで、人間の声優が注目されるのはそう遠くないかもしれない。 ディープゼン.

人工知能アルゴリズムを使用し、テクノロジーの火力を強化します。 IBMのPower A.I. とワトソンテクノロジー, DeepZen は、一見すると人間のように聞こえるだけでなく、テキストを説得力のある方法で読むために必要な感情的な手がかりを拾うことができるテキスト読み上げツールを開発しました。 そうすることで、オーディオブックの制作にかかる時間とコストを最大90%削減できると同社は主張している。

おすすめ動画

「私たちのシステムは本当に革新的です」と DeepZen の CEO 兼共同創設者である Taylan Kamis 氏は Digital Trends に語った。 「ディープラーニングとニューラルネットワークを使用して、人間がどのように話したり読んだりするかを理解します。 次に、テキストを読むときに適切な感情とイントネーションをどこに適用するかを認識できるようにシステムをトレーニングします。 その結果、本物に非常によく似た人間らしい音声が得られます。」

関連している

  • 目の錯覚は次世代の AI の構築に役立つ可能性がある
  • 最後の仕上げ: 科学者はどのようにロボットに人間のような触覚を与えているのか
  • 不気味に美しい AI の「合成聖典」を読んでください。 それは神だと思っている

必然的に、このような研究は、最先端の AI のさらに別の例として位置づけられる可能性があります。 ツール 人間の職業を脅かす. この場合、その職業には、少数の著名な人物が成功を収めているにもかかわらず、それほど安定したキャリアを持っていない俳優が含まれています。 このようなソフトが声優の将来に影響を与えないと考えるのは甘いかもしれませんが、 カミス氏は、DeepZen のようなツールが最終的にプラスになるシナリオはたくさんあると指摘します。 人類。

たとえば、新人作家や多額の予算を持たない出版社の作品に基づいたオーディオブックの作成が可能になる可能性があります。 また、失読症やその他の理由で読むことが困難な人々のための優れたテキスト読み上げツールの開発にも使用できる可能性があります。

「将来的には、ビデオ制作業界向けのナレーションの制作も検討しています。 ゲームだけでなく、プレーヤーのエクスペリエンスを向上させるためにリアルタイムのテキスト読み上げが必要になる場合もあります」とカミ氏は述べています。 言った。 「他の言語も検討しています。」

システムのサンプルをご覧いただけます ここ.

編集者のおすすめ

  • あなたの近くの学校に警備ロボットがやってくるかもしれない
  • AI が実際に知覚力を持つようになる時期をどうやって知ることができるのでしょうか?
  • アナログAI? クレイジーに聞こえるかもしれないが、それは未来かもしれない
  • AI の将来: 今後数年間で注目すべき 4 つの大きな事柄
  • この技術は 20 年前には SF の話でした。 今、それが現実です

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。