Diese realistische synthetisierte Sprache könnte die Zukunft von Hörbüchern sein

Synthetische Stimmen, wie sie von Siri und Alexa verwendet werden, eignen sich hervorragend, um uns die Wettervorhersage für den Tag oder das Wetter mitzuteilen Auf einem Kochtimer verbleiben noch viele Minuten, aber möchten Sie wirklich, dass ihre flachen, monotonen Töne Sie lesen? Hörbücher? Wahrscheinlich nicht, weshalb die meisten von uns auf Dienste mit menschlicher Stimme wie Audible zurückgreifen, um ihr Hörbuch in Ordnung zu bringen. Aufgrund der Pionierarbeit eines in London ansässigen Startups namens DeepZen.

Mithilfe von Algorithmen der künstlichen Intelligenz, ergänzt durch die technologische Feuerkraft von IBMs Power A.I. und Watson-Technologien, DeepZen hat Text-to-Speech-Tools entwickelt, die nicht nur beim ersten Hören menschlich klingen, sondern auch die emotionalen Hinweise erfassen können, die zum Lesen von Texten auf überzeugende Weise erforderlich sind. Das Unternehmen gibt an, dass dadurch der Zeit- und Kostenaufwand für die Produktion von Hörbüchern um bis zu 90 % gesenkt werden könne.

Empfohlene Videos

„Unser System ist wirklich revolutionär“, sagte Taylan Kamis, CEO und Mitbegründer von DeepZen, gegenüber Digital Trends. „Es funktioniert mithilfe von Deep Learning und neuronalen Netzen, um zu verstehen, wie ein Mensch spricht und liest. Anschließend trainieren wir das System, damit es beim Lesen eines Textes erkennen kann, wo die richtigen Emotionen und der richtige Tonfall eingesetzt werden müssen. Das Ergebnis ist eine menschenähnliche Sprache, die der Realität sehr ähnlich ist.“

Verwandt

  • Optische Täuschungen könnten uns beim Aufbau der nächsten Generation der KI helfen
  • Der letzte Schliff: Wie Wissenschaftler Robotern menschenähnliche Tastsinne verleihen
  • Lesen Sie die unheimlich schöne „synthetische Schrift“ einer KI. das denkt, es sei Gott

Arbeiten wie diese können unweigerlich als ein weiteres Beispiel für hochmoderne KI angesehen werden. Werkzeuge einen menschlichen Beruf bedrohen. In diesem Fall handelt es sich bei diesem Beruf um Schauspieler, die ungeachtet dessen, was einige hochkarätige Persönlichkeiten erreichen können, ohnehin nicht die stabilsten und stabilsten Karrieren haben. Es wäre naiv zu glauben, dass Software wie diese keinen Einfluss auf die Zukunft von Synchronsprechern haben wird, aber wie Kamis weist darauf hin, dass es viele Szenarien gibt, in denen Tools wie DeepZen von Vorteil sein könnten Menschheit.

Es könnte beispielsweise die Erstellung von Hörbüchern ermöglichen, die auf Werken neuer und aufstrebender Autoren oder von Verlagen basieren, die nicht über den Luxus großer Budgets verfügen. Es könnte auch zur Entwicklung besserer Text-to-Speech-Tools für Menschen mit Legasthenie oder anderen Leseproblemen genutzt werden.

„Für die Zukunft denken wir auch über die Produktion von Voice-Overs für die Videoproduktionsbranche nach „Aber auch beim Spielen, wo Text-to-Speech in Echtzeit benötigt wird, um das Spielerlebnis zu verbessern“, sagt Kami sagte. „Wir schauen uns auch andere Sprachen an.“

Sie können sich ein Beispiel des Systems ansehen Hier.

Empfehlungen der Redaktion

  • Sicherheitsroboter könnten zu einer Schule in Ihrer Nähe kommen
  • Woher wissen wir, wann eine KI tatsächlich empfindungsfähig wird?
  • Analoge KI? Es klingt verrückt, aber es könnte die Zukunft sein
  • Die Zukunft der KI: 4 große Dinge, auf die man in den nächsten Jahren achten sollte
  • Diese Technologie war vor 20 Jahren Science-Fiction. Jetzt ist es Realität

Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.