Tato realistická syntetizovaná řeč by mohla být budoucností audioknih

Syntetizované hlasy, jako jsou ty, které používají Siri a Alexa, nám dobře sdělují předpověď počasí na den nebo jak Na časovači vaření zbývá mnoho minut, ale opravdu byste chtěli, aby vás jejich ploché, monotónní tóny četly audioknihy? Pravděpodobně ne, a proto se většina z nás obrací na služby s lidským hlasem, jako je Audible, aby naši audioknihu opravili. Lidští hlasoví herci však možná nebudou kývnout příliš dlouho, kvůli průkopnické práci londýnského startupu zvaného DeepZen.

Pomocí algoritmů umělé inteligence, rozšířených o technologickou palebnou sílu IBM Power A.I. a technologie Watson, DeepZen vyvinul nástroje pro převod textu na řeč, které nejen že znějí lidsky na první poslech, ale také dokážou přesvědčivým způsobem zachytit emocionální podněty potřebné pro čtení textu. Společnost tak tvrdí, že by mohla snížit čas a náklady na výrobu audioknih až o 90 %.

Doporučená videa

„Náš systém je skutečně revoluční,“ řekl pro Digital Trends Taylan Kamis, generální ředitel a spoluzakladatel společnosti DeepZen. „Funguje pomocí hlubokého učení a neuronových sítí k pochopení toho, jak člověk mluví a čte. Systém pak trénujeme, aby při čtení textu dokázal rozpoznat, kde použít správné emoce a intonaci. Výsledkem je lidská řeč, která se velmi podobá skutečné věci.“

Příbuzný

  • Optické iluze by nám mohly pomoci vybudovat další generaci AI
  • Finishing touch: Jak vědci dávají robotům lidské hmatové smysly
  • Přečtěte si děsivě krásné ‚syntetické písmo‘ A.I. který si myslí, že je to Bůh

Práce, jako je tato, může být nevyhnutelně dalším příkladem špičkové A.I. nástroje ohrožující lidskou profesi. V tomto případě tato profese zahrnuje herce, kteří navzdory tomu, čeho je schopno dosáhnout několik významných osobností, nemají nejstabilnější a nejstabilnější kariéru. Bylo by naivní si myslet, že software jako tento nebude mít dopad na budoucnost hlasových herců, ale Kamis poukazuje na to, že existuje spousta scénářů, ve kterých by nástroje, jako je DeepZen, mohly být pro lidstvo.

Mohlo by to například umožnit vytváření audioknih založených na dílech nových a začínajících autorů nebo od vydavatelů, kteří nemají luxus velkých rozpočtů. Mohlo by se také použít k vývoji vynikajících nástrojů pro převod textu na řeč pro lidi, kteří mají dyslexii nebo mají jiné problémy se čtením.

„Pokud jde o budoucnost, uvažujeme také o produkci voice-overů pro průmysl video produkce, as stejně jako hraní her, kde je potřeba převodu textu na řeč v reálném čase ke zlepšení hráčského zážitku,“ Kami řekl. "Díváme se také na další jazyky."

Můžete se podívat na ukázku systému tady.

Doporučení redakce

  • Do školy poblíž vás mohou přicházet bezpečnostní roboti
  • Jak budeme vědět, kdy se AI skutečně stane vnímavou?
  • Analogové A.I.? Zní to šíleně, ale může to být budoucnost
  • Budoucnost A.I.: 4 velké věci, na které je třeba se v příštích letech dívat
  • Tato technologie byla před 20 lety sci-fi. Nyní je to realita

Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.