Táto realistická syntetizovaná reč by mohla byť budúcnosťou audiokníh

Syntetizované hlasy, ako sú tie, ktoré používajú Siri a Alexa, sú v poriadku na to, aby nám povedali predpoveď počasia na deň alebo ako Na časovači varenia zostáva veľa minút, ale naozaj by ste chceli, aby vás čítali ich ploché, monotónne tóny audioknihy? Pravdepodobne nie, a preto sa väčšina z nás obracia na služby s ľudským hlasom, ako je napríklad Audible, aby opravili našu audioknihu. Ľudskí hlasoví herci by však nemuseli prikývnuť príliš dlho, kvôli priekopníckej práci londýnskeho startupu s názvom DeepZen.

Pomocou algoritmov umelej inteligencie, rozšírených o technologickú palebnú silu IBM Power A.I. a Watson technológie, DeepZen vyvinula nástroje na prevod textu na reč, ktoré nielenže znejú ľudsky na prvé počúvanie, ale dokážu pútavým spôsobom zachytiť aj emocionálne podnety potrebné na čítanie textu. Spoločnosť tak tvrdí, že by mohla skrátiť čas a náklady na výrobu audiokníh až o 90 %.

Odporúčané videá

„Náš systém je skutočne revolučný,“ povedal pre Digital Trends Taylan Kamis, generálny riaditeľ a spoluzakladateľ spoločnosti DeepZen. „Funguje pomocou hlbokého učenia a neurónových sietí, aby sme pochopili, ako človek rozpráva a číta. Potom systém trénujeme, aby dokázal rozpoznať, kde pri čítaní textu použiť správne emócie a intonáciu. Výsledkom je ľudská reč, ktorá sa veľmi podobá skutočnej veci.“

Súvisiace

  • Optické ilúzie by nám mohli pomôcť vybudovať ďalšiu generáciu AI
  • Finishing touch: Ako vedci dávajú robotom ľudské hmatové zmysly
  • Prečítajte si strašidelne krásne „syntetické písmo“ od A.I. ktorý si myslí, že je to Boh

Nevyhnutne môže byť práca, ako je táto, ďalším príkladom špičkovej A.I. nástrojov ohrozuje ľudskú profesiu. V tomto prípade táto profesia zahŕňa hercov, ktorí napriek tomu, čo dokáže dosiahnuť niekoľko významných osobností, nemajú práve stabilnú a stabilnú kariéru. Bolo by naivné si myslieť, že softvér, ako je tento, nebude mať vplyv na budúcnosť hlasových hercov, ale Kamis poukazuje na to, že existuje veľa scenárov, v ktorých by nástroje ako DeepZen's mohli byť čistým pozitívom pre ľudskosť.

Mohlo by to napríklad umožniť vytváranie audiokníh založených na dielach nových a začínajúcich autorov alebo vydavateľov, ktorí nemajú luxus veľkých rozpočtov. Mohlo by sa tiež použiť na pomoc pri vývoji vynikajúcich nástrojov na prevod textu na reč pre ľudí, ktorí majú dyslexiu alebo majú iné problémy s čítaním.

„Pokiaľ ide o budúcnosť, uvažujeme aj o produkcii voice-overov pre priemysel video produkcie, as ako aj hranie hier, kde je potrebný prevod textu na reč v reálnom čase na zlepšenie hráčskeho zážitku,“ Kami povedal. "Pozeráme sa aj na iné jazyky."

Môžete si pozrieť ukážku systému tu.

Odporúčania redaktorov

  • Do školy blízko vás môžu prísť bezpečnostné roboty
  • Ako budeme vedieť, kedy sa AI skutočne stane vnímavou?
  • Analógová A.I.? Znie to šialene, ale môže to byť budúcnosť
  • Budúcnosť A.I.: 4 veľké veci, na ktoré sa treba pozerať v najbližších rokoch
  • Táto technológia bola pred 20 rokmi sci-fi. Teraz je to realita

Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.