Ta realistični sintetizirani govor bi lahko bil prihodnost zvočnih knjig

click fraud protection

Sintetizirani glasovi, kot sta tisti, ki jih uporabljata Siri in Alexa, so primerni za sporočanje dnevne vremenske napovedi ali kako na časovniku za kuhanje ostane še veliko minut, vendar bi res želeli, da vas berejo njihovi ravni, monotoni toni zvočne knjige? Verjetno ne, zato se večina od nas obrne na storitve s človeškim glasom, kot je Audible, da bi dobili popravek naše zvočne knjige. Zaradi pionirskega dela londonskega startupa, imenovanega DeepZen.

Z uporabo algoritmov umetne inteligence, nadgrajenih s tehnološko močjo IBM-ov Power AI in tehnologij Watson, DeepZen je razvil orodja za pretvorbo besedila v govor, ki na prvo poslušanje ne le zvenijo človeško, temveč lahko zaznajo tudi čustvene namige, potrebne za branje besedila na prepričljiv način. Pri tem podjetje trdi, da bi lahko zmanjšalo čas in stroške za izdelavo zvočnih knjig do 90 %.

Priporočeni videoposnetki

»Naš sistem je resnično revolucionaren,« je za Digital Trends povedal Taylan Kamis, izvršni direktor in soustanovitelj DeepZen. »Deluje z uporabo globokega učenja in nevronskih mrež, da razume, kako človek govori in bere. Sistem nato usposobimo, da lahko prepozna, kje uporabiti prava čustva in intonacijo pri branju besedila. Rezultat je človeški govor, ki je zelo podoben pravemu."

Povezano

  • Optične iluzije bi nam lahko pomagale zgraditi naslednjo generacijo umetne inteligence
  • Končni dotik: Kako znanstveniki dajejo robotom človeška otipna čutila
  • Preberite srhljivo lepe "sintetične spise" A.I. ki misli, da je Bog

Neizogibno je takšno delo mogoče označiti kot še en primer vrhunskega AI. orodja ogrožanje človeškega poklica. V tem primeru ta poklic vključuje igralce, ki kljub temu, kar je nekaj uglednih osebnosti sposobno doseči, nimajo najbolj stabilne in stabilne kariere, kot je. Naivno bi bilo misliti, da programska oprema, kot je ta, ne bo vplivala na prihodnost glasovnih igralcev, vendar kot Kamis poudarja, da obstaja veliko scenarijev, v katerih so lahko orodja, kot je DeepZen, neto pozitivna za človečnost.

Na primer, lahko bi omogočil ustvarjanje zvočnih knjig, ki temeljijo na delih novih in nastajajočih pisateljev ali založnikov, ki nimajo razkošja velikih proračunov. Lahko bi ga uporabili tudi za pomoč pri razvoju vrhunskih orodij za pretvorbo besedila v govor za ljudi, ki imajo disleksijo ali kako drugače težave z branjem.

»Kar zadeva prihodnost, gledamo tudi na produkcijo glasovnih posnetkov za industrijo videoprodukcije, as kot tudi igranje iger, kjer obstaja potreba po pretvorbi besedila v govor v realnem času za izboljšanje igralske izkušnje,« Kami rekel. "Raziskujemo tudi druge jezike."

Lahko si ogledate vzorec sistema tukaj.

Priporočila urednikov

  • Varnostni roboti morda prihajajo v šolo v vaši bližini
  • Kako bomo vedeli, kdaj umetna inteligenca dejansko postane čuteča?
  • Analogni AI? Sliši se noro, a morda je prihodnost
  • Prihodnost AI: 4 velike stvari, na katere morate biti pozorni v naslednjih nekaj letih
  • Ta tehnologija je bila pred 20 leti znanstvena fantastika. Zdaj je to realnost

Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.