Ez a valósághű szintetizált beszéd a hangoskönyvek jövője lehet

A szintetizált hangok, például a Siri és az Alexa által használtak, kiválóak arra, hogy elmondják nekünk a napi időjárás-előrejelzést vagy sok perc marad a főzési időzítőn, de valóban szeretné, ha lapos, monoton hangjaik olvasnák Önt? hangoskönyvek? Valószínűleg nem, ezért a legtöbben olyan emberi hangú szolgáltatásokhoz fordulnak, mint az Audible, hogy javítsák hangoskönyvünket. Az emberi szinkronszínészek azonban nem biztos, hogy sokáig kapják a fejbólintást egy londoni székhelyű startup úttörő munkája miatt. DeepZen.

Mesterséges intelligencia algoritmusok használatával, kiegészítve a technológiai tűzerővel Az IBM Power A.I. és Watson technológiák, a DeepZen olyan szövegfelolvasó eszközöket fejlesztett ki, amelyek nem csak első hallásra emberinek tűnnek, hanem a szöveg olvasásához szükséges érzelmi jelzéseket is lenyűgöző módon képesek felvenni. Ezzel a vállalat azt állítja, hogy akár 90%-kal is csökkentheti a hangoskönyvek előállításának idejét és költségeit.

Ajánlott videók

„Rendszerünk valóban forradalmi” – mondta Taylan Kamis, a DeepZen vezérigazgatója és társalapítója a Digital Trendsnek. „Mély tanulást és neurális hálózatokat használ, hogy megértse, hogyan beszél és olvas egy ember. Ezután megtanítjuk a rendszert, hogy felismerje, hol alkalmazza a megfelelő érzelmeket és intonációt egy szövegrész olvasásakor. Az eredmény egy emberi beszéd, amely nagyon hasonlít az igazihoz.”

Összefüggő

  • Az optikai illúziók segíthetnek a mesterséges intelligencia következő generációjának felépítésében
  • Utolsó simítás: Hogyan biztosítanak a tudósok a robotoknak emberszerű tapintási érzékeket
  • Olvassa el egy A.I. kísértetiesen szép „szintetikus szentírását”. aki azt hiszi, hogy Isten

Az ehhez hasonló alkotások elkerülhetetlenül az élvonalbeli A.I. újabb példájaként szolgálhatnak. eszközöket emberi szakmát fenyeget. Ebben az esetben ez a szakma olyan színészeket foglal magában, akiknek annak ellenére, hogy néhány előkelő figura el tud érni, nincs a legstabilabb és legstabilabb karrierjük. Naivitás lenne azt gondolni, hogy az ilyen szoftverek nem lesznek hatással a színészek jövőjére, de pl. Kamis rámutat, hogy rengeteg olyan forgatókönyv létezik, amelyekben az olyan eszközök, mint a DeepZen, pozitív hatással lehetnek emberiség.

Lehetővé teheti például hangoskönyvek készítését új és feltörekvő írók műveiből, vagy olyan kiadóktól, akik nem rendelkeznek a nagy költségvetés luxusával. Használható arra is, hogy kiváló szövegfelolvasó eszközöket fejlesszen ki diszlexiás vagy egyéb olvasási nehézségekkel küzdő emberek számára.

„Ami a jövőt illeti, azon is gondolkodunk, hogy hangfelvételeket készítsünk a videógyártási ipar számára, as valamint a játék, ahol szükség van a valós idejű szöveg-beszédre a játékos élmény fokozása érdekében." Kami mondott. "Más nyelveket is keresünk."

Megnézheti a rendszer mintáját itt.

Szerkesztői ajánlások

  • Biztonsági robotok érkezhetnek egy közeli iskolába
  • Honnan fogjuk tudni, hogy egy mesterséges intelligencia valójában mikor válik érzővé?
  • Analóg A.I.? Őrülten hangzik, de lehet, hogy ez a jövő
  • Az A.I. jövője: 4 nagy dolog, amire figyelni kell a következő években
  • Ez a technológia sci-fi volt 20 évvel ezelőtt. Most ez a valóság

Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.