Тази реалистична синтезирана реч може да бъде бъдещето на аудиокнигите

Синтезирани гласове като тези, използвани от Siri и Alexa, са подходящи, за да ни кажат прогнозата за времето за деня или как много минути остават на таймера за готвене, но бихте ли искали наистина техните плоски, монотонни тонове да ви четат аудиокниги? Вероятно не, поради което повечето от нас се обръщат към услуги с човешки глас като Audible, за да поправят аудиокнигата си. Човешките гласови актьори обаче може да не получат одобрение твърде дълго, поради пионерската работа на базиран в Лондон стартъп, наречен DeepZen.

Използване на алгоритми за изкуствен интелект, подсилени от технологичната огнева мощ на Power AI на IBM и Watson технологии, DeepZen разработи инструменти за преобразуване на текст в реч, които не само звучат човешки при първо слушане, но също така могат да уловят емоционалните знаци, необходими за четене на текст по завладяващ начин. По този начин компанията твърди, че може да намали времето и разходите за производство на аудиокниги с до 90%.

Препоръчани видеоклипове

„Нашата система е наистина революционна“, каза Тайлан Камис, главен изпълнителен директор и съосновател на DeepZen, пред Digital Trends. „Той работи, използвайки дълбоко обучение и невронни мрежи, за да разбере как човек говори и чете. След това обучаваме системата, за да може да разпознае къде да приложи правилните емоции и интонация, когато чете текст. Резултатът е човешка реч, много наподобяваща истинската.”

Свързани

  • Оптичните илюзии могат да ни помогнат да изградим следващото поколение AI
  • Завършващ щрих: Как учените дават на роботите човекоподобни тактилни сетива
  • Прочетете зловещо красивото „синтетично писание“ на A.I. който мисли, че е Бог

Неизбежно, работа като тази може да бъде хвърлена като още един пример за авангарден ИИ. инструменти заплаха за една човешка професия. В този случай тази професия включва актьори, които, въпреки това, което няколко високопоставени фигури успяват да постигнат, нямат най-стабилните и стабилни кариери, каквито са. Би било наивно да се мисли, че софтуер като този няма да окаже влияние върху бъдещето на гласовите актьори, но като Камис посочва, че има много сценарии, при които инструменти като DeepZen могат да бъдат чисто положителни за човечеството.

Например, това може да направи възможно създаването на аудиокниги, базирани на произведения на нови и изгряващи писатели или от издатели, които нямат лукса на големи бюджети. Може също да се използва за подпомагане на разработването на превъзходни инструменти за преобразуване на текст в реч за хора, които имат дислексия или по друг начин имат проблеми с четенето.

„Що се отнася до бъдещето, ние също гледаме да продуцираме глас зад кадър за индустрията за видео продукция, като както и игри, където има нужда от преобразуване на текст в говор в реално време, за да се подобри изживяването на играча,” Ками казах. „Разглеждаме и други езици.“

Можете да разгледате примерна система тук.

Препоръки на редакторите

  • Роботите за сигурност може да идват в училище близо до вас
  • Как ще разберем кога изкуственият интелект наистина ще стане разумен?
  • Аналогов AI? Звучи налудничаво, но това може да е бъдещето
  • Бъдещето на ИИ: 4 големи неща, за които да следите през следващите няколко години
  • Тази технология беше научна фантастика преди 20 години. Сега това е реалност

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.