Це реалістичне синтезоване мовлення може стати майбутнім аудіокниг

Синтезовані голоси, подібні до тих, що використовуються Siri та Alexa, підходять для того, щоб повідомляти нам прогноз погоди на день або як На таймері залишається багато хвилин, але ви дійсно хочете, щоб їхні плоскі монотонні тони читали вас? аудіокниги? Напевно, ні, тому більшість із нас звертаються до сервісів людського голосу, таких як Audible, щоб виправити аудіокнигу. Однак актори людського голосу можуть не отримувати підтримки ще довго через новаторську роботу лондонського стартапу під назвою DeepZen.

Використовуючи алгоритми штучного інтелекту, доповнені технологічною вогневою міць Power A.I від IBM і технології Watson, DeepZen розробив інструменти перетворення тексту в мовлення, які не тільки звучать по-людськи при першому прослуховуванні, але й можуть вловлювати емоційні сигнали, необхідні для переконливого читання тексту. При цьому компанія стверджує, що може скоротити час і вартість виробництва аудіокниг до 90%.

Рекомендовані відео

«Наша система справді революційна, — сказав Тайлан Каміс, генеральний директор і співзасновник DeepZen, Digital Trends. «Це працює за допомогою глибокого навчання та нейронних мереж, щоб зрозуміти, як людина розмовляє та читає. Потім ми навчаємо систему, щоб вона могла розпізнавати, де застосувати правильні емоції та інтонацію під час читання фрагмента тексту. У результаті виходить людська мова, дуже схожа на справжню».

Пов'язані

Оптичні ілюзії можуть допомогти нам створити наступне покоління ШІ
Останній штрих: як вчені надають роботам людські тактильні відчуття
Прочитайте моторошно красиве «синтетичне писання» штучного інтелекту. що думає, що це Бог

Неминуче таку роботу можна вважати ще одним прикладом передового штучного інтелекту. інструменти загрожує людській професії. У цьому випадку ця професія включає в себе акторів, які, незважаючи на те, що кілька високопоставлених фігур можуть досягти, не мають найстійкішої, стабільної кар’єри, як це є. Було б наївно думати, що таке програмне забезпечення не вплине на майбутнє акторів голосу, але, як Каміс зазначає, що є багато сценаріїв, у яких такі інструменти, як DeepZen, можуть бути позитивними для людство.

Наприклад, це може зробити можливим створення аудіокниг на основі творів нових і починаючих письменників або від видавців, які не можуть дозволити собі розкіш великих бюджетів. Його також можна використовувати, щоб допомогти розробити чудові інструменти перетворення тексту в мовлення для людей, які мають дислексію або інші проблеми з читанням.

«Що стосується майбутнього, ми також дивимося на виробництво голосу за кадром для індустрії виробництва відео а також ігор, де існує потреба в перетворенні тексту в мовлення в реальному часі для покращення досвіду гравця», – Камі сказав. «Ми також розглядаємо інші мови».

Ви можете ознайомитись із зразком системи тут.

Це реалістичне синтезоване мовлення може стати майбутнім аудіокниг

Рекомендації редакції

Категорії

Останні

Roku ліцензує технологію для OEM-виробників

ЄС окреслює правила захисту персональних даних

United Airlines додає Bluetooth до всіх своїх літаків