Эта реалистичная синтезированная речь может стать будущим аудиокниг

Синтезированные голоса, подобные тем, которые используют Siri и Alexa, подходят для того, чтобы сообщить нам прогноз погоды на день или то, как на таймере приготовления осталось много минут, но действительно ли вы хотите, чтобы их ровные, монотонные звуки читали вас? аудиокниги? Вероятно, нет, поэтому большинство из нас обращаются к сервисам с человеческим голосом, таким как Audible, чтобы исправить аудиокнигу. Однако актеры человеческого озвучивания, возможно, еще долго не получат одобрения из-за новаторской работы лондонского стартапа под названием ДипЗен.

Используя алгоритмы искусственного интеллекта, дополненные технологической огневой мощью IBM Power A.I. и технологии WatsonКомпания DeepZen разработала инструменты преобразования текста в речь, которые не только звучат по-человечески при первом прослушивании, но также могут улавливать эмоциональные сигналы, необходимые для убедительного чтения текста. При этом компания утверждает, что сможет сократить время и затраты на производство аудиокниг до 90%.

Рекомендуемые видео

«Наша система поистине революционна», — сказал Digital Trends Тайлан Камис, генеральный директор и соучредитель DeepZen. «Он работает с использованием глубокого обучения и нейронных сетей, чтобы понять, как человек разговаривает и читает. Затем мы обучаем систему, чтобы она могла распознавать, где применять правильные эмоции и интонацию при чтении фрагмента текста. В результате получается человеческая речь, очень похожая на настоящую».

Связанный

Оптические иллюзии могут помочь нам создать ИИ следующего поколения
Последний штрих: как ученые наделяют роботов человеческими тактильными чувствами
Прочтите устрашающе красивое «синтетическое писание» ИИ. который думает, что это Бог

Подобные работы неизбежно можно рассматривать как еще один пример передового ИИ. инструменты угроза человеческой профессии. В данном случае в эту профессию входят актеры, которые, несмотря на то, чего способны достичь несколько известных деятелей, не имеют самой устойчивой и стабильной карьеры. Было бы наивно думать, что подобное программное обеспечение не окажет влияния на будущее актеров озвучивания, но, как Камис отмечает, что существует множество сценариев, в которых такие инструменты, как DeepZen, могут принести чистую пользу для человечество.

Например, это могло бы сделать возможным создание аудиокниг на основе произведений новых и начинающих писателей или издателей, которые не могут позволить себе роскошь больших бюджетов. Его также можно использовать для разработки превосходных инструментов преобразования текста в речь для людей, страдающих дислексией или имеющих другие проблемы с чтением.

«Что касается будущего, мы также рассматриваем возможность создания озвучки для индустрии видеопроизводства, поскольку а также игры, где требуется преобразование текста в речь в реальном времени для улучшения впечатлений от игры», — Ками сказал. «Мы также рассматриваем другие языки».

Вы можете посмотреть образец системы здесь.

Эта реалистичная синтезированная речь может стать будущим аудиокниг

Рекомендации редакции

Категории

Недавний

Boost Mobile нацелен на американцев кубинского происхождения с новыми планами

Uber грозит судебный иск в рамках ADA за пренебрежительное отношение к слепым

Смотрите, как Мэтью МакКонахи плачет во время трейлера «Звездных войн»