Ta realistyczna, syntetyczna mowa może być przyszłością audiobooków

Syntetyzowane głosy, takie jak te używane przez Siri i Alexę, doskonale nadają się do informowania nas o prognozie pogody na dany dzień lub o tym, jak to zrobić na liczniku gotowania pozostało wiele minut, ale czy naprawdę chcesz, aby czytały Cię ich płaskie, monotonne dźwięki? audiobooki? Prawdopodobnie nie, dlatego większość z nas zwraca się do usług głosowych, takich jak Audible, aby naprawić nasz audiobook. Ludzkimi aktorami głosowymi może jednak nie cieszyć się zbyt długo ze względu na pionierską pracę londyńskiego startupu o nazwie DeepZen.

Wykorzystując algorytmy sztucznej inteligencji, wzmocnione technologiczną siłą ognia IBM Power AI i technologie WatsonaFirma DeepZen opracowała narzędzia do zamiany tekstu na mowę, które nie tylko przy pierwszym usłyszeniu brzmią jak ludzkie dźwięki, ale także potrafią wychwytywać bodźce emocjonalne potrzebne do czytania tekstu w przekonujący sposób. Firma twierdzi, że w ten sposób mogłaby skrócić czas i koszty produkcji audiobooków nawet o 90%.

Polecane filmy

„Nasz system jest naprawdę rewolucyjny” – powiedział Digital Trends Taylan Kamis, dyrektor generalny i współzałożyciel DeepZen. „Działa, wykorzystując głębokie uczenie się i sieci neuronowe, aby zrozumieć, w jaki sposób człowiek mówi i czyta. Następnie szkolimy system, aby potrafił rozpoznać, gdzie zastosować właściwe emocje i intonację podczas czytania fragmentu tekstu. W rezultacie otrzymujemy mowę przypominającą ludzką, bardzo zbliżoną do prawdziwej”.

Powiązany

Złudzenia optyczne mogą pomóc nam w zbudowaniu sztucznej inteligencji nowej generacji
Wykończenie: jak naukowcy nadają robotom zmysły dotyku przypominające ludzkie
Przeczytaj niesamowicie piękne „syntetyczne pismo” AI. który myśli, że jest Bogiem

Nieuchronnie taką pracę można uznać za kolejny przykład najnowocześniejszej sztucznej inteligencji. narzędzia zagrażające ludzkiemu zawodowi. W tym przypadku zawód ten dotyczy aktorów, którzy pomimo tego, co może osiągnąć kilka znanych osobistości, nie mają obecnie najbardziej stabilnej kariery. Naiwnością byłoby sądzić, że tego typu oprogramowanie nie będzie miało wpływu na przyszłość aktorów głosowych, ale – jak wynika z Kamis podkreśla, że istnieje wiele scenariuszy, w których narzędzia takie jak DeepZen mogą przynieść pozytywne rezultaty ludzkość.

Może na przykład umożliwić tworzenie audiobooków w oparciu o dzieła nowych i wschodzących pisarzy lub wydawców, którzy nie dysponują luksusem dużych budżetów. Można go również wykorzystać do opracowania doskonałych narzędzi do zamiany tekstu na mowę dla osób cierpiących na dysleksję lub z innych powodów mających problemy z czytaniem.

„Jeśli chodzi o przyszłość, myślimy również o produkcji lektorów dla branży produkcji wideo, as a także w grach, gdzie istnieje potrzeba zamiany tekstu na mowę w czasie rzeczywistym, aby poprawić wrażenia gracza” – Kami powiedział. „Przyglądamy się także innym językom”.

Możesz sprawdzić próbkę systemu Tutaj.

Zalecenia redaktorów

Roboty zabezpieczające mogą pojawić się w pobliskiej szkole
Skąd będziemy wiedzieć, kiedy sztuczna inteligencja faktycznie stanie się świadoma?
Analogowa sztuczna inteligencja? Brzmi szalenie, ale może to być przyszłość
Przyszłość sztucznej inteligencji: 4 ważne rzeczy, na które warto zwrócić uwagę w ciągu najbliższych kilku lat
Ta technologia była science fiction 20 lat temu. Teraz to rzeczywistość

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.

Ta realistyczna, syntetyczna mowa może być przyszłością audiobooków

Zalecenia redaktorów

Kategorie

Niedawny

Wskazówki NASA dotyczące obserwacji nieba na styczeń obejmują deszcz meteorów

NASA twierdzi, że pierwsze wdrożenie osłon przeciwsłonecznych Webb zakończyło się sukcesem

Kosmiczny Teleskop Hubble'a uchwycił przerażającą gwiazdę węglową CW Leonis