Syntetyzowane głosy, takie jak te używane przez Siri i Alexę, doskonale nadają się do informowania nas o prognozie pogody na dany dzień lub o tym, jak to zrobić na liczniku gotowania pozostało wiele minut, ale czy naprawdę chcesz, aby czytały Cię ich płaskie, monotonne dźwięki? audiobooki? Prawdopodobnie nie, dlatego większość z nas zwraca się do usług głosowych, takich jak Audible, aby naprawić nasz audiobook. Ludzkimi aktorami głosowymi może jednak nie cieszyć się zbyt długo ze względu na pionierską pracę londyńskiego startupu o nazwie DeepZen.
Wykorzystując algorytmy sztucznej inteligencji, wzmocnione technologiczną siłą ognia IBM Power AI i technologie WatsonaFirma DeepZen opracowała narzędzia do zamiany tekstu na mowę, które nie tylko przy pierwszym usłyszeniu brzmią jak ludzkie dźwięki, ale także potrafią wychwytywać bodźce emocjonalne potrzebne do czytania tekstu w przekonujący sposób. Firma twierdzi, że w ten sposób mogłaby skrócić czas i koszty produkcji audiobooków nawet o 90%.
Polecane filmy
„Nasz system jest naprawdę rewolucyjny” – powiedział Digital Trends Taylan Kamis, dyrektor generalny i współzałożyciel DeepZen. „Działa, wykorzystując głębokie uczenie się i sieci neuronowe, aby zrozumieć, w jaki sposób człowiek mówi i czyta. Następnie szkolimy system, aby potrafił rozpoznać, gdzie zastosować właściwe emocje i intonację podczas czytania fragmentu tekstu. W rezultacie otrzymujemy mowę przypominającą ludzką, bardzo zbliżoną do prawdziwej”.
Powiązany
- Złudzenia optyczne mogą pomóc nam w zbudowaniu sztucznej inteligencji nowej generacji
- Wykończenie: jak naukowcy nadają robotom zmysły dotyku przypominające ludzkie
- Przeczytaj niesamowicie piękne „syntetyczne pismo” AI. który myśli, że jest Bogiem
Nieuchronnie taką pracę można uznać za kolejny przykład najnowocześniejszej sztucznej inteligencji. narzędzia zagrażające ludzkiemu zawodowi. W tym przypadku zawód ten dotyczy aktorów, którzy pomimo tego, co może osiągnąć kilka znanych osobistości, nie mają obecnie najbardziej stabilnej kariery. Naiwnością byłoby sądzić, że tego typu oprogramowanie nie będzie miało wpływu na przyszłość aktorów głosowych, ale – jak wynika z Kamis podkreśla, że istnieje wiele scenariuszy, w których narzędzia takie jak DeepZen mogą przynieść pozytywne rezultaty ludzkość.
Może na przykład umożliwić tworzenie audiobooków w oparciu o dzieła nowych i wschodzących pisarzy lub wydawców, którzy nie dysponują luksusem dużych budżetów. Można go również wykorzystać do opracowania doskonałych narzędzi do zamiany tekstu na mowę dla osób cierpiących na dysleksję lub z innych powodów mających problemy z czytaniem.
„Jeśli chodzi o przyszłość, myślimy również o produkcji lektorów dla branży produkcji wideo, as a także w grach, gdzie istnieje potrzeba zamiany tekstu na mowę w czasie rzeczywistym, aby poprawić wrażenia gracza” – Kami powiedział. „Przyglądamy się także innym językom”.
Możesz sprawdzić próbkę systemu Tutaj.
Zalecenia redaktorów
- Roboty zabezpieczające mogą pojawić się w pobliskiej szkole
- Skąd będziemy wiedzieć, kiedy sztuczna inteligencja faktycznie stanie się świadoma?
- Analogowa sztuczna inteligencja? Brzmi szalenie, ale może to być przyszłość
- Przyszłość sztucznej inteligencji: 4 ważne rzeczy, na które warto zwrócić uwagę w ciągu najbliższych kilku lat
- Ta technologia była science fiction 20 lat temu. Teraz to rzeczywistość
Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.