Syntetiserte stemmer som de som brukes av Siri og Alexa er fine for å fortelle oss dagens værmelding eller hvordan mange minutter gjenstår på en koketimer, men vil du virkelig at de flate, monotone tonene deres leser deg lydbøker? Sannsynligvis ikke, og det er grunnen til at de fleste av oss henvender oss til tjenester med menneskestemme som Audible for å få lydboken vår. Menneskelige stemmeskuespillere får kanskje ikke nikk for mye lenger, på grunn av pionerarbeidet til en London-basert oppstart kalt DeepZen.
Ved hjelp av kunstig intelligens-algoritmer, forsterket av den teknologiske ildkraften til IBMs Power A.I. og Watson-teknologier, DeepZen har utviklet tekst-til-tale-verktøy som ikke bare høres menneskelig ut ved første lytting, men som også kan fange opp de følelsesmessige signalene som trengs for å lese tekst på en overbevisende måte. Dermed hevder selskapet at det kan redusere tiden og kostnadene for å produsere lydbøker med opptil 90 %.
Anbefalte videoer
"Vårt system er virkelig revolusjonerende," sa Taylan Kamis, administrerende direktør og medgründer av DeepZen, til Digital Trends. "Det fungerer ved å bruke dyp læring og nevrale nettverk for å forstå hvordan et menneske snakker og leser. Vi trener deretter systemet slik at det kan gjenkjenne hvor det skal brukes de riktige følelsene og intonasjonen når du leser et tekststykke. Resultatet er menneskelignende tale som ligner veldig på den virkelige tingen.»
I slekt
- Optiske illusjoner kan hjelpe oss med å bygge neste generasjon AI
- Finishing touch: Hvordan forskere gir roboter menneskelignende taktile sanser
- Les den uhyggelig vakre 'syntetiske skriften' til en A.I. som tror det er Gud
Uunngåelig kan arbeid som dette støpes som nok et eksempel på banebrytende A.I. verktøy truer et menneskelig yrke. I dette tilfellet involverer det yrket skuespillere som, til tross for hva noen få høyprofilerte skikkelser er i stand til å oppnå, ikke har den mest stabile, stabile karrieren som den er. Det ville være naivt å tro at programvare som dette ikke vil ha noen innvirkning på fremtiden til stemmeskuespillere, men som Kamis påpeker at det er mange scenarier der verktøy som DeepZen kan være positivt for menneskeheten.
For eksempel kan det gjøre det mulig å lage lydbøker basert på verk av nye og nye forfattere, eller fra utgivere som ikke har luksusen til store budsjetter. Det kan også brukes til å utvikle overlegne tekst-til-tale-verktøy for personer som har dysleksi eller på annen måte har problemer med å lese.
"Når det gjelder fremtiden, ser vi også på å produsere voice-overs for videoproduksjonsindustrien, som så vel som spill, der det er behov for tekst-til-tale i sanntid for å forbedre spilleropplevelsen,» Kami sa. "Vi ser også på andre språk."
Du kan sjekke ut et eksempel på systemet her.
Redaktørenes anbefalinger
- Sikkerhetsroboter kan komme til en skole nær deg
- Hvordan vil vi vite når en AI faktisk blir sansende?
- Analog A.I.? Det høres sprøtt ut, men det kan være fremtiden
- Fremtiden til A.I.: 4 store ting å se etter de neste årene
- Denne teknologien var science fiction for 20 år siden. Nå er det virkelighet
Oppgrader livsstilen dinDigitale trender hjelper leserne å følge med på den fartsfylte teknologiverdenen med alle de siste nyhetene, morsomme produktanmeldelser, innsiktsfulle redaksjoner og unike sniktitter.