Denne realistiske syntetiserede tale kunne være fremtiden for lydbøger

Syntetiserede stemmer som dem, der bruges af Siri og Alexa er fine til at fortælle os dagens vejrudsigt eller hvordan Der er mange minutter tilbage på en tilberedningstimer, men vil du virkelig have, at deres flade, monotone toner læser dig lydbøger? Sandsynligvis ikke, hvilket er grunden til, at de fleste af os henvender sig til tjenester med menneskestemme som Audible for at få vores lydbogsfix. Menneskelige stemmeskuespillere får dog måske ikke nikk for meget længere, på grund af det banebrydende arbejde fra en London-baseret startup kaldet DeepZen.

Brug af kunstig intelligens algoritmer, forstærket af den teknologiske ildkraft fra IBMs Power A.I. og Watson-teknologier, DeepZen har udviklet tekst-til-tale-værktøjer, der ikke kun lyder menneskelige ved første lytning, men som også kan opfange de følelsesmæssige signaler, der er nødvendige for at læse tekst på en overbevisende måde. Dermed hævder virksomheden, at det kan reducere tiden og omkostningerne til at producere lydbøger med op til 90%.

Anbefalede videoer

"Vores system er virkelig revolutionerende," sagde Taylan Kamis, CEO og medstifter af DeepZen, til Digital Trends. "Det virker ved at bruge dyb læring og neurale netværk til at forstå, hvordan et menneske taler og læser. Vi træner derefter systemet, så det kan genkende, hvor man skal anvende de rigtige følelser og intonation, når man læser et stykke tekst. Resultatet er menneskelignende tale, der meget ligner den ægte vare."

Relaterede

  • Optiske illusioner kan hjælpe os med at bygge den næste generation af kunstig intelligens
  • Prikken over i'et: Hvordan videnskabsmænd giver robotter menneskelignende taktile sanser
  • Læs det uhyggeligt smukke 'syntetiske skrift' af en A.I. der tror, ​​det er Gud

Uundgåeligt kan arbejde som dette støbes som endnu et eksempel på banebrydende A.I. værktøjer truer en menneskelig profession. I dette tilfælde involverer det fag skuespillere, som på trods af, hvad nogle få højprofilerede figurer er i stand til at opnå, ikke har den mest stabile, stabile karriere, som den er. Det ville være naivt at tro, at software som denne ikke vil have indflydelse på stemmeskuespillernes fremtid, men som Kamis påpeger, at der er masser af scenarier, hvor værktøjer som DeepZen's kunne være netto positive for menneskelighed.

For eksempel kunne det gøre det muligt at skabe lydbøger baseret på værker af nye og nye forfattere eller fra forlag, der ikke har luksusen med store budgetter. Det kan også bruges til at hjælpe med at udvikle overlegne tekst-til-tale-værktøjer til folk, der har ordblindhed eller på anden måde har problemer med at læse.

“Med hensyn til fremtiden kigger vi også på at producere voice-overs til videoproduktionsindustrien, som samt spil, hvor der er behov for tekst-til-tale i realtid for at forbedre spilleroplevelsen,” Kami sagde. "Vi kigger også på andre sprog."

Du kan se et eksempel på systemet her.

Redaktørens anbefalinger

  • Sikkerhedsrobotter kommer muligvis til en skole i nærheden af ​​dig
  • Hvordan ved vi, hvornår en AI rent faktisk bliver sansende?
  • Analog A.I.? Det lyder skørt, men det er måske fremtiden
  • Fremtiden for A.I.: 4 store ting at holde øje med i de næste par år
  • Denne teknologi var science fiction for 20 år siden. Nu er det virkelighed

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.