Deze realistische gesynthetiseerde toespraak zou de toekomst van audioboeken kunnen zijn

Gesynthetiseerde stemmen zoals die worden gebruikt door Siri en Alexa zijn prima om ons de weersvoorspelling voor de dag te vertellen of hoe Er staan ​​nog vele minuten op een kookwekker, maar zou je echt willen dat hun vlakke, monotone tonen je lezen? audioboeken? Waarschijnlijk niet, en daarom wenden de meesten van ons zich tot diensten met menselijke stem, zoals Audible, om onze oplossing voor audioboeken te krijgen. Menselijke stemacteurs zullen misschien niet lang meer de eer krijgen, dankzij het baanbrekende werk van een in Londen gevestigde startup genaamd DiepZen.

Met behulp van kunstmatige intelligentie-algoritmen, aangevuld met de technologische vuurkracht van IBM's Power A.I. en Watson-technologieënheeft DeepZen tekst-naar-spraak-hulpmiddelen ontwikkeld die niet alleen bij de eerste luisterbeurt menselijk klinken, maar ook de emotionele signalen kunnen oppikken die nodig zijn om tekst op een boeiende manier te lezen. Door dit te doen beweert het bedrijf dat het de tijd en kosten voor het produceren van audioboeken met wel 90% zou kunnen verminderen.

Aanbevolen video's

“Ons systeem is echt revolutionair”, vertelde Taylan Kamis, CEO en mede-oprichter van DeepZen, aan Digital Trends. “Het werkt met behulp van deep learning en neurale netwerken om te begrijpen hoe een mens praat en leest. Vervolgens trainen we het systeem zodat het kan herkennen waar de juiste emoties en intonatie moeten worden toegepast bij het lezen van een stuk tekst. Het resultaat is menselijke spraak die heel sterk lijkt op de werkelijkheid.”

Verwant

  • Optische illusies kunnen ons helpen de volgende generatie AI te bouwen
  • Finishing touch: hoe wetenschappers robots mensachtige tastzintuigen geven
  • Lees het griezelig mooie ‘synthetische geschrift’ van een A.I. die denkt dat het God is

Het is onvermijdelijk dat dit soort werk kan worden gezien als het zoveelste voorbeeld van geavanceerde AI. hulpmiddelen een menselijk beroep bedreigen. In dit geval gaat het bij dat beroep om acteurs die, ondanks wat een paar spraakmakende figuren kunnen bereiken, niet de meest stabiele, stabiele carrière hebben zoals die nu is. Het zou naïef zijn om te denken dat dit soort software geen impact zal hebben op de toekomst van stemacteurs, maar aangezien Kamis wijst erop dat er tal van scenario’s zijn waarin tools zoals die van DeepZen netto positief kunnen zijn de mensheid.

Het zou bijvoorbeeld de creatie van audioboeken mogelijk kunnen maken op basis van werken van nieuwe en opkomende schrijvers, of van uitgevers die niet de luxe hebben van grote budgetten. Het kan ook worden gebruikt om superieure tekst-naar-spraak-hulpmiddelen te ontwikkelen voor mensen die dyslexie hebben of anderszins moeite hebben met lezen.

“Wat de toekomst betreft, kijken we ook naar het produceren van voice-overs voor de videoproductie-industrie evenals gaming, waarbij er behoefte is aan realtime tekst-naar-spraak om de spelerservaring te verbeteren”, zegt Kami gezegd. “We kijken ook naar andere talen.”

U kunt een voorbeeld van het systeem bekijken hier.

Aanbevelingen van de redactie

  • Beveiligingsrobots kunnen naar een school bij u in de buurt komen
  • Hoe weten we wanneer een AI daadwerkelijk bewust wordt?
  • Analoge AI? Het klinkt gek, maar het zou de toekomst kunnen zijn
  • De toekomst van AI: 4 grote dingen om naar te kijken de komende jaren
  • Deze technologie was twintig jaar geleden sciencefiction. Nu is het realiteit

Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.