Syvä ääni 2, joka seuraa Deep Voicen julkista debyyttiä aiemmin tänä vuonna, voi tuottaa reaaliaikaista puhetta, joka on lähes erottamaton ihmisäänestä. Sitäkin vaikuttavampaa, että se tarvitsee vain 30 minuuttia ääntä toimivan mallin rakentamiseksi, ja se voi jäljitellä satojen eri kaiuttimien alueellisia aksentteja.
Suositellut videot
Se on harppauksin parempi kuin Deep Voicen varhaiset versiot, joiden yhden äänen oppiminen vei useita tunteja.
Keskeistä on Deep Voice 2:n kyky tunnistaa yhtäläisyyksiä satojen eri kaiuttimien välillä ja rakentaa toimiva malli ihmisäänestä. Sitten se saa itsenäisesti ainutlaatuisia ääniä tästä mallista – toisin kuin ääniavustajat, kuten Applen Siri, jotka vaativat ihmisen ennätys tuhansia tunteja puhetta, jonka insinöörit virittävät käsin, Deep Voice 2 ei vaadi ohjausta tai manuaalia väliintuloa.
"Anna sille oikeat tiedot, ja se voi oppia itse, millaiset ominaisuudet ovat tärkeitä", Baidu's Silicon Valley AI Labin tutkija Andrew Gibiansky kertoi The Vergelle.
Baidu ei ole ainoa yritys, joka investoi korkealaatuiseen tekstistä puheeksi -tekniikkaan. Googlen WaveNet, yrityksen DeepMind-divisioonan tuote, tuottaa ääniä ottamalla näytteitä todellisesta ihmispuheesta ja luomalla itsenäisesti omia ääniään eri äänillä. Adoben Project VoCo litteroi ihmisen puheen muokattavaksi tekstiksi reaaliajassa. Ja Lyrebird, kanadalainen tekoälyn startup, lisensoi algoritmeja, jotka voivat jäljitellä mitä tahansa ääntä vain minuutin näyteäänellä, luoda tuhat lausetta alle puolessa sekunnissa, ja se voi täyttää luomaansa puheen tunteita, kuten vihaa, myötätuntoa ja stressi.
Mutta älä odota Deep Voice 2:n tai WaveNetin korvaavan Sirin Google Assistanttai Amazonin Alexa milloin tahansa pian – tekoälyllä toimivat käännössovellukset vaativat enemmän resursseja kuin nykyiset puhelimet pystyvät tarjoamaan. Baidu näkee kuitenkin potentiaalia sovelluksissa, kuten tekstistä puheeksi -sovelluksissa ja äänipohjaisissa avustajissa. ”Kyky syntetisoida nopeasti useita ihmisääniä vaikuttaa tulevaisuudessa valtavasti tuotteisiin, kuten henkilökohtaisiin avustajiin ja eBook-lukijoihin. Esimerkiksi jokaisella e-kirjan hahmolla voi olla ainutlaatuinen ääni, kun kuuntelet e-kirjaa."
Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.