![baidu](/f/7b0607c26119d0a5d3a0d32cbe4847a1.jpeg)
Hlboký hlas 2, ktorý nasleduje po verejnom debute Deep Voice začiatkom tohto roka, dokáže produkovať reč v reálnom čase, ktorá je takmer na nerozoznanie od ľudského hlasu. O to pôsobivejšie je, že na zostavenie funkčného modelu potrebuje len tridsať minút zvuku a dokáže napodobniť regionálne akcenty stoviek rôznych reproduktorov.
Odporúčané videá
To je skokovo lepšie ako skoré verzie Deep Voice, ktorým trvalo niekoľko hodín, kým sa naučili jeden hlas.
Ich kľúčová je schopnosť Deep Voice 2 identifikovať podobnosti medzi stovkami rôznych reproduktorov a vytvoriť funkčný model ľudského hlasu. Potom z tohto modelu autonómne odvodzuje jedinečné hlasy – na rozdiel od hlasových asistentov, ako je Siri od Apple, ktorí vyžadujú človek zaznamená tisíce hodín reči, ktorú inžinieri vyladia ručne, Deep Voice 2 nevyžaduje vedenie ani manuál zásah.
![Baidu (znamenie)](/f/276fb420345256934e4f206e2ebe69f9.jpg)
„Dajte mu správne údaje a on sa môže sám naučiť, aké funkcie sú dôležité,“ povedal pre The Verge Andrew Gibiansky, vedecký pracovník v laboratóriu AI v Silicon Valley v Baidu.
Baidu nie je jedinou spoločnosťou, ktorá investuje do vysokokvalitnej technológie prevodu textu na reč. Google WaveNet, produkt divízie DeepMind spoločnosti, generuje hlasy vzorkovaním skutočnej ľudskej reči a nezávislým vytváraním vlastných zvukov v rôznych hlasoch. Adobe Project VoCo prepisuje ľudskú reč na upraviteľný text v reálnom čase. A Lyrebird, kanadský startup s umelou inteligenciou, licencuje algoritmy, ktoré dokážu napodobniť akýkoľvek hlas pomocou jedinej minúty ukážkového zvuku, tisíc viet za menej ako pol sekundy a dokáže naplniť reč, ktorú vytvára, emóciami ako hnev, súcit a stres.
Nečakajte však, že Deep Voice 2 alebo WaveNet nahradia Siri Google Assistantalebo Amazon Alexa čoskoro – prekladateľské aplikácie poháňané umelou inteligenciou vyžadujú viac zdrojov, ako dokážu dnešné telefóny primerane poskytnúť. Baidu však vidí potenciál v aplikáciách, ako sú aplikácie na prevod textu na reč a hlasoví asistenti. „Možnosť rýchlej syntézy viacerých ľudských hlasov bude mať v budúcnosti obrovský vplyv na produkty, ako sú osobní asistenti a čítačky elektronických kníh. Napríklad každá postava vašej eKnihy môže mať pri počúvaní eKnihy jedinečný hlas.“
Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.