Дубоки глас 2, који следи за петама јавног дебија Дееп Воице-а раније ове године, може произвести говор у реалном времену који се готово не разликује од људског гласа. Што је још импресивније, потребно му је само тридесет минута звука да би се направио радни модел и може да имитира регионалне акценте стотина различитих звучника.
Препоручени видео снимци
То је много боље од раних верзија Дееп Воице-а, којима је требало више сати да се научи један глас.
Њихова кључна је способност Дееп Воицеа 2 да идентификује сличности између стотина различитих звучника како би изградио радни модел људског гласа. Затим, аутономно изводи јединствене гласове из тог модела - за разлику од гласовних помоћника као што је Аппле-ов Сири, који захтевају да људски рекорд хиљада сати говора које инжењери подешавају ручно, Дееп Воице 2 не захтева упутства или приручник интервенција.
„Дајте му праве податке и он ће сам научити које су карактеристике важне“, рекао је за Верге Ендрју Гибијански, научник истраживач у Баидуовој лабораторији за вештачку интелигенцију у Силицијумској долини.
Баиду није једина компанија која улаже у висококвалитетну технологију претварања текста у говор. Гоогле-ов ВавеНет, производ одељења компаније ДеепМинд, генерише гласове узорковањем правог људског говора и независно креирањем сопствених звукова у различитим гласовима. Адобе-ов пројекат ВоЦо транскрибује људски говор у текст који се може уређивати у реалном времену. Лиребирд, канадски АИ стартуп, лиценцира алгоритме који могу да имитирају било који глас са само једним минутом узорка звука, креирају хиљаду реченица за мање од пола секунде и може да унесе у говор који ствара емоције попут љутње, симпатије и стреса.
Али немојте очекивати да ће Дееп Воице 2 или ВавеНет заменити Сири Гоогле помоћник, или Амазон Алека ускоро — апликације за превођење које покреће вештачка интелигенција захтевају више ресурса него што данашњи телефони разумно могу да обезбеде. Али Баиду види потенцијал у апликацијама као што су апликације за претварање текста у говор и гласовни помоћници. „Способност да се брзо синтетише више људских гласова имаће огроман утицај на производе као што су лични асистенти и читачи е-књига у будућности. На пример, сваки лик ваше е-књиге може имати јединствен глас када слушате е-књигу.”
Надоградите свој животни стилДигитални трендови помажу читаоцима да прате убрзани свет технологије са свим најновијим вестима, забавним рецензијама производа, проницљивим уводницима и јединственим кратким прегледима.