Изкуственият интелект (AI) е имам момент точно сега, а вятърът продължава да духа в платната му с новината, че Microsoft работи върху AI, който може да имитира гласа на всеки, след като му бъде подаден кратък трисекунден образец.
Новият инструмент, наречен VALL-E, е обучен на приблизително 60 000 часа гласови данни на английски език, които според Microsoft са „стотици пъти по-големи от съществуващите системи“. Използвайки това знание, неговите създатели твърдят, че се нуждае само от малка част от вокалния вход, за да разбере как да възпроизведе гласа на потребителя.

Още по-впечатляващо е, че VALL-E може да възпроизвежда емоциите, гласовите тонове и акустичната среда, намиращи се във всяка проба, нещо, с което други гласови AI програми са се борили. Това му придава по-реалистична аура и доближава резултатите му до нещо, което може да мине като истинска човешка реч.
Свързани
- GPT-4: как да използвате AI chatbot, който засрамва ChatGPT
- Google Bard вече може да говори, но може ли да заглуши ChatGPT?
- Новата AI компания на Илон Мъск има за цел да „разбере вселената“
В сравнение с други конкуренти от текст към реч (TTS), Microsoft казва, че VALL-E „значително превъзхожда най-съвременната TTS система с нулев удар по отношение на речта естественост и подобие на говорещия.“ С други думи, VALL-E звучи много повече като истински хора, отколкото съперничещи AI, които срещат аудио входове, които не са били обучени На.
Препоръчани видеоклипове
В GitHub Microsoft създаде a малка библиотека с мостри създаден с помощта на VALL-E. Резултатите са предимно много впечатляващи, с много проби, които възпроизвеждат трепета и акцента на гласовете на говорещите. Някои от примерите са по-малко убедителни, което показва, че VALL-E вероятно не е завършен продукт, но като цяло резултатът е убедителен.
Огромен потенциал — и рискове

В хартия, представяща VALL-E, Microsoft обяснява, че VALL-E „може да носи потенциални рискове при злоупотреба с модела, като например подправяне на глас идентифициране или представяне на конкретен говорител.“ Такъв способен инструмент за генериране на реалистично звучащи речеви повдигания призракът на все по-убедителни deepfakes, който може да се използва за имитиране на всичко - от бивш романтичен партньор до видна международна личност.
За да смекчи тази заплаха, Microsoft казва, че „е възможно да се изгради модел за откриване, за да се разграничи дали аудио клипът е бил синтезиран от VALL-E.“ Компанията казва, че ще използва и собствена Принципи на ИИ когато развива работата си. Тези принципи обхващат области като справедливост, безопасност, поверителност и отчетност.
VALL-E е само последният пример за експериментите на Microsoft с AI. Напоследък компанията работи по интегриране на ChatGPT в Bing, използвайки AI за направете резюме на срещите си в Teams, и присаждане на разширени инструменти в приложения като Outlook, Word и PowerPoint. И според Semafor, Microsoft търси инвестира $10 милиарда в създателя на ChatGPT OpenAI, компания, в която вече е инвестирал значителни средства.
Въпреки очевидните рискове, инструменти като VALL-E могат да бъдат особено полезни в медицината, например, за да помогнат на хората да възвърнат гласа си след инцидент. Възможността за възпроизвеждане на реч с такъв малък входен набор може да бъде изключително обещаваща в тези ситуации, при условие че се направи правилно. Но с всички пари, изразходвани за AI - както от Microsoft, така и от други - е ясно, че няма да изчезне скоро.
Препоръки на редакторите
- Топ автори изискват заплащане от фирми за изкуствен интелект за използване на работата им
- Най-добрите AI инструменти за редактиране на видео
- Създателят на ChatGPT OpenAI е изправен пред разследване на FTC относно законите за защита на потребителите
- Пробивите в ИИ могат да дойдат чрез мозъците на пчелите, твърдят учени
- OpenAI изгражда нов екип, за да спре свръхинтелигентния AI да стане измамник
Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.