Вештачка интелигенција (АИ) је имајући тренутак сада, а ветар наставља да му дува у једра са вестима да Мајкрософт ради на вештачкој интелигенцији која може да имитира било чији глас након кратког узорка од три секунде.
Нови алат, назван ВАЛЛ-Е, обучен је за отприлике 60.000 сати гласовних података на енглеском језику, за који Мицрософт каже да је „стотине пута већи од постојећих система“. Користећи то знање, његови креатори тврде да му је потребно само мало гласовног уноса да би се разумело како да реплицира глас корисника.
![човек говори у телефон](/f/cd7d144624280a34f84f21e2840a782e.jpg)
Још импресивније, ВАЛЛ-Е може да репродукује емоције, вокалне тонове и акустично окружење које се налази у сваком узорку, нешто са чиме су се други гласовни АИ програми борили. То му даје реалистичнију ауру и приближава његове резултате нечему што би могло проћи као прави људски говор.
Повезан
- ГПТ-4: како користити АИ цхатбот који доводи ЦхатГПТ у срамоту
- Гоогле Бард сада може да говори, али може ли да пригуши ЦхатГПТ?
- Нова АИ компанија Елона Муска има за циљ да „разуме универзум“
У поређењу са другим конкурентима за претварање текста у говор (ТТС), Мицрософт каже да ВАЛЛ-Е „значајно надмашује најсавременији ТТС систем нулте слике у погледу говора природност и сличност говорника“. Другим речима, ВАЛЛ-Е звучи много више као прави људи него супарнички АИ који наилазе на аудио улазе које нису обучени на.
Препоручени видео снимци
На ГитХуб-у, Мицрософт је направио а мала библиотека узорака креиран помоћу ВАЛЛ-Е. Резултати су углавном врло импресивни, са много узорака који репродукују тон и акценат гласова говорника. Неки од примера су мање убедљиви, што указује да ВАЛЛ-Е вероватно није готов производ, али у целини резултат је убедљив.
Огроман потенцијал — и ризици
![Особа која обавља видео позив на Мицрософт Сурфаце уређају који користи Виндовс 11.](/f/d8ee217ada1a5024d555042df629a097.jpg)
У а рад који представља ВАЛЛ-Е, Мицрософт објашњава да ВАЛЛ-Е „може носити потенцијалне ризике у злоупотреби модела, као што је лажирање гласа идентификација или лажно представљање одређеног говорника.” Тако способан алат за генерисање говора који реално звучи тхе спецтер оф све убедљивији деепфакес, који би могао да се користи за опонашање било чега, од бившег романтичног партнера до истакнуте међународне личности.
Да би ублажио ту претњу, Мицрософт каже да је „могуће изградити модел детекције да би се разликовало да ли је аудио снимак синтетизовао ВАЛЛ-Е“. Компанија каже да ће користити и своје АИ принципи када развија свој рад. Ти принципи покривају области као што су правичност, безбедност, приватност и одговорност.
ВАЛЛ-Е је само најновији пример Мицрософтовог експериментисања са вештачком интелигенцијом. Недавно је компанија радила на интегрисање ЦхатГПТ-а у Бинг, користећи АИ за резимирајте састанке својих тимова, и калемљење напредних алата у апликације као што су Оутлоок, Ворд и ПоверПоинт. А према Семафору, Мицрософт то жели уложите 10 милијарди долара у ОпенАИ произвођача ЦхатГПТ, компанија у коју је већ уложила значајна средства.
Упркос очигледним ризицима, алати попут ВАЛЛ-Е могу бити посебно корисни у медицини, на пример, да помогну људима да поврате свој глас након несреће. Могућност реплицирања говора са тако малим улазним скупом може бити изузетно обећавајућа у овим ситуацијама, под условом да се уради како треба. Али са свим новцем који се троши на АИ – и од стране Мицрософта и других – јасно је да неће нестати ускоро.
Препоруке уредника
- Врхунски аутори захтевају плаћање од АИ фирми за коришћење њиховог рада
- Најбољи АИ алати за уређивање видеа
- Произвођач ЦхатГПТ-а ОпенАИ суочава се са истрагом ФТЦ-а због закона о заштити потрошача
- Пробоји вештачке интелигенције могли би доћи преко мозгова пчела, кажу научници
- ОпенАИ гради нови тим како би спречио да суперинтелигентна вештачка интелигенција постане неваљала
Надоградите свој животни стилДигитални трендови помажу читаоцима да прате брзи свет технологије са свим најновијим вестима, забавним рецензијама производа, проницљивим уводницима и јединственим кратким прегледима.