Новото AI приложение на Meta има за цел да помогне както на хората, така и на NPC да говорят

Meta (по-рано Facebook) представя първото си предложение за изкуствен интелект, откакто индустрията за генериране на AI избухна в края на 2022 г.

Генераторът на текст към аудио на марката, наречен Voicebox, се очаква да бъде гласов еквивалент на ChatGPT, който обработва текстови подкани в подробни писмени резултати, и Dall-E което създава реалистични произведения на изкуството. Voicebox от своя страна ще може да приема текстови указания и да произвежда аудио клипове, според Engadget.

Audio-Technica AT-SB727 Sound Burger заден панел и ремък за носене.
Саймън Коен / Цифрови тенденции

След като обучихме новия генератор на над „50 000 часа нефилтрирано аудио“, включително обществено достояние реч и преписи на английски, френски, испански, немски, полски и португалски. Voicebox е подготвен да развива резултати в разговорно звучаща реч на различни налични езици. Meta също така твърди, че техният модел има един процент влошаване на процента грешки в сравнение с други модели.

Свързани

  • Новите AI инструменти на Zoom ще ви позволят да се откажете от срещите завинаги
  • Meta ще представи AI агенти на „милиарди хора“
  • Meta иска да зареди Wikipedia с надграждане на AI

Според изследователите на Meta, моделът е бил обучен, като е бил накаран да предсказва блокове от реч в рамките на транскрипция, вместо да се налага да разработва набор от работа от нулата. Инструментът също има способността да редактира аудио клипове за нежелан шум или грешно изречени думи, по подобен начин на софтуер за редактиране на неподвижни изображения, като напр. Адобе Фотошоп.

Препоръчани видеоклипове

Meta заяви, че в момента не планира да пуска публично приложението Voicebox или изходния код поради „потенциалните рискове от злоупотреба.” Това е разбираемо, тъй като наскоро Федералното бюро за разследване (ФБР) издаде предупреждение за нарастващата употреба на дълбоко фалшиво съдържание в престъпления, включително изнудване, шантаж и тормоз.

Компанията пусна аудио мостри с изследователската си статия, представяща приложението. Той също така подробно описва потенциални бъдещи планове за подпомагане на „пациенти с увреждане на гласните струни, NPC в играта и цифрови асистенти“.

Meta е в интересна позиция да се опитва да бъде в крак с текущите тенденции в индустрията. Въпреки че има няколко модела от своите слушалки Meta Quest VR, изглежда, че компанията вече не върви напред с плановете си да разработи своите концепция за метавселена в полза на повече иновации в ИИ. Междувременно Apple наскоро представи първия си Слушалки Vision Pro и инвестира във виртуална реалност. В момента Apple не е показала голям интерес към AI.

Препоръки на редакторите

  • Сенаторите ще получат уроци по изкуствен интелект преди регулаторните решения
  • Новото приложение ChatGPT на OpenAI е безплатно за iPhone и iPad
  • Шефът на Meta Зукърбърг казва, че новият екип изгражда „персони с изкуствен интелект“

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.