Новата говорна технология на IBM има за цел да бъде свръхчовешка

IBM има представи Embedded ViaVoice 4.4, който предлага разпознаване на команди в свободна форма, услуги за превод и субтитри в движение и може да твърди, че разбира някои нюанси на говоримия английски. Технологията е предназначена да позволи на потребителите да контролират системи, вградени в превозни средства, преносими устройства и други некомпютърни приложения, за да говорят гъвкаво и естествено на устройства, без да се налага да запомняте и внимателно произнасяте предварително дефинирани говорими команди.

Като пример за „разпознаване на команда в свободна форма“, IBM предлага команда за промяна на радиостанция в кола на 104,3 FM, потребителите могат изговаряйте различни команди като „Промяна на 104.3“, „Настройте на 104.3 FM“ или „Настройте радиостанцията на 104.3“. Разрешаване на системата за разбирането на по-голям набор от интуитивни команди ще позволи технологията за гласово разпознаване да се използва по-успешно в по-широк диапазон от приложения. ViaVoice вече използва статистически и семантичен анализ на команди, за да интерпретира команди извън предварително дефиниран, запаметен набор, и подобреното акустично моделиране осигурява по-голяма точност в шумни условия и където речта е прекъсната от преходни шумове.

Препоръчани видеоклипове

Два други проекта за разпознаване на реч в IBM, MASTOR и Tales, предлагат две интригуващи нови насоки за изследване на речта. МАСТОР (Multilingual Automatic Speech-to-Speech Translator), изследователски проект на IBM, може динамично да превежда английска реч на мандарин китайски. Потребител говори в микрофон на английски, а MASTOR превежда изречението на мандарин в движение. MASTOR използва статистически анализ на устния вход, като първо декомпилира изречението в набор от структурни и концептуални модели, след което компилиране на преведено изречение на целевия език, като се използват същите модели. Известно забавяне е неизбежно в системи като тази

Препоръки на редакторите

  • Най-добрият софтуер за говор към текст за 2022 г
  • Технологията за лицево разпознаване на мечки има за цел да предпази хората в безопасност
  • IBM повече няма да разработва или изследва технологии за разпознаване на лица

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.