Нова мовна технологія IBM прагне бути надлюдською

IBM має представив вбудований ViaVoice 4.4, який пропонує розпізнавання команд у довільній формі, послуги перекладу та субтитрів на льоту та може претендувати на розуміння деяких нюансів розмовної англійської мови. Ця технологія розроблена, щоб дозволити користувачам керувати системами, вбудованими в транспортні засоби, кишенькові пристрої та інші некомп’ютерні програми, щоб гнучко та природно спілкуватися з пристроями без необхідності запам’ятовувати та ретельно вимовляти попередньо визначені розмовні слова команди.

Як приклад «розпізнавання команд довільної форми» IBM пропонує команду змінити радіостанцію в автомобілі на 104,3 FM, користувачі можуть промовляйте різноманітні команди, наприклад «Змінити на 104.3», «Налаштувати на 104.3 FM» або «Налаштувати радіостанцію на 104.3». Увімкнення системи для розуміння більшого діапазону інтуїтивно зрозумілих команд дозволить більш успішно використовувати технологію розпізнавання голосу в більш широкому діапазоні програми. ViaVoice тепер використовує статистичний і семантичний аналіз команд для інтерпретації команд поза попередньо визначеним, запам’ятованим набором, а покращене акустичне моделювання забезпечує більшу точність у шумних умовах і там, де мова переривається через перехідні процеси шуми.

Рекомендовані відео

Два інших проекти розпізнавання мовлення в IBM, MASTOR і Tales, пропонують два інтригуючих нових напрямки для дослідження мовлення. МАСТОР (Multilingual Automatic Speech-to-Speech Translator), дослідницький проект IBM, може динамічно перекладати англійську мову китайською мовою. Користувач говорить у мікрофон англійською мовою, а MASTOR на ходу перекладає речення на мандарин. MASTOR використовує статистичний аналіз усного введення, спочатку декомпілюючи речення на набір структурних і концептуальні шаблони, а потім складання перекладеного речення цільовою мовою, використовуючи ті самі візерунки. Деякі затримки неминучі в таких системах

Рекомендації редакції

  • Найкраще програмне забезпечення для перетворення мовлення в текст на 2022 рік
  • Технологія розпізнавання облич ведмедів спрямована на безпеку людей
  • IBM більше не розроблятиме та не досліджуватиме технологію розпізнавання обличчя

Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.