Nova IBM Speech Tech pretende ser sobre-humana

IBM tem revelou o ViaVoice 4.4 incorporado, que oferece reconhecimento de comando de forma livre, serviços de tradução e legendagem em tempo real, e pode afirmar compreender algumas nuances do inglês falado. A tecnologia foi projetada para permitir que os usuários controlem sistemas incorporados em veículos, dispositivos portáteis e outros dispositivos não computacionais. aplicativos para falar de forma flexível e natural com os dispositivos sem ter que memorizar e pronunciar cuidadosamente falas predefinidas comandos.

Como exemplo de “reconhecimento de comando de forma livre”, a IBM oferece que um comando para mudar uma estação de rádio em um carro para 104,3 FM, os usuários podem fale diversos comandos, como “Mudar para 104,3”, “Sintonizar 104,3 FM” ou “Definir a estação de rádio para 104,3”. Habilitando o sistema para compreender uma gama maior de comandos intuitivos permitirá que a tecnologia de reconhecimento de voz seja usada com mais sucesso em uma gama mais ampla de formulários. O ViaVoice agora usa análise estatística e semântica de comandos para interpretar comandos fora de um conjunto pré-definido e memorizado, e modelagem acústica aprimorada proporcionam maior precisão em condições ruidosas e onde a fala é interrompida por transientes ruídos.

Vídeos recomendados

Dois outros projetos de reconhecimento de fala da IBM, MASTOR e Tales, oferecem duas novas direções intrigantes para a pesquisa da fala. MASTOR (Multilingual Automatic Speech-to-Speech Translator), um projeto de pesquisa da IBM, pode traduzir dinamicamente a fala do inglês para o chinês mandarim. Um usuário fala ao microfone em inglês e o MASTOR traduz a frase para o mandarim na hora. MASTOR usa análise estatística da entrada falada, primeiro descompilando a frase em um conjunto de estruturas e padrões conceituais e, em seguida, compilar uma frase traduzida no idioma alvo usando esses mesmos padrões. Alguma latência é inevitável em sistemas como este

Recomendações dos Editores

  • O melhor software de fala para texto para 2022
  • Tecnologia de reconhecimento facial para ursos visa manter os humanos seguros
  • A IBM não desenvolverá ou pesquisará mais tecnologia de reconhecimento facial

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.