IBM tiene presentó ViaVoice 4.4 integrado, que ofrece reconocimiento de comandos de forma libre, traducción sobre la marcha y servicios de subtitulado, y puede afirmar que comprende algunos matices del inglés hablado. La tecnología está diseñada para permitir a los usuarios controlar sistemas integrados en vehículos, dispositivos portátiles y otros dispositivos no informáticos. aplicaciones para hablar de forma flexible y natural con dispositivos sin tener que memorizar y pronunciar cuidadosamente voces predefinidas comandos.
Como ejemplo de “reconocimiento de comando de forma libre”, IBM ofrece que un comando para cambiar una estación de radio en un automóvil a 104.3 FM, los usuarios pueden pronuncie diversos comandos como "Cambiar a 104.3", "Sintonizar 104.3 FM" o "Configurar la estación de radio en 104.3". Permitir que el sistema comprender una mayor gama de comandos intuitivos permitirá que la tecnología de reconocimiento de voz se utilice con mayor éxito en una gama más amplia de aplicaciones. ViaVoice ahora utiliza análisis estadístico y semántico de comandos para interpretar comandos fuera de un conjunto memorizado predefinido. y el modelado acústico mejorado proporciona mayor precisión en condiciones ruidosas y donde el habla se ve interrumpida por transitorios. ruidos.
Vídeos recomendados
Otros dos proyectos de reconocimiento de voz de IBM, MASTOR y Tales, ofrecen dos nuevas e interesantes direcciones para la investigación del habla. MAESTRO (Traductor automático multilingüe de voz a voz), un proyecto de investigación de IBM, puede traducir dinámicamente el habla del inglés al chino mandarín. Un usuario habla por un micrófono en inglés y MASTOR traduce la frase al mandarín sobre la marcha. MASTOR utiliza análisis estadístico de la entrada hablada, primero descompilando la oración en un conjunto de estructuras y patrones conceptuales, y luego compilar una oración traducida en el idioma de destino usando esos mismos patrones. Algo de latencia es inevitable en sistemas como este.
Recomendaciones de los editores
- El mejor software de conversión de voz a texto para 2022
- La tecnología de reconocimiento facial para osos tiene como objetivo mantener seguros a los humanos
- IBM ya no desarrollará ni investigará tecnología de reconocimiento facial
Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.