La tecnología de reconocimiento de voz está en todas partes hoy en día, sobre todo en AI. asistentes inteligentes como Alexa de Amazon, Siri de Apple y el Asistente de Google. Pero como sabrá cualquiera que haya tenido una conversación en la vida real (en la vida real), el habla no se trata solo de las palabras que dice una persona, sino del tono de voz en el que las dice. Es una de las razones por las que las conversaciones de texto en línea pueden ser una pesadilla, ya que las palabras básicas en sí mismas no permiten matices suficientes para transmitir siempre el significado de una persona.
Una startup interesante que busca inyectar más comprensión en el reconocimiento de voz es oto, un spin-off de la prestigiosa SRI Internacional, que ayudó a generar Siri hace más de una década. Oto está trabajando en una tecnología de entonación de voz que permitirá, al menos inicialmente, a los centros de llamadas comprender mejor las emociones vocales de quienes llaman y de los agentes de ventas por igual.
Vídeos recomendados
“En Oto, nuestra misión es desbloquear la empatía en las máquinas y, para ello, hemos desarrollado DeepTone, una tecnología única basada en redes neuronales profundas entrenadas en cientos de miles de conversaciones reales para registrar pequeñas variaciones en las emociones presentes en el habla”, dijo a Digital Nicolas Perony, cofundador y director de tecnología de Oto. Tendencias.
Relacionado
- Probablemente no puedas alcanzar velocidades de reloj máximas en el Ryzen 9 7950X de AMD
- El helicóptero Ingenuity de Marte realiza su vuelo número 23, no se puede detener
- Este SSD es uno de los más rápidos que hemos visto, pero probablemente no puedas usarlo
Estas pequeñas variaciones, descritas como “estados latentes del hablante”, permiten registrar el tono emocional de las palabras de un hablante en tiempo real, muchas veces por segundo. El sistema se entrenó en una base de datos de 100.000 expresiones de 3.000 personas, extraídas de 2 millones de conversaciones de ventas.
"Las aplicaciones de la entonación son casi infinitas", afirmó Teo Borschberg, cofundador y director ejecutivo. “Estamos entrando en un mundo en el que la voz es lo primero. Pronto hablarás con todo: tu coche, tu reloj, tu nevera, tus parlantes [y más]. Captar los matices del habla será clave para crear conversaciones significativas. Actualmente trabajamos en la calidad humana de las conversaciones en los contact center. Hasta ahora, no es realmente posible juzgar la calidad experiencial de una llamada basándose únicamente en el texto; es demasiado ambiguo”.
A través de la tecnología de Oto, se puede solicitar a los agentes de ventas en tiempo real que pongan “la energía adecuada” durante las llamadas, y al mismo tiempo muestren suficiente empatía con el cliente. "El valor es que, por primera vez, los centros de llamadas pueden medir la calidad de las experiencias y actuar sobre esta información a escala para evitar que los clientes enojados abandonen sus servicios", dijo Borschberg.
Oto anunció recientemente una ronda de financiación inicial de 5,3 millones de dólares. Esto se utilizará para hacer crecer los equipos de ingeniería y ventas de la empresa. También le ayudará a ampliar aún más su oferta tecnológica para comprender nuevas emociones y comportamientos a través de la voz.
Recomendaciones de los editores
- La versión de Chrome de Nvidia DLSS está lista para lanzarse, pero aún no puedes usarla
- La nueva MacBook Pro M2 de Apple no puede soportar el calor, ¿aún deberías comprarla?
- Se filtró el nuevo y genial teléfono para juegos de Lenovo, pero no puedes comprarlo
- ¿Tu Amazon Echo, Alexa o Ring están caídos hoy? no estas solo
- Google lanza una colección de moda Material You para Pixel 6 que en realidad no puedes usar
Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.