5 formas en que la futura A.I. Los asistentes llevarán la tecnología de voz al siguiente nivel.

Manzana

Desde que Siri debutó en el iPhone 4s en 2011, los asistentes de voz han pasado de ser un truco inviable a la base de la tecnología de altavoces inteligentes que se encuentra en uno de cada seis hogares estadounidenses.

Contenido

  • Más conocimiento, menos problemas
  • Más (y mejor) personalización
  • Ser proactivo
  • Se trata de la retroalimentación
  • Nuevos métodos de interacción

"Antes de Siri, cuando hablaba de [lo que hago] había miradas en blanco", dijo Tom Hebner, jefe de innovación de Comunicaciones de matices, que desarrolla inteligencia artificial de vanguardia. tecnología de voz, dijo a Digital Trends. “La gente decía: '¿Construyes esos horribles sistemas telefónicos? Te odio. Esa fue la única interacción de un grupo de personas con la tecnología de voz”.

Vídeos recomendados

Ese ya no es el caso hoy. Según las previsiones de eMarketer, casi 100 millones teléfono inteligente Los usuarios utilizarán asistentes de voz en 2020. Pero mientras A.I. Los asistentes ya no son una novedad, todavía estamos en el inicio de su evolución. Queda un largo camino por recorrer antes de que cumplan plenamente la promesa que tienen los asistentes de voz como categoría de producto.

Aquí hay cinco formas en que la tecnología podría mejorar para hacerla más inteligente y eficiente y, como resultado, ayudarnos a llevar vidas más productivas. Llámelos “predicciones” o “lista de deseos”, estos son los desafíos que deben resolverse.

Más conocimiento, menos problemas

alexa puedo decirle cuál es el clima en Kuala Lumpur, Malasia; la cantidad total de dólares estadounidenses que obtendrá por 720 rands sudafricanos y cómo se escribe “desestablecimiento”. Pero IA del consumidor Los asistentes son, en esencia, el equivalente digital de una persona con un conjunto completo de datos actualizados. enciclopedias. Obtendrá (con suerte) la información correcta, pero no existe un nivel de experiencia profesional allí.

"El desafío que enfrentan los sistemas en su hogar es que hay una gama muy amplia de cosas que están tratando de hacer", dijo Hebner a Digital Trends.

Este es un problema difícil de resolver, pero hacerlo cambiaría las reglas del juego. Nuance desarrolla muchos sistemas especializados destinados a un caso de uso específico, como ayudar a los clientes de las aerolíneas a responder consultas o a los médicos a tomar notas. Hacerlo no sólo significa que estos sistemas pueden profundizar para obtener información más detallada, sino que también significa que se puede incorporar más inteligencia. "La gente estaba muy entusiasmada con las computadoras que podían entender palabras, pero eso no necesariamente importa si no sabes qué hacer con esas palabras", dijo Hebner.

Un ejemplo que da es el de un sistema Nuance que no sólo entiende cuándo los médicos leen una lista de posibles medicamentos para los pacientes, sino que también puede señalar posibles conflictos. Esto está mucho más allá de las capacidades de la mayoría de los sistemas de IA de nivel de usuario. asistentes.

Sin embargo, tener un conocimiento más especializado y detallado de diferentes dominios es algo que insinuado por Alexa Skills – podría ser transformador. Pedirle consejo legal o médico a su altavoz inteligente suena, a primera vista, una locura. Pero ha habido Avances extraordinarios en campos como los robots legales., mientras que un informe publicado recientemente sugiere que Apple quiere que Siri pueda tener Conversaciones centradas en la salud con los usuarios para 2021..

Gráficos de conocimiento especializados para A.I. Los asistentes son materia de sueños de ciencia ficción en este momento, aunque un informe reciente de Voicebot.ai muestra cuán rápidamente se están expandiendo las habilidades de los asistentes virtuales. Sin embargo, cuando las habilidades pasen al terreno de las especialidades, ¡nos espera un placer!

Más (y mejor) personalización

La personalización de los parlantes inteligentes actuales aún está en sus primeras etapas. Puede cambiar el acento de los asistentes de voz y el género de presentación, agregar o eliminar habilidades y proporcionarles información como su nombre y lugar de trabajo. En algunos casos, puede configurar varios perfiles de voz para que Página principal de Google reconocerá a los miembros individuales de su hogar.

Espectáculo de eco de Amazon

Pero todavía queda un largo camino por recorrer, aunque vale la pena exprimir el jugo. Mattersight Corporation ha desarrollado A.I. tecnología de call center, llamada Enrutamiento de comportamiento predictivo, que analiza los patrones de habla de las personas que llaman y los compara con agentes humanos con tipos de personalidad compatibles. Según la empresa, hacer coincidir a una persona con una personalidad compatible dará como resultado una llamada exitosa que durará sólo la mitad del tiempo, en comparación con la de una persona con un tipo de personalidad conflictiva.

Usar un enfoque similar podría resultar en que la A.I. asistentes que le responden como le gusta que se dirijan a usted. Podría ser algo tan simple como hacer coincidir el acento y el volumen de voz de la persona con la que están hablando. O podría cambiar la forma en que aborda las ideas quizás usando palabras más emotivas para algunos usuarios, en comparación con información más densa y detallada que podría usar para otros. Tal vez algunas personas quieran un asistente de voz con quien charlar extensamente, mientras que otras simplemente quieran que uno les transmita la información necesaria de la manera más concisa posible. AI. los asistentes deben ser capaces de ambas cosas.

Tecnologías como Google Dúplex muestra cuán convincentemente precisas se están volviendo las voces y conversaciones sintetizadas generadas por IA. A medida que las IA avanzan hacia áreas más complejas que la de servir solicitudes de canciones y cronómetros de comida, se espera que esta tecnología desempeñe un papel importante.

Esto podría verse favorecido por avances en la capacidad de identificar usuarios por voz. Hebner señala que la tecnología de Nuance puede identificar a los usuarios con tan solo un segundo de audio. “Solía ​​tomar 10 segundos entender quién era usted y obtener una señal precisa”, dijo. "El poder de eso es significativo". Ser capaz de identificar a los usuarios con un pequeño fragmento de voz resuelve el problema. problema de contraseña y abre la oportunidad de utilizar asistentes de voz para asuntos confidenciales más delicados. información.

Ser proactivo

Un buen asistente hará algo cuando se lo pidas. No será necesario que se lo preguntes a un gran asistente. En este momento, A.I. Los asistentes aún se encuentran en esta primera etapa. Los usuarios pueden obtener la canción que desean o el recordatorio que necesitan, pero generalmente solo cuando se lo solicita explícitamente. A medida que las personas se sienten más cómodas con los asistentes de voz, existe una gran oportunidad para que pasen de ser dispositivos puramente reactivos a dispositivos proactivos.

Hay grandes interrogantes sobre si la gente quiere o no dejar ciertos trabajos en manos de las máquinas.

¿Cómo te sentirías acerca de una A.I. ¿Asistente que toma decisiones en su nombre? Estos podrían ser cualquier cosa, desde subir el termostato cuando alguien dice que tiene frío o volver a reservar un almuerzo. reunirse porque llega tarde, hasta incitarlo a hacer más ejercicio o mejorar en el ahorro de su cheque de pago. A medida que más y más dispositivos inteligentes lleguen a los hogares, aumentará considerablemente el número de cosas que un asistente de voz podría controlar.

Parte de esto es una cuestión social sobre qué tan cómoda se siente la gente con que las máquinas tomen decisiones por su parte. Hay grandes interrogantes sobre si la gente quiere o no dejar ciertos trabajos en manos de las máquinas. Piense en ello como darle su tarjeta de crédito y las llaves de su casa a su asistente de carne y hueso, solo que con una pizca mucho mayor de Skynet. La desventaja es renunciar a una cierta cantidad de control. La ventaja potencial es aumentar su tiempo libre. Por supuesto, existe un gran desafío técnico...

Se trata de la retroalimentación

Tom Hebner señaló un gran desafío con la cuestión de la proactividad: ¿cómo saben nuestras máquinas si lo han hecho bien? Volviendo a la idea del bien vs. Un gran asistente, un gran asistente podría tener todos sus archivos listos antes de una gran reunión, sin que usted tenga que pedírselo. ¿Pero qué pasa si son los archivos equivocados? Un gran problema a la hora de crear A.I. en casa. Lo que hace que los asistentes sean más proactivos es que actualmente existen formas limitadas de revelar si estamos obteniendo la información correcta o no.

AI. es buena pimienta el robot
Tomohiro Ohsumi/Getty Images

“Si pido la misma canción todos los días cuando entro a mi casa, y luego el día que entro y comienza a sonar, ¿cómo saben que la interpretaron bien?” dijo Hebner. “Si no dejo de reproducirlo, ¿eso significa que está bien? Si digo "para", ¿significa eso que se equivocó y que no debería volver a hacerlo nunca más? El mecanismo de retroalimentación es una de las razones por las que no se obtienen sistemas más proactivos”.

Esto es un desafío para los ingenieros. Cualquiera que haya tenido un pasante que le haya pedido instrucción y comentarios sobre cada tarea sabe que a veces es más fácil hacer un trabajo uno mismo que delegarlo. Una IA el asistente está ahí para hacer tu vida más sencilla; no para darle docenas de mini encuestas cada día para confirmar si ha hecho bien su trabajo. Esto deberá resolverse de una manera que no perjudique la facilidad de uso de estos dispositivos y que no requiera mucha capacitación inicial antes de que los sistemas aprendan sus preferencias.

¿Cuál es la respuesta? No estoy seguro. Pero, como dijo una vez Steve Jobs, no es trabajo del cliente resolverlo.

Nuevos métodos de interacción

Hay una escena en 2001: Una odisea en el espacio en el que el asesino HAL 9000, desconcertantemente aún la IA ficticia más famosa. asistente de la historia, revela que no sólo utiliza micrófonos para determinar lo que se le dice. Cuando dos miembros de la tripulación intentan elegir un lugar para hablar donde saben que HAL no puede oír, HAL revela que aún puede entenderlos. basado en la lectura del movimiento de sus labios.

2001: Una odisea en el espacio

¿Momento aterrador de la película? Seguro. Un ejemplo de cómo la A.I. ¿Los asistentes podrían trabajar en el futuro? ¡UM, seguro!

La idea de que los asistentes de voz deberían limitarse a la voz disminuye la cantidad posible de formas en que podrían interactuar de manera útil con nosotros. Con el ascenso de reconocimiento facial y tecnologías de seguimiento de emociones, un número cada vez mayor de datos biométricos recopilados sobre los usuarios de forma constante, e incluso la posibilidad de Tecnología de lectura de mentes en el horizonte, hay muchas señales diferentes que la IA podría utilizar. asistentes para sacar sus conclusiones.

La idea de que, dentro de 10 años, solo usaremos la voz para controlar estas IA. asistentes es como mirar las PC de principios de los 80 y pensar que nunca tendremos más que un teclado a nuestra disposición.

Recomendaciones de los editores

  • IA con detección de emociones está aquí, y podría estar en tu próxima entrevista de trabajo
  • El nuevo campus de Apple en Seattle puede significar grandes cosas para Siri y la inteligencia artificial
  • Google ha encontrado una manera de utilizar la A.I. para potenciar la utilidad de la energía eólica