Probamos Google Duplex, la IA para llamadas telefónicas que llegará este verano

Mientras trabajaba en la recepción de un restaurante tailandés de la ciudad de Nueva York, cogí el teléfono, hice una reserva y colgué. Surrealista fue la primera palabra que me vino a la mente después, no porque estuviera fingiendo trabajar en una restaurante, pero con el que acabo de hablar y reservar una mesa del Google artificialmente inteligente Asistente.

Contenido

  • ¿Qué es Duplex y dónde funcionará?
  • la demostración
  • Cómo funciona Dúplex
  • Los “ums” y los “ahs”
  • Conveniencia

No podía dejar de pensar que la voz al otro lado de la línea no era un ser vivo, aunque solo fuera una conversación de dos minutos. Eso no quiere decir que el Asistente no fuera convincente; si no me lo hubiera dicho (y si no estuviera en un entorno de demostración), no habría pensado mucho en el intercambio con lo que parecía ser otro humano al otro lado de la línea.

Vídeos recomendados

El intercambio de robots que tuve fue parte de una demostración de prensa realizada durante La tecnología dúplex de Google, anunciado por primera vez en el I/O de la compañía

conferencia de desarrolladores en mayo. Permite a las personas reservar una mesa en un restaurante, programar una cita para un corte de pelo y conocer el horario de la tienda a través de Asistente de Google. El asistente de voz llamará al restaurante o tienda, después de realizar una solicitud desde su teléfono o altavoz inteligente habilitado para el Asistente, como un Página principal de Google – y minutos después recibirás una notificación confirmando que tus planes están reservados oficialmente (o si no se pudo completar la llamada).

Relacionado

  • Puse Dynamic Island del iPhone en mi Pixel 7 Pro y no puedo volver atrás
  • Le di una segunda oportunidad al Pixel 7 Pro: no salió como esperaba
  • ¿Puede la cámara del Pixel 6 Pro de Google vencer al Samsung Galaxy S21 Ultra? Lo descubrí
Google Duplex en un teléfono Android
Julian Chokkattu/Tendencias digitales

La demostración en I/O fue asombrosa, pero no estuvo exenta de controversia. Surgieron preocupaciones: ¿por qué la IA necesitaba sonar tan realista y por qué no anunciaba un descargo de responsabilidad a la persona que llamaba, lo que equivalía a lo que algunos consideraban un engaño? Y debido a que la llamada fue grabada, algunos cuestionaron si la tecnología violaría ciertas leyes que rigen las llamadas telefónicas.

Desde entonces, Google ha aclarado su posición y ahora tenemos algunas respuestas. Digital Trends pasó algún tiempo con el equipo detrás Dúplex y demostramos la tecnología por nosotros mismos. Pero antes de sumergirnos en nuestra experiencia, echemos un vistazo a los nuevos detalles que hemos descubierto sobre cómo y dónde funcionará Duplex.

¿Qué es Duplex y dónde funcionará?

Duplex es una tecnología en desarrollo que permite al Asistente de Google realizar llamadas telefónicas en el teléfono del usuario. nombre, y surge de años de investigación y trabajo en inteligencia artificial para el lenguaje natural Procesando.

"Ahora podemos entender el habla natural y podemos generarla", dijo Nick Fox, vicepresidente de gestión de productos de Google. "Esas tecnologías se aplican con Duplex para tener una conversación natural y atractiva que se adapta a lo que sucede dentro de la conversación, en última instancia, con el objetivo de hacer las cosas".

Google Duplex programando una cita con el cabelloGoogle

Ayudarte a hacer las cosas es el objetivo de Google para el Asistente, y con Duplex la empresa está empezando con tres tareas específicas: reservar una mesa en un restaurante, encontrar el horario de la tienda y programar una peluquería cita. Duplex no puede hacer nada más que esto en este momento, por lo que si una consulta no es pertinente (por ejemplo, sobre el clima o resultados deportivos), el Asistente no la entenderá. De manera similar, un usuario no puede pedirle al Asistente que realice llamadas no relacionadas con las tareas antes mencionadas.

Tiene el potencial de ahorrar mucho tiempo a los empleados que están atrapados respondiendo llamadas sobre el horario de la tienda.

Para el usuario, que el Asistente realice estas llamadas le libera un poco de tiempo, pero también beneficia a las empresas que reciben estas llamadas. Por ejemplo, si una persona que llama le pregunta al Asistente el horario festivo de una tienda local, el Asistente realizará la llamada, obtendrá la respuesta y el horario se agregará a mapas de Google y la Búsqueda de Google para que todos la vean, con una etiqueta de verificado al lado.

Con esta información, si otras personas que llaman quieren saber la misma información, el Asistente solo necesitará extraerla de los servidores de Google y no realizar otra llamada. Solo se necesita una persona para preguntarle al Asistente, pero tiene el potencial de ahorrar mucho tiempo a los empleados que, de lo contrario, se verían atrapados respondiendo llamadas sobre el horario de la tienda.

Durante la fase de prueba de Google este verano, Duplex solo funcionará con empresas y usuarios seleccionados en el EE. UU., y solo estará disponible en restaurantes y peluquerías que no tengan reserva online. sistema. Asistente de Google ya funciona con OpenTable, por lo que no es necesario llamar a los restaurantes que utilizan el servicio de reservas.

Google probará las llamadas en horario comercial primero en las próximas semanas y, más adelante este verano, la prueba se ampliará a llamadas para reservas y citas para cortes de pelo. Habrá muchas pruebas y ajustes durante este período, por lo que el resultado final de Duplex puede verse un poco diferente de lo que ya hemos visto. Las empresas podrán optar por no participar si no desean recibir llamadas del Asistente de Google.

Google

"Lo que estamos viendo es una tecnología que se encuentra en etapas muy tempranas", dijo Fox. "Queremos hablar de ello públicamente incluso en esta etapa para asegurarnos de que lo hacemos bien, pero aquí se está viendo algo bastante temprano en el proceso".

la demostración

La experiencia de demostración, que tuvo lugar en El tailandés en el barrio Upper East Side de la ciudad de Nueva York, estaba fuertemente controlado. Primero, Google realizó una presentación que muestra el proceso general de realizar y finalizar una llamada, pero utilizando la tecnología en tiempo real. Un ingeniero le indicó a Duplex la hora y el tamaño del grupo que sugerimos para una reserva, y esto es lo que siguió.

La idea es que le digas al Asistente de Google en tu teléfono o Página principal de Google que quieres “reservar una mesa en Thep Thai para dos a las 8 p.m. mañana." El asistente le preguntará si está bien reservar un horario de 8 p. m. a 9 p.m. en caso de que no haya mesa disponible a las 8 p.m., y después de confirmar, dirá que llamará al restaurante y se comunicará con usted pronto.

Cuando el empleado del restaurante levante el teléfono, el Asistente dirá lo siguiente, o algo parecido: “Hola, llamo para hacer una reserva. Soy el servicio de reservas automatizado de Google, así que grabaré la llamada. ¿Puedo reservar una mesa para el jueves?

La llamada se graba para que los operadores humanos de Google puedan escuchar la grabación, anotar la conversación y resaltar los errores que cometió Duplex para poder mejorar el servicio.

Llevar a Duplex al nivel en el que se encuentra ahora comenzó con mucho trabajo manual y humano.

El asistente continúa respondiendo a cada pregunta formulada, como para qué hora es la reserva, para cuántos hay personas en el grupo, y el nombre de la reserva, y la conversación cortés y pronta termina. Si se le solicita información como la dirección de correo electrónico de un usuario, el Asistente dirá que no tiene permiso para proporcionar esa información.

La persona que realizó la reserva a través del Asistente ahora recibirá una notificación indicando que la mesa ha sido reservada y se agregará automáticamente a Google Calendar. Antes de la reserva, el usuario recibirá una notificación y la oportunidad de cancelar la cita en caso de que ya no pueda asistir. El dueño del restaurante Thep Thai dijo que mucha gente hace reservaciones y luego no se presenta. Tiene la esperanza de que este sistema, que ofrece una manera fácil de cancelar una reserva, signifique menos mesas vacías.

Después de la demostración principal, Google nos permitió probarlo. Cuando atendimos la llamada, intentamos hacer tropezar a Duplex y presentamos algunas complicaciones, pero el Asistente las manejó bien. Le pedimos que esperara al comienzo de la conversación, a lo que respondió "mhmm", en lugar de un "sí" verbal. Cuando lo dijimos el 6 pm. El tiempo de reserva estaba completo, el Asistente respondió con un rango entre las 6 p.m. y las 8 p. m., y se conformó con nuestras 7:45 p. m. recomendación. Luego solicitamos un nombre y un número de teléfono para la reserva, y si el Asistente podía deletrear el nombre, lo cual hizo exitosamente.

Google Duplex programando una reserva en un restauranteGoogle

Es impresionante lo bien que el Asistente manejó sus demostraciones, aunque encontramos un momento en el que tuvo que recurrir a un operador humano. Fue cuando alguien preguntó si el cliente del Asistente estaba de acuerdo con recibir correos electrónicos del restaurante. La frase fue un poco incómoda y el asistente respondió: "Lo siento, creo que me confundí" y dijo que estaba poniendo a un supervisor en la línea. El operador humano rápidamente tomó el control, le dijo a la persona que llamó que no podía revelar la dirección de correo electrónico y terminó de realizar la reserva.

Cómo funciona Dúplex

Las primeras versiones de prueba de Duplex, que Google nos mostró, sonaban increíblemente robóticas. Sin embargo, el Asistente aún pudo entender las pausas en la conversación e incluso decir “¿hola?” cuando un empleado del restaurante hizo una pausa de unos segundos. Aún así, Scott Huffman, vicepresidente de Ingeniería del Asistente de Google, dijo que era "doloroso escucharlo".

Si el sistema realmente no sabe qué hacer a continuación, se retirará elegantemente de la llamada y un operador humano se hará cargo.

Llevar a Duplex al nivel en el que se encuentra ahora comenzó con mucho trabajo manual y humano. Los operadores humanos realizaron llamadas a restaurantes, anotaron conversaciones e introdujeron los resultados en Duplex. El equipo vincularía frases como “cuántas personas” y sus variaciones con “cantidad de personas en el grupo”, lo que permitiría a Duplex comprender la pregunta.

La segunda etapa involucró a operadores humanos que escuchaban las llamadas realizadas por el Asistente y, si las cosas se desviaban, el operador intervenía para hacerse cargo y asegurarse de que la llamada fuera exitosa. Esto permitió al equipo identificar las irregularidades del servicio, anotar esas conversaciones y retroalimentarlas a los algoritmos de aprendizaje automático para que Duplex pudiera aprender.

La etapa de prueba final es el modo automatizado, donde el sistema automatizado realiza llamadas y las completa. Las trampillas de escape integradas en el sistema permiten al Asistente regresar al objetivo clave de completar la tarea, gracias a frases como: "No estoy seguro de lo que dijiste, pero ¿puedo reservar una mesa para tres? Si el sistema realmente no sabe qué hacer a continuación, se retirará elegantemente de la conversación y el operador humano tomará la iniciativa. encima.

Conferencia magistral (Google I/O '18)

Por el momento, Huffman dijo que aproximadamente cuatro de cada cinco llamadas realizadas por Duplex no necesitan la asistencia de un operador humano. Curiosamente, dijo que los operadores humanos no serán retirados del servicio a medida que Duplex mejore, ya que Google los ve como una parte integral para garantizar que Duplex funcione sin problemas.

Los “ums” y los “ahs”

A lo largo del proceso de enseñanza del Asistente, Google puso énfasis en hacerlo sonar más natural y menos como un robot. Después de la demostración en Google I/O, los críticos preguntaron por qué Google intenta mezclar "ums y ahs" para crear el Asistente. Suena más humano, especialmente si no agregaba un descargo de responsabilidad al comienzo de la llamada de que no era un humano. Ahora hay descargos de responsabilidad, pero Huffman dijo que se agregaron faltas de fluidez en el habla como “um” o “mhm” para mantener el flujo de la conversación.

El asistente agregó un "um" después de que no pudo escuchar lo que dijo el empleado del restaurante y siguió con su solicitud nuevamente.

"No estamos tratando de engañar o suplantar, pero si regresas a esa grabación de ese doloroso sistema temprano, no sonó muy natural, no sonó muy humano", dijo Huffman. “Pero como resultado de eso, el Asistente no tuvo mucho éxito en completar las tareas. Mucha gente colgaba o se confundía acerca de con qué estaban hablando, la conversación simplemente se interrumpía porque no parecía natural”.

Huffman dijo que las faltas de fluidez en el habla, según lingüistas, son una parte clave para mantener la conversación humana entre dos personas. Es fácil ver qué tan bien funciona al escuchar conversaciones con el Asistente y los resultados están lejos de la grabación original.

Una forma en que ayudan las disfluencias del habla es mediante el reconocimiento conversacional, como cuando una persona está hablando, pero usted quiere asegúrese de que el receptor sepa que todavía está ocupado y escuchando, como cuando el Asistente nos dijo "mhmm" cuando se le pidió que lo hiciéramos. sostener.

Google dúplex manos a la obra io2018 2835
Google dúplex manos a la obra io2018 2836

Otra herramienta útil es decir "um" cuando hay incertidumbre, como una forma educada de pedir una aclaración. El asistente agregó un "um" después de que no pudo escuchar lo que dijo el empleado del restaurante y siguió con su solicitud nuevamente.

El Asistente con estas disfluencias en el habla es un marcado contraste con el Asistente robótico original. Hace mucho menos frío y la conversación avanzó mucho más rápidamente. Y en lugar de aceptar órdenes simples, el Asistente en realidad interactúa con los humanos a través de nuestro lenguaje, lo que seguramente entusiasmará a algunos y asustará a otros.

Conveniencia

El dúplex tiene que ver con la comodidad. Le ahorra un poco de tiempo, puede brindarle horarios de tienda más precisos y también puede ahorrar tiempo a las empresas. Google también dijo que aquí existe una gran oportunidad para ayudar a las personas que no pueden hablar o tienen problemas para hablar.

Huffman dijo pensar en Duplex como una evolución de las máquinas de voz automatizadas del pasado, como al llamar a su banco, cuando era un proceso lento de presionar números para llegar a la derecha departamento.

"Hoy en día, si llamas a esas aerolíneas o a esos bancos, obtendrás algo mucho, mucho mejor", dijo. “Escucharás una voz que suena mucho más natural y podría decir algo como: 'Solo dime lo que necesitas, puedes decir cosas como, ¿a qué hora es mi vuelo?' Duplex, en realidad estamos llevando la misma idea un paso más allá, evolucionando la conversación y haciéndola más natural para que sea más exitosa para los usuarios y negocios”.

Por lo que hemos visto hasta ahora, es una tecnología prometedora, pero ¿es algo que deberíamos adoptar o temer?

Google no nos ha mostrado cómo Duplex realiza llamadas a empresas durante el horario de atención de la tienda, ni nos ha mostrado cómo programar citas para cortes de pelo, por lo que no podemos comentar qué tan bien funcionaría Duplex en estos casos. Tampoco estamos seguros de si los operadores humanos tendrán acceso a su número de teléfono y nombre completo, ya que eso representa un riesgo para la privacidad. También nos preguntamos si Duplex admitirá varios idiomas en el futuro. Nos comunicamos con Google para verificar algunas preguntas sin respuesta, pero, por supuesto, seguramente habrá más a medida que avance la tecnología.

Por lo que hemos visto hasta ahora, es una tecnología prometedora, pero ¿es algo que deberíamos adoptar o temer? Seremos felices si nunca más tenemos que estar en espera durante horas y horas, pero es importante considerar la trayectoria aquí. Avanzamos constantemente hacia un futuro en el que no necesitemos hablar con nadie, en el que puedas vivir aislado en un apartamento y con la comida a domicilio; paquetes entregados por drones y miles de horas de medios para consumir sin tener que salir.

Si bien Duplex puede comenzar con algunas de las llamadas telefónicas más mundanas, la IA mejorará en las conversaciones, lo que facilitará la transferencia a otras industrias. Dependerá de nosotros como sociedad decidir qué parte de nuestra conversación debería realizarse a través de IA y si vale la pena volver a levantar el teléfono.

Recomendaciones de los editores

  • Me obligué a probar una tableta de 14,5 pulgadas y no me fue muy bien
  • Me gusta mucho el Pixel 7a, pero hay un gran problema que no puedo ignorar
  • Quiero amar el Pixel 7 y el Pixel 7 Pro, pero Google no me deja
  • Aquí está todo lo que Google no anunció en el evento de lanzamiento de Pixel Fall
  • Todo lo que Google no anunció en Google I/O 2021