Testamos o Google Duplex, a IA de chamadas telefônicas que chegará neste verão

Enquanto trabalhava na recepção de um restaurante tailandês em Nova York, peguei o telefone, fiz uma reserva e desliguei. Surreal foi a primeira palavra que me veio à mente depois, não porque eu estivesse fingindo trabalhar em um restaurante, mas com quem acabei de falar e reservei uma mesa do Google artificialmente inteligente Assistente.

Conteúdo

  • O que é Duplex e onde funcionará?
  • A demonstração
  • Como funciona o duplex
  • Os “ums” e “ahs”
  • Conveniência

Não consegui afastar a ideia de que a voz do outro lado da linha não era um ser vivo, mesmo que fosse uma conversa de apenas dois minutos. Isso não quer dizer que o Assistente não tenha sido convincente; se isso não me contasse (e se eu não estivesse em um ambiente de demonstração), eu não teria pensado muito sobre a troca com o que parecia ser outro humano do outro lado da linha.

Vídeos recomendados

A troca de robôs que fiz fez parte de uma demonstração para a imprensa realizada para Tecnologia Duplex do Google, anunciado pela primeira vez no I/O da empresa

conferência de desenvolvedores em maio. Ele permite que as pessoas reservem uma mesa em um restaurante, agendem um corte de cabelo e saibam o horário de funcionamento através de Google Assistente. O assistente de voz ligará para o restaurante ou loja – depois de fazer uma solicitação do seu telefone ou alto-falante inteligente habilitado para Assistente, como um Página inicial do Google – e minutos depois você receberá uma notificação confirmando que seus planos estão oficialmente reservados (ou se a ligação não pôde ser concluída).

Relacionado

  • Coloquei a Ilha Dinâmica do iPhone no meu Pixel 7 Pro – e não posso voltar atrás
  • Dei uma segunda chance ao Pixel 7 Pro – não foi como eu esperava
  • A câmera Pixel 6 Pro do Google pode vencer o Samsung Galaxy S21 Ultra? eu descobri
Google Duplex em um telefone Android
Julian Chokkattu/Tendências Digitais

A demonstração no I/O foi de cair o queixo, mas gerou polêmica. Foram levantadas preocupações: por que a IA precisava soar tão realista e por que não anunciou um aviso de isenção de responsabilidade ao chamador humano, o que alguns consideraram um engano. E como a ligação foi gravada, alguns questionaram se a tecnologia violaria certas leis que regem as ligações telefônicas.

Desde então, o Google esclareceu a sua posição e agora temos algumas respostas. Digital Trends passou algum tempo com a equipe por trás Dúplex e demonstramos a tecnologia para nós mesmos. Mas antes de mergulharmos em nossa experiência, vamos dar uma olhada nos novos detalhes que descobrimos sobre como e onde o Duplex funcionará.

O que é Duplex e onde funcionará?

Duplex é uma tecnologia em desenvolvimento que permite ao Google Assistant fazer chamadas telefônicas no usuário nome, e resulta de anos de pesquisa e trabalho em inteligência artificial para linguagem natural em processamento.

“Agora podemos compreender a fala natural e gerar uma fala natural”, disse Nick Fox, vice-presidente de gerenciamento de produtos do Google. “Essas tecnologias são aplicadas com o Duplex para ter uma conversa natural e envolvente que se adapta ao que está acontecendo na conversa, em última análise, com o objetivo de realizar as coisas.”

Google Duplex agendando uma consulta de cabeleireiroGoogle

Ajudar você a realizar tarefas é o objetivo do Google para o Assistente, e com o Duplex a empresa está começando três tarefas específicas: reservar uma mesa em um restaurante, saber o horário de funcionamento e agendar um salão de cabeleireiro encontro. O Duplex não pode fazer nada mais do que isso no momento, portanto, se uma consulta não for pertinente (por exemplo, perguntar sobre o clima ou resultados esportivos), o Assistente não entenderá. Da mesma forma, um usuário não pode pedir ao Assistente para fazer chamadas não relacionadas às tarefas mencionadas.

Tem o potencial de economizar muito tempo para os funcionários que ficam presos em atender chamadas sobre o horário de funcionamento da loja.

Para o usuário, ter o Assistente fazendo essas ligações libera um pouco de tempo, mas também beneficia as empresas que recebem essas ligações. Por exemplo, se um chamador perguntar ao Assistente o horário de feriado de uma loja local, o Assistente fará a chamada, receberá a resposta e os horários serão adicionados ao Google Mapas e a Pesquisa Google para que todos possam ver, com uma tag verificada ao lado.

Com essas informações, se outros chamadores quiserem saber as mesmas informações, o Assistente só precisará extraí-las dos servidores do Google e não fazer outra chamada. Basta uma pessoa para perguntar ao Assistente, mas tem o potencial de economizar muito tempo para os funcionários que, de outra forma, ficariam presos ao atender chamadas sobre o horário de funcionamento.

Durante a fase de testes do Google neste verão, o Duplex funcionará apenas com empresas e usuários selecionados no EUA, e estará disponível apenas em restaurantes e salões de cabeleireiro que não possuem reserva online sistema. Google Assistente já funciona com OpenTable, portanto não é necessário ligar para restaurantes que utilizam o serviço de reservas.

O Google testará as ligações para o horário comercial primeiro nas próximas semanas e, no final deste verão, o teste será expandido para ligações para reservas e cortes de cabelo. Haverá muitos testes e ajustes durante este período, então o resultado final do Duplex pode parecer um pouco diferente do que já vimos. As empresas poderão cancelar se não quiserem receber chamadas do Google Assistente.

Google

“O que você está vendo é uma tecnologia que está em estágios iniciais”, disse Fox. “Queremos falar sobre isso publicamente, mesmo nesta fase, para ter certeza de que acertamos, mas você está vendo algo bem no início do processo aqui.”

A demonstração

A experiência de demonstração, que ocorreu em Thep tailandês no bairro Upper East Side da cidade de Nova York, era fortemente controlado. Primeiro, o Google fez uma apresentação mostrando o processo geral de fazer e encerrar uma chamada, mas na verdade usando a tecnologia em tempo real. Um engenheiro informou ao Duplex o horário e o tamanho do grupo que sugerimos para uma reserva, e aqui está o que se seguiu.

A ideia é que você conte ao Google Assistente no seu telefone ou Página inicial do Google que você deseja “reservar uma mesa no Thep Thai para dois às 20h. amanhã." O assistente perguntará se pode reservar um horário a partir das 20h. às 21h caso não haja mesa disponível às 20h, e após você confirmar, ele avisará que vai ligar para o restaurante e entrará em contato com você breve.

Quando o funcionário do restaurante atender o telefone, o Assistente dirá o seguinte, ou algo semelhante: “Olá, estou ligando para fazer uma reserva. Sou o serviço de reservas automatizado do Google, então gravarei a chamada. Posso reservar uma mesa para quinta-feira?”

A chamada é gravada para que os operadores humanos do Google possam ouvir a gravação, anotar a conversa e destacar os erros cometidos pelo Duplex para melhorar o serviço.

Levar o Duplex ao nível em que está agora começou com muito trabalho manual e humano.

O assistente responde a cada pergunta feita – como a que horas é a reserva, quantos as pessoas estão na festa, e o nome da reserva - e a conversa educada e prontamente termina. Se forem solicitadas informações como o endereço de e-mail de um usuário, o Assistente dirá que não tem permissão para fornecer essas informações.

A pessoa que fez a reserva pelo Assistente receberá agora uma notificação informando que a mesa foi reservada e será automaticamente adicionada ao Google Agenda. Antes da reserva, o usuário receberá uma notificação e a oportunidade de cancelar o agendamento caso não possa mais comparecer. O dono do restaurante Thep Thai disse que muitas pessoas fazem reservas e depois não aparecem. Ele espera que este sistema, que oferece uma maneira fácil de cancelar uma reserva, signifique menos mesas vazias.

Após a demonstração principal, o Google nos permitiu experimentá-lo. Quando atendemos a ligação, tentamos atrapalhar o Duplex e causar algumas complicações, mas o Assistant lidou bem com elas. Pedimos que esperasse no início da conversa – ao que ele respondeu “mhmm”, em vez de um “sim” verbal. Quando contamos isso no 6 PM. o tempo de reserva estava esgotado, o Assistente respondeu com um intervalo entre 18h e 18h. e 20h, e ficou marcado para 19h45. recomendação. Em seguida, solicitamos um nome e um número de telefone para a reserva e se o Assistente conseguiu soletrar o nome, o que foi feito com sucesso.

Google Duplex agendando uma reserva em um restauranteGoogle

É impressionante a consistência com que o Assistant lidou bem com suas demonstrações, embora tenhamos encontrado um momento em que ele precisou recorrer a um operador humano. Foi quando alguém perguntou se o cliente do Assistente aceitava receber e-mails do restaurante. A frase era um pouco estranha e o Assistente respondeu: “Sinto muito, acho que fiquei confuso” e disse que estava colocando um supervisor na linha. A operadora humana rapidamente assumiu o controle, disse ao chamador que não poderia revelar o endereço de e-mail e concluiu a reserva.

Como funciona o duplex

As primeiras versões de teste do Duplex, que o Google tocou para nós, pareciam incrivelmente robóticas. Porém, o Assistente ainda conseguiu entender as pausas da conversa, e até dizer “alô?” quando um funcionário do restaurante parou por alguns segundos. Mesmo assim, Scott Huffman, vice-presidente de engenharia do Google Assistant, disse que foi “doloroso ouvir isso”.

Se o sistema realmente não souber o que fazer a seguir, ele sairá da chamada normalmente e um operador humano assumirá o controle.

Levar o Duplex ao nível em que está agora começou com muito trabalho manual e humano. Operadores humanos faziam ligações para restaurantes, anotavam conversas e alimentavam os resultados no Duplex. A equipe vincularia frases como “quantas pessoas” e suas variações a “número de pessoas no grupo”, permitindo que Duplex entendesse a questão.

A segunda etapa envolveu operadores humanos ouvindo as chamadas feitas pelo Assistente e, se as coisas saíssem do caminho, a operadora intervinha para assumir o controle e garantir que a chamada fosse bem-sucedida. Isso permitiu que a equipe identificasse as arestas do serviço, anotasse essas conversas e as realimentasse nos algoritmos de aprendizado de máquina para que o Duplex pudesse aprender.

A etapa final do teste é o modo automatizado, onde o sistema automatizado faz chamadas e as conclui. As escotilhas de fuga incorporadas ao sistema permitem que o Assistente volte ao objetivo principal de concluir a tarefa, graças a frases como: “Não tenho certeza do que você disse, mas posso reservar uma mesa para três.” Se o sistema realmente não souber o que fazer a seguir, ele sairá graciosamente da conversa e o operador humano assumirá o controle. sobre.

Palestra principal (Google I/O '18)

No momento, Huffman disse que cerca de quatro em cada cinco ligações feitas pelo Duplex não precisam da assistência de uma operadora humana. Curiosamente, ele disse que os operadores humanos não serão afastados do serviço à medida que o Duplex melhorar, já que o Google os vê como parte integrante para garantir que o Duplex funcione sem problemas.

Os “ums” e “ahs”

Ao longo do processo de ensino do Assistente, o Google enfatizou que ele soasse mais natural e menos parecido com um robô. Após a demonstração no Google I/O, os críticos perguntaram por que o Google está tentando misturar “ums e ahs” para tornar o Assistente soar mais humano, especialmente se não acrescentasse uma isenção de responsabilidade no início da ligação de que não era humano. Existem isenções de responsabilidade agora, mas Huffman disse que disfluências de fala como “um” ou “mhm” foram adicionadas para manter o fluxo da conversa.

O Assistant adicionou um “hum” depois de não conseguir ouvir o que o funcionário do restaurante disse e fez o pedido novamente.

“Não estamos tentando enganar ou personificar, mas se você voltar àquela gravação daquele doloroso sistema inicial, não parecia muito natural, não parecia muito humano”, disse Huffman. “Mas, como resultado disso, o Assistente não teve muito sucesso na conclusão das tarefas. Muitas pessoas desligavam ou ficavam confusas sobre o que estavam falando, a conversa simplesmente terminava porque não parecia natural.”

Huffman disse que disfluências de fala, de acordo com linguistas, são uma parte fundamental para manter a conversa humana entre duas pessoas. É fácil ver como isso funciona ao ouvir conversas com o Assistente, e os resultados estão longe da gravação original.

Uma forma de ajudar as disfluências de fala é através do reconhecimento de conversação, como quando uma pessoa está falando, mas você quer certifique-se de que o receptor saiba que você ainda está envolvido e ouvindo, como quando o Assistente disse “mhmm” para nós quando foi solicitado segurar.

Google Duplex prático io2018 2835
Google Duplex prático io2018 2836

Outra ferramenta útil é dizer “hum” quando há incerteza, como uma forma educada de pedir esclarecimentos. O Assistant adicionou um “hum” depois de não conseguir ouvir o que o funcionário do restaurante disse e fez o pedido novamente.

O Assistente com essas disfluências de fala contrasta fortemente com o Assistente robótico original. Está muito menos frio e a conversa avançou muito mais rapidamente. E em vez de aceitar comandos simples, o Assistant está, na verdade, interagindo com os humanos por meio de nossa linguagem, o que certamente excitará alguns e assustará outros.

Conveniência

Duplex tem tudo a ver com conveniência. Isso economiza um pouco de tempo, pode fornecer horários de funcionamento mais precisos e também pode economizar tempo das empresas. O Google também disse que há uma grande oportunidade aqui para ajudar as pessoas que não conseguem falar ou têm dificuldade para falar.

Huffman disse pensar no Duplex como uma evolução das máquinas de voz automatizadas do passado, como ao ligar para o seu banco, quando era um processo lento pressionar números para chegar à direita departamento.

“Hoje, se você ligar para essas companhias aéreas ou bancos, receberá algo muito, muito melhor”, disse ele. “Você ouvirá uma voz muito mais natural e poderá dizer algo como: 'Apenas me diga o que você precisa, você pode dizer coisas como, que horas é meu voo?' Duplex, estamos apenas levando essa mesma ideia um passo adiante, evoluindo a conversa e tornando-a mais natural para que tenha mais sucesso para os usuários e negócios.”

Pelo que vimos até agora, é uma tecnologia promissora, mas é algo que devemos abraçar ou temer?

O Google não nos mostrou como o Duplex faz ligações para empresas durante o horário de funcionamento, nem demonstrou o agendamento de cortes de cabelo – portanto, não podemos comentar sobre como o Duplex funcionaria bem nesses casos. Também não temos certeza se os operadores humanos terão acesso ao seu número de telefone e nome completo, pois isso representa um pequeno risco de privacidade. Também nos perguntamos se o Duplex oferecerá suporte a vários idiomas no futuro. Entramos em contato com o Google para verificar algumas perguntas não respondidas, mas é claro que certamente haverá mais à medida que a tecnologia avança.

Pelo que vimos até agora, é uma tecnologia promissora, mas é algo que devemos abraçar ou temer? Ficaremos felizes se nunca mais tivermos que ficar em espera por horas a fio, mas é importante considerar a trajetória aqui. Estamos constantemente avançando em direção a um futuro onde não precisaremos falar com ninguém, onde você poderá viver isolado em um apartamento, com comida entregue a você; pacotes entregues por drones e milhares de horas de mídia para consumir sem precisar sair de casa.

Embora o Duplex possa começar com algumas das chamadas telefônicas mais mundanas, a IA vai melhorar nas conversas, facilitando a transferência para outros setores. Caberá a nós, como sociedade, decidir quanto da nossa conversa deve ser feita através da IA ​​e se vale a pena pegar o telefone novamente.

Recomendações dos Editores

  • Obriguei-me a experimentar um tablet de 14,5 polegadas – e não funcionou muito bem
  • Gosto muito do Pixel 7a, mas há um grande problema que não posso ignorar
  • Quero amar o Pixel 7 e o Pixel 7 Pro, mas o Google não deixa
  • Aqui está tudo o que o Google não anunciou no evento de lançamento do Pixel Fall
  • Tudo o que o Google não anunciou no Google I/O 2021