5 maneiras pelas quais a futura IA. assistentes levarão a tecnologia de voz para o próximo nível

Maçã

Desde que a Siri estreou no iPhone 4s em 2011, os assistentes de voz deixaram de ser um artifício impraticável e se tornaram a base da tecnologia de alto-falantes inteligentes encontrada em um em cada seis lares americanos.

Conteúdo

  • Mais conhecimento, menos problemas
  • Mais (e melhor) personalização
  • Tornando-se proativo
  • É tudo uma questão de feedback
  • Novos métodos de interação

“Antes da Siri, quando eu falava sobre [o que eu faço], havia olhares vazios”, Tom Hebner, chefe de inovação da Nuance Comunicações, que desenvolve IA de ponta. tecnologia de voz, disse Digital Trends. “As pessoas diriam: ‘Você constrói esses sistemas telefônicos horríveis? Eu te odeio.’ Essa foi a única interação de um grupo de pessoas com a tecnologia de voz.”

Vídeos recomendados

Esse não é mais o caso hoje. De acordo com as previsões do eMarketer, quase 100 milhões Smartphone os usuários usarão assistentes de voz até 2020. Mas enquanto A.I. os assistentes já não são uma novidade, ainda estamos no início da sua evolução. Há um longo caminho a percorrer antes que eles cumpram totalmente a promessa que os assistentes de voz têm como categoria de produto.

Aqui estão cinco maneiras pelas quais a tecnologia pode melhorar para torná-la mais inteligente e eficiente – e, como resultado, nos ajudar a levar uma vida mais produtiva. Chame-os de “previsões” ou “lista de desejos”, esses são os desafios que precisam ser resolvidos.

Mais conhecimento, menos problemas

Alexa posso dizer como está o tempo em Kuala Lumpur, Malásia; o número total de dólares americanos que você receberá por 720 rands sul-africanos e como se escreve “desestabelecimento”. Mas IA do consumidor assistentes são, em essência, o equivalente digital de uma pessoa com um conjunto completo de informações atualizadas enciclopédias. Você obtém (espero) as informações corretas, mas não existe um nível de especialização profissional nisso.

“O desafio que os sistemas da sua casa enfrentam é que há uma ampla gama de coisas que eles estão tentando fazer”, disse Hebner ao Digital Trends.

Este é um problema difícil de resolver, mas fazê-lo seria uma virada de jogo. A Nuance desenvolve muitos sistemas especializados voltados para um caso de uso específico, como ajudar clientes de companhias aéreas a responder perguntas ou médicos a fazer anotações. Fazer isso não significa apenas que esses sistemas podem se aprofundar para obter informações mais detalhadas, mas também significa que mais inteligência pode ser incorporada. “As pessoas estavam muito entusiasmadas com os computadores que conseguem compreender palavras, mas isso não importa necessariamente se não sabemos o que fazer com essas palavras”, disse Hebner.

Um exemplo que ele dá é o de um sistema Nuance que não só compreende quando os médicos lêem uma lista de potenciais medicamentos para os pacientes, mas também pode identificar potenciais conflitos. Isso está muito além das capacidades da maioria dos sistemas de IA de nível de usuário. assistentes.

No entanto, ter um conhecimento mais especializado e detalhado de diferentes domínios — algo sugerido por Alexa Skills - pode ser transformador. Pedir conselhos jurídicos ou médicos ao seu alto-falante inteligente parece, à primeira vista, uma loucura. Mas houve avanços extraordinários em áreas como bots legais, enquanto um relatório publicado recentemente sugere que a Apple deseja que a Siri seja capaz de ter conversas focadas na saúde com usuários até 2021.

Gráficos de conhecimento especializado para IA assistentes são o sonho da ficção científica no momento, embora um relatório recente do Voicebot.ai mostra a rapidez com que o conjunto de habilidades dos assistentes virtuais está se expandindo. Porém, quando as habilidades passarem para o terreno das especialidades, teremos uma surpresa!

Mais (e melhor) personalização

A personalização dos alto-falantes inteligentes de hoje ainda está engatinhando. Você pode alterar o sotaque e o gênero de apresentação dos assistentes de voz, adicionar ou remover habilidades e fornecer informações como seu nome e local de trabalho. Em alguns casos, você pode configurar vários perfis de voz para que Página inicial do Google reconhecerá os membros individuais da sua família.

Amazon Eco Show

Mas ainda há um longo caminho a percorrer – embora valha a pena espremer o suco. A Mattersight Corporation desenvolveu IA. tecnologia de call center, chamada Roteamento Comportamental Preditivo, que analisa os padrões de fala dos chamadores e os compara com agentes humanos com tipos de personalidade compatíveis. Segundo a empresa, combinar uma pessoa com personalidade compatível resultará em uma ligação bem-sucedida que durará apenas metade do tempo, ao lado de uma pessoa com tipo de personalidade conflitante.

Usar uma abordagem semelhante pode resultar em IA. assistentes que respondem a você da maneira que você gostaria de ser tratado. Isso pode ser algo tão simples como combinar o sotaque e o volume da voz da pessoa com quem estão falando. Ou poderia mudar a forma como aborda ideias, talvez usando palavras mais emotivas para alguns usuários, em comparação com informações mais densas e detalhadas que poderia usar para outros. Talvez algumas pessoas queiram um assistente de voz para conversar longamente, enquanto outras simplesmente desejam que ele transmita as informações necessárias da maneira mais concisa possível. IA os assistentes devem ser capazes de ambos.

Tecnologias como Google Duplex mostram como as vozes e conversas sintetizadas geradas por IA são convincentemente precisas. À medida que as IAs avançam para áreas mais complexas do que apenas a distribuição de pedidos de música e cronômetros de comida, esperamos ver essa tecnologia desempenhar um papel importante.

Isto poderia ser auxiliado por avanços na capacidade de identificar usuários por voz. Hebner observa que a tecnologia da Nuance pode identificar usuários com apenas um único segundo de áudio. “Costumava levar 10 segundos para entender quem você é, para obter um sinal preciso”, disse ele. “O poder disso é significativo.” Ser capaz de identificar usuários por meio de um pequeno trecho de voz resolve o problema problema de senha e abre a oportunidade de usar assistentes de voz para informações confidenciais mais delicadas Informação.

Tornando-se proativo

Um bom assistente fará algo quando você pedir. Um ótimo assistente não precisa ser solicitado. Neste momento, A.I. os assistentes ainda estão nesta primeira fase. Os usuários podem obter a música que desejam ou o lembrete de que precisam, mas normalmente apenas quando solicitado explicitamente. À medida que as pessoas ficam mais confortáveis ​​com os assistentes de voz, há uma grande oportunidade para elas deixarem de ser dispositivos puramente reativos e passarem a ser dispositivos proativos.

Há grandes questões sobre se as pessoas querem ou não entregar determinados trabalhos às máquinas.

Como você se sentiria em relação a uma IA? assistente tomando decisões em seu nome? Isso pode ser qualquer coisa, desde ligar o termostato quando alguém diz que está com frio ou remarcar um almoço reunião porque você está atrasado, para incentivá-lo a fazer mais exercícios ou melhorar sua economia contracheque. À medida que mais e mais dispositivos inteligentes entram em casa, o número de coisas que um assistente de voz poderia comandar aumentará muito.

Parte disso é uma questão social sobre o quanto as pessoas se sentem confortáveis ​​com as máquinas tomando decisões da sua parte. Há grandes questões sobre se as pessoas querem ou não entregar determinados trabalhos às máquinas. Pense nisso como dar seu cartão de crédito e as chaves de casa ao seu assistente de carne e osso – só que com uma pitada muito maior de Skynet. A desvantagem é abrir mão de uma certa quantidade de controle. A vantagem potencial é aumentar seu tempo livre. Claro, há um grande desafio técnico…

É tudo uma questão de feedback

Tom Hebner apontou um grande desafio com a questão da proatividade: como nossas máquinas sabem quando acertaram? Voltando à ideia do bem vs. ótimo assistente, um ótimo assistente pode ter todos os seus arquivos disponíveis antes de uma grande reunião, sem que você precise pedir. Mas e se forem os arquivos errados? Um grande problema em tornar a IA doméstica assistentes mais proativos é que atualmente existem maneiras limitadas de revelar se estamos ou não recebendo as informações corretas.

IA é pimenta boa o robô
Tomohiro Ohsumi/Getty Images

“Se eu peço a mesma música todos os dias quando entro em minha casa, e no dia em que entro e ela começa a tocar, como eles sabem que acertaram?” Hebner disse. “Se eu não parar de tocar, isso significa que está certo? Se eu disser ‘pare’, isso significa que ele errou e nunca mais deveria fazer isso? O mecanismo de feedback é um dos motivos pelos quais você não está obtendo sistemas mais proativos.”

Isso é um desafio para os engenheiros descobrirem. Qualquer pessoa que já teve um estagiário pedindo instruções e feedback sobre cada tarefa sabe que às vezes é mais fácil fazer um trabalho sozinho do que delegá-lo. Uma IA o assistente está lá para tornar sua vida mais tranquila; não quero fazer dezenas de mini pesquisas todos os dias para confirmar se o trabalho foi feito corretamente. Isso precisará ser resolvido de uma forma que não prejudique a facilidade de uso desses dispositivos e não exija muito treinamento prévio antes que os sistemas aprendam suas preferências.

Qual é a resposta? Eu não tenho certeza. Mas, como Steve Jobs disse uma vez, não é função do cliente descobrir isso.

Novos métodos de interação

Há uma cena em 2001: Uma Odisseia no Espaço em que o assassino HAL 9000, desconcertantemente ainda o mais famoso A.I. assistente na história, revela que não usa microfones apenas para determinar o que lhe está sendo dito. Quando dois membros da tripulação tentam escolher um local para falar onde sabem que HAL não consegue ouvir, HAL revela que ainda consegue entendê-los. com base na leitura do movimento labial.

2001: Uma Odisseia no Espaço

Momento assustador do filme? Claro. Um exemplo de como a IA. assistentes poderiam trabalhar no futuro? Hum, claro!

A ideia de que os assistentes de voz devem ser limitados à voz diminui o número possível de maneiras pelas quais eles poderiam interagir conosco de forma útil. Com a ascensão de reconhecimento facial e tecnologias de rastreamento de emoções, um número cada vez maior de dados biométricos coletados constantemente sobre os usuários e até mesmo a possibilidade de tecnologia de leitura de mentes no horizonte, existem muitos sinais diferentes que podem ser usados ​​pela IA. assistentes para tirarem suas conclusões.

A ideia de que, daqui a 10 anos, usaremos apenas a voz para controlar essas IAs. assistentes é como olhar para os PCs do início dos anos 80 e pensar que nunca teremos mais do que um teclado à nossa disposição.

Recomendações dos Editores

  • IA com detecção de emoção está aqui e pode estar na sua próxima entrevista de emprego
  • O novo campus da Apple em Seattle pode significar grandes coisas para Siri, inteligência artificial
  • O Google encontrou uma maneira de usar IA. para aumentar a utilidade da energia eólica