5 façons dont la future IA les assistants feront passer la technologie vocale au niveau supérieur

Pomme

Depuis que Siri a fait ses débuts sur l'iPhone 4 en 2011, les assistants vocaux sont passés du statut de gadget inutilisable à la base de la technologie de haut-parleur intelligent que l'on retrouve dans un foyer américain sur six.

Contenu

  • Mo' connaissances, moins de problèmes
  • Plus (et meilleure) de personnalisation
  • Être proactif
  • Tout est question de feedback
  • De nouvelles méthodes d'interaction

"Avant Siri, quand je parlais de [ce que je fais], il y avait des regards vides", Tom Hebner, responsable de l'innovation chez Nuance Communications, qui développe des technologies d'IA de pointe. technologie vocale, a déclaré à Digital Trends. « Les gens disaient: « Construisez-vous ces horribles systèmes téléphoniques? Je te déteste.’ C’était la seule interaction d’un groupe de personnes avec la technologie vocale.

Vidéos recommandées

Ce n’est plus le cas aujourd’hui. Selon les prévisions d'eMarketer, près de 100 millions téléphone intelligent les utilisateurs utiliseront des assistants vocaux d’ici 2020. Mais même si l’A.I. les assistants ne sont plus une nouveauté, nous sommes encore au début de leur évolution. Il y a un long chemin à parcourir avant qu’ils ne tiennent pleinement la promesse que les assistants vocaux ont en tant que catégorie de produits.

Voici cinq façons dont la technologie pourrait s’améliorer pour la rendre plus intelligente et plus efficace – et ainsi nous aider à mener une vie plus productive. Appelez-les « prédictions » ou « liste de souhaits », tels sont les défis qui doivent être résolus.

Mo' connaissances, moins de problèmes

Alexa peut vous dire quel temps il fait à Kuala Lumpur, en Malaisie; le nombre total de dollars américains que vous obtiendrez pour 720 rands sud-africains et comment épeler « désestablishmentarianisme ». Mais IA consommateur les assistants sont, par essence, l’équivalent numérique d’une personne disposant d’un ensemble complet de données à jour. encyclopédies. Vous obtenez (espérons-le) les bonnes informations, mais il n’y a pas de niveau d’expertise de niveau professionnel.

"Le défi que rencontrent les systèmes de votre maison est qu'ils essaient de faire un très large éventail de choses", a déclaré Hebner à Digital Trends.

C’est un problème difficile à résoudre, mais cela changerait la donne. Nuance développe de nombreux systèmes spécialisés destinés à un cas d'utilisation spécifique, comme aider les clients des compagnies aériennes à répondre à des questions ou les médecins à prendre des notes. Cela signifie non seulement que ces systèmes peuvent explorer en profondeur pour obtenir des informations plus détaillées, mais également que davantage d'informations peuvent être intégrées. "Les gens étaient très enthousiasmés par les ordinateurs capables de comprendre les mots, mais cela n'a pas nécessairement d'importance si vous ne savez pas quoi faire avec ces mots", a déclaré Hebner.

Un exemple qu'il donne est celui d'un système Nuance qui non seulement comprend quand les médecins lisent une liste de médicaments potentiels pour les patients, mais qui pourrait également signaler des conflits potentiels. C’est bien au-delà des capacités de la plupart des outils d’IA destinés aux utilisateurs. assistants.

Cependant, avoir une connaissance plus approfondie et plus spécialisée de différents domaines — quelque chose évoqué par Alexa Skills – pourrait être transformateur. Demander à votre haut-parleur intelligent des conseils juridiques ou médicaux semble, à première vue, fou. Mais il y a eu des avancées extraordinaires dans des domaines comme les robots légaux, alors qu'un rapport récemment publié suggère qu'Apple souhaite que Siri puisse avoir conversations axées sur la santé avec les utilisateurs d’ici 2021.

Graphiques de connaissances spécialisés pour l’IA. les assistants font actuellement partie des rêves de science-fiction, même si un rapport récent de Voicebot.ai montre à quelle vitesse les compétences des assistants virtuels se développent. Mais lorsque les compétences évolueront sur le terrain des spécialités, nous allons nous régaler !

Plus (et meilleure) de personnalisation

La personnalisation des enceintes intelligentes d’aujourd’hui en est encore à ses balbutiements. Vous pouvez modifier l’accent et le sexe des assistants vocaux, ajouter ou supprimer des compétences et leur fournir des informations telles que votre nom et votre lieu de travail. Dans certains cas, vous pouvez configurer plusieurs profils vocaux afin que Accueil Google reconnaîtra les membres individuels de votre foyer.

Spectacle d'écho d'Amazon

Mais il reste encore un long chemin à parcourir, même si le jus en vaut la peine. Mattersight Corporation a développé l'IA. technologie de centre d'appels, appelée Routage comportemental prédictif, qui analyse les modèles de parole des appelants et les met en relation avec des agents humains ayant des types de personnalité compatibles. Selon l'entreprise, la mise en relation d'une personne ayant une personnalité compatible se traduira par un appel réussi qui ne durera que la moitié du temps, à côté de celui d'une personne ayant un type de personnalité conflictuel.

L’utilisation d’une approche similaire pourrait permettre à l’A.I. des assistants qui vous répondent comme vous aimez qu'on s'adresse à vous. Cela pourrait être quelque chose d’aussi simple que de faire correspondre l’accent et le volume de la voix de la personne avec qui elle parle. Ou bien, il pourrait changer la façon dont il aborde les idées en utilisant peut-être des mots plus émotifs pour certains utilisateurs, par rapport à des informations plus détaillées et plus denses qu'il pourrait utiliser pour d'autres. Peut-être que certaines personnes souhaitent qu'un assistant vocal puisse discuter longuement, tandis que d'autres souhaitent simplement qu'il transmette les informations nécessaires de la manière la plus concise possible. I.A. les assistants doivent être capables des deux.

Des technologies comme Google Duplex montrez à quel point les voix et les conversations synthétisées générées par l’IA sont d’une précision convaincante. À mesure que les IA évoluent dans des domaines plus complexes que la diffusion de demandes de chansons et de minuteries de repas, attendez-vous à voir cette technologie jouer un rôle majeur.

Cela pourrait être facilité par des avancées dans la capacité d’identifier les utilisateurs par la voix. Hebner note que la technologie de Nuance peut identifier les utilisateurs à partir d’une seule seconde d’audio. « Avant, il fallait 10 secondes pour comprendre qui vous êtes et obtenir un signal précis », a-t-il déclaré. "Le pouvoir de cela est important." Être capable d'identifier les utilisateurs par un petit extrait de voix résout le problème problème de mot de passe, et ouvre la possibilité d'utiliser des assistants vocaux pour des informations confidentielles plus délicates information.

Être proactif

Un bon assistant fera quelque chose lorsque vous le lui demanderez. Un excellent assistant n’aura pas besoin de demander. À l’heure actuelle, A.I. les assistants en sont encore à cette première étape. Les utilisateurs peuvent obtenir la chanson qu’ils souhaitent ou le rappel dont ils ont besoin, mais généralement uniquement lorsque cela a été explicitement demandé. À mesure que les gens se familiarisent avec les assistants vocaux, ils ont une excellente opportunité de passer du statut d’appareil purement réactif à celui d’appareil proactif.

De grandes questions se posent quant à savoir si les gens souhaitent ou non confier certains travaux aux machines.

Que penseriez-vous d’une I.A. assistant prenant des décisions en votre nom? Cela peut aller d'augmenter le thermostat lorsque quelqu'un dit qu'il a froid ou de modifier la réservation d'un déjeuner. réunion parce que vous êtes en retard, pour vous inciter à faire plus d'exercice ou à mieux économiser votre chèque de paie. À mesure que de plus en plus d’appareils intelligents font leur entrée dans la maison, le nombre de choses qu’un assistant vocal pourrait éventuellement commander augmentera considérablement.

Il s’agit en partie d’une question sociale: à quel point les gens sont-ils à l’aise avec le fait que les machines prennent des décisions à leur place. De grandes questions se posent quant à savoir si les gens souhaitent ou non confier certains travaux aux machines. Pensez-y comme si vous donniez votre carte de crédit et vos clés de maison à votre assistant en chair et en os – seulement avec une pincée beaucoup plus importante de Skynet. L’inconvénient est de renoncer à un certain contrôle. L’avantage potentiel est d’augmenter votre temps libre. Bien sûr, il y a un gros défi technique…

Tout est question de feedback

Tom Hebner a souligné un défi majeur lié à la question de la proactivité: comment nos machines savent-elles qu'elles fonctionnent correctement? Revenant à l’idée du bien contre. excellent assistant, un excellent assistant pourrait avoir tous vos fichiers avant une grande réunion, sans que vous ayez besoin de le demander. Mais que se passe-t-il s’il s’agit de mauvais fichiers? Un gros problème avec la création d’une IA domestique. Les assistants sont plus proactifs car il existe actuellement des moyens limités de révéler si les informations que nous obtenons sont correctes ou non.

I.A. c'est du bon poivre le robot
Tomohiro Ohsumi/Getty Images

"Si je demande la même chanson tous les jours quand j'entre chez moi, et qu'un jour j'entre et qu'elle commence à jouer, comment savent-ils qu'ils ont bien compris ?" dit Hebner. « Si je ne l’arrête pas de jouer, est-ce que ça veut dire que c’est vrai? Si je dis « stop », cela signifie-t-il qu’il s’est trompé et qu’il ne devrait plus jamais recommencer? Le mécanisme de feedback est l’une des raisons pour lesquelles vous ne disposez pas de systèmes plus proactifs.

C’est une question difficile à comprendre pour les ingénieurs. Quiconque a déjà eu un stagiaire qui lui a demandé des instructions et des commentaires sur chaque tâche sait qu'il est parfois plus facile de faire un travail soi-même que de le déléguer. Une I.A. l'assistant est là pour rendre votre vie plus fluide; pas pour vous faire faire des dizaines de mini-enquêtes chaque jour pour confirmer s’il a bien fait son travail. Ce problème devra être résolu d’une manière qui ne paralyse pas la convivialité de ces appareils et ne nécessite pas beaucoup de formation préalable avant que les systèmes n’apprennent vos préférences.

Quelle est la réponse? Je ne suis pas sûr. Mais, comme l’a dit un jour Steve Jobs, ce n’est pas au client de le comprendre.

De nouvelles méthodes d'interaction

Il y a une scène dans 2001: Une odyssée de l'espace dans lequel le meurtrier HAL 9000, encore déconcertant le plus célèbre personnage fictif d'IA. assistant en histoire, révèle qu’il n’utilise pas seulement des microphones pour déterminer ce qu’on lui dit. Lorsque deux membres de l'équipage tentent de choisir un endroit pour parler là où ils savent que HAL ne peut pas entendre, HAL révèle qu'il peut toujours les comprendre. basé sur la lecture du mouvement de leurs lèvres.

2001: Une odyssée de l'espace

Moment effrayant du film? Bien sûr. Un exemple de la façon dont l'IA. les assistants pourraient-ils travailler à l’avenir? Um sûr!

L’idée selon laquelle les assistants vocaux devraient se limiter à la voix diminue le nombre possible de façons dont ils pourraient interagir utilement avec nous. Avec la montée de la reconnaissance faciale et technologies de suivi des émotions, un nombre toujours croissant de données biométriques collectées en permanence sur les utilisateurs, et même la possibilité de une technologie de lecture des pensées à l'horizon, il existe de nombreux signaux différents qui pourraient être utilisés par l'IA. assistants pour tirer leurs conclusions.

L’idée selon laquelle, dans 10 ans, nous n’utiliserons que la voix pour contrôler ces I.A. Les assistants, c’est comme regarder des PC au début des années 80 et penser que nous n’aurons jamais plus qu’un clavier à notre disposition.

Recommandations des rédacteurs

  • L'IA qui détecte les émotions est là, et cela pourrait être lors de votre prochain entretien d'embauche
  • Le nouveau campus d'Apple à Seattle pourrait signifier de grandes choses pour Siri et l'intelligence artificielle
  • Google a trouvé un moyen d'utiliser l'IA. pour accroître l’utilité de l’énergie éolienne