5 manieren waarop toekomstige A.I. assistenten zullen stemtechnologie naar een hoger niveau tillen

Appel

Sinds Siri in 2011 debuteerde op de iPhone 4s, zijn stemassistenten van een onwerkbare gimmick uitgegroeid tot de basis voor slimme luidsprekertechnologie die in één op de zes Amerikaanse huizen te vinden is.

Inhoud

  • Mo’ kennis, minder problemen
  • Meer (en betere) personalisatie
  • Proactief worden
  • Het draait allemaal om de feedback
  • Nieuwe interactiemethoden

“Vóór Siri, toen ik sprak over [wat ik doe] waren er blanco blikken”, zegt Tom Hebner, hoofd innovatie bij Nuance-communicatie, dat geavanceerde A.I. spraaktechnologie, vertelde Digital Trends. “Mensen zouden zeggen: ‘Bouw jij die vreselijke telefoonsystemen? Ik haat je.’ Dat was de enige interactie van één groep mensen met stemtechnologie.”

Aanbevolen video's

Dat is vandaag de dag niet meer het geval. Volgens eMarketer-voorspellingen, bijna 100 miljoen smartphone gebruikers zullen in 2020 stemassistenten gebruiken. Maar terwijl A.I. assistenten zijn geen nieuwigheid meer, we staan ​​nog aan het begin van hun evolutie. Er is nog een lange weg te gaan voordat ze de belofte die stemassistenten als productcategorie hebben volledig waarmaken.

Hier zijn vijf manieren waarop de technologie kan worden verbeterd om deze slimmer en efficiënter te maken – en ons daardoor te helpen een productiever leven te leiden. Noem ze ‘voorspellingen’ of een ‘verlanglijstje’, dit zijn de uitdagingen die moeten worden opgelost.

Mo’ kennis, minder problemen

Alexa kan je vertellen wat het weer is in Kuala Lumpur, Maleisië; het totale aantal Amerikaanse dollars dat u krijgt voor 720 Zuid-Afrikaanse Rand, en hoe u ‘disestablishmentarianisme’ spelt. Maar consumenten-AI assistenten zijn in wezen het digitale equivalent van een persoon met een compleet up-to-date pakket encyclopedieën. Je krijgt (hopelijk) de juiste informatie, maar er is geen professioneel expertiseniveau.

“De uitdaging van de systemen in je huis is dat ze zo’n breed scala aan dingen proberen te doen”, vertelde Hebner aan Digital Trends.

Dit is lastig op te lossen, maar als je dit wel doet, verandert het spel. Nuance ontwikkelt veel gespecialiseerde systemen die zijn gericht op één specifieke gebruikssituatie, zoals het helpen van vliegtuigklanten bij het beantwoorden van vragen of het helpen van artsen bij het maken van aantekeningen. Dit betekent niet alleen dat deze systemen kunnen inzoomen om meer gedetailleerde informatie te verkrijgen, maar betekent ook dat er meer intelligentie kan worden ingebakken. “Mensen waren erg enthousiast over computers die woorden konden begrijpen, maar dat maakt niet per se uit als je niet weet wat je met die woorden moet doen,” zei Hebner.

Een voorbeeld dat hij geeft is dat van een Nuance-systeem dat niet alleen begrijpt wanneer artsen een lijst met mogelijke medicijnen voor patiënten voorlezen, maar ook potentiële conflicten kan signaleren. Dit gaat veel verder dan de mogelijkheden van de meeste gebruikers-AI. assistenten.

Het hebben van een meer specialistische, gedetailleerde kennis van verschillende domeinen – iets gezinspeeld door Alexa Skills – kan transformatief zijn. Je slimme luidspreker om juridisch of medisch advies vragen, klinkt op het eerste gezicht gek. Maar die zijn er geweest buitengewone vooruitgang op gebieden als juridische bots, terwijl een onlangs gepubliceerd rapport suggereert dat Apple wil dat Siri dit kan hebben gezondheidsgerichte gesprekken met gebruikers tegen 2021.

Specialistische kennisgrafieken voor A.I. assistenten zijn momenteel het spul van sciencefictiondromen, hoewel a recent Voicebot.ai-rapport laat zien hoe snel de vaardigheden van virtuele assistenten zich uitbreiden. Wanneer vaardigheden zich echter op het terrein van specialiteiten begeven, staat ons een traktatie te wachten!

Meer (en betere) personalisatie

Personalisatie van de huidige slimme luidsprekers staat nog in de kinderschoenen. U kunt het accent van de stemassistenten wijzigen en het geslacht weergeven, vaardigheden toevoegen of verwijderen en stukjes informatie invoeren, zoals uw naam en werkplek. In sommige gevallen kunt u meerdere stemprofielen instellen Google huis herkent de individuele leden van uw huishouden.

Amazon Echo-show

Maar er is nog een lange weg te gaan – hoewel het sap de moeite waard zou moeten zijn. Mattersight Corporation heeft A.I. callcentertechnologie, gebeld Voorspellende gedragsroutering, dat de spraakpatronen van bellers analyseert en vergelijkt met menselijke agenten met compatibele persoonlijkheidstypes. Volgens het bedrijf zal het matchen van een persoon met een compatibele persoonlijkheid resulteren in een succesvol gesprek dat slechts de helft van de tijd duurt, naast dat van een persoon met een conflicterend persoonlijkheidstype.

Het gebruik van een vergelijkbare aanpak zou ertoe kunnen leiden dat A.I. assistenten die tegen u praten zoals u graag aangesproken wilt worden. Dat kan zoiets simpels zijn als het matchen van het accent en het stemvolume van de persoon met wie ze praten. Of het zou de manier kunnen veranderen waarop het ideeën aanpakt door voor sommige gebruikers misschien meer emotionele woorden te gebruiken, vergeleken met meer gedetailleerde informatie die het voor anderen zou kunnen gebruiken. Misschien willen sommige mensen een stemassistent waarmee ze uitgebreid kunnen chatten, terwijl anderen gewoon willen dat iemand de benodigde informatie op de meest beknopte manier overbrengt. AI assistenten moeten tot beide in staat zijn.

Technologieën zoals Google Duplex laten zien hoe overtuigend nauwkeurig door AI gegenereerde gesynthetiseerde stemmen en gesprekken worden. Nu AI's zich op terreinen begeven die complexer zijn dan het opdienen van liedjesverzoeken en voedseltimers, kun je verwachten dat deze technologie een grote rol gaat spelen.

Dit zou kunnen worden bevorderd door doorbraken in het vermogen om gebruikers met hun stem te identificeren. Hebner merkt op dat de technologie van Nuance gebruikers kan identificeren via slechts één enkele seconde audio. “Vroeger duurde het tien seconden om te begrijpen wie je bent, om een ​​accuraat signaal te krijgen”, zei hij. “De kracht daarvan is aanzienlijk.” Het kunnen identificeren van gebruikers aan de hand van een klein stemfragment lost het probleem op wachtwoordprobleem, en biedt de mogelijkheid om stemassistenten te gebruiken voor meer delicate vertrouwelijkheid informatie.

Proactief worden

Een goede assistent zal iets doen als je erom vraagt. Een geweldige assistent hoeft niet te worden gevraagd. Op dit moment is A.I. assistenten bevinden zich nog in deze eerste fase. Gebruikers kunnen het gewenste nummer of de herinnering krijgen die ze nodig hebben, maar doorgaans alleen als hier expliciet om wordt gevraagd. Naarmate mensen zich meer op hun gemak voelen met stemassistenten, is er een geweldige kans voor hen om van louter reactieve apparaten over te stappen naar proactieve apparaten.

Er zijn grote vragen over de vraag of mensen bepaalde taken wel of niet aan machines willen overdragen.

Wat zou jij vinden van een A.I. assistent die namens u beslissingen neemt? Dit kan van alles zijn, van het hoger zetten van de thermostaat als iemand zegt dat hij het koud heeft of het omboeken van een lunch vergadering omdat u te laat komt, om u aan te sporen meer te gaan sporten of beter te worden in het redden van uw agenda salaris. Naarmate er steeds meer slimme apparaten in huis komen, zal het aantal dingen dat een stemassistent mogelijk kan bedienen enorm toenemen.

Onderdeel hiervan is een sociale vraag over hoe comfortabel mensen zijn als machines van hun kant beslissingen nemen. Er zijn grote vragen over de vraag of mensen bepaalde taken wel of niet aan machines willen overdragen. Zie het als het geven van uw creditcard en huissleutels aan uw assistent van vlees en bloed – alleen met een veel grotere hoeveelheid Skynet. Het nadeel is dat je een bepaalde mate van controle verliest. Het potentiële voordeel is dat u uw vrije tijd vergroot. Natuurlijk is er een grote technische uitdaging…

Het draait allemaal om de feedback

Tom Hebner wees op een grote uitdaging op het gebied van proactiviteit: hoe weten onze machines wanneer ze het goed hebben? Terugkomend op het idee van het goede vs. geweldige assistent, een geweldige assistent kan al uw bestanden klaar hebben voor een grote vergadering, zonder dat u erom hoeft te vragen. Maar wat als het de verkeerde bestanden zijn? Een groot probleem bij het maken van thuis-AI. assistenten die proactiever zijn, is dat er momenteel beperkte manieren zijn om te onthullen of we de informatie wel of niet de juiste informatie krijgen.

AI is goed peper de robot
Tomohiro Ohsumi/Getty Images

"Als ik elke dag om hetzelfde liedje vraag als ik mijn huis binnenloop, en de dag dat ik binnenkom en het begint gewoon te spelen, hoe weten ze dan dat ze het goed hebben?" zei Hebner. “Als ik het niet stop met spelen, betekent dat dan dat het goed is? Als ik ‘stop’ zeg, betekent dat dan dat het fout is gegaan en dat het dit nooit meer mag doen? Het feedbackmechanisme is een van de redenen waarom je geen proactievere systemen krijgt.”

Dit is een uitdaging voor ingenieurs om erachter te komen. Iedereen die ooit een stagiair heeft gehad die hem om instructie en feedback vroeg over elke afzonderlijke taak, weet dat het soms gemakkelijker is om een ​​taak zelf te doen dan deze te delegeren. Een A.I. assistent is er om uw leven wrijvingslozer te maken; niet om u elke dag tientallen mini-enquêtes te geven om te bevestigen of het zijn werk goed heeft gedaan. Dit moet worden opgelost op een manier die de gebruiksvriendelijkheid van deze apparaten niet schaadt, en er is niet veel training vooraf nodig voordat systemen uw voorkeuren leren kennen.

Wat is het antwoord? Ik weet het niet zeker. Maar zoals Steve Jobs ooit zei: het is niet de taak van de klant om dit uit te zoeken.

Nieuwe interactiemethoden

Er zit een scène in 2001: Een ruimte-odyssee waarin de moordzuchtige HAL 9000, verontrustend nog steeds de bekendste fictieve A.I. assistent in de geschiedenis, onthult dat het niet alleen microfoons gebruikt om te bepalen wat er tegen hem wordt gezegd. Wanneer twee bemanningsleden een locatie proberen te kiezen waar ze willen spreken waarvan ze weten dat HAL het niet kan horen, onthult HAL dat hij ze nog steeds kan verstaan. gebaseerd op het lezen van hun lipbeweging.

2001: Een ruimte-odyssee

Eng moment van de film? Zeker. Een voorbeeld van hoe A.I. zouden assistenten in de toekomst kunnen werken? Eh, zeker!

Het idee dat stemassistenten beperkt moeten blijven tot stem, vermindert het mogelijke aantal manieren waarop ze nuttig met ons kunnen communiceren. Met de opkomst van gezichtsherkenning En technologieën voor het volgen van emoties, er wordt voortdurend een steeds groter aantal biometrische gegevens over gebruikers verzameld, en zelfs de mogelijkheid daartoe technologie voor het lezen van gedachten aan de horizonzijn er tal van verschillende signalen die door A.I. assistenten om hun conclusies te trekken.

Het idee dat we over tien jaar alleen nog maar stem zullen gebruiken om deze A.I. assistenten is alsof je begin jaren 80 naar pc's kijkt en denkt dat we nooit meer dan een toetsenbord tot onze beschikking zullen hebben.

Aanbevelingen van de redactie

  • Emotiegevoelige A.I. is hier, en het zou in je volgende sollicitatiegesprek kunnen zijn
  • De nieuwe campus van Apple in Seattle kan grote dingen betekenen voor Siri, kunstmatige intelligentie
  • Google heeft een manier gevonden om AI te gebruiken. om het nut van windenergie te vergroten