5 måder, som fremtidens A.I. assistenter vil tage stemmeteknologi til næste niveau

click fraud protection
Æble

Siden Siri debuterede på iPhone 4s tilbage i 2011, er stemmeassistenter gået fra ubrugelig gimmick til grundlaget for smart højttalerteknologi, der findes i et ud af seks amerikanske hjem.

Indhold

  • Mo’ viden, færre problemer
  • Mere (og bedre) personalisering
  • At blive proaktiv
  • Det hele handler om feedback
  • Nye interaktionsmetoder

"Før Siri, da jeg talte om [hvad jeg gør], var der tomme blikke," Tom Hebner, innovationschef hos Nuance Communications, som udvikler banebrydende A.I. stemmeteknologi, fortalte Digital Trends. "Folk ville sige," Bygger du de forfærdelige telefonsystemer? Jeg hader dig.’ Det var en gruppe menneskers eneste interaktion med stemmeteknologi.”

Anbefalede videoer

Sådan er det ikke længere i dag. Ifølge eMarketers prognosernæsten 100 mio smartphone brugere vil bruge stemmeassistenter i 2020. Men mens A.I. assistenter er ikke længere en nyhed, vi er stadig i starten af ​​deres udvikling. Der er lang vej igen, før de fuldt ud lever op til det løfte, stemmeassistenter har som produktkategori.

Her er fem måder, hvorpå teknologien kan forbedres for at gøre den smartere og mere effektiv - og hjælpe os med at føre mere produktive liv som et resultat. Kald dem "forudsigelser" eller en "ønskeliste", det er de udfordringer, der skal løses.

Mo’ viden, færre problemer

Alexa kan fortælle dig, hvordan vejret er i Kuala Lumpur, Malaysia; det samlede antal amerikanske dollars, du får for 720 sydafrikanske rand, og hvordan man staver "disestablishmentarianism." Men forbruger A.I. assistenter er i bund og grund den digitale ækvivalent til en person med et komplet sæt up-to-date encyklopædier. Du får (forhåbentlig) den rigtige information, men der er ingen pro-grade ekspertise der.

"Udfordringen, som systemerne i dit hjem har, er, at der er en så bred vifte af ting, de forsøger at gøre," sagde Hebner til Digital Trends.

Dette er svært at løse, men at gøre det ville være en game-changer. Nuance udvikler mange specialistsystemer rettet mod én specifik use-case, såsom at hjælpe flyselskabskunder med at besvare forespørgsler eller læger med at tage noter. Hvis du gør det, betyder det ikke kun, at disse systemer kan bore ned for at få mere detaljerede oplysninger, men det betyder også, at mere intelligens kan blive bagt ind. "Folk var meget begejstrede for computere, der kunne forstå ord, men det betyder ikke nødvendigvis noget, hvis du ikke ved, hvad du skal gøre med disse ord," sagde Hebner.

Et eksempel, han giver, er et Nuance-system, der ikke kun forstår, hvornår læger læser en liste over potentielle lægemidler op for patienter, men som kan kalde potentielle konflikter op. Dette er langt ud over mulighederne for de fleste A.I. assistenter.

Men at have en mere specialist detaljeret viden om forskellige domæner - noget antydet af Alexa Skills - kunne være transformerende. At bede din smarthøjttaler om juridisk eller lægelig rådgivning lyder umiddelbart skørt. Men der har været ekstraordinære fremskridt inden for områder som juridiske bots, mens en nylig offentliggjort rapport antyder, at Apple ønsker, at Siri skal kunne have sundhedsfokuserede samtaler med brugere inden 2021.

Specialistviden grafer for A.I. assistenter er noget af sci-fi drømme lige nu, selvom en seneste Voicebot.ai-rapport viser, hvor hurtigt virtuelle assistenters færdigheder udvides. Når færdigheder bevæger sig ind i specialiteternes terræn, kommer vi dog til at nyde en godbid!

Mere (og bedre) personalisering

Personalisering af nutidens smarte højttalere er stadig i sin vorden. Du kan ændre stemmeassistenters accent og præsenterende køn, tilføje eller fjerne færdigheder og give den informationsstykker som dit navn og dit arbejdssted. I nogle tilfælde kan du opsætte flere stemmeprofiler, så det Google Home vil genkende de enkelte medlemmer af din husstand.

Amazon Echo Show

Men der er stadig et stykke vej igen - selvom juicen burde være presset værd. Mattersight Corporation har udviklet A.I. call center teknologi, kaldet Predictive Behavioural Routing, som analyserer opkaldernes talemønstre og matcher dem med menneskelige medarbejdere med kompatible personlighedstyper. Ifølge virksomheden vil matchning af en person med en kompatibel personlighed resultere i et vellykket opkald, der varer kun halvdelen af ​​tiden, ved siden af ​​en person med en modstridende personlighedstype.

Brug af en lignende tilgang kan resultere i A.I. assistenter, som taler tilbage til dig på den måde, du kan lide at blive tiltalt. Det kunne være noget så simpelt som at matche accenten og stemmestyrken for den person, de taler med. Eller det kan ændre den måde, det adresserer ideer på, ved måske at bruge mere følelsesladede ord for nogle brugere sammenlignet med mere tætte detaljerede oplysninger, det kunne bruge til andre. Måske ønsker nogle mennesker en stemmeassistent at chatte længe med, mens andre blot ønsker, at en skal formidle de nødvendige oplysninger på den mest kortfattede måde som muligt. A.I. assistenter skal være i stand til begge dele.

Teknologier som Google Duplex vise, hvor overbevisende nøjagtige A.I.-genererede syntetiserede stemmer og samtaler bliver. Efterhånden som A.I.s bevæger sig ind i områder, der er mere komplekse end at diske op med sanganmodninger og madtimere, kan du forvente at se denne teknologi spille en stor rolle.

Dette kunne hjælpes af gennembrud i evnen til at identificere brugere med stemmen. Hebner bemærker, at Nuances teknologi kan identificere brugere fra kun et enkelt sekunds lyd. "Det plejede at tage 10 sekunder at forstå, hvem du er, at få et præcist signal," sagde han. "Kraften i det er betydelig." At være i stand til at identificere brugere med et lille stykke stemme løser problemet adgangskodeproblem, og åbner mulighed for at bruge stemmeassistenter til mere delikat fortrolighed Information.

At blive proaktiv

En god assistent vil gøre noget, når du beder dem om det. En god assistent behøver ikke at spørge. Lige nu har A.I. assistenter er stadig på dette første stadie. Brugere kan få den sang, de ønsker, eller den påmindelse, de har brug for, men typisk kun når det er blevet eksplicit anmodet om. Efterhånden som folk bliver mere fortrolige med stemmeassistenter, er der en fantastisk mulighed for dem til at gå ud over at være rene reaktive enheder til proaktive.

Der er store spørgsmål om, hvorvidt folk ønsker at overdrage bestemte opgaver til maskiner.

Hvordan ville du have det med en A.I. assistent, der træffer beslutninger på dine vegne? Det kan være alt fra at skrue op for termostaten, når nogen siger, de er kolde, eller at ombooke en frokost møde, fordi du kommer for sent, for at nudge dig til at dyrke mere motion eller blive bedre til at redde dit lønseddel. Efterhånden som flere og flere smarte enheder kommer ind i hjemmet, vil antallet af ting, en stemmeassistent kunne tænkes, stige markant.

En del af dette er et socialt spørgsmål om, hvor komfortable folk er ved, at maskiner træffer beslutninger fra deres side. Der er store spørgsmål om, hvorvidt folk ønsker at overdrage bestemte opgaver til maskiner. Tænk på det som at give dit kreditkort og husnøgler til din assistent af kød og blod - kun med et meget større drys af Skynet. Ulempen er at give afkald på en vis mængde kontrol. Den potentielle fordel er at øge din fritid. Selvfølgelig er der en stor teknisk udfordring...

Det hele handler om feedback

Tom Hebner påpegede en stor udfordring med spørgsmålet om proaktivitet: hvordan ved vores maskiner, hvornår de har det rigtigt? Vende tilbage til ideen om det gode vs. god assistent, en god assistent kan have alle dine filer ude forud for et stort møde, uden at du behøver at spørge. Men hvad hvis de er de forkerte filer? Et stort problem med at lave A.I. assistenter mere proaktive er, at der i øjeblikket er begrænsede måder at afsløre, om vi får informationen er den rigtige information eller ej.

A.I. er god peber robotten
Tomohiro Ohsumi/Getty Images

"Hvis jeg beder om den samme sang hver dag, når jeg går ind i mit hus, og den dag, jeg går ind, og den bare begynder at spille, hvordan ved de, at de fik det rigtigt?" sagde Hebner. "Hvis jeg ikke stopper med at spille, betyder det så, at det er rigtigt? Hvis jeg siger 'stop', betyder det så, at det tog fejl, og at det aldrig burde gøre det igen? Feedbackmekanismen er en af ​​grundene til, at du ikke får mere proaktive systemer."

Dette er en udfordring for ingeniører at finde ud af. Enhver, der nogensinde har haft en praktikant, der har bedt dem om instruktion og feedback på hver enkelt opgave, ved, at nogle gange er det nemmere at udføre et job selv end at uddelegere det. En A.I. assistent er der for at gøre dit liv mere friktionsfrit; for ikke at give dig dusinvis af miniundersøgelser hver dag for at bekræfte, om det har gjort sit arbejde rigtigt. Dette skal løses på en måde, der ikke hæmmer brugervenligheden af ​​disse enheder, og det kræver ikke en hel masse træning på forhånd, før systemerne lærer dine præferencer.

Hvad er svaret? Jeg er ikke sikker. Men som Steve Jobs engang sagde, er det ikke kundens opgave at finde ud af det.

Nye interaktionsmetoder

Der er en scene i 2001: A Space Odyssey hvori den morderiske HAL 9000, foruroligende stadig den mest berømte fiktive A.I. assistent i historie, afslører, at den ikke kun bruger mikrofoner til at bestemme, hvad der bliver sagt til den. Da to besætningsmedlemmer forsøger at vælge et sted at tale, hvor de ved, at HAL ikke kan høre, afslører HAL, at han stadig kan forstå dem, baseret på at læse deres læbebevægelser.

2001: A Space Odyssey

Skræmmende øjeblik af filmen? Jo da. Et eksempel på, hvordan A.I. assistenter kunne arbejde i fremtiden? Øh, selvfølgelig!

Ideen om, at stemmeassistenter skal begrænses til stemme, mindsker det mulige antal måder, de med fordel kunne interagere med os på. Med fremkomsten af ansigtsgenkendelse og teknologier til sporing af følelser, et stadigt voksende antal biometri indsamlet om brugere på konstant basis, og endda mulighed for tankelæsende teknologi i horisonten, er der masser af forskellige signaler, som kunne bruges af A.I. assistenter til at drage deres konklusioner.

Ideen om, at vi om 10 år kun vil bruge stemme til at styre disse A.I. assistenter er som at se på pc'er i begyndelsen af ​​80'erne og tro, at vi aldrig vil have mere end et tastatur til vores rådighed.

Redaktørens anbefalinger

  • Følelsesfølende A.I. er her, og det kan blive til din næste jobsamtale
  • Apples nye Seattle-campus kan betyde store ting for Siri, kunstig intelligens
  • Google har fundet en måde at bruge A.I. at øge nytten af ​​vindenergi