5 sätt att framtida A.I. assistenter tar rösttekniken till nästa nivå

Äpple

Sedan Siri debuterade på iPhone 4s 2011, har röstassistenter gått från en oanvändbar gimmick till grunden för smart högtalarteknik som finns i vart sjätte amerikanska hem.

Innehåll

  • Mo’ kunskap, mindre problem
  • Mer (och bättre) anpassning
  • Bli proaktiv
  • Allt handlar om feedback
  • Nya interaktionsmetoder

"Innan Siri, när jag pratade om [vad jag gör] fanns det tomma blickar," Tom Hebner, innovationschef på Nuance Communications, som utvecklar banbrytande A.I. röstteknik, berättade för Digital Trends. "Folk skulle säga," Bygger du de där hemska telefonsystemen? Jag hatar dig.’ Det var en grupp människors enda interaktion med röstteknik.”

Rekommenderade videor

Så är det inte längre idag. Enligt eMarketers prognoser, nästan 100 miljoner smartphone användare kommer att använda röstassistenter 2020. Men medan A.I. assistenter är inte längre en nyhet, vi är fortfarande i början av deras utveckling. Det är en lång väg kvar innan de helt lever upp till löftet som röstassistenter har som produktkategori.

Här är fem sätt på vilka tekniken kan förbättras för att göra den smartare och effektivare – och hjälpa oss att leva mer produktiva liv som ett resultat. Kalla dem "förutsägelser" eller en "önskelista", det här är utmaningarna som måste lösas.

Mo’ kunskap, mindre problem

Alexa kan berätta hur vädret är i Kuala Lumpur, Malaysia; det totala antalet amerikanska dollar du får för 720 sydafrikanska rand, och hur man stavar "disestablishmentarianism". Men konsument A.I. assistenter är i huvudsak den digitala motsvarigheten till en person med en komplett uppsättning up-to-date uppslagsverk. Du får (förhoppningsvis) rätt information, men det finns ingen pro-grad expertis där.

"Utmaningen som systemen i ditt hem har är att det finns ett så brett utbud av saker som de försöker göra," sa Hebner till Digital Trends.

Det här är svårt att lösa, men att göra det skulle förändra spelet. Nuance utvecklar många specialistsystem som är inriktade på ett specifikt användningsfall, som att hjälpa flygbolagskunder att svara på frågor eller läkare att göra anteckningar. Att göra det betyder inte bara att dessa system kan borra ner för att få mer detaljerad information, utan betyder också att mer intelligens kan bli inbakad. "Folk var väldigt entusiastiska över datorer som kunde förstå ord, men det spelar ingen roll om du inte vet vad du ska göra med de orden," sa Hebner.

Ett exempel han ger är ett Nuance-system som inte bara förstår när läkare läser upp en lista över potentiella läkemedel för patienter, utan som kan ropa ut potentiella konflikter. Detta är långt utöver kapaciteten hos de flesta användarklassade A.I. assistenter.

Men att ha en mer specialiserad detaljerad kunskap om olika domäner - något antydd av Alexa Skills – kan vara transformerande. Att be din smarta högtalare om juridiska eller medicinska råd låter, på första sidan, galet. Men det har funnits extraordinära framsteg inom områden som juridiska bots, medan en nyligen publicerad rapport antyder att Apple vill att Siri ska kunna ha hälsofokuserade samtal med användare senast 2021.

Specialistkunskapsdiagram för A.I. assistenter är grejen med sci-fi-drömmar just nu, även om en senaste Voicebot.ai-rapporten visar hur snabbt virtuella assistenters kompetenser växer. Men när kompetensen flyttar in i specialiteternas terräng, kommer vi att få en njutning!

Mer (och bättre) anpassning

Personalisering av dagens smarta högtalare är fortfarande i sin linda. Du kan ändra röstassistenternas accent och presentation av kön, lägga till eller ta bort färdigheter och ge den information som ditt namn och arbetsplats. I vissa fall kan du ställa in flera röstprofiler så att Google Home kommer att känna igen de enskilda medlemmarna i ditt hushåll.

Amazon Echo Show

Men det är fortfarande en lång väg kvar - även om juicen borde vara värd att pressa. Mattersight Corporation har utvecklat A.I. callcenterteknik, kallad Predictive Behavioral Routing, som analyserar uppringarnas talmönster och matchar dem med mänskliga operatörer med kompatibla personlighetstyper. Enligt företaget kommer matchning av en person med en kompatibel personlighet att resultera i ett framgångsrikt samtal som varar bara halva tiden, bredvid det för en person med en motstridig personlighetstyp.

Att använda ett liknande tillvägagångssätt kan resultera i A.I. assistenter som pratar tillbaka till dig på det sätt du vill bli tilltalad. Det kan vara något så enkelt som att matcha accenten och röstvolymen för personen de pratar med. Eller så kan det ändra sättet det tar upp idéer genom att kanske använda mer känslomässiga ord för vissa användare, jämfört med mer tät detaljerad information som det kan använda för andra. Kanske vill vissa personer ha en röstassistent att prata länge med, medan andra helt enkelt vill att en ska förmedla nödvändig information på ett så kortfattat sätt som möjligt. A.I. assistenter bör kunna båda.

Teknik som Google Duplex visa hur övertygande exakta A.I.-genererade syntetiserade röster och konversationer blir. När A.I.s flyttar till områden som är mer komplexa än att diska upp låtförfrågningar och mattimer, förvänta dig att se denna teknik spela en viktig roll.

Detta skulle kunna underlättas av genombrott i förmågan att identifiera användare med röst. Hebner noterar att Nuances teknologi kan identifiera användare från bara en enda sekund av ljud. "Det brukade ta 10 sekunder att förstå vem du är, för att få en korrekt signal," sa han. "Kraften i det är betydande." Att kunna identifiera användare med ett litet röststycke löser problemet lösenordsproblem och öppnar möjligheten att använda röstassistenter för mer känslig konfidentiell information information.

Bli proaktiv

En bra assistent kommer att göra något när du ber dem om det. En bra assistent behöver inte fråga. Just nu har A.I. assistenter är fortfarande i detta första skede. Användare kan få den låt de vill ha eller den påminnelse de behöver, men vanligtvis bara när det uttryckligen har begärts. När människor blir mer bekväma med röstassistenter, finns det en stor möjlighet för dem att gå bortom att vara rent reaktiva enheter till proaktiva.

Det finns stora frågor om huruvida människor vill lämna över vissa jobb till maskiner eller inte.

Hur skulle du känna om en A.I. assistent som fattar beslut för din räkning? Dessa kan vara allt från att skruva upp termostaten när någon säger att de är kall eller att boka om en lunch möte för att du kommer för sent, för att knuffa dig att träna mer eller bli bättre på att rädda din lönecheck. I takt med att fler och fler smarta enheter tar sig in i hemmet kommer antalet saker som en röstassistent kan tänkas kunna befalla att öka avsevärt.

En del av detta är en social fråga om hur bekväma människor är med att maskiner fattar beslut från deras sida. Det finns stora frågor om huruvida människor vill lämna över vissa jobb till maskiner eller inte. Tänk på det som att ge ditt kreditkort och din husnycklar till din assistent av kött och blod - bara med ett mycket större stänk av Skynet. Nackdelen är att ge upp en viss kontroll. Den potentiella fördelen är att öka din fritid. Naturligtvis finns det en stor teknisk utmaning...

Allt handlar om feedback

Tom Hebner påpekade en stor utmaning med frågan om proaktivitet: hur vet våra maskiner när de har rätt? Återgå till idén om det goda vs. bra assistent, en bra assistent kanske har alla dina filer ute inför ett stort möte, utan att du behöver fråga. Men vad händer om de är fel filer? Ett stort problem med att göra hem A.I. assistenter mer proaktiva är att det för närvarande finns begränsade sätt att avslöja om vi får informationen är rätt information eller inte.

A.I. är bra peppar roboten
Tomohiro Ohsumi/Getty Images

"Om jag ber om samma låt varje dag när jag går in i mitt hus, och sedan dagen jag går in och den bara börjar spela, hur vet de att de fattade rätt?" sa Hebner. "Om jag inte slutar spela, betyder det att det är rätt? Om jag säger "sluta", betyder det att det blev fel och att det aldrig borde göra det igen? Feedbackmekanismen är en av anledningarna till att du inte får mer proaktiva system."

Detta är en utmaning för ingenjörer att ta reda på. Alla som någonsin har haft en praktikant som frågat dem om instruktioner och feedback på varje enskild uppgift vet att det ibland är lättare att göra ett jobb själv än att delegera det. En A.I. assistent är där för att göra ditt liv mer friktionsfritt; att inte ge dig dussintals miniundersökningar varje dag för att bekräfta om det har gjort sitt jobb rätt. Detta kommer att behöva lösas på ett sätt som inte försämrar användarvänligheten hos dessa enheter, och kräver inte en hel del träning i förväg innan systemen lär sig dina preferenser.

Vad är svaret? Jag är inte säker. Men, som Steve Jobs en gång sa, det är inte kundens uppgift att ta reda på det.

Nya interaktionsmetoder

Det finns en scen i 2001: A Space Odyssey där den mordiska HAL 9000, fortfarande oroande den mest kända fiktiva A.I. assistent i historia, avslöjar att den inte bara använder mikrofoner för att avgöra vad som sägs till den. När två besättningsmedlemmar försöker välja en plats att tala där de vet att HAL inte kan höra, avslöjar HAL att han fortfarande kan förstå dem, baserat på att läsa deras läpprörelser.

2001: A Space Odyssey

Skrämmande ögonblick av filmen? Säker. Ett exempel på hur A.I. assistenter skulle kunna arbeta i framtiden? Um, visst!

Idén att röstassistenter bör begränsas till röster minskar det möjliga antalet sätt som de med fördel kan interagera med oss. Med uppkomsten av ansiktsigenkänning och teknik för att spåra känslor, ett ständigt växande antal biometri som samlas in om användare på en konstant basis, och till och med möjligheten att tankeläsningsteknik vid horisonten, det finns många olika signaler som kan användas av A.I. assistenter att dra sina slutsatser.

Tanken att vi om 10 år bara kommer att använda röst för att kontrollera dessa A.I. assistenter är som att titta på datorer i början av 80-talet och tro att vi aldrig kommer att ha mer än ett tangentbord till vårt förfogande.

Redaktörens rekommendationer

  • Känslokännande A.I. är här, och det kan vara i din nästa anställningsintervju
  • Apples nya Seattle-campus kan betyda stora saker för Siri, artificiell intelligens
  • Google har hittat ett sätt att använda A.I. för att öka användbarheten av vindenergi