Taligenkänningsteknik finns överallt nuförtiden, framför allt inom A.I. smarta assistenter som Amazons Alexa, Apples Siri och Googles assistent. Men som alla som någonsin har haft en konversation IRL (i verkligheten) kommer att veta, handlar tal inte bara om orden som en person säger, utan om tonen i rösten som de säger dem i. Det är en anledning till att textbaserade konversationer online kan vara en sådan mardröm, eftersom de grundläggande orden i sig inte tillåter tillräcklig nyans för att alltid förmedla en persons mening.
En spännande startup som vill injicera mer förståelse i taligenkänning är Oto, en spinoff från det prestigefyllda SRI International, som hjälpte till att skapa Siri för mer än ett decennium sedan. Oto arbetar med röstintonationsteknik som åtminstone initialt kommer att göra det möjligt för callcenter att bättre förstå röstkänslorna hos både uppringare och försäljningsagenter.
Rekommenderade videor
"På Oto är vårt uppdrag att låsa upp empati i maskiner, och för detta ändamål har vi utvecklat DeepTone, en unik teknologi baserad på djupa neurala nätverk tränade på hundratals tusentals riktiga konversationer för att få fram små variationer i känslorna som finns i tal, säger Nicolas Perony, medgrundare och teknisk chef på Oto, till Digital Trender.
Relaterad
- Du kan förmodligen inte nå maximala klockhastigheter på AMDs Ryzen 9 7950X
- Mars-helikoptern Ingenuity når den 23:e flygningen, kan inte stoppas
- Denna SSD är en av de snabbaste vi har sett, men du kan förmodligen inte använda den
Dessa små variationer, som beskrivs som "latenta talartillstånd", gör att den känslomässiga tonen i en talares ord kan registreras i realtid, många gånger per sekund. Systemet tränades på en databas med 100 000 yttranden från 3 000 personer, hämtade från 2 miljoner säljsamtal.
"Tillämpningarna av intonation är nästan oändliga", säger Teo Borschberg, medgrundare och VD. "Vi går in i en värld med röstförst. Snart kommer du att prata med allt: din bil, klocka, kylskåp, högtalare, [och mer]. Att få talets nyanser kommer att vara nyckeln till att skapa meningsfulla konversationer. Just nu arbetar vi med den mänskliga kvaliteten på samtal i kontaktcenter. Än så länge är det inte riktigt möjligt att bedöma den upplevelsemässiga kvaliteten på ett samtal endast baserat på text; det är för tvetydigt."
Genom Otos teknik kan försäljningsagenter uppmanas i realtid att lägga in "rätt energi" under samtal, samtidigt som de visar tillräcklig kund empati. "Värdet är att callcenter för första gången kan mäta kvaliteten på upplevelser och agera på denna information i stor skala för att rädda arga kunder från att gnälla", sa Borschberg.
Oto meddelade nyligen en såddfinansieringsrunda på 5,3 miljoner dollar. Detta kommer att användas för att utöka företagets ingenjörs- och försäljningsteam. Det kommer också att hjälpa den att ytterligare utöka sina tekniska erbjudanden för att förstå nya känslor och beteenden genom röst.
Redaktörens rekommendationer
- Chromes version av Nvidia DLSS är inställd på att lanseras, men du kan inte använda den ännu
- Apples nya M2 MacBook Pro klarar inte värmen – ska du ändå köpa den?
- Lenovos coola nya speltelefon läckte, men du kan inte köpa den
- Är ditt Amazon Echo, Alexa eller Ring nere idag? Du är inte ensam
- Google lanserar en Pixel 6 Material You-modekollektion som du faktiskt inte kan bära
Uppgradera din livsstilDigitala trender hjälper läsare att hålla koll på den snabba teknikvärlden med alla de senaste nyheterna, roliga produktrecensioner, insiktsfulla redaktioner och unika smygtittar.