Alexa og Siri kan ikke forstå tonen i din stemme, men Oto kan

Talegenkendelsesteknologi er overalt i disse dage, især inden for A.I. smarte assistenter såsom Amazons Alexa, Apples Siri og Googles Assistant. Men som enhver, der nogensinde har haft en samtale IRL (i det virkelige liv), vil vide, handler tale ikke kun om de ord, som en person siger, men den tone, de siger dem i. Det er en af ​​grundene til, at tekstbaserede samtaler online kan være sådan et mareridt, da de grundlæggende ord i sig selv ikke giver mulighed for tilstrækkelig nuance til altid at formidle en persons mening.

En spændende startup, der ønsker at tilføre mere forståelse i talegenkendelse, er Oto, et spinoff fra det prestigefyldte SRI International, som var med til at skabe Siri for mere end ti år siden. Oto arbejder på stemme-intonationsteknologi, der i det mindste i første omgang vil gøre callcentre i stand til bedre at forstå de vokale følelser hos både opkaldere og salgsagenter.

Anbefalede videoer

"Hos Oto er vores mission at låse op for empati i maskiner, og til dette formål har vi udviklet DeepTone, en unik teknologi baseret på dybe neurale netværk trænet på hundredvis af tusindvis af rigtige samtaler for at opnå små variationer i de følelser, der er til stede i tale, siger Nicolas Perony, medstifter og teknologichef hos Oto, til Digital Trends.

Relaterede

  • Du kan sandsynligvis ikke nå de maksimale clockhastigheder på AMDs Ryzen 9 7950X
  • Mars-helikopteren Ingenuity rammer 23. flyvning, kan ikke stoppes
  • Denne SSD er en af ​​de hurtigste, vi har set, men du kan sandsynligvis ikke bruge den

Disse små variationer, beskrevet som "latente talertilstande", gør det muligt at registrere den følelsesmæssige tone i en talers ord i realtid, mange gange i sekundet. Systemet blev trænet på en database med 100.000 ytringer fra 3.000 personer, hentet fra 2 millioner salgssamtaler.

"Anvendelser af intonation er næsten uendelige," sagde Teo Borschberg, medstifter og administrerende direktør. "Vi er på vej ind i en stemme-første verden. Snart vil du tale med alt: Din bil, ur, køleskab, højttalere, [og mere]. At få talens nuancer vil være nøglen til at skabe meningsfulde samtaler. Lige nu arbejder vi med den menneskelige kvalitet af samtaler i kontaktcentre. Indtil videre er det ikke rigtigt muligt at bedømme den oplevelsesmæssige kvalitet af et opkald udelukkende baseret på tekst; det er for tvetydigt."

Gennem Otos teknologi kan salgsagenter i realtid blive bedt om at lægge "den rigtige energi" i under opkald, samtidig med at de viser tilstrækkelig kundeempati. "Værdien er, at callcentre for første gang kan måle kvaliteten af ​​oplevelser og handle på denne information i stor skala for at redde vrede kunder fra at tude," sagde Borschberg.

Oto annoncerede for nylig en seed-finansieringsrunde på 5,3 millioner dollars. Dette vil blive brugt til at udvide virksomhedens ingeniør- og salgsteam. Det vil også hjælpe det yderligere med at udvide sine tekniske tilbud til at forstå nye følelser og adfærd gennem stemme.

Redaktørens anbefalinger

  • Chromes version af Nvidia DLSS er indstillet til at lancere, men du kan ikke bruge det endnu
  • Apples nye M2 MacBook Pro kan ikke klare varmen - skal du stadig købe den?
  • Lenovos seje nye gaming-telefon lækket, men du kan ikke købe den
  • Er din Amazon Echo, Alexa eller Ring nede i dag? Du er ikke alene
  • Google lancerer en Pixel 6 Material You-modekollektion, som du faktisk ikke kan bære

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.