Al giorno d'oggi la tecnologia di riconoscimento vocale è ovunque, in particolare nei A.I. assistenti intelligenti come Alexa di Amazon, Siri di Apple e l'Assistente di Google. Ma come saprà chiunque abbia mai avuto una conversazione nella vita reale (nella vita reale), il discorso non riguarda solo le parole che una persona dice, ma il tono di voce con cui le dice. È uno dei motivi per cui le conversazioni basate su testo online possono essere un vero incubo, poiché le parole di base stesse non consentono sfumature sufficienti per trasmettere sempre il significato di una persona.
Un'entusiasmante startup che cerca di apportare maggiore comprensione al riconoscimento vocale è Oto, uno spin-off del prestigioso SRI Internazionale, che ha contribuito a generare Siri più di dieci anni fa. Oto sta lavorando su una tecnologia di intonazione vocale che, almeno inizialmente, consentirà ai call center di comprendere meglio le emozioni vocali sia dei chiamanti che degli agenti di vendita.
Video consigliati
“In Oto, la nostra missione è sbloccare l’empatia nelle macchine e, a tal fine, abbiamo sviluppato DeepTone, una tecnologia unica basata su reti neurali profonde addestrate su centinaia di migliaia di conversazioni reali per ottenere piccole variazioni nelle emozioni presenti nel discorso", ha dichiarato a Digital Nicolas Perony, co-fondatore e chief technology officer di Oto. Tendenze.
Imparentato
- Probabilmente non puoi raggiungere la massima velocità di clock sul Ryzen 9 7950X di AMD
- L'elicottero su Marte Ingenuity effettua il 23° volo e non può essere fermato
- Questo SSD è uno dei più veloci che abbiamo visto, ma probabilmente non puoi usarlo
Queste minuscole variazioni, descritte come “stati latenti del parlante”, consentono di registrare in tempo reale il tono emotivo delle parole di chi parla, molte volte al secondo. Il sistema è stato addestrato su un database di 100.000 espressioni di 3.000 persone, tratte da 2 milioni di conversazioni di vendita.
"Le applicazioni dell'intonazione sono quasi infinite", ha affermato Teo Borschberg, cofondatore e CEO. “Stiamo entrando in un mondo incentrato sulla voce. Presto parlerai con tutto: la tua auto, l'orologio, il frigorifero, gli altoparlanti e [e altro ancora]. Comprendere le sfumature del discorso sarà fondamentale per creare conversazioni significative. In questo momento lavoriamo sulla qualità umana delle conversazioni nei contact center. Finora non è realmente possibile giudicare la qualità esperienziale di una chiamata basandosi solo sul testo; è troppo ambiguo”.
Attraverso la tecnologia di Oto, gli agenti di vendita possono essere spinti in tempo reale a mettere “la giusta energia” durante le chiamate, mostrando allo stesso tempo una sufficiente empatia con il cliente. “Il valore è che per la prima volta i call center possono misurare la qualità delle esperienze e agire su queste informazioni su larga scala per evitare che i clienti arrabbiati si arrendano”, ha affermato Borschberg.
Oto ha recentemente annunciato a round di finanziamento iniziale di 5,3 milioni di dollari. Questo verrà utilizzato per far crescere i team di ingegneria e vendita dell’azienda. Lo aiuterà anche a espandere ulteriormente la sua offerta tecnologica per comprendere nuove emozioni e comportamenti attraverso la voce.
Raccomandazioni degli editori
- La versione di Chrome di Nvidia DLSS è pronta per essere lanciata, ma non puoi ancora utilizzarla
- Il nuovo MacBook Pro M2 di Apple non sopporta il caldo: dovresti comunque comprarlo?
- Il nuovo fantastico telefono da gioco di Lenovo è trapelato, ma non puoi comprarlo
- Il tuo Amazon Echo, Alexa o Ring non funzionano oggi? Non sei solo
- Google lancia una collezione di moda Pixel 6 Material You che non puoi effettivamente indossare
Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.