Tehnologija prepoznavanja govora je posvuda ovih dana, a najviše u A.I. pametni pomoćnici kao što su Amazonova Alexa, Appleov Siri i Googleov pomoćnik. Ali kao što zna svatko tko je ikada vodio IRL razgovor (u stvarnom životu), govor se ne odnosi samo na riječi koje osoba izgovara, već i na ton glasa kojim ih izgovara. To je jedan od razloga zašto tekstualni razgovori na mreži mogu biti takva noćna mora, budući da same osnovne riječi ne dopuštaju dovoljno nijansi da uvijek prenesu značenje osobe.
Jedan uzbudljiv startup koji želi ubrizgati više razumijevanja u prepoznavanje govora je Oto, spinoff iz prestižnog SRI International, koji je pomogao u rađanju Siri prije više od deset godina. Oto radi na tehnologiji glasovne intonacije koja će, barem u početku, omogućiti pozivnim centrima da bolje razumiju glasovne emocije pozivatelja i prodajnih agenata.
Preporučeni videozapisi
“U Otu, naša misija je otključati empatiju u strojevima, i u tu smo svrhu razvili DeepTone, jedinstvenu tehnologiju temeljenu na dubokim neuronskim mrežama uvježbanim na stotinama tisuće stvarnih razgovora za postizanje sitnih varijacija u emocijama prisutnim u govoru,” rekao je za Digital Nicolas Perony, suosnivač i glavni tehnološki direktor tvrtke Oto Trendovi.
Povezano
- Vjerojatno ne možete postići maksimalnu brzinu takta na AMD-ovom Ryzen 9 7950X
- Helikopter za Mars Ingenuity postiže 23. let, ne može se zaustaviti
- Ovaj SSD je jedan od najbržih koje smo vidjeli, ali ga vjerojatno ne možete koristiti
Ove sićušne varijacije, opisane kao "latentna stanja govornika", omogućuju da se emocionalni ton govornikovih riječi registrira u stvarnom vremenu, mnogo puta u sekundi. Sustav je treniran na bazi podataka od 100.000 izjava 3.000 ljudi, uzetih iz 2 milijuna prodajnih razgovora.
"Primjene intonacije gotovo su beskonačne", rekao je Teo Borschberg, suosnivač i izvršni direktor. “Ulazimo u svijet na prvom mjestu glasa. Uskoro ćete razgovarati sa svime: svojim automobilom, satom, hladnjakom, zvučnicima, [i više]. Shvaćanje nijansi govora bit će ključno za stvaranje smislenih razgovora. Upravo sada radimo na ljudskoj kvaliteti razgovora u kontakt centrima. Do sada nije moguće procijeniti iskustvenu kvalitetu poziva samo na temelju teksta; previše je dvosmisleno.”
Putem Otove tehnologije, prodajni agenti mogu biti pozvani u stvarnom vremenu da unesu "pravu energiju" tijekom poziva, dok također pokazuju dovoljno empatije prema kupcima. "Vrijednost je u tome što po prvi put pozivni centri mogu mjeriti kvalitetu iskustva i djelovati na temelju tih informacija u velikom broju kako bi spasili ljutite kupce od odbijanja", rekao je Borschberg.
Oto je nedavno najavio a početno financiranje od 5,3 milijuna dolara. To će se koristiti za razvoj inženjerskih i prodajnih timova tvrtke. Također će mu pomoći da dodatno proširi svoju tehnološku ponudu za razumijevanje novih emocija i ponašanja putem glasa.
Preporuke urednika
- Chromeov pristup Nvidia DLSS-u je spreman za pokretanje, ali ga još ne možete koristiti
- Appleov novi M2 MacBook Pro ne može podnijeti vrućinu — trebate li ga ipak kupiti?
- Procurio je cool novi gaming telefon tvrtke Lenovo, ali ga ne možete kupiti
- Je li vaš Amazon Echo, Alexa ili Ring danas neispravan? Niste sami
- Google lansira Pixel 6 Material You modnu kolekciju koju zapravo ne možete nositi
Nadogradite svoj životni stilDigitalni trendovi pomažu čitateljima da prate brzi svijet tehnologije sa svim najnovijim vijestima, zabavnim recenzijama proizvoda, pronicljivim uvodnicima i jedinstvenim brzim pregledima.