Alexa in Siri ne moreta razumeti tona vašega glasu, Oto pa lahko

click fraud protection

Tehnologija za prepoznavanje govora je dandanes povsod, še posebej v A.I. pametni pomočniki kot so Amazonova Alexa, Applova Siri in Googlov pomočnik. Toda kot ve vsakdo, ki se je kdaj pogovarjal z IRL (v resničnem življenju), govor niso le besede, ki jih oseba izgovori, ampak ton glasu, s katerim jih izgovori. To je eden od razlogov, zakaj so besedilni pogovori na spletu lahko taka nočna mora, saj osnovne besede same po sebi ne dopuščajo dovolj nianse, da bi vedno izrazili pomen osebe.

Eno vznemirljivo zagonsko podjetje, ki želi vnesti več razumevanja v prepoznavanje govora, je Oto, spinoff iz prestižne SRI International, ki je pred več kot desetletjem pomagal ustvariti Siri. Oto dela na tehnologiji glasovne intonacije, ki bo vsaj na začetku klicnim centrom omogočila boljše razumevanje glasovnih čustev klicateljev in prodajnih agentov.

Priporočeni videoposnetki

»Pri Otu je naše poslanstvo odkleniti empatijo v strojih in v ta namen smo razvili DeepTone, edinstveno tehnologijo, ki temelji na globokih nevronskih mrežah, urjenih na stotine na tisoče resničnih pogovorov za doseganje majhnih variacij v čustvih, prisotnih v govoru,« je za Digital povedal Nicolas Perony, soustanovitelj in glavni tehnološki direktor pri Oto. Trendi.

Povezano

  • Verjetno ne morete doseči najvišje hitrosti na AMD-jevem Ryzen 9 7950X
  • Marsov helikopter Ingenuity doseže 23 let, ni ga mogoče ustaviti
  • Ta SSD je eden najhitrejših, kar smo jih videli, vendar ga verjetno ne morete uporabljati

Te majhne variacije, opisane kot "latentna stanja govorca", omogočajo, da se čustveni ton govorčevih besed registrira v realnem času, večkrat na sekundo. Sistem je bil učen na bazi podatkov 100.000 izjav 3.000 ljudi, vzetih iz 2 milijonov prodajnih pogovorov.

"Uporabe intonacije so skoraj neskončne," je dejal Teo Borschberg, soustanovitelj in izvršni direktor. »Vstopamo v svet, kjer je na prvem mestu glas. Kmalu boste govorili z vsem: svojim avtomobilom, uro, hladilnikom, zvočniki [in še več]. Dojemanje odtenkov govora bo ključno za ustvarjanje smiselnih pogovorov. Trenutno delamo na človeški kakovosti pogovorov v kontaktnih centrih. Zaenkrat še ni mogoče oceniti izkustvene kakovosti klica samo na podlagi besedila; je preveč dvoumen."

Prek Otove tehnologije je mogoče prodajne agente v realnem času pozvati, naj med klici vložijo »pravo energijo«, hkrati pa pokažejo dovolj empatije do strank. »Vrednost je v tem, da lahko klicni centri prvič merijo kakovost izkušenj in ukrepajo na podlagi teh informacij v velikem obsegu, da jeznim strankam preprečijo odpoved,« je dejal Borschberg.

Oto je pred kratkim napovedal a začetno financiranje v višini 5,3 milijona dolarjev. To bo uporabljeno za rast inženirskih in prodajnih ekip podjetja. Prav tako mu bo pomagalo dodatno razširiti svojo tehnološko ponudbo za razumevanje novih čustev in vedenja prek glasu.

Priporočila urednikov

  • Chromov pogled na Nvidia DLSS je nastavljen, vendar ga še ne morete uporabljati
  • Applov novi M2 MacBook Pro ne prenese vročine – ali bi ga vseeno morali kupiti?
  • Lep novi igralni telefon Lenovo je pricurljal, vendar ga ne morete kupiti
  • Ali vaš Amazon Echo, Alexa ali Ring danes ne deluje? Niste sami
  • Google lansira modno kolekcijo Pixel 6 Material You, ki je dejansko ne morete nositi

Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.