Alexa ir Siri negali suprasti jūsų balso tono, bet Oto gali

Kalbos atpažinimo technologija šiais laikais yra visur, ypač A.I. protingi padėjėjai pvz., „Amazon“ „Alexa“, „Apple“ „Siri“ ir „Google“ padėjėjas. Tačiau, kaip žino kiekvienas, kada nors kalbėjęs IRL (realiame gyvenime), kalba yra ne tik apie žodžius, kuriuos žmogus sako, bet ir apie balso toną, kuriuo jie juos sako. Tai viena iš priežasčių, kodėl tekstiniai pokalbiai internete gali būti toks košmaras, nes patys pagrindiniai žodžiai nesuteikia pakankamai niuansų, kad visada perteiktų asmens reikšmę.

Vienas įdomus startuolis, norintis įnešti daugiau supratimo į kalbos atpažinimą Oto, spinoffas iš prestižinio SRI International, kuris padėjo sukurti Siri daugiau nei prieš dešimtmetį. Oto kuria balso intonavimo technologiją, kuri bent jau iš pradžių leis skambučių centrams geriau suprasti skambinančiųjų ir pardavimo agentų emocijas.

Rekomenduojami vaizdo įrašai

„Mūsų „Oto“ misija yra atrakinti empatiją mašinose ir šiuo tikslu sukūrėme „DeepTone“ – unikalią technologiją, pagrįstą giliais neuroniniais tinklais, apmokytais šimtuose tūkstančiai tikrų pokalbių, kad būtų galima įvertinti nedidelius kalboje esančių emocijų variantus“, – „Digital“ sakė Nicolas Perony, „Oto“ įkūrėjas ir vyriausiasis technologijų pareigūnas. Tendencijos.

Susijęs

  • Tikriausiai negalite pasiekti maksimalaus AMD Ryzen 9 7950X laikrodžio greičio
  • Marso sraigtasparnis „Ingenuity“ pasiekė 23-ią skrydį, jo sustabdyti nepavyks
  • Šis SSD yra vienas greičiausių, bet tikriausiai negalite jo naudoti

Šie maži variantai, apibūdinami kaip „latentinės kalbėtojo būsenos“, leidžia daug kartų per sekundę registruoti kalbėtojo žodžių emocinį toną realiuoju laiku. Sistema buvo apmokyta duomenų bazėje, kurioje yra 100 000 pasisakymų iš 3 000 žmonių, paimtų iš 2 milijonų pardavimo pokalbių.

"Intonacijos pritaikymas yra beveik begalinis", - sakė Teo Borschberg, vienas iš įkūrėjų ir generalinis direktorius. „Mes įžengiame į pasaulį, kuriame pirmiausia kalbama. Netrukus kalbėsite apie viską: savo automobilį, laikrodį, šaldytuvą, garsiakalbius ir dar daugiau. Norint sukurti prasmingus pokalbius, labai svarbu suprasti kalbos niuansus. Šiuo metu mes dirbame su žmogiškąja pokalbių kokybe kontaktų centruose. Kol kas iš tikrųjų neįmanoma įvertinti patirtinės skambučio kokybės remiantis tik tekstu; tai per daug dviprasmiška“.

Naudojant „Oto“ technologijas, pardavimo agentai gali būti raginami realiuoju laiku panaudoti „tinkamą energiją“ pokalbių metu, taip pat parodyti pakankamai klientų empatijos. „Vertė yra ta, kad skambučių centrai pirmą kartą gali įvertinti patirties kokybę ir plačiu mastu veikti pagal šią informaciją, kad išgelbėtų piktus klientus nuo pykčio“, – sakė Borschbergas.

Oto neseniai paskelbė a pradinio finansavimo turas – 5,3 mln. Tai bus panaudota įmonės inžinierių ir pardavimų komandoms plėsti. Tai taip pat padės toliau plėsti savo technologijų pasiūlą, kad balsu suprastų naujas emocijas ir elgesį.

Redaktorių rekomendacijos

  • Nustatyta, kad „Chrome“ įdiegta „Nvidia DLSS“ bus paleista, tačiau dar negalite jos naudoti
  • Naujasis Apple M2 MacBook Pro neatlaiko karščio – ar vis tiek turėtumėte jį nusipirkti?
  • Naujas „Lenovo“ žaidimų telefonas nutekėjo, bet jūs negalite jo nusipirkti
  • Ar jūsų „Amazon Echo“, „Alexa“ ar „Ring“ šiandien neveikia? Jūs nesate vieni
  • „Google“ pristato „Pixel 6 Material You“ mados kolekciją, kurios iš tikrųjų negalite dėvėti

Atnaujinkite savo gyvenimo būdąSkaitmeninės tendencijos padeda skaitytojams stebėti sparčiai besivystantį technologijų pasaulį – pateikiamos visos naujausios naujienos, smagios produktų apžvalgos, įžvalgūs vedamieji leidiniai ir unikalūs žvilgsniai.