A beszédfelismerési technológia manapság mindenhol megtalálható, leginkább az A.I. okos asszisztensek mint például az Amazon Alexa, az Apple Siri és a Google Assistant. De amint azt bárki, aki valaha is beszélgetett IRL-vel (a való életben), tudja, a beszéd nem csak azokról a szavakról szól, amelyeket egy személy mond, hanem a hangnemről, amellyel kimondja őket. Ez az egyik oka annak, hogy a szöveges online beszélgetések rémálmok lehetnek, mivel maguk az alapszavak nem engednek kellő árnyalatot ahhoz, hogy mindig átadják az ember jelentését.
Az egyik izgalmas induló vállalkozás, amely több megértést szeretne adni a beszédfelismerésnek Oto, spinoff a tekintélyestől SRI International, amely több mint egy évtizeddel ezelőtt segítette a Siri megjelenését. Az Oto a hang-intonációs technológián dolgozik, amely – legalábbis kezdetben – lehetővé teszi a call centerek számára, hogy jobban megértsék a hívók és az értékesítési ügynökök hangos érzelmeit.
Ajánlott videók
„Az Oto-nál az a küldetésünk, hogy felszabadítsuk az empátiát a gépekben, és e célból kifejlesztettük a DeepTone-t, egy egyedülálló technológiát, amely mély neurális hálózatokon alapul, amelyeket több százan képeztek ki. valódi beszélgetések ezrei a beszédben jelenlévő érzelmek apró variációinak értékeléséhez” – mondta Nicolas Perony, az Oto társalapítója és technológiai igazgatója a Digitalnak. Trendek.
Összefüggő
- Valószínűleg nem tudja elérni a maximális órajelet az AMD Ryzen 9 7950X-en
- Az Ingenuity Mars-helikopter elérte a 23. repülést, nem lehet megállítani
- Ez az SSD az egyik leggyorsabb, amit láttunk, de valószínűleg nem tudja használni
Ezek az apró variációk, amelyeket „látens beszélői állapotoknak” neveznek, lehetővé teszik a beszélő szavainak érzelmi hangjának valós időben történő, másodpercenkénti többszöri rögzítését. A rendszert 3000 ember 100 000 megnyilatkozását tartalmazó adatbázison képezték ki, amely 2 millió értékesítési beszélgetésből származik.
„Az intonáció alkalmazása szinte végtelen” – mondta Teo Borschberg, társalapító és vezérigazgató. „Egy hang-első világba lépünk be. Hamarosan mindenről beszélni fog: az autójával, órájával, hűtőjével, hangszóróival és még sok mással. A beszéd árnyalatainak megismerése kulcsfontosságú lesz az értelmes beszélgetések létrehozásához. Jelenleg a kapcsolattartó központokban zajló beszélgetések emberi minőségén dolgozunk. Egyelőre nem igazán lehet csak szöveg alapján megítélni egy hívás élményszerű minőségét; túl kétértelmű."
Az Oto technológiája révén az értékesítési ügynökök valós időben felszólíthatók arra, hogy „megfelelő energiát” fordítsanak a hívások során, miközben kellő empátiát is tanúsítanak az ügyfelekkel. „Az az érték, hogy a telefonközpontok most először tudják mérni az élmények minőségét, és nagymértékben cselekedni ezen információk alapján, hogy megóvják a dühös ügyfeleket a zűrzavartól” – mondta Borschberg.
Oto nemrég bejelentette a 5,3 millió dolláros magvető finanszírozási kör. Ezt a vállalat mérnöki és értékesítési csapatainak bővítésére fogják használni. Segítségével tovább bővítheti technológiai kínálatát az új érzelmek és viselkedések hangon keresztüli megértéséhez.
Szerkesztői ajánlások
- A Chrome Nvidia DLSS-re vonatkozó változata elindul, de még nem használhatja
- Az Apple új M2 MacBook Pro nem bírja a meleget – érdemes megvenni?
- Kiszivárgott a Lenovo menő új játéktelefonja, de nem tudod megvenni
- Ma leállt az Amazon Echo, Alexa vagy Ring? nem vagy egyedül
- A Google piacra dob egy Pixel 6 Material You divatkollekciót, amelyet valójában nem viselhet
Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.