Alexa a Siri nerozumejú tónu vášho hlasu, ale Oto áno

Technológia rozpoznávania reči je v dnešnej dobe všade, najmä v A.I. inteligentných asistentov ako napríklad Alexa od Amazonu, Siri od Apple a Asistent Google. Ale ako každý, kto niekedy mal rozhovor IRL (v reálnom živote), vie, reč nie je len o slovách, ktoré človek hovorí, ale aj o tóne hlasu, ktorým ich hovorí. Je to jeden z dôvodov, prečo textové konverzácie online môžu byť takou nočnou morou, pretože samotné základné slová neumožňujú dostatočné nuansy, aby vždy vyjadrili význam osoby.

Jeden vzrušujúci startup, ktorý chce vniesť viac porozumenia do rozpoznávania reči, je Oto, spinoff z prestížnej SRI International, ktorá pomohla splodiť Siri pred viac ako desiatimi rokmi. Oto pracuje na technológii hlasovej intonácie, ktorá, aspoň spočiatku, umožní call centrám lepšie porozumieť hlasovým emóciám volajúcich aj obchodných zástupcov.

Odporúčané videá

„V spoločnosti Oto je naším poslaním odomknúť empatiu v strojoch a na tento účel sme vyvinuli DeepTone, jedinečnú technológiu založenú na hlbokých neurónových sieťach trénovaných na stovkách tisícky skutočných konverzácií, aby sme zaznamenali drobné variácie v emóciách prítomných v reči,“ povedal pre Digital Nicolas Perony, spoluzakladateľ a technologický riaditeľ spoločnosti Oto. Trendy.

Súvisiace

  • Pravdepodobne nemôžete dosiahnuť maximálne rýchlosti hodín na AMD Ryzen 9 7950X
  • Vrtuľník Mars Ingenuity dosiahol 23. let, nedá sa zastaviť
  • Tento SSD je jedným z najrýchlejších, aké sme videli, ale pravdepodobne ho nemôžete použiť

Tieto drobné variácie, označované ako „latentné stavy rečníka“, umožňujú registráciu emocionálneho tónu slov rečníka v reálnom čase, mnohokrát za sekundu. Systém bol trénovaný na databáze 100 000 výrokov od 3 000 ľudí, prevzatých z 2 miliónov predajných konverzácií.

„Aplikácie intonácie sú takmer nekonečné,“ povedal Teo Borschberg, spoluzakladateľ a generálny riaditeľ. „Vstupujeme do sveta, kde vládne hlas. Čoskoro budete hovoriť so všetkým: so svojím autom, hodinkami, chladničkou, reproduktormi [a ďalším]. Získanie nuansy reči bude kľúčom k vytvoreniu zmysluplných rozhovorov. Práve teraz pracujeme na ľudskej kvalite rozhovorov v kontaktných centrách. Zatiaľ nie je skutočne možné posúdiť zážitkovú kvalitu hovoru len na základe textu; je to príliš nejednoznačné."

Prostredníctvom Otovej technológie môžu byť obchodní zástupcovia vyzvaní v reálnom čase, aby počas hovorov vložili „správnu energiu“, pričom zároveň prejavia dostatočnú empatiu so zákazníkmi. „Hodnotou je, že po prvýkrát môžu call centrá merať kvalitu skúseností a konať na základe týchto informácií vo veľkom meradle, aby ušetrili nahnevaných zákazníkov od burcovania,“ povedal Borschberg.

Oto nedávno oznámil a kolo počiatočného financovania vo výške 5,3 milióna dolárov. To sa použije na rast inžinierskych a predajných tímov spoločnosti. Pomôže jej to tiež ďalej rozširovať svoju technickú ponuku, aby porozumela novým emóciám a správaniu prostredníctvom hlasu.

Odporúčania redaktorov

  • Pohľad prehliadača Chrome na Nvidia DLSS je pripravený na spustenie, ale zatiaľ ho nemôžete používať
  • Nový M2 MacBook Pro od Apple nezvládne teplo – mali by ste si ho stále kúpiť?
  • Skvelý nový herný telefón od spoločnosti Lenovo unikol, ale nemôžete si ho kúpiť
  • Nefunguje vám dnes Amazon Echo, Alexa alebo Ring? nie ste sami
  • Google uvádza na trh módnu kolekciu Pixel 6 Material You, ktorú v skutočnosti nemôžete nosiť

Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.