Technologie rozpoznávání řeči je v dnešní době všude, zejména v A.I. chytré asistenty jako je Amazon Alexa, Apple Siri a Google Assistant. Ale jak každý, kdo někdy měl konverzaci IRL (ve skutečném životě), ví, řeč není jen o slovech, které člověk říká, ale o tónu hlasu, kterým je říká. Je to jeden z důvodů, proč textové konverzace online mohou být takovou noční můrou, protože samotná základní slova neumožňují dostatečné nuance, aby vždy vyjádřily význam osoby.
Jeden vzrušující startup, který chce vnést více porozumění do rozpoznávání řeči, je Oto, spinoff z prestižní Mezinárodní SRI, který pomohl zplodit Siri před více než deseti lety. Oto pracuje na technologii hlasové intonace, která alespoň zpočátku umožní callcentrům lépe porozumět hlasovým emocím volajících i obchodních zástupců.
Doporučená videa
„V Oto je naším posláním odemknout empatii ve strojích, a za tímto účelem jsme vyvinuli DeepTone, unikátní technologii založenou na hlubokých neuronových sítích trénovaných na stovkách tisíce skutečných konverzací, abychom zaznamenali drobné odchylky v emocích přítomných v řeči,“ řekl pro Digital Nicolas Perony, spoluzakladatel a technologický ředitel společnosti Oto. Trendy.
Příbuzný
- Pravděpodobně nemůžete dosáhnout maximální rychlosti hodin na AMD Ryzen 9 7950X
- Mars vrtulník Ingenuity zasáhne 23. let, nelze jej zastavit
- Tento SSD je jedním z nejrychlejších, které jsme viděli, ale pravděpodobně ho nemůžete použít
Tyto drobné variace, popisované jako „latentní stavy mluvčího“, umožňují emocionální tón slov mluvčího registrovat v reálném čase, mnohokrát za sekundu. Systém byl trénován na databázi 100 000 výroků od 3 000 lidí, převzatých z 2 milionů prodejních konverzací.
"Aplikace intonace jsou téměř nekonečné," řekl Teo Borschberg, spoluzakladatel a CEO. „Vstupujeme do světa, kde vládne hlas. Brzy budete mluvit se vším: se svým autem, hodinkami, lednicí, reproduktory [a dalšími]. Získání nuancí řeči bude klíčem k vytvoření smysluplné konverzace. Právě teď pracujeme na lidské kvalitě konverzací v kontaktních centrech. Zatím není skutečně možné posoudit zážitkovou kvalitu hovoru pouze na základě textu; je to příliš nejednoznačné."
Prostřednictvím technologie Oto mohou být obchodní zástupci v reálném čase vyzváni, aby během hovorů vložili „správnou energii“, a zároveň projevili dostatečnou empatii se zákazníky. „Hodnota spočívá v tom, že call centra mohou poprvé měřit kvalitu zkušeností a jednat na základě těchto informací ve velkém, aby uchránili rozzlobené zákazníky před zmítáním,“ řekl Borschberg.
Oto nedávno oznámil a kolo počátečního financování ve výši 5,3 milionu dolarů. To bude použito k růstu inženýrských a prodejních týmů společnosti. Pomůže také dále rozšiřovat své technologické nabídky, aby porozuměla novým emocím a chování prostřednictvím hlasu.
Doporučení redakce
- Spuštění Chrome na Nvidia DLSS je připraveno, ale zatím jej nemůžete používat
- Nový M2 MacBook Pro od Apple nezvládá horko – měli byste si ho přesto koupit?
- Skvělý nový herní telefon Lenovo unikal, ale nemůžete si ho koupit
- Nefunguje vám dnes Amazon Echo, Alexa nebo Ring? nejsi sám
- Google uvádí na trh módní kolekci Pixel 6 Material You, kterou ve skutečnosti nemůžete nosit
Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.