Alexa и Siri не могат да разберат тона на гласа ви, но Oto може

Технологията за разпознаване на реч е навсякъде в наши дни, най-вече в ИИ умни асистенти като Alexa на Amazon, Siri на Apple и Google Assistant. Но както всеки, който някога е водил IRL разговор (в реалния живот), ще знае, речта не е само за думите, които човек казва, но и тона на гласа, с който ги казва. Това е една от причините, поради която текстовите разговори онлайн могат да бъдат такъв кошмар, тъй като самите основни думи не позволяват достатъчно нюанси, за да предадат винаги значението на даден човек.

Едно вълнуващо стартиране, което иска да внесе повече разбиране в разпознаването на реч, е Ото, спиноф от престижния SRI International, което помогна за създаването на Siri преди повече от десетилетие. Oto работи върху технология за гласова интонация, която поне първоначално ще позволи на центровете за повикване да разбират по-добре вокалните емоции както на обаждащите се, така и на търговските агенти.

Препоръчани видеоклипове

„В Oto нашата мисия е да отключим емпатията в машините и за тази цел разработихме DeepTone, уникална технология, базирана на дълбоки невронни мрежи, обучени на стотици хиляди реални разговори, за да отбележим малки вариации в емоциите, присъстващи в речта“, каза Никола Перони, съосновател и главен технологичен директор в Oto, пред Digital Тенденции.

Свързани

  • Вероятно не можете да достигнете максималните тактови скорости на Ryzen 9 7950X на AMD
  • Марс хеликоптер Ingenuity достига 23-ти полет, не може да бъде спрян
  • Този SSD е един от най-бързите, които сме виждали, но вероятно не можете да го използвате

Тези малки вариации, описани като „латентни състояния на говорещия“, позволяват емоционалният тон на думите на говорещия да бъде регистриран в реално време, много пъти в секунда. Системата е обучена на база данни от 100 000 изказвания на 3000 души, взети от 2 милиона разговора за продажба.

„Приложенията на интонацията са почти безкрайни“, каза Тео Боршберг, съосновател и главен изпълнителен директор. „Ние навлизаме в свят на глас на първо място. Скоро ще говорите с всичко: вашата кола, часовник, хладилник, високоговорители [и още]. Получаването на нюансите на речта ще бъде от ключово значение за създаването на смислени разговори. В момента работим върху човешкото качество на разговорите в центровете за контакт. Засега не е наистина възможно да се прецени емпиричното качество на обаждане само въз основа на текст; това е твърде двусмислено.

Чрез технологията на Oto агентите по продажбите могат да бъдат подканени в реално време да вложат „правилната енергия“ по време на разговори, като същевременно показват достатъчно съпричастност към клиентите. „Стойността е, че за първи път кол центровете могат да измерват качеството на преживяванията и да действат въз основа на тази информация в мащаб, за да спестят разгневените клиенти от отказ“, каза Боршберг.

Oto наскоро обяви a първоначално финансиране от 5,3 милиона долара. Това ще се използва за увеличаване на инженерните и търговските екипи на компанията. Освен това ще му помогне да разшири своите технологични предложения, за да разбере нови емоции и поведения чрез глас.

Препоръки на редакторите

  • Възприемането на Chrome за Nvidia DLSS е настроено да стартира, но все още не можете да го използвате
  • Новият M2 MacBook Pro на Apple не може да се справи с топлината - все пак трябва ли да го купите?
  • Страхотният нов телефон за игри на Lenovo изтече, но не можете да го купите
  • Вашият Amazon Echo, Alexa или Ring не работи ли днес? Вие не сте сами
  • Google пуска модна колекция Pixel 6 Material You, която всъщност не можете да носите

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.