Alexa și Siri nu pot înțelege tonul vocii tale, dar Oto poate

Tehnologia de recunoaștere a vorbirii este peste tot în zilele noastre, mai ales în A.I. asistenți inteligenți cum ar fi Alexa de la Amazon, Siri de la Apple și Asistentul Google. Dar, după cum oricine a avut vreodată o conversație IRL (în viața reală), va ști, vorbirea nu este doar despre cuvintele pe care le spune o persoană, ci despre tonul vocii în care le spune. Este unul dintre motivele pentru care conversațiile online bazate pe text pot fi un astfel de coșmar, deoarece cuvintele de bază în sine nu permit o nuanță suficientă pentru a transmite întotdeauna sensul unei persoane.

Un startup interesant care caută să injecteze mai multă înțelegere în recunoașterea vorbirii este Oto, un spin-off de la prestigios SRI International, care a ajutat la generarea Siri cu mai bine de un deceniu în urmă. Oto lucrează la o tehnologie de intonație vocală care, cel puțin inițial, va permite centrelor de apeluri să înțeleagă mai bine emoțiile vocale ale apelanților și agenților de vânzări deopotrivă.

Videoclipuri recomandate

„La Oto, misiunea noastră este de a debloca empatia în mașini și, în acest scop, am dezvoltat DeepTone, o tehnologie unică bazată pe rețele neuronale profunde antrenate pe sute de mii de conversații reale pentru a nota mici variații ale emoțiilor prezente în vorbire”, a declarat Nicolas Perony, co-fondator și director de tehnologie la Oto, pentru Digital. Tendințe.

Legate de

  • Probabil că nu puteți atinge vitezele maxime de ceas pe Ryzen 9 7950X de la AMD
  • Elicopterul Marte Ingenuity atinge al 23-lea zbor, nu poate fi oprit
  • Acest SSD este unul dintre cele mai rapide pe care le-am văzut, dar probabil că nu îl puteți folosi

Aceste variații minuscule, descrise ca „stări latente ale vorbitorului”, permit ca tonul emoțional al cuvintelor unui vorbitor să fie înregistrat în timp real, de multe ori pe secundă. Sistemul a fost antrenat pe o bază de date de 100.000 de enunțuri de la 3.000 de persoane, preluate din 2 milioane de conversații de vânzări.

„Aplicațiile intonației sunt aproape infinite”, a spus Teo Borschberg, co-fondator și CEO. „Intrăm într-o lume cu voce în primul rând. În curând vei vorbi cu totul: mașina, ceasul, frigiderul, difuzoarele și multe altele. Obținerea nuanțelor vorbirii va fi cheia pentru a crea conversații semnificative. În prezent, lucrăm la calitatea umană a conversațiilor din centrele de contact. Până acum, nu este cu adevărat posibil să judecăm calitatea experienţială a unui apel doar pe baza textului; este prea ambiguu.”

Prin intermediul tehnologiei Oto, agenții de vânzări pot fi solicitați în timp real să pună „energia potrivită” în timpul apelurilor, arătând în același timp suficientă empatie pentru clienți. „Valoarea este că, pentru prima dată, centrele de apeluri pot măsura calitatea experiențelor și pot acționa pe baza acestor informații la scară pentru a salva clienții furioși de la agitare”, a spus Borschberg.

Oto a anunțat recent a rundă de finanțare de început de 5,3 milioane USD. Acesta va fi folosit pentru a crește echipele de inginerie și vânzări ale companiei. De asemenea, îl va ajuta să-și extindă și mai mult ofertele tehnologice pentru a înțelege noi emoții și comportamente prin voce.

Recomandările editorilor

  • Imaginea de către Chrome a Nvidia DLSS este setată să se lanseze, dar nu o puteți utiliza încă
  • Noul MacBook Pro M2 de la Apple nu poate face față căldurii - ar trebui să-l cumperi în continuare?
  • Noul telefon de gaming al lui Lenovo s-a scurs, dar nu îl puteți cumpăra
  • Amazon Echo, Alexa sau Ring nu sunt astăzi? nu ești singur
  • Google lansează o colecție de modă Pixel 6 Material You pe care de fapt nu o poți purta

Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.