Alexa та Siri не можуть зрозуміти тон вашого голосу, але Oto може

Технологія розпізнавання мовлення сьогодні повсюдна, особливо в А.І. розумні помічники таких як Alexa від Amazon, Siri від Apple і Google Assistant. Але, як знає будь-хто, хто коли-небудь спілкувався з IRL (у реальному житті), мова залежить не лише від слів, які людина каже, а від тону голосу, яким вона їх вимовляє. Це одна з причин того, що текстові розмови в Інтернеті можуть бути таким кошмаром, оскільки основні слова самі по собі не дозволяють достатніх нюансів, щоб завжди передати значення людини.

Одним із захоплюючих стартапів, який прагне покращити розуміння розпізнавання мовлення, є Ото, спіноф престижного SRI International, яка допомогла створити Siri більше десяти років тому. Oto працює над технологією голосової інтонації, яка, принаймні спочатку, дозволить колл-центрам краще розуміти голосові емоції абонентів і торгових агентів.

Рекомендовані відео

«У Oto наша місія полягає в тому, щоб розблокувати емпатію в машинах, і з цією метою ми розробили DeepTone, унікальну технологію, засновану на глибоких нейронних мережах, навчених сотнями тисячі реальних розмов, щоб оцінити крихітні варіації емоцій, присутніх у мові», – сказав Ніколя Пероні, співзасновник і головний технічний директор Oto, для Digital. Тенденції.

Пов'язані

  • Ймовірно, ви не можете досягти максимальної тактової частоти на AMD Ryzen 9 7950X
  • Марсіанський гелікоптер Ingenuity виконує 23-й рейс, його неможливо зупинити
  • Цей SSD є одним із найшвидших, які ми бачили, але ви, мабуть, не можете ним користуватися

Ці крихітні варіації, які описуються як «латентні стани мовця», дозволяють реєструвати емоційний тон слів мовця в реальному часі, багато разів на секунду. Система була навчена на базі даних із 100 000 висловлювань 3 000 людей, взятих із 2 мільйонів розмов про продаж.

«Застосування інтонації майже нескінченне», — сказав Тео Боршберг, співзасновник і генеральний директор. «Ми вступаємо у світ, у якому перш за все голос. Незабаром ви будете розмовляти всім: своєю машиною, годинником, холодильником, динаміками [і іншим]. Отримання нюансів мовлення буде ключовим для створення змістовних розмов. Зараз ми працюємо над людською якістю розмов у контакт-центрах. Поки що неможливо судити про якість розмови лише на основі тексту; це надто неоднозначно».

Завдяки технології Oto торгові агенти можуть отримувати підказки в режимі реального часу вкласти «потрібну енергію» під час дзвінків, одночасно демонструючи достатню емпатію до клієнтів. «Цінність полягає в тому, що вперше колл-центри можуть вимірювати якість досвіду та діяти на основі цієї інформації в масштабі, щоб уберегти розлючених клієнтів від відмови», — сказав Боршберг.

Ото нещодавно оголосив про a раунд початкового фінансування в розмірі 5,3 мільйона доларів. Це буде використано для розвитку команд інженерів і продажів компанії. Це також допоможе йому ще більше розширити свої технологічні пропозиції, щоб зрозуміти нові емоції та поведінку за допомогою голосу.

Рекомендації редакції

  • Chrome розглядає Nvidia DLSS налаштовано на запуск, але ви ще не можете використовувати його
  • Новий M2 MacBook Pro від Apple не витримує спеки — чи варто купувати його?
  • Новий класний ігровий телефон Lenovo просочився, але ви не можете його купити
  • Ваш Amazon Echo, Alexa або Ring сьогодні не працює? Ви не самотні
  • Google випускає модну колекцію Pixel 6 Material You, яку насправді не можна носити

Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.