Технологія розпізнавання мовлення сьогодні повсюдна, особливо в А.І. розумні помічники таких як Alexa від Amazon, Siri від Apple і Google Assistant. Але, як знає будь-хто, хто коли-небудь спілкувався з IRL (у реальному житті), мова залежить не лише від слів, які людина каже, а від тону голосу, яким вона їх вимовляє. Це одна з причин того, що текстові розмови в Інтернеті можуть бути таким кошмаром, оскільки основні слова самі по собі не дозволяють достатніх нюансів, щоб завжди передати значення людини.
Одним із захоплюючих стартапів, який прагне покращити розуміння розпізнавання мовлення, є Ото, спіноф престижного SRI International, яка допомогла створити Siri більше десяти років тому. Oto працює над технологією голосової інтонації, яка, принаймні спочатку, дозволить колл-центрам краще розуміти голосові емоції абонентів і торгових агентів.
Рекомендовані відео
«У Oto наша місія полягає в тому, щоб розблокувати емпатію в машинах, і з цією метою ми розробили DeepTone, унікальну технологію, засновану на глибоких нейронних мережах, навчених сотнями тисячі реальних розмов, щоб оцінити крихітні варіації емоцій, присутніх у мові», – сказав Ніколя Пероні, співзасновник і головний технічний директор Oto, для Digital. Тенденції.
Пов'язані
- Ймовірно, ви не можете досягти максимальної тактової частоти на AMD Ryzen 9 7950X
- Марсіанський гелікоптер Ingenuity виконує 23-й рейс, його неможливо зупинити
- Цей SSD є одним із найшвидших, які ми бачили, але ви, мабуть, не можете ним користуватися
Ці крихітні варіації, які описуються як «латентні стани мовця», дозволяють реєструвати емоційний тон слів мовця в реальному часі, багато разів на секунду. Система була навчена на базі даних із 100 000 висловлювань 3 000 людей, взятих із 2 мільйонів розмов про продаж.
«Застосування інтонації майже нескінченне», — сказав Тео Боршберг, співзасновник і генеральний директор. «Ми вступаємо у світ, у якому перш за все голос. Незабаром ви будете розмовляти всім: своєю машиною, годинником, холодильником, динаміками [і іншим]. Отримання нюансів мовлення буде ключовим для створення змістовних розмов. Зараз ми працюємо над людською якістю розмов у контакт-центрах. Поки що неможливо судити про якість розмови лише на основі тексту; це надто неоднозначно».
Завдяки технології Oto торгові агенти можуть отримувати підказки в режимі реального часу вкласти «потрібну енергію» під час дзвінків, одночасно демонструючи достатню емпатію до клієнтів. «Цінність полягає в тому, що вперше колл-центри можуть вимірювати якість досвіду та діяти на основі цієї інформації в масштабі, щоб уберегти розлючених клієнтів від відмови», — сказав Боршберг.
Ото нещодавно оголосив про a раунд початкового фінансування в розмірі 5,3 мільйона доларів. Це буде використано для розвитку команд інженерів і продажів компанії. Це також допоможе йому ще більше розширити свої технологічні пропозиції, щоб зрозуміти нові емоції та поведінку за допомогою голосу.
Рекомендації редакції
- Chrome розглядає Nvidia DLSS налаштовано на запуск, але ви ще не можете використовувати його
- Новий M2 MacBook Pro від Apple не витримує спеки — чи варто купувати його?
- Новий класний ігровий телефон Lenovo просочився, але ви не можете його купити
- Ваш Amazon Echo, Alexa або Ring сьогодні не працює? Ви не самотні
- Google випускає модну колекцію Pixel 6 Material You, яку насправді не можна носити
Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.