Alexa ve Siri Sesinizin Tonunu Anlayamıyor Ama Oto Anlayabilir

Konuşma tanıma teknolojisi bugünlerde her yerde, özellikle de yapay zeka akıllı asistanlar Amazon'un Alexa'sı, Apple'ın Siri'si ve Google'ın Asistanı gibi. Ancak IRL (gerçek hayatta) sohbet eden herkesin bileceği gibi, konuşma sadece kişinin söylediği kelimelerle değil, aynı zamanda bunları söylerken kullanılan ses tonuyla da ilgilidir. Çevrimiçi metin tabanlı konuşmaların bu kadar kabusa dönüşmesinin bir nedeni de budur, çünkü temel kelimelerin kendisi, bir kişinin anlamını her zaman iletmek için yeterli nüansa izin vermez.

Konuşma tanımaya daha fazla anlayış kazandırmak isteyen heyecan verici bir girişim: Oto, prestijli markanın bir yan ürünü Sri UluslararasıBu, on yıldan fazla bir süre önce Siri'nin ortaya çıkmasına yardımcı oldu. Oto, en azından başlangıçta çağrı merkezlerinin arayanların ve satış temsilcilerinin sesli duygularını daha iyi anlamasını sağlayacak ses tonlama teknolojisi üzerinde çalışıyor.

Önerilen Videolar

“Oto olarak misyonumuz, makinelerde empatinin kilidini açmaktır ve bu amaçla, yüzlerce kullanıcı tarafından eğitilen derin sinir ağlarına dayanan benzersiz bir teknoloji olan DeepTone'u geliştirdik. Oto'nun kurucu ortağı ve baş teknoloji sorumlusu Nicolas Perony, Digital'e şunları söyledi: "Konuşmada mevcut olan duygulardaki küçük değişiklikleri puanlamak için binlerce gerçek konuşma. Trendler.

İlgili

  • Muhtemelen AMD'nin Ryzen 9 7950X'inde maksimum saat hızlarına ulaşamazsınız
  • Mars helikopteri Ingenuity 23. uçuşunu gerçekleştirdi, durdurulamıyor
  • Bu SSD şimdiye kadar gördüğümüz en hızlı SSD'lerden biri ancak muhtemelen kullanamazsınız

"Gizli konuşmacı durumları" olarak tanımlanan bu küçük farklılıklar, konuşmacının sözcüklerinin duygusal tonunun saniyede birçok kez gerçek zamanlı olarak kaydedilmesine olanak tanır. Sistem, 2 milyon satış konuşmasından alınan, 3.000 kişiden gelen 100.000 ifadeden oluşan bir veritabanı üzerinde eğitildi.

Kurucu ortak ve CEO Teo Borschberg, "Tonlamanın uygulamaları neredeyse sonsuzdur" dedi. “Önce sesin olduğu bir dünyaya giriyoruz. Yakında her şeyle konuşacaksınız: Arabanız, saatiniz, buzdolabınız, hoparlörleriniz [ve daha fazlası]. Konuşmanın nüanslarını anlamak, anlamlı konuşmalar oluşturmanın anahtarı olacaktır. Şu anda çağrı merkezlerindeki konuşmaların insani kalitesi üzerinde çalışıyoruz. Şu ana kadar bir aramanın deneyimsel kalitesini yalnızca metne dayanarak yargılamak gerçekten mümkün değil; bu çok belirsiz.”

Oto'nun teknolojisi sayesinde, satış temsilcileri gerçek zamanlı olarak aramalar sırasında "doğru enerjiyi" kullanmaları ve aynı zamanda yeterli müşteri empatisi göstermeleri konusunda yönlendirilebiliyor. Borschberg, "Değer şu ki, çağrı merkezleri ilk kez deneyimlerin kalitesini ölçebiliyor ve öfkeli müşterileri dağılmaktan kurtarmak için bu bilgilere göre geniş ölçekte harekete geçebiliyor." dedi.

Oto yakın zamanda bir açıklama yaptı 5,3 milyon dolarlık tohum finansmanı turu. Bu, şirketin mühendislik ve satış ekiplerini büyütmek için kullanılacak. Ayrıca, yeni duygu ve davranışları ses aracılığıyla anlamak için teknoloji tekliflerini daha da genişletmesine yardımcı olacak.

Editörlerin Önerileri

  • Chrome'un Nvidia DLSS'yi ele alması başlatılacak, ancak henüz kullanamazsınız
  • Apple'ın yeni M2 MacBook Pro'su sıcağa dayanamıyor; yine de satın almalı mısınız?
  • Lenovo'nun harika yeni oyun telefonu sızdırıldı, ancak satın alamıyorsunuz
  • Amazon Echo, Alexa veya Ring'iniz bugün kapalı mı? Yalnız değilsin
  • Google, aslında giyemeyeceğiniz bir Pixel 6 Material You moda koleksiyonunu piyasaya sürüyor

Yaşam tarzınızı yükseltinDigital Trends, en son haberler, eğlenceli ürün incelemeleri, anlayışlı başyazılar ve türünün tek örneği olan ön bakışlarla okuyucuların teknolojinin hızlı tempolu dünyasını takip etmelerine yardımcı olur.