Alexa Dan Siri Tidak Bisa Memahami Nada Suara Anda, Tapi Oto Bisa

Teknologi pengenalan suara ada dimana-mana saat ini, terutama di dunia A.I. asisten pintar seperti Alexa dari Amazon, Siri dari Apple, dan Asisten Google. Namun seperti yang diketahui oleh siapa pun yang pernah melakukan percakapan IRL (dalam kehidupan nyata), pidato bukan hanya tentang kata-kata yang diucapkan seseorang, tetapi nada suara yang mereka ucapkan. Inilah salah satu alasan mengapa percakapan online berbasis teks bisa menjadi mimpi buruk, karena kata-kata dasarnya tidak memberikan nuansa yang cukup untuk selalu menyampaikan maksud seseorang.

Salah satu startup menarik yang ingin memberikan lebih banyak pemahaman ke dalam pengenalan suara adalah Oto, spin-off dari yang bergengsi SRI Internasional, yang membantu menelurkan Siri lebih dari satu dekade lalu. Oto sedang mengembangkan teknologi intonasi suara yang, setidaknya pada tahap awal, akan memungkinkan pusat panggilan untuk lebih memahami emosi vokal penelepon dan agen penjualan.

Video yang Direkomendasikan

“Di Oto, misi kami adalah untuk membuka empati pada mesin, dan untuk tujuan ini kami telah mengembangkan DeepTone, sebuah teknologi unik berdasarkan jaringan saraf dalam yang dilatih pada ratusan ribuan percakapan nyata untuk menilai variasi kecil dalam emosi yang ada dalam ucapan,” Nicolas Perony, salah satu pendiri dan chief technology officer di Oto, mengatakan kepada Digital Tren.

Terkait

  • Anda mungkin tidak dapat mencapai kecepatan clock maksimal pada AMD Ryzen 9 7950X
  • Helikopter Mars Ingenuity mencapai penerbangan ke-23, tidak dapat dihentikan
  • SSD ini adalah salah satu yang tercepat yang pernah kami lihat, tetapi Anda mungkin tidak dapat menggunakannya

Variasi kecil ini, yang digambarkan sebagai “keadaan laten pembicara”, memungkinkan nada emosional dari kata-kata pembicara dicatat secara real time, berkali-kali per detik. Sistem ini dilatih pada database 100.000 ucapan dari 3.000 orang, yang diambil dari 2 juta percakapan penjualan.

“Penerapan intonasi hampir tidak terbatas,” kata Teo Borschberg, salah satu pendiri dan CEO. “Kita memasuki dunia yang mengutamakan suara. Anda akan segera berbicara dengan segalanya: Mobil, jam tangan, lemari es, speaker, [dan banyak lagi]. Memahami nuansa pembicaraan akan menjadi kunci untuk menciptakan percakapan yang bermakna. Saat ini, kami sedang mengerjakan kualitas percakapan manusia di pusat kontak. Sejauh ini, tidak mungkin menilai kualitas pengalaman panggilan hanya berdasarkan teks saja; itu terlalu ambigu.”

Melalui teknologi Oto, agen penjualan dapat diminta secara real-time untuk menggunakan “energi yang tepat” selama menelepon, sekaligus menunjukkan empati pelanggan yang memadai. “Nilainya adalah untuk pertama kalinya, pusat panggilan dapat mengukur kualitas pengalaman dan bertindak berdasarkan informasi ini dalam skala besar untuk menyelamatkan pelanggan yang marah agar tidak melakukan churn,” kata Borschberg.

Oto baru-baru ini mengumumkan a putaran pendanaan awal sebesar $5,3 juta. Ini akan digunakan untuk mengembangkan tim teknik dan penjualan perusahaan. Hal ini juga akan membantunya memperluas penawaran teknologinya untuk memahami emosi dan perilaku baru melalui suara.

Rekomendasi Editor

  • Versi Chrome tentang Nvidia DLSS akan diluncurkan, tetapi Anda belum dapat menggunakannya
  • M2 MacBook Pro baru dari Apple tidak tahan panas — apakah Anda tetap harus membelinya?
  • Ponsel gaming keren baru dari Lenovo bocor, tapi Anda tidak bisa membelinya
  • Apakah Amazon Echo, Alexa, atau Ring Anda mati hari ini? Anda tidak sendirian
  • Google meluncurkan koleksi busana Pixel 6 Material You yang sebenarnya tidak bisa Anda pakai

Tingkatkan gaya hidup AndaTren Digital membantu pembaca mengawasi dunia teknologi yang bergerak cepat dengan semua berita terbaru, ulasan produk yang menyenangkan, editorial yang berwawasan luas, dan cuplikan unik.