Spracherkennungstechnologie ist heutzutage allgegenwärtig, vor allem in K.I. intelligente Assistenten wie Amazons Alexa, Apples Siri und Googles Assistant. Aber wie jeder weiß, der jemals ein Gespräch im echten Leben geführt hat, kommt es beim Sprechen nicht nur auf die Worte an, die eine Person sagt, sondern auch auf den Tonfall, in dem sie sie sagt. Dies ist einer der Gründe dafür, dass textbasierte Online-Konversationen so ein Albtraum sein können, da die grundlegenden Wörter selbst nicht genügend Nuancen zulassen, um immer die Bedeutung einer Person zu vermitteln.
Ein spannendes Startup, das mehr Verständnis in die Spracherkennung bringen möchte, ist Oto, ein Spin-off des prestigeträchtigen SRI International, das vor mehr als einem Jahrzehnt zur Entstehung von Siri beigetragen hat. Oto arbeitet an einer Sprachintonationstechnologie, die es Callcentern zumindest zunächst ermöglichen wird, die Stimmgefühle von Anrufern und Vertriebsmitarbeitern besser zu verstehen.
Empfohlene Videos
„Unsere Mission bei Oto ist es, Empathie in Maschinen freizusetzen, und zu diesem Zweck haben wir DeepTone entwickelt, eine einzigartige Technologie, die auf tiefen neuronalen Netzen basiert, die auf Hunderten von Geräten trainiert wurden Tausende realer Gespräche, um winzige Variationen der in der Sprache vorhandenen Emotionen zu erzielen“, sagte Nicolas Perony, Mitbegründer und Chief Technology Officer bei Oto, gegenüber Digital Trends.
Verwandt
- Mit dem Ryzen 9 7950X von AMD können Sie die maximale Taktrate wahrscheinlich nicht erreichen
- Der Mars-Helikopter Ingenuity erreicht seinen 23. Flug und kann nicht aufgehalten werden
- Diese SSD ist eine der schnellsten, die wir je gesehen haben, aber Sie können sie wahrscheinlich nicht verwenden
Diese winzigen Variationen, die als „latente Sprecherzustände“ bezeichnet werden, ermöglichen die Registrierung des emotionalen Tons der Worte eines Sprechers in Echtzeit, viele Male pro Sekunde. Das System wurde anhand einer Datenbank mit 100.000 Äußerungen von 3.000 Personen aus 2 Millionen Verkaufsgesprächen trainiert.
„Die Anwendungsmöglichkeiten der Intonation sind nahezu unbegrenzt“, sagte Teo Borschberg, Mitbegründer und CEO. „Wir betreten eine Voice-First-Welt. Bald werden Sie mit allem sprechen: Ihrem Auto, Ihrer Uhr, Ihrem Kühlschrank, Ihren Lautsprechern und mehr. Das Erkennen der Nuancen der Sprache wird der Schlüssel zum Aufbau sinnvoller Gespräche sein. Derzeit arbeiten wir an der menschlichen Qualität von Gesprächen in Contact Centern. Bisher ist es nicht wirklich möglich, die Erlebnisqualität eines Anrufs allein anhand des Textes zu beurteilen; es ist zu zweideutig.“
Durch die Technologie von Oto können Vertriebsmitarbeiter in Echtzeit aufgefordert werden, bei Anrufen „die richtige Energie“ zu investieren und gleichzeitig ausreichend Einfühlungsvermögen gegenüber den Kunden zu zeigen. „Der Wert besteht darin, dass Callcenter erstmals die Qualität von Erlebnissen messen und auf der Grundlage dieser Informationen in großem Maßstab reagieren können, um verärgerte Kunden vor der Abwanderung zu bewahren“, sagte Borschberg.
Oto hat kürzlich a angekündigt Seed-Finanzierungsrunde über 5,3 Millionen US-Dollar. Dies wird dazu genutzt, die Technik- und Vertriebsteams des Unternehmens zu vergrößern. Es wird auch dazu beitragen, sein Technologieangebot weiter auszubauen, um neue Emotionen und Verhaltensweisen mithilfe der Stimme zu verstehen.
Empfehlungen der Redaktion
- Chromes Version von Nvidia DLSS steht kurz vor der Veröffentlichung, Sie können sie jedoch noch nicht verwenden
- Apples neues M2 MacBook Pro verträgt die Hitze nicht – sollte man es trotzdem kaufen?
- Das coole neue Gaming-Telefon von Lenovo ist durchgesickert, aber Sie können es nicht kaufen
- Ist Ihr Amazon Echo, Alexa oder Ring heute ausgefallen? Du bist nicht allein
- Google bringt eine Pixel 6 Material You-Modekollektion auf den Markt, die man eigentlich nicht tragen kann
Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.