Alexa와 Siri는 사용자의 목소리 톤을 이해할 수 없지만 Oto는 이해할 수 있습니다.

음성 인식 기술은 요즘 어디에나 있습니다. 특히 일체 포함. 스마트 비서 아마존의 알렉사, 애플의 시리, 구글의 어시스턴트 등이 대표적이다. 그러나 실생활에서 대화를 해본 사람이라면 누구나 알겠지만, 말은 사람이 말하는 단어뿐만 아니라 말하는 목소리의 톤에 관한 것입니다. 온라인에서 텍스트 기반 대화가 그렇게 악몽이 될 수 있는 이유 중 하나는 기본 단어 자체가 사람의 의미를 항상 전달할 만큼 충분한 뉘앙스를 허용하지 않기 때문입니다.

음성 인식에 대한 더 많은 이해를 제공하려는 흥미로운 스타트업 중 하나는 오토, 명문 회사의 스핀오프 SRI 인터내셔널, 이는 10여년 전에 Siri를 탄생시키는 데 도움이 되었습니다. Oto는 적어도 초기에는 콜센터가 발신자와 판매 상담원 모두의 음성 감정을 더 잘 이해할 수 있도록 하는 음성 억양 기술을 연구하고 있습니다.

추천 동영상

“Oto에서 우리의 임무는 기계의 공감 능력을 발휘하는 것입니다. 이를 위해 우리는 수백 개의 데이터로 훈련된 심층 신경망을 기반으로 하는 고유한 기술인 DeepTone을 개발했습니다. Oto의 공동 창립자이자 최고 기술 책임자인 Nicolas Perony는 Digital에 이렇게 말했습니다. 동향.

관련된

  • 아마도 AMD의 Ryzen 9 7950X에서는 최대 클럭 속도에 도달하지 못할 것입니다.
  • 화성 헬리콥터 독창성, 23번째 비행, 멈출 수 없어
  • 이 SSD는 우리가 본 것 중 가장 빠른 SSD 중 하나이지만 아마도 사용하지 못할 것입니다.

"잠재 화자 상태"라고 설명되는 이러한 작은 변화를 통해 화자의 말의 감정적 어조가 초당 여러 번 실시간으로 등록될 수 있습니다. 이 시스템은 200만 건의 판매 대화에서 가져온 3,000명의 사람이 한 100,000개의 발언 데이터베이스에서 훈련되었습니다.

공동 창립자이자 CEO인 Teo Borschberg는 “억양의 적용은 거의 무한합니다.”라고 말했습니다. “우리는 음성 우선 세계로 진입하고 있습니다. 곧 당신은 자동차, 시계, 냉장고, 스피커 등 모든 것과 대화하게 될 것입니다. 말의 뉘앙스를 파악하는 것이 의미 있는 대화를 만드는 데 중요합니다. 현재 우리는 컨택 센터에서 인간적인 대화의 질을 높이기 위해 노력하고 있습니다. 지금까지는 텍스트만을 기반으로 통화의 경험적 품질을 판단하는 것이 실제로 불가능합니다. 너무 모호해요.”

Oto의 기술을 통해 영업 담당자는 통화 중에 "올바른 에너지"를 투입하도록 실시간으로 유도하는 동시에 충분한 고객 공감을 보여줄 수 있습니다. Borschberg는 “처음으로 콜센터가 경험의 품질을 측정하고 이 정보에 따라 대규모로 조치를 취하여 화난 고객을 이탈하지 않도록 할 수 있다는 것이 가치입니다.”라고 말했습니다.

Oto는 최근에 530만 달러의 종자 자금 조달 라운드. 이는 회사의 엔지니어링 및 영업 팀을 성장시키는 데 사용됩니다. 또한 음성을 통해 새로운 감정과 행동을 이해하기 위한 기술 제공을 더욱 확장하는 데 도움이 될 것입니다.

편집자의 추천

  • Nvidia DLSS에 대한 Chrome의 출시가 예정되어 있지만 아직 사용할 수 없습니다
  • Apple의 새로운 M2 MacBook Pro는 열을 감당할 수 없습니다. 그래도 구매해야 할까요?
  • 레노버의 멋진 새 게이밍 폰이 유출됐지만 살 수는 없다
  • 오늘 Amazon Echo, Alexa 또는 Ring이 다운되었습니까? 당신은 혼자가 아닙니다
  • 구글, 실제로 입을 수 없는 픽셀 6 Material You 패션 컬렉션 출시

당신의 라이프스타일을 업그레이드하세요Digital Trends는 독자들이 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 빠르게 변화하는 기술 세계를 계속해서 살펴볼 수 있도록 도와줍니다.