새로운 IBM 음성 기술은 초인간적인 것을 목표로 합니다.

IBM 가지다 Embedded ViaVoice 4.4 공개는 자유 형식 명령 인식, 즉석 번역 및 자막 서비스를 제공하며 영어 음성의 뉘앙스를 이해할 수 있다고 주장합니다. 이 기술은 사용자가 차량, 휴대용 장치 및 기타 비컴퓨터에 내장된 시스템을 제어할 수 있도록 설계되었습니다. 미리 정의된 음성을 외우고 신중하게 발음할 필요 없이 장치에 유연하고 자연스럽게 말할 수 있는 애플리케이션 명령.

"자유 형식 명령 인식"의 예로 IBM은 자동차의 라디오 방송국을 104.3 FM으로 변경하는 명령을 제공합니다. "104.3으로 변경", "104.3 FM으로 조정" 또는 "라디오 방송국을 104.3으로 설정"과 같은 다양한 명령을 말합니다. 시스템 활성화 보다 다양한 직관적인 명령을 이해하게 되면 음성인식 기술을 더욱 다양한 분야에서 성공적으로 사용할 수 있게 될 것입니다. 응용 프로그램. ViaVoice는 이제 명령의 통계 및 의미 분석을 사용하여 미리 정의되고 기억된 세트 외부의 명령을 해석합니다. 향상된 음향 모델링은 시끄러운 조건과 일시적인 소리로 인해 음성이 중단되는 경우 더 높은 정확도를 제공합니다. 소음.

추천 동영상

IBM의 다른 두 가지 음성 인식 프로젝트인 MASTOR와 Tales는 음성 연구에 대한 두 가지 흥미로운 새로운 방향을 제시합니다. 마스터 IBM 연구 프로젝트인 다국어 자동 음성 대 음성 번역기(Multilingual Automatic Speech-to-Speech Translator)는 영어 음성을 중국어로 동적으로 번역할 수 있습니다. 사용자가 마이크에 영어로 말하면 MASTOR는 그 문장을 즉석에서 중국어로 번역합니다. MASTOR는 음성 입력에 대한 통계 분석을 사용하여 먼저 문장을 구조적 집합으로 디컴파일합니다. 개념적 패턴을 바탕으로 목표 언어로 번역된 문장을 컴파일합니다. 패턴. 이와 같은 시스템에서는 약간의 대기 시간이 불가피합니다.

편집자의 추천

  • 2022년 최고의 음성-텍스트 변환 소프트웨어
  • 곰을 위한 얼굴 인식 기술은 인간을 안전하게 지키는 것을 목표로 합니다.
  • IBM은 더 이상 얼굴 인식 기술을 개발하거나 연구하지 않을 것입니다.

당신의 라이프스타일을 업그레이드하세요Digital Trends는 독자들이 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 빠르게 변화하는 기술 세계를 계속해서 살펴볼 수 있도록 도와줍니다.