페이스북 AI 화상 채팅 앱의 성가신 문제를 해결할 수 있습니다

Facebook에서의 의사소통은 주로 텍스트를 통해 이루어질 수 있지만, 소셜 미디어 거대 기업은 그럼에도 불구하고 오디오 의사소통과 관련된 몇 가지 가장 큰 문제를 해결하는 데 도움을 줄 수 있습니다. 7월 10일 금요일에 발표되었습니다. 머신러닝에 관한 국제 컨퍼런스, Facebook은 새로운 기능을 개발했습니다. 최첨단 인공지능 동시에 말하는 최대 5명의 목소리를 구별할 수 있습니다.

이는 차세대 보청기나 전화를 걸어 특정 소리를 증폭시키는 스마트 스피커 등 모든 것에 혁신을 가져올 수 있습니다. 미래의 Zoom 스타일 화상 회의 학습에 대한 목소리를 통해 발표자의 우선순위를 높여 모든 사람이 서로 대화하는 것을 방지합니다. 다른.

추천 동영상

"이것은 음성 분리를 위한 지도 학습 접근 방식입니다." 엘리야 나크마니, FAIR의 연구 조교(페이스북 일체 포함. 연구) Tel Aviv는 Digital Trends에 말했습니다. “처음으로 우리는 단일 마이크 녹음에서 5개의 개별 스피커를 분리하는 것이 가능하다는 것을 보여주었습니다. 또한 모델이 녹음에서 화자의 수를 감지하고 이에 따라 사전 구성하는 방법도 보여줍니다. 모델에는 마스크가 없습니다. 즉, 다른 음성을 제거하는 마스킹을 추정하지 않습니다. 대신 우리 모델은 다른 목소리나 배경 소음을 필터링하는 방법을 학습합니다.”

2 화자 음성 분리 애니메이션 FINAL

이 "마스크 프리" 요소가 중요합니다. 인상적인 벤치마크를 달성한 이전 모델은 마스크를 사용하여 다른 목소리를 제거했습니다. 이 접근 방식의 문제점은 화자의 수가 증가하거나 알 수 없음에 따라 모델이 악화된다는 것입니다. Facebook 모델에서는 여전히 스피커 수를 지정해야 하지만 일부 스마트 기술을 사용하여 대화 중인 사람의 수를 자동으로 파악한 후 작업에 가장 적합한 모델을 선택합니다. 그 번호.

Nachmani는 이 음성 분리 기술이 다른 용도로도 사용될 수 있다고 지적했습니다. 음성을 분리하는 것 외에도 배경 소음에서 다른 소리를 정렬할 수도 있습니다. 예를 들어, 이렇게 하면 다음이 가능해집니다. 다양한 악기를 분리하다 단일 오디오 파일에서.

이 기술이 조만간 Facebook 제품에 적용되나요? 그 정도는 명확하지 않습니다. 이것이 기본적인 A.I입니다. 반드시 미래에 반영될 필요는 없는 연구 페이스북 앱. 하지만 그러한 도구가 얼마나 유용할지 쉽게 알 수 있습니다. 을 고려하면 페이스북 이미 다양한 영상 및 음성 채팅 기능을 제공하고 있으며, 향후 언젠가는 이러한 기능이 미래 제품에 적용될 가능성도 배제할 수 없습니다.

이 A.I. 시연은 Facebook이 이번 주말에 시작되는 기계 학습에 관한 국제 컨퍼런스에서 논의하고 있는 30개 이상의 논문 중 하나일 뿐입니다.

편집자의 추천

  • 트위터가 가장 짜증나는 문제 중 하나를 해결했습니다.
  • Nintendo가 A.I.를 어떻게 사용할 수 있습니까? Switch Pro에 4K 게이밍 구현
  • 영리하고 새로운 A.I. 시스템은 당신이 집에 없는 동안 개를 훈련시키겠다고 약속합니다.
  • 이 기본적인 인간 기술은 AI의 다음 주요 이정표입니다.
  • GTC 2020 요약: Nvidia의 로봇을 위한 가상 세계, A.I. 화상 통화

당신의 라이프스타일을 업그레이드하세요Digital Trends는 독자들이 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 빠르게 변화하는 기술 세계를 계속해서 살펴볼 수 있도록 도와줍니다.