IA do Facebook Poderia resolver problemas irritantes em aplicativos de chat de vídeo

click fraud protection

A comunicação no Facebook pode ser predominantemente realizada através de texto, mas o gigante das redes sociais pode, no entanto, ajudar a resolver alguns dos maiores desafios da comunicação áudio. Anunciado na sexta-feira, 10 de julho, antes do Conferência Internacional sobre Aprendizado de Máquina, o Facebook desenvolveu um novo, inteligência artificial de última geração que é capaz de distinguir até cinco vozes falando simultaneamente.

Isso pode ser transformador para tudo, desde aparelhos auditivos de última geração ou alto-falantes inteligentes que discam e amplificam determinados vozes para futuras videoconferências no estilo Zoom, aprendendo a priorizar melhor os palestrantes e impedir que todos falem entre si outro.

Vídeos recomendados

“Esta é uma abordagem de aprendizagem supervisionada para separação de fala,” Eliya Nachmani, assistente de pesquisa na FAIR (Facebook IA Pesquisa) Tel Aviv, disse à Digital Trends. “Pela primeira vez, estamos mostrando que é possível separar cinco alto-falantes separados de uma única gravação de microfone. Também estamos mostrando como o modelo pode detectar o número de alto-falantes na gravação e pré-formar de acordo. O modelo não contém máscaras, o que significa que não estimamos máscaras que removam outras vozes. Em vez disso, nosso modelo aprende a filtrar outras vozes ou ruídos de fundo.”

Animação de separação de voz de 2 alto-falantes FINAL

Este elemento “sem máscara” é significativo. Os modelos anteriores que alcançaram benchmarks impressionantes usam uma máscara para remover outras vozes. O problema com esta abordagem é que os modelos pioram à medida que o número de falantes aumenta ou é desconhecido. Embora o modelo do Facebook ainda exija que o número de alto-falantes seja especificado, ele usa alguma tecnologia inteligente para descobrir automaticamente o número de pessoas que estão falando e então selecionar o modelo mais apropriado para trabalhar esse número.

Nachmani destacou que esta tecnologia de separação de fala também poderia ter outras aplicações. Além de separar vozes, também pode separar outros sons do ruído de fundo. Por exemplo, isso poderia permitir que isolar diferentes instrumentos musicais a partir de um único arquivo de áudio.

Será que alguma dessas tecnologias chegará a um produto do Facebook em breve? Isso não está claro. Esta é a IA fundamental. pesquisa que não necessariamente será incorporada a um futuro Facebook aplicativo. Mas é certamente fácil ver como tal ferramenta pode ser útil. Dado que Facebook já oferece vários recursos de bate-papo por vídeo e voz, não está fora de questão que isso possa chegar a um produto futuro em algum momento no futuro.

Esta IA a demonstração é apenas um dos mais de 30 artigos que o Facebook está discutindo na Conferência Internacional sobre Aprendizado de Máquina, que começa neste fim de semana.

Recomendações dos Editores

  • O Twitter acaba de corrigir um de seus problemas mais irritantes
  • Como a Nintendo poderia usar IA para trazer jogos em 4K para o Switch Pro
  • Nova IA inteligente sistema promete treinar seu cachorro enquanto você estiver fora de casa
  • Esta habilidade humana básica é o próximo marco importante para a IA.
  • Resumo do GTC 2020: o mundo virtual da Nvidia para robôs, A.I. Chamada de Vídeo

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.