Facebook IA Podría solucionar un problema molesto en las aplicaciones de video chat

La comunicación en Facebook puede realizarse predominantemente a través de texto, pero el gigante de las redes sociales puede ayudar a resolver algunos de los mayores desafíos de la comunicación por audio. Anunciado el viernes 10 de julio, antes del Conferencia internacional sobre aprendizaje automático, Facebook ha desarrollado una nueva, inteligencia artificial de vanguardia que es capaz de distinguir hasta cinco voces hablando simultáneamente.

Esto podría ser transformador para todo, desde los audífonos de próxima generación o los parlantes inteligentes que marcan y amplifican ciertos voces para el futuro aprendizaje de videoconferencias estilo Zoom para priorizar mejor a los oradores y evitar que todos hablen entre sí otro.

Vídeos recomendados

"Este es un enfoque de aprendizaje supervisado para la separación del habla". Eliya Nachmani, asistente de investigación en FAIR (Facebook AI. Investigación) Tel Aviv, dijo a Digital Trends. “Por primera vez, estamos demostrando que es posible separar cinco altavoces distintos de una grabación con un solo micrófono. También mostramos cómo el modelo puede detectar el número de hablantes en la grabación y realizar preformas en consecuencia. El modelo no tiene máscaras, lo que significa que no estimamos el enmascaramiento que elimina otras voces. En cambio, nuestro modelo aprende a filtrar las otras voces o el ruido de fondo”.

Animación de separación de voz de 2 oradores FINAL

Este elemento “sin máscara” es significativo. Los modelos anteriores que alcanzaron puntos de referencia impresionantes utilizan una máscara para eliminar otras voces. El problema de este enfoque es que los modelos empeoran a medida que aumenta o se desconoce el número de hablantes. Si bien el modelo de Facebook aún requiere que se especifique la cantidad de parlantes, utiliza alguna tecnología inteligente para Calcula automáticamente el número de personas que están hablando y luego selecciona el modelo más apropiado para trabajar. Ese número.

Nachmani señaló que esta tecnología de separación del habla también podría tener otras aplicaciones. Además de separar voces, también podría separar otros sonidos del ruido de fondo. Por ejemplo, eso podría permitirle aislar diferentes instrumentos musicales desde un único archivo de audio.

¿Alguna de esta tecnología llegará pronto a un producto de Facebook? Eso no está claro. Esta es la IA fundamental. investigación que no necesariamente se incorporará en el futuro Facebook aplicación. Pero ciertamente es fácil ver cuán útil podría ser una herramienta de este tipo. Dado que Facebook ya ofrece varias funciones de video y chat de voz, no es imposible que esto pueda llegar a un producto futuro en el futuro.

Esta IA La demostración es solo uno de los más de 30 artículos que Facebook está discutiendo en la Conferencia Internacional sobre Aprendizaje Automático, que comienza este fin de semana.

Recomendaciones de los editores

  • Twitter acaba de solucionar uno de sus problemas más molestos
  • Cómo Nintendo podría usar A.I. para llevar los juegos 4K al Switch Pro
  • Nueva e inteligente IA. El sistema promete entrenar a tu perro mientras estás fuera de casa.
  • Esta habilidad humana básica es el próximo gran hito para la IA.
  • Resumen de GTC 2020: el mundo virtual de Nvidia para robots, A.I. videollamadas

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.