Facebook IA Pourrait résoudre un problème ennuyeux dans les applications de chat vidéo

La communication sur Facebook se fait peut-être principalement par texte, mais le géant des médias sociaux peut néanmoins contribuer à résoudre certains des plus grands défis liés à la communication audio. Annoncé le vendredi 10 juillet, avant le Conférence internationale sur l'apprentissage automatique, Facebook a développé un nouveau, intelligence artificielle de pointe capable de distinguer jusqu’à cinq voix parlant simultanément.

Cela pourrait être transformateur pour tout, des aides auditives de nouvelle génération aux haut-parleurs intelligents connectant et amplifiant certains voix vers l'apprentissage futur des vidéoconférences de style Zoom pour mieux hiérarchiser les intervenants afin d'empêcher tout le monde de parler les uns des autres autre.

Vidéos recommandées

"Il s'agit d'une approche d'apprentissage supervisé pour la séparation de la parole." Eliya Nachmani, assistant de recherche à FAIR (Facebook I.A. Research) Tel Aviv, a déclaré à Digital Trends. « Pour la première fois, nous montrons qu’il est possible de séparer cinq haut-parleurs distincts à partir d’un seul enregistrement par microphone. Nous montrons également comment le modèle peut détecter le nombre de locuteurs dans l'enregistrement et pré-former en conséquence. Le modèle est sans masque, ce qui signifie que nous n’estimons pas le masquage qui supprime les autres voix. Au lieu de cela, notre modèle apprend à filtrer les autres voix ou bruits de fond.

Animation de séparation vocale à 2 haut-parleurs FINAL

Cet élément « sans masque » est significatif. Les modèles précédents qui ont atteint des résultats impressionnants utilisent un masque pour supprimer les autres voix. Le problème avec cette approche est que les modèles se détériorent à mesure que le nombre de locuteurs augmente ou est inconnu. Même si le modèle de Facebook nécessite toujours de préciser le nombre de locuteurs, il utilise une technologie intelligente pour détermine automatiquement le nombre de personnes qui parlent, puis sélectionne le modèle le plus approprié avec lequel travailler ce numéro.

Nachmani a souligné que cette technologie de séparation de la parole pourrait également avoir d'autres applications. En plus de séparer les voix, il pourrait également trier les autres sons du bruit de fond. Par exemple, cela pourrait lui permettre de isoler différents instruments de musique à partir d'un seul fichier audio.

Cette technologie sera-t-elle bientôt intégrée à un produit Facebook? Cela n’est pas clair. C’est fondamental pour l’IA. des recherches qui ne seront pas nécessairement projetées dans le futur Facebook application. Mais il est certainement facile de voir à quel point un tel outil pourrait être utile. Étant donné que Facebook propose déjà diverses fonctionnalités de chat vidéo et vocal, il n’est pas exclu que cela puisse se retrouver dans un futur produit dans le futur.

Cette A.I. Cette démonstration n'est que l'un des plus de 30 articles dont Facebook discute lors de la Conférence internationale sur l'apprentissage automatique, qui débute ce week-end.

Recommandations des rédacteurs

  • Twitter vient de résoudre l'un de ses problèmes les plus ennuyeux
  • Comment Nintendo pourrait utiliser l'IA pour apporter le jeu 4K au Switch Pro
  • Une nouvelle IA intelligente le système promet de dresser votre chien pendant que vous êtes loin de chez vous
  • Cette compétence humaine fondamentale constitue la prochaine étape majeure pour l’IA.
  • Résumé GTC 2020: le monde virtuel de Nvidia pour les robots, l'IA appels vidéo

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.