L'IA à lecture labiale écrase les humains dans l'interprétation de phrases silencieuses

LipNet: À votre avis, la lecture labiale est-elle facile ?

L’une des parties les plus mémorables du chef-d’œuvre de science-fiction de Stanley Kubrick 2001: Une odyssée de l'espace est une intrigue dans laquelle deux membres du Découverte 1 L’équipage du vaisseau spatial se méfie de plus en plus du comportement de l’assistant IA du vaisseau, HAL 9000.

Sachant que HAL écoute constamment ce qu'ils disent, ils se retirent quelque part où ils savent que HAL ne peut pas écouter et acceptent de le déconnecter. HAL dévoile son plan après que les deux astronautes n'ont pas pris en compte les Capacités supérieures de lecture labiale de l’IA.

Des trucs futuristes, hein? Pas selon les recherches menées par des enquêteurs de l’Université d’Oxford. Ils ont développé un programme d’intelligence artificielle appelé LipNet, capable d’interpréter avec précision ce que disent les gens, en se basant uniquement sur la façon dont ils bougent la bouche lorsqu’ils parlent.

En rapport

  • Photoshop AI pense que le « bonheur » est un sourire aux dents pourries
  • J'ai présenté mon idée de startup ridicule à un robot VC
  • Comment saurons-nous quand une IA devient réellement sensible?

"LipNet effectue la lecture labiale au niveau de la phrase en utilisant l'apprentissage automatique" Brendan Shillingford, l'un des chercheurs sur le papier, a déclaré à Digital Trends. « Un réseau neuronal similaire aux modèles de reconnaissance vocale de pointe traite une séquence d'images vidéo et les mappe sur une phrase. Les approches précédentes fonctionnaient en prédisant des mots individuels plutôt que des phrases.

Vidéos recommandées

Les performances de LipNet se comparent incroyablement favorablement à celles des experts en lecture labiale humaine sur le corpus GRID, le plus grand ensemble de données de lecture labiale au niveau des phrases accessible au public. En fait, là où les experts humains n’ont obtenu que 52 pour cent, LipNet a obtenu 93 pour cent. Son approche de la lecture labiale basée sur des phrases a également brisé la meilleure tentative précédente d'une machine, qui a réussi une précision de 79,6 % sur le même ensemble de données.

Cependant, alors que le HAL 9000 fictif utilise ses pouvoirs de lecture labiale pour rien, l'équipe derrière LipNet a d'autres objectifs pour sa création. Environ 360 millions de personnes dans le monde souffrent d’une perte auditive invalidante. Des outils comme LipNet pourraient être très importants pour ces personnes, en les aidant à interpréter avec précision la parole de manière à leur faciliter la vie.

"D'autres applications qui nous intéressent incluent la dictée silencieuse dans les espaces publics, les conversations secrètes, reconnaissance vocale dans les environnements bruyants, identification biométrique et traitement des films muets », Shillingford a continué.

Bien que la surveillance soit un problème avec toute technologie comme celle-ci, Nando de Freitas, qui a également travaillé sur le projet, a déclaré qu'il ne s'agissait pas d'une application sur laquelle ils se sont concentrés. Cependant, il a déclaré qu’il « ne serait pas surprenant » que d’autres laboratoires tentent à l’avenir de s’appuyer sur de tels travaux dans ce but.

« Le public doit en être conscient et s'appuyer sur nos institutions juridiques démocratiques pour établir des lois appropriées qui protègent notre vie privée et notre dignité », a poursuivi de Freitas. "Nous espérons qu'en publiant ce travail, nous contribuerons à sensibiliser les gens, tout en soulignant l'utilité de cette technologie pour aider les personnes dans le besoin."

Recommandations des rédacteurs

  • Le rival ChatGPT d'Apple peut écrire automatiquement du code pour vous
  • Meta a créé DALL-E pour la vidéo, et c'est à la fois effrayant et incroyable
  • Les illusions d'optique pourraient nous aider à construire la prochaine génération d'IA
  • L'ordinateur portable d'apprentissage automatique de Lambda est un Razer déguisé
  • Lisez les « écritures synthétiques » étrangement belles d’un IA. qui pense que c'est Dieu

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.