La dernière IA du MIT est incroyable pour déterminer ce qui se passe dans les vidéos

Comment un réseau de relations temporelles comprend ce qui s'y passe

Quelques images d’informations racontant une histoire suffisent pour comprendre ce qui se passe. C’est, après tout, la base des bandes dessinées – qui fournissent juste assez de moments importants de l’histoire pour que nous puissions suivre ce qui s’est passé. Malheureusement, les robots équipés de la technologie de vision par ordinateur ont du mal à y parvenir. Jusqu'à présent, du moins.

Vidéos recommandées

Récemment, le Massachusetts Institute of Technology (MIT) a démontré un nouveau type d'intelligence artificielle. système qui utilise un réseau neuronal pour remplir les blancs dans les images vidéo afin de déterminer quelle activité prend lieu. Les résultats permettent de déterminer étonnamment bien ce qui se passe dans une vidéo.

« Les modules de relations temporelles nouvellement développés permettent à l'A.I. système pour analyser quelques images clés et estimer le temps relation entre eux, afin de comprendre ce qui se passe dans la vidéo – comme une pile d’objets [en train d’être] renversés »,

Bolei Zhou, ancien doctorant. étudiant au Laboratoire d’informatique et d’intelligence artificielle (CSAIL) du MIT, qui est maintenant professeur adjoint d’informatique à l’Université chinoise de Hong Kong, a déclaré à Digital Trends. "Comme le modèle fonctionne avec des images clés peu échantillonnées de la vidéo entrante, l'efficacité du traitement est considérablement améliorée, permettant la reconnaissance d'activité en temps réel."

Une autre propriété intéressante de l'A.I. Le modèle est qu’il peut anticiper et prévoir ce qui va se passer très tôt en visionnant des images vidéo. Par exemple, s’il voit une personne tenir une bouteille, l’algorithme anticipe qu’elle pourrait prendre un verre ou éventuellement le presser. De telles capacités d'anticipation seront essentielles pour l'intelligence artificielle utilisée dans des domaines tels que conduite autonome, où il pourrait prévenir les accidents de manière proactive en devinant ce qui se passera à chaque instant.

"Cela pourrait également être utilisé pour surveiller les comportements humains, comme un assistant robot domestique qui pourrait anticiper votre intention en livrant des choses à l'avance", a poursuivi Zhou. "Il [pourrait également être utilisé] pour analyser le grand nombre de vidéos en ligne, afin de mieux comprendre et récupérer les vidéos."

La prochaine étape du projet consistera à accroître la capacité de l’IA à reconnaître un plus grand nombre d’objets et d’activités. L’équipe travaille également avec des chercheurs en robotique pour déployer cette reconnaissance d’activité dans les systèmes robotisés. Cela pourrait entraîner une amélioration de la perception et des capacités de raisonnement visuel.

Recommandations des rédacteurs

  • Personne ne veut acheter les puces Zen 4 d’AMD – que se passe-t-il?
  • L’IA de Zoom une technologie permettant de détecter les émotions pendant les appels dérange les critiques
  • La formule amusante: pourquoi l'humour généré par la machine est le Saint Graal de l'IA.
  • Nvidia abaisse la barrière à l’entrée dans l’IA avec Fleet Command et LaunchPad
  • L'IA d'IBM Le navire Mayflower traverse l’Atlantique et vous pouvez le regarder en direct

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.