Facebook ouvre son IA de reconnaissance d'image à tout le monde

Facebook Messenger virus malware Windows Chrome facebookcomp tête
La division de recherche en IA de Facebook ouvre son logiciel de reconnaissance d'image dans le but de faire progresser la technologie afin qu'elle puisse un jour être appliquée à la vidéo en direct. Facebook Masque profond, masque pointu, et MultiPathNet le logiciel est désormais accessible à tous sur GitHub.

Facebook a déjà présenté ses systèmes de reconnaissance d'images dans un certain nombre de documents de recherche, qui sont également mis à la disposition du public avec ses démos. À l’heure actuelle, les algorithmes de l’entreprise fonctionnent en conjonction avec ses réseaux neuronaux convolutifs MultiPathNet – une IA alimentée par d’énormes quantités de données jusqu'à ce qu'il puisse reconnaître de manière autonome d'autres données - permettant à Facebook de comprendre une image en fonction de chaque pixel qu'elle contient contient.

Vidéos recommandées

Afin de classer et d'étiqueter les objets d'une image, Facebook associe son framework de segmentation DeepMask à son module de raffinement de segment SharpMask. La dernière étape du système de vision industrielle de Facebook utilise son IA d’apprentissage en profondeur MultiPathNet pour étiqueter chaque objet de la photo.

En rapport

  • OpenAI révèle l'emplacement de son premier avant-poste international
  • Photoshop AI pense que le « bonheur » est un sourire aux dents pourries
  • Les illusions d'optique pourraient nous aider à construire la prochaine génération d'IA

Selon Facebook, les logiciels de vision artificielle IA ont progressé à pas de géant au cours des dernières années, permettant un type de classification d’images qui n’existait même pas il y a peu. Facebook affirme que l'open source du logiciel est essentiel à son avancement.

Exemples d'images numérisées par le système complet de reconnaissance d'images de Facebook
Exemples d'images numérisées par le système complet de reconnaissance d'images de Facebook

Les techniques d’apprentissage profond fleurissent partout sur le grand géant bleu. L’IA alimente Facebook (controversé), fonction de reconnaissance faciale, gère la curation sur son fil d'actualité et est même utilisée au sein de son assistant numérique pour Messenger.

Ce n’est pas la première fois que Facebook rend son IA open source. En fait, l’entreprise est en quelque sorte une pionnière en matière de partage de sa technologie. En décembre, Facebook a soumis son état de l'art Serveur informatique dédié à l'IA à l'Open Compute Project — un groupe composé de géants de la technologie, tels qu'Apple et Microsoft, qui partagent la conception de leurs infrastructures informatiques respectives.

Facebook prédit déjà les futurs cas d'utilisation de la technologie de reconnaissance d'images. La société révèle qu'elle pourrait potentiellement l'aider à s'appuyer sur ses descriptions d'images existantes générées par l'IA pour le malvoyant.

"Actuellement, les utilisateurs malvoyants qui parcourent des photos sur Facebook n'entendent que le nom de la personne qui a partagé la photo, suivi du terme « photo » lorsqu'ils tombent sur une image dans leur fil d'actualité », écrit Piotr Dollar, chercheur scientifique. à Facebook AI Research (FAIR), dans un article de blog. « Au lieu de cela, nous visons à proposer des descriptions plus riches, telles que « La photo contient une plage, des arbres et trois personnes souriantes ».

De plus, Facebook affirme que son prochain défi consiste à appliquer ses techniques de reconnaissance d'images à la vidéo, « où les objets bougent, interagissent et changent au fil du temps », et même à la vidéo. Facebook Diffusions en direct. « La classification en temps réel pourrait aider à faire apparaître des vidéos en direct pertinentes et importantes sur Facebook, tout en appliquant des techniques plus raffinées pour détecter des scènes, des objets et des actions dans l’espace et dans le temps, cela pourrait un jour permettre une narration en temps réel », ajoute Dollar.

Recommandations des rédacteurs

  • Même OpenAI a renoncé à détecter le plagiat de ChatGPT
  • Les meilleurs générateurs d'images IA pour créer de l'art à partir de texte
  • Meta a créé DALL-E pour la vidéo, et c'est à la fois effrayant et incroyable
  • Trois raisons pour lesquelles Facebook/Meta ferme son système de reconnaissance faciale
  • L'IA BigSleep c'est comme Google Image Search pour des images qui n'existent pas encore

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.