Flickr "Park or Bird" présente un logiciel de reconnaissance d'images

outil simple pour les oiseaux de parc flickrs en fait une démonstration de reconnaissance d'image complexe flickr
La raison de la création de ce nouvel outil vient de ceci bande dessinée xkcd, ce qui a posé un défi aux ingénieurs de Flickr.

Les ingénieurs de Flickr ont travaillé très dur pour développer un nouvel outil cela permet de savoir si une photo a été prise dans un parc national et si elle contient un oiseau. Vous téléchargez simplement une image et, en quelques secondes, Flickr renvoie les résultats. Vous devez vous demander pourquoi Flickr consacrerait de l'argent, du temps et des ressources à quelque chose que nos yeux peuvent facilement repérer? Alors que le nouveau «Flickr Parc ou Oiseau" Cette fonctionnalité semble inutile, elle démontre en fait un logiciel de reconnaissance d'image complexe que Flickr utilise dans ses algorithmes de recherche. Ce qui peut sembler facile à discerner pour nous, les humains, est légèrement plus compliqué pour les ordinateurs, mais cette fonctionnalité montre à quel point les logiciels ont progressé et à quoi ressemblera l'avenir de la recherche d'images.

Vidéos recommandées

Déterminer si une image a été prise dans un parc est relativement simple, à condition que les données GPS soient intégrées. Flickr fait correspondre les informations GPS avec les enregistrements d'une base de données et peut vous indiquer le nom exact du parc où la photo a été prise. S'il n'y a aucune information, les résultats sont renvoyés sous forme de points d'interrogation; sur une image que nous avons téléchargée, Flickr ne disposait d'aucune donnée GPS sur laquelle travailler, mais il était capable de dire qu'elle avait été prise à l'intérieur.

En rapport:Yahoo lance enfin Flickr pour iPad

Reconnaître un oiseau (ou toute autre chose d'ailleurs) dans une image est plus complexe. Flickr affirme que son équipe Vision « travaille depuis environ un an pour pouvoir reconnaître plus de 1 000 choses dans les images en utilisant réseaux neuronaux convolutifs profonds", et l'une des choses pour lesquelles son logiciel est efficace est la recherche d'oiseaux. La méthode est un peu technique à expliquer (vous pouvez en savoir plus ici), mais en termes simples, le logiciel associe une image d'entrée (image d'un oiseau) à des couches et des couches d'images; un calque "pourrait reconnaître les caractéristiques les plus élémentaires de l'image, telles que des lignes droites courtes, des coins et de petits arcs de cercle", tandis qu'une autre couche a des formes plus complexes, et « d'autres couches pourraient reconnaître des concepts de niveau supérieur, comme les yeux et becs.

Flickr affirme que son équipe Vision « applique déjà ce réseau approfondi aux photos Flickr pour aider les gens à les trouver plus facilement ». ce qu'ils recherchent via la recherche Flickr, et nous prévoyons de l'intégrer dans Flickr d'autres manières intéressantes dans le avenir. Nous travaillons également sur d’autres technologies innovantes de vision par ordinateur et de reconnaissance d’images qui permettront aux membres Flickr de trouver et d’organiser plus facilement leurs photos. Par En reconnaissant le contenu d'une photo, les utilisateurs du futur n'auront plus besoin d'étiqueter manuellement ce qu'il y a dedans à l'aide de texte, car le logiciel sera capable de sélectionner ces éléments automatiquement.

Ce n'est pas parfait, comme le montre ce téléchargement d'image. Flickr n'a pas pu déterminer où la photo a été prise en raison de l'absence d'informations GPS, mais il a également pensé que ce célèbre félin Internet était un oiseau.
Ce n’est pas parfait, comme le montre ce téléchargement d’image. Flickr n'a pas pu déterminer où la photo a été prise en raison de l'absence d'informations GPS, mais il a également pensé que ce célèbre félin Internet était un oiseau.

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.