La technologie de vision par ordinateur de Google Lens vous aide à comprendre ce que voit la caméra

La technologie de vision par ordinateur de Google Lens vous permet de trouver le contexte de ce que voit votre caméra.
Sundar Pichai se tient devant un logo Google lors de Google IO 2021.
Cette histoire fait partie de notre couverture complète de Google I/O

Vous voulez connaître le nom de cette fleur ou de cet oiseau que vous rencontrez lors de votre promenade dans un parc? Bientôt, Google Assistant pourra vous le dire, grâce à la caméra et à l'intelligence artificielle.

Vidéos recommandées

Google a lancé son année 2017 Conférence E/S autour de l'IA et de l'apprentissage automatique, et l'une des technologies de vision par ordinateur mise en avant est Google Lens, qui permet la caméra fait plus que simplement capturer une image: elle donne un meilleur contexte autour de ce que vous voyez.

Venir Assistant Google et GooglePhotos, la technologie Google Lens peut « comprendre ce que vous regardez et vous aider à agir », a déclaré Sundar Pichai, PDG de Google, lors du discours d'ouverture. Par exemple, si vous pointez la caméra vers le chapiteau d'une salle de concert, l'Assistant Google peut vous en dire plus sur l'événement. artiste, ainsi que jouer de la musique, vous aider à acheter des billets pour le spectacle et à l'ajouter à votre calendrier, le tout dans un application unique.

Lorsque la caméra pointe vers un objet inconnu, l’Assistant Google, grâce à la reconnaissance d’image, peut vous dire de quoi il s’agit. Dirigez-le vers une enseigne de magasin et, en utilisant les informations de localisation, vous pourrez obtenir des informations significatives sur l'entreprise. Tout cela peut être fait grâce à l’interaction vocale « conversationnelle » que l’utilisateur a avec l’Assistant.

"Vous pouvez pointer votre téléphone dessus et nous pouvons automatiquement faire le gros du travail à votre place", a déclaré Pichai.

Avec Google Lens, votre téléphone intelligent la caméra ne verra pas seulement ce que vous voyez, mais comprendra également ce que vous voyez pour vous aider à agir. #io17pic.twitter.com/viOmWFjqk1

-Google (@Google) 17 mai 2017

Si vous utilisez l'application Translate de Google, vous avez déjà vu comment fonctionne la technologie: placez une caméra sur un texte et l'application le traduira dans une langue que vous comprenez. Dans Google Assistant, Google Lens ira plus loin. Lors d'une démonstration, Google a montré que Assistant Google non seulement traduira le texte étranger, mais affichera également des images de ce que le texte décrit, pour donner plus d'informations.

Dans une démo, Scott Huffman, vice-président de l'ingénierie de Google pour Assistant, a montré comment Google Lens au sein de Google L'Assistant peut traduire le texte japonais d'une image, mais également donner un contexte supplémentaire sur ce que signifie le mot. est.

La technologie de reconnaissance d’images n’est pas nouvelle, mais Google Lens montre à quel point l’apprentissage automatique devient avancé. Pichai a déclaré que, comme pour ses travaux sur la parole, Google constate de grandes améliorations en termes de vision. La technologie de vision par ordinateur permet non seulement de reconnaître ce qu’est quelque chose, mais peut même aider à réparer ou à améliorer une image. Vous avez pris une photo floue de la Tour Eiffel? Parce que l’ordinateur reconnaît l’objet et sait à quoi il est censé ressembler, il peut automatiquement améliorer cette image en fonction de ce qu’il sait déjà.

"Nous pouvons comprendre les attributs d'une photo", a déclaré Pichai. "Nos systèmes de vision par ordinateur sont désormais encore meilleurs que les humains en matière de reconnaissance d'images."

Vous n’aurez plus besoin d’écrire le contenu de vos photos de vacances. Anil Sabharwal, vice-président de Google pour Google Photos, a montré comment Google Lens peut reconnaître des objets sur une photo et afficher des informations pertinentes à ce sujet.

Pour rendre Lens efficace dans son travail, Google utilise une architecture informatique sophistiquée de Chipsets Cloud Tensor Processing Unit (TPU), pour gérer la formation et l'inférence pour sa machine apprentissage. Sa technologie TPU de deuxième génération peut gérer 180 000 milliards d'opérations en virgule flottante par seconde; 64 cartes TPU dans un super ordinateur peuvent gérer 11,5 pétaflops. Avec cette puissance de calcul, le nouveau TPU peut gérer simultanément la formation et l’inférence, ce qui n’était pas le cas. possible dans le passé (le TPU précédent ne pouvait gérer que le travail d'inférence, mais pas le plus complexe) entraînement). L'apprentissage automatique prend du temps, mais ce matériel contribuera à accélérer les efforts.

Google Lens alimentera également la prochaine mise à jour de Google Photos. La reconnaissance d'images est déjà utilisée dans Photos pour reconnaître des visages, des lieux et des objets afin de faciliter l'organisation et la recherche. Avec Google Lens, Google Photos peut vous fournir davantage d'informations sur les éléments de vos photos, comme le nom et la description d'un bâtiment; appuyer sur un numéro de téléphone sur une photo passera un appel, obtenant plus d'informations sur une œuvre d'art que vous avez vue dans un musée, ou même saisir automatiquement le mot de passe Wi-Fi à partir d'une photo que vous avez prise à l'arrière d'un réseau Wi-Fi routeur.

Vous détestez saisir les mots de passe du réseau Wi-Fi? Prenez une photo des paramètres sans fil et la technologie Google Lens via Google Photos peut la saisir automatiquement pour vous.

Assistant et Photos seront les premières applications à utiliser Google Lens, mais il sera déployé dans d'autres applications. Et avec l'annonce de la prise en charge de l'Assistant dans iOS, les utilisateurs d'iPhone pourront également utiliser la technologie Google Lens.

Recommandations des rédacteurs

  • Non, vous n'avez vraiment pas besoin de Google Assistant sur votre montre intelligente
  • 5 choses que nous aimerions voir à Google I/O 2023 (mais ce ne sera probablement pas le cas)
  • Google I/O 2023 aura lieu le 10 mai avec un événement en personne
  • iPhone 14 Pro contre La bataille des caméras Google Pixel 7 Pro est incroyablement proche
  • Cette nouvelle fonctionnalité de Google Lens semble tout droit sortie d'un film de science-fiction

Améliorez votre style de vieDigital Trends aide les lecteurs à garder un œil sur le monde en évolution rapide de la technologie avec toutes les dernières nouvelles, des critiques de produits amusantes, des éditoriaux perspicaces et des aperçus uniques.