Tehnologia Google Lens Computer Vision vă ajută să înțelegeți ce vede camera

Tehnologia de viziune computerizată Google Lens vă permite să găsiți context cu ceea ce vede camera dvs.
Sundar Pichai stă în fața unei sigle Google la Google IO 2021.
Această poveste face parte din acoperirea noastră completă Google I/O

Vrei să știi numele acelei flori sau păsări pe care o întâlnești în timpul plimbării prin parc? În curând, Asistentul Google vă va putea spune, folosind camera și inteligența artificială.

Videoclipuri recomandate

Google și-a început din plin 2017 conferință I/O în jurul inteligenței artificiale și a învățării automate și o tehnologie de viziune computerizată pe care a evidențiat-o este Google Lens, care permite camera face mai mult decât să captureze o imagine - oferă un context mai mare în jurul a ceea ce vedeți.

Vin la Asistent Google și Google Foto, tehnologia Google Lens poate „înțelege la ce te uiți și te poate ajuta să acționezi”, a spus CEO-ul Google, Sundar Pichai, în timpul conferinței. De exemplu, dacă îndreptați camera către o locație de concert, Asistentul Google vă poate spune mai multe despre interpret, precum și să redați muzică, vă ajută să cumpărați bilete la spectacol și să le adăugați în calendar, totul într-un interval de timp. o singură aplicație.

Când camera este îndreptată către un obiect necunoscut, Asistentul Google, prin recunoașterea imaginii, vă poate spune despre ce este vorba. Îndreptați-l către un semn de magazin și, folosind informații despre locație, vă poate oferi informații semnificative despre companie. Toate acestea se pot face prin interacțiunea vocală „conversațională” pe care utilizatorul o are cu Asistentul.

„Puteți îndrepta telefonul spre el și noi putem face automat munca grea pentru dvs.”, a spus Pichai.

Cu Google Lens, dvs smartphone camera nu va vedea doar ceea ce vedeți, ci va înțelege și ceea ce vedeți pentru a vă ajuta să luați măsuri. #io17pic.twitter.com/viOmWFjqk1

— Google (@Google) 17 mai 2017

Dacă utilizați aplicația Google Translate, ați văzut deja cum funcționează tehnologia: plasați o cameră pe un text și aplicația îl va traduce într-o limbă pe care o înțelegeți. În Google Assistant, Google Lens va duce acest lucru mai departe. Într-o demonstrație, Google a arătat asta Asistent Google nu numai că va traduce text străin, dar va afișa și imagini cu ceea ce textul descrie, pentru a oferi mai multe informații.

Într-o demonstrație, Scott Huffman, vicepreședintele ingineriei Google pentru Assistant, a demonstrat cum Google Lens în cadrul Google Asistentul poate traduce textul japonez al unei imagini, dar, de asemenea, poate oferi un context suplimentar despre cuvântul este.

Tehnologia de recunoaștere a imaginilor nu este nouă, dar Google Lens arată cât de avansată devine învățarea automată. Pichai a spus că, la fel ca și în ceea ce privește activitatea sa privind vorbirea, Google observă îmbunătățiri mari în viziune. Tehnologia de viziune computerizată nu numai că ajută la recunoașterea a ceea ce este ceva, dar poate chiar ajuta la repararea sau îmbunătățirea unei imagini. Ați făcut o fotografie neclară a Turnului Eiffel? Deoarece computerul recunoaște obiectul și știe cum ar trebui să arate, poate îmbunătăți automat acea imagine pe baza a ceea ce se știe deja.

„Putem înțelege atributele din spatele unei fotografii”, a spus Pichai. „Sistemele noastre de viziune computerizată acum sunt chiar mai bune decât oamenii la recunoașterea imaginilor.”

Nu va mai fi nevoie să notați ce este în fotografiile din vacanță. Vicepreședintele Google Anil Sabharwal pentru Google Photos a arătat cum Google Lens poate recunoaște obiectele dintr-o fotografie și poate aduce informații relevante despre aceasta.

Pentru ca Lens să fie eficient în activitatea sa, Google folosește o arhitectură de calcul sofisticată Chipset-uri Cloud Tensor Processing Unit (TPU), pentru a gestiona instruirea și inferența pentru mașina sa învăţare. Tehnologia sa TPU de a doua generație poate gestiona 180 de trilioane de operațiuni în virgulă mobilă pe secundă; 64 de plăci TPU într-un singur super computer pot gestiona 11,5 petaflopi. Cu această putere de calcul, noul TPU poate gestiona atât antrenamentul, cât și inferența simultan, ceea ce nu a fost posibil în trecut (TPU-ul anterior putea gestiona doar lucrări de inferență, dar nu și cele mai complexe Instruire). Învățarea automată necesită timp, dar acest hardware va ajuta la accelerarea efortului.

Google Lens va alimenta și următoarea actualizare a Google Foto. Recunoașterea imaginilor este deja folosită în Fotografii pentru a recunoaște fețe, locuri și lucruri care să ajute la organizare și căutare. Cu Google Lens, Google Photos vă poate oferi mai multe informații despre lucrurile din fotografiile dvs., cum ar fi numele și descrierea unei clădiri; Atingerea unui număr de telefon dintr-o fotografie va efectua un apel, afișând mai multe informații despre o opera de artă pe care ați văzut-o într-un muzeu sau chiar introduceți automat parola Wi-Fi dintr-o fotografie pe care ați făcut-o cu partea din spate a unui Wi-Fi router.

Urăsc introducerea parolelor rețelei Wi-Fi? Faceți o fotografie cu setările wireless, iar tehnologia Google Lens prin Google Foto o poate introduce automat pentru dvs.

Asistentul și Fotografiile vor fi primele aplicații care vor folosi Google Lens, dar vor fi implementate în alte aplicații. Și odată cu anunțul suportului pentru Asistent în iOS, utilizatorii de iPhone vor putea folosi și tehnologia Google Lens.

Recomandările editorilor

  • Nu, chiar nu aveți nevoie de Asistent Google pe ceasul inteligent
  • 5 lucruri pe care ne-ar plăcea să le vedem la Google I/O 2023 (dar probabil că nu o vor face)
  • Google I/O 2023 are loc pe 10 mai cu un eveniment în persoană
  • iPhone 14 Pro vs. Lupta cu camera Google Pixel 7 Pro este incredibil de aproape
  • Această nouă funcție Google Lens pare a fi scoasă direct dintr-un film SF

Îmbunătățește-ți stilul de viațăDigital Trends îi ajută pe cititori să țină cont de lumea rapidă a tehnologiei cu toate cele mai recente știri, recenzii distractive despre produse, editoriale perspicace și anticipări unice.