A Google Lens Computer Vision Tech segít megérteni, mit lát a fényképezőgép

A Google Lens számítógépes látástechnológiája segítségével kontextust találhat azzal, amit a fényképezőgépe lát.
Sundar Pichai a Google logója előtt áll a Google IO 2021 kiállításon.
Ez a történet a Google I/O teljes terjedelmének része

Szeretné tudni annak a virágnak vagy madárnak a nevét, akivel a parkban sétálva találkozik? Hamarosan a Google Asszisztens a kamera és a mesterséges intelligencia segítségével meg tudja mondani.

Ajánlott videók

A Google ugrásszerűen elindította 2017-et I/O konferencia az AI és a gépi tanulás körül, és az egyik kiemelt számítógépes látástechnológia a Google Lens, amely lehetővé teszi a kamera többet tesz, mint csupán egy képet rögzít – nagyobb kontextust biztosít a látottakhoz.

Jön Google Asszisztens és Google Fotók, a Google Lens technológia „meg tudja érteni, hogy mit néz, és segít a cselekvésben” – mondta Sundar Pichai, a Google vezérigazgatója a vitaindító előadás során. Ha például a kamerát egy koncerthelyszínre irányítja, a Google Asszisztens többet tud mondani a előadót, zenét játszhat, jegyet vásárolhat az előadásra, és hozzáadhatja a naptárához, mindezt egy egyetlen alkalmazás.

Ha a fényképezőgép egy ismeretlen tárgyra mutat, a Google Assistant a képfelismerés révén meg tudja mondani, mi az. Irányítsa egy üzlet táblájára, és a helyadatok használatával érdemi információkat adhat a vállalkozásról. Mindez megtehető a felhasználó és az Asszisztens közötti „beszélgetési” hanginterakció révén.

„Telefonját ráirányíthatja, és mi automatikusan elvégezhetjük helyetted a kemény munkát” – mondta Pichai.

A Google Lens segítségével az Ön okostelefon a kamera nem csak azt fogja látni, amit lát, hanem megérti is a látottakat, és segít a cselekvésben. #io17pic.twitter.com/viOmWFjqk1

– Google (@Google) 2017. május 17

Ha a Google Fordító alkalmazását használja, már látta, hogyan működik a technológia: Helyezzen egy kamerát egy szöveg fölé, és az alkalmazás lefordítja azt egy Ön által értett nyelvre. A Google Asszisztensben a Google Lens továbbviszi ezt. Egy demonstráción a Google megmutatta ezt Google Asszisztens nem csak lefordítja az idegen szöveget, hanem képeket is jelenít meg a szövegben leírtakról, hogy több információt adjon.

Egy demóban Scott Huffman, a Google Assistant mérnöki alelnöke bemutatta, hogy a Google Lens hogyan működik a Google-on belül Az asszisztens le tudja fordítani egy kép japán szövegét, de további kontextust is adhat a szóhoz van.

A képfelismerő technológia nem új keletű, de a Google Lens megmutatja, milyen fejlettsé válik a gépi tanulás. Pichai elmondta, hogy a beszéddel kapcsolatos munkájához hasonlóan a Google is jelentős javulást tapasztal a látás terén. A számítógépes látástechnológia nem csak segít felismerni, hogy mi az, de még a kép javításában vagy javításában is segíthet. Homályos fotót készített az Eiffel-toronyról? Mivel a számítógép felismeri az objektumot, és tudja, hogy annak feltételezhetően kell kinéznie, automatikusan javítani tudja a képet az alapján, amit már ismer.

„Meg tudjuk érteni a fotó mögött rejlő tulajdonságokat” – mondta Pichai. „Számítógépes látórendszereink ma még az embereknél is jobbak a képfelismerés terén.”

Többé nem kell leírnia, hogy mi van a nyaralásról készült fotóin. Anil Sabharwal, a Google alelnöke a Google Fotókért megmutatta, hogy a Google Lens hogyan képes felismerni a fényképeken lévő objektumokat, és releváns információkat szolgáltatni róla.

Annak érdekében, hogy a Lens hatékonyan végezze munkáját, a Google kifinomult számítási architektúrát alkalmaz Cloud Tensor Processing Unit (TPU) lapkakészletek a betanítás és a következtetések kezelésére a gépén tanulás. Második generációs TPU technológiája másodpercenként 180 trillió lebegőpontos műveletet képes kezelni; 64 TPU kártya egy szuper számítógépben 11,5 petaflopot képes kezelni. Ezzel a számítási teljesítménnyel az új TPU egyszerre képes kezelni a betanítást és a következtetést, ami nem volt a múltban lehetséges volt (az előző TPU csak következtetési munkát tudott kezelni, de az összetettebbet nem kiképzés). A gépi tanulás időt vesz igénybe, de ez a hardver segít felgyorsítani az erőfeszítést.

A Google Lens a Google Fotók következő frissítését is működteti. A képfelismerés már használatban van a Fotókban az arcok, helyek és dolgok felismerésére, amelyek segítik a rendszerezést és a keresést. A Google Lens segítségével a Google Fotók több információt nyújthat a fotóin lévő dolgokról, például egy épület nevéről és leírásáról; a fotón szereplő telefonszám megérintésével hívást kezdeményez, és további információk jelennek meg a képen látott műalkotásról múzeumban, vagy akár automatikusan beírhatja a Wi-Fi jelszavát egy Wi-Fi hátuljáról készített fényképről router.

Utálod beírni a Wi-Fi hálózati jelszavakat? Készítsen fényképet a vezeték nélküli beállításokról, és a Google Lens technológia a Google Fotókon keresztül automatikusan be tudja adni azt.

Az Asszisztens és a Fotók lesznek az első olyan alkalmazások, amelyek a Google Lens-t használják, de más alkalmazásokban is elérhető lesz. Az iOS Assistant támogatásának bejelentésével pedig az iPhone felhasználók is használhatják a Google Lens technológiát.

Szerkesztői ajánlások

  • Nem, tényleg nincs szüksége Google Asszisztensre az okosóráján
  • 5 dolog, amit szívesen látnánk a Google I/O 2023-on (de valószínűleg nem)
  • A Google I/O 2023 május 10-én kerül sor egy személyes eseménnyel
  • iPhone 14 Pro vs. A Google Pixel 7 Pro kameracsata hihetetlenül közel van
  • Ez az új Google Lens funkció úgy néz ki, mint egy sci-fi filmből

Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.