„Google Lens Computer Vision Tech“ padeda suprasti, ką mato fotoaparatas

„Google Lens“ kompiuterinio matymo technologija leidžia rasti kontekstą to, ką mato jūsų fotoaparatas.
Sundar Pichai stovi priešais „Google“ logotipą „Google IO 2021“.
Ši istorija yra mūsų visos „Google I/O“ aprėpties dalis

Norite sužinoti, kaip vadinasi gėlė ar paukštis, su kuriuo susitinkate eidami po parką? Netrukus „Google Assistant“ galės jums pasakyti, naudodamas fotoaparatą ir dirbtinį intelektą.

Rekomenduojami vaizdo įrašai

„Google“ pradėjo savo 2017 m I/O konferencija apie dirbtinį intelektą ir mašininį mokymąsi, o viena kompiuterinio matymo technologija, kurią ji pabrėžė, yra „Google Lens“, kuri leidžia fotoaparatas daro daugiau nei tiesiog fiksuoja vaizdą – suteikia daugiau konteksto apie tai, ką matote.

Artėja prie „Google“ padėjėjas ir „Google“ nuotraukos, „Google Lens“ technologija gali „suprasti, į ką žiūrite, ir padėti imtis veiksmų“, – per pagrindinį pranešimą sakė „Google“ generalinis direktorius Sundaras Pichai. Pavyzdžiui, jei nukreipsite fotoaparatą į koncerto vietos palapinę, „Google Assistant“ gali papasakoti daugiau apie atlikėjas, taip pat leisti muziką, padėti nusipirkti bilietus į spektaklį ir įtraukti jį į savo kalendorių – visa tai viena programa.

Kai fotoaparatas nukreipiamas į nepažįstamą objektą, „Google Assistant“ per vaizdo atpažinimą gali pasakyti, kas tai yra. Nukreipkite jį į parduotuvės ženklą ir naudodami vietos informaciją galite suteikti reikšmingos informacijos apie įmonę. Visa tai galima padaryti naudojant „pokalbio“ balso sąveiką su Padėjėju.

„Galite nukreipti savo telefoną į jį ir mes galime automatiškai atlikti sunkų darbą už jus“, – sakė Pichai.

Naudodami „Google Lens“, jūsų išmanusis telefonas fotoaparatas ne tik matys tai, ką matote, bet ir supras, ką matote, kad padėtų jums imtis veiksmų. #io17pic.twitter.com/viOmWFjqk1

- Google Google) 2017 m. gegužės 17 d

Jei naudojate „Google“ vertėjo programą, jau matėte, kaip ši technologija veikia: uždėkite kamerą virš teksto ir programa išvers jį į jums suprantamą kalbą. „Google Assistant“ sistemoje „Google Lens“ tai padarys toliau. „Google“ tai parodė demonstracijoje „Google“ padėjėjas ne tik išvers svetimą tekstą, bet ir parodys tekste aprašomus vaizdus, ​​​​kad suteiktų daugiau informacijos.

Demonstracinėje versijoje Scottas Huffmanas, „Google“ padėjėjo inžinerijos viceprezidentas, demonstravo, kaip „Google Lens“ sistemoje „Google“ Padėjėjas gali išversti japonišką vaizdo tekstą, bet taip pat pateikti išsamesnį žodžio kontekstą yra.

Vaizdų atpažinimo technologija nėra nauja, tačiau „Google Lens“ parodo, kaip tobulėja mašininis mokymasis. Pichai teigė, kad, kaip ir kalbėdamas, „Google“ pastebi didelius regėjimo patobulinimus. Kompiuterinio matymo technologija ne tik padeda atpažinti, kas yra, bet netgi gali padėti pataisyti ar pagerinti vaizdą. Ar padarėte neryškią Eifelio bokšto nuotrauką? Kadangi kompiuteris atpažįsta objektą ir žino, kaip jis turėtų atrodyti, jis gali automatiškai patobulinti vaizdą pagal tai, ką jau žino.

„Galime suprasti nuotraukos požymius“, - sakė Pichai. „Mūsų kompiuterinės regos sistemos dabar netgi geriau atpažįsta vaizdą nei žmonės.

Jums nebereikės rašyti, kas yra jūsų atostogų nuotraukose. „Google“ viceprezidentas Anil Sabharwal „Google“ nuotraukoms parodė, kaip „Google Lens“ gali atpažinti objektus nuotraukoje ir pateikti apie ją svarbią informaciją.

Kad Lens efektyviai atliktų savo darbą, „Google“ naudoja sudėtingą skaičiavimo architektūrą „Cloud Tensor Processing Unit“ (TPU) mikroschemų rinkiniai, kad būtų galima atlikti mokymą ir daryti išvadas apie savo įrenginį mokymasis. Jo antrosios kartos TPU technologija gali atlikti 180 trilijonų slankiojo kablelio operacijų per sekundę; 64 TPU plokštės viename super kompiuteryje gali apdoroti 11,5 petaflops. Su šia skaičiavimo galia naujasis TPU vienu metu gali atlikti mokymą ir išvadas, o tai nebuvo įmanoma anksčiau (ankstesnis TPU galėjo atlikti tik išvadų darbą, bet ne sudėtingesnį mokymas). Mašinų mokymasis užtrunka, tačiau ši aparatinė įranga padės paspartinti pastangas.

„Google Lens“ taip pat aprūpins kitą „Google“ nuotraukų atnaujinimą. Vaizdo atpažinimas jau naudojamas Nuotraukose, kad atpažintų veidus, vietas ir dalykus, kad būtų lengviau organizuoti ir ieškoti. Naudojant „Google Lens“, „Google“ nuotraukos gali suteikti daugiau informacijos apie nuotraukose esančius dalykus, pvz., pastato pavadinimą ir aprašymą; palietus telefono numerį nuotraukoje, paskambinsite ir gausite daugiau informacijos apie meno kūrinį, kurį matėte a muziejuje arba net automatiškai įveskite „Wi-Fi“ slaptažodį iš nuotraukos, kurią padarėte Wi-Fi įrenginio gale maršrutizatorius.

Nemėgstate įvesti „Wi-Fi“ tinklo slaptažodžių? Nufotografuokite belaidžio ryšio nustatymus, o „Google Lens“ technologija per „Google“ nuotraukas galės ją automatiškai įvesti už jus.

„Assistant“ ir „Photos“ bus pirmosios programos, kuriose bus naudojamas „Google Lens“, tačiau jos bus įtrauktos į kitas programas. Ir paskelbus apie „iOS“ asistento palaikymą, „iPhone“ vartotojai taip pat galės naudoti „Google Lens“ technologiją.

Redaktorių rekomendacijos

  • Ne, jums tikrai nereikia „Google Assistant“ jūsų išmaniajame laikrodyje
  • 5 dalykai, kuriuos norėtume pamatyti „Google I/O 2023“ (bet tikriausiai to nepamatys)
  • „Google I/O 2023“ vyks gegužės 10 d. su asmeniniu renginiu
  • iPhone 14 Pro vs. „Google Pixel 7 Pro“ fotoaparatų kova yra neįtikėtinai arti
  • Ši nauja „Google Lens“ funkcija atrodo kaip tiesiog iš mokslinės fantastikos filmo

Atnaujinkite savo gyvenimo būdąSkaitmeninės tendencijos padeda skaitytojams stebėti sparčiai besivystantį technologijų pasaulį – pateikiamos visos naujausios naujienos, smagios produktų apžvalgos, įžvalgūs vedamieji leidiniai ir unikalūs žvilgsniai.