Flickr 'Park ali ptica' prikazuje programsko opremo za prepoznavanje slik

flickr preprosto orodje za park ptice dejansko demo zapleteno prepoznavanje slik flickr
Razlog za ustvarjanje tega novega orodja izhaja iz tega xkcd strip, ki je Flickrjeve inženirje postavilo pred izziv.

Flickrjevi inženirji so se zelo potrudili pri razvoju novo orodje ki lahko pove, ali je bila fotografija posneta v narodnem parku in ali je na njej ptica. Preprosto naložite sliko in v nekaj sekundah Flickr vrne rezultate. Zagotovo se sprašujete, zakaj bi Flickr namenjal denar, čas in vire nečemu, kar naše oko zlahka izbere? Medtem ko novi "Flickr Park ali Bird” se zdi nesmiselna, dejansko prikazuje zapleteno programsko opremo za prepoznavanje slik, ki jo Flickr uporablja v svojih iskalnih algoritmih. Kar se nam ljudem zdi preprosto zaznati, je za računalnike nekoliko bolj zapleteno, vendar funkcija kaže, kako daleč je napredovala programska oprema in kakšna bo prihodnost iskanja slik.

Priporočeni videoposnetki

Ugotavljanje, ali je bila slika posneta v parku, je relativno enostavno, če so vgrajeni podatki GPS. Flickr poveže podatke GPS z zapisi v zbirki podatkov in vam lahko pove točno ime parka, kjer je bila fotografija posneta. Če informacij ni, se rezultati vrnejo kot vprašaji; na eni sliki, ki smo jo naložili, Flickr ni imel podatkov GPS, ki bi jih lahko obdelal, vendar je ugotovil, da je bila posneta v zaprtih prostorih.

Sorodno:Yahoo je končno uvedel Flickr za iPad

Prepoznavanje ptice (ali karkoli drugega) na sliki je bolj zapleteno. Flickr pravi, da je njegova ekipa Vision »delala zadnje leto ali več, da bi lahko prepozna več kot 1000 stvari v slikah z uporabo globoke konvolucijske nevronske mreže,« in ena od stvari, v kateri je njegova programska oprema dobra, je iskanje ptic. Metoda je nekoliko tehnična za razlago (več o njej lahko preberete tukaj), preprosto povedano, programska oprema primerja vhodno sliko (podobo ptice) s plastmi in plastmi slik; en sloj "lahko prepozna najosnovnejše značilnosti slike, kot so kratke ravne črte, vogali in majhni krožni loki," medtem ko ima druga plast bolj zapletene oblike in »nadaljnje plasti lahko prepoznajo koncepte višje ravni, kot so oči in kljuni."

Flickr pravi, da njegova ekipa Vision »že uporablja to globoko omrežje za fotografije Flickr, da bi ljudem pomagala pri lažjem iskanju kaj iščejo prek iskanja Flickr, in nameravamo to vključiti v Flickr na druge kul načine v prihodnost. Delamo tudi na drugih inovativnih tehnologijah računalniškega vida in prepoznavanja slik, ki bodo članom Flickra olajšale iskanje in organiziranje svojih fotografij.« Avtor: Pri prepoznavanju, kaj je na fotografiji, uporabnikom v prihodnosti ne bo treba ročno označevati, kaj je na njih, z besedilom, saj bo programska oprema te stvari lahko izbrala samodejno.

Ni popolno, kot kaže ta naložena slika. Flickr zaradi manjkajočih podatkov GPS ni mogel ugotoviti, kje je bil posnet, vendar je tudi mislil, da je ta znana spletna mačka ptica.
Ni popolno, kot kaže ta naložena slika. Flickr zaradi manjkajočih podatkov GPS ni mogel ugotoviti, kje je bil posnet, vendar je tudi mislil, da je ta znana spletna mačka ptica.

Nadgradite svoj življenjski slogDigitalni trendi bralcem pomagajo slediti hitremu svetu tehnologije z vsemi najnovejšimi novicami, zabavnimi ocenami izdelkov, pronicljivimi uvodniki in enkratnimi vpogledi v vsebine.