Flickr “Parks vai putns” parāda attēlu atpazīšanas programmatūru

flickrs vienkāršs parka putnu rīks faktiski demo sarežģītas attēlu atpazīšanas flickr
Iemesls šī jaunā rīka izveidei izriet no tā xkcd komikss, kas piedāvāja Flickr inženieriem izaicinājumu.

Flickr inženieri ir ļoti smagi strādājuši, izstrādājot jauns rīks kas var noteikt, vai fotoattēls ir uzņemts nacionālajā parkā un vai tajā ir putns. Jūs vienkārši augšupielādējat attēlu, un dažu sekunžu laikā Flickr atgriež rezultātus. Jūs noteikti jautāsiet, kāpēc Flickr varētu veltīt naudu, laiku un resursus kaut kam, ko mūsu acis var viegli pamanīt? Kamēr jaunā "Flickr parks vai putns” funkcija šķiet bezjēdzīga, tā patiesībā parāda sarežģītu attēlu atpazīšanas programmatūru, ko Flickr izmanto savos meklēšanas algoritmos. Tas, kas mums, cilvēkiem, varētu šķist viegli pamanāms, datoriem ir nedaudz sarežģītāks, tomēr šī funkcija parāda, cik tālu ir panākusi programmatūra un kāda būs attēlu meklēšanas nākotne.

Ieteiktie videoklipi

Noteikt, vai attēls ir uzņemts parkā, ir salīdzinoši viegli, ja vien ir iegulti GPS dati. Flickr saskaņo GPS informāciju ar ierakstiem datu bāzē un var pateikt precīzu parka nosaukumu, kurā tika uzņemts fotoattēls. Ja informācijas nav, rezultāti tiek atgriezti kā jautājuma zīmes; vienā augšupielādētajā attēlā Flickr nebija GPS datu, lai strādātu, bet tas varēja pateikt, ka tas tika uzņemts telpās.

Saistīts:Yahoo beidzot izlaiž Flickr iPad

Putna (vai jebko citu) atpazīšana attēlā ir vairāk saistīta. Flickr saka, ka tā Vision komanda "ir strādājusi apmēram pēdējo gadu, lai varētu atpazīt vairāk nekā 1000 lietas attēlos, izmantojot dziļi konvolucionālie neironu tīkli”, un viena no lietām, ko tā programmatūra ir laba, ir putnu atrašana. Metode ir nedaudz tehniska, lai izskaidrotu (par to varat lasīt vairāk šeit), bet vienkārši sakot, programmatūra saskaņo ievades attēlu (putna attēlu) ar attēlu slāņiem un slāņiem; viens slānis "var atpazīt visvienkāršākās attēla iezīmes, piemēram, īsas taisnas līnijas, stūrus un mazus apļveida lokus", savukārt citam slānim ir sarežģītākas formas, un "turpmāki slāņi var atpazīt augstāka līmeņa jēdzienus, piemēram, acis un knābji.”

Flickr saka, ka tā Vision komanda "jau izmanto šo dziļo tīklu Flickr fotoattēliem, lai palīdzētu cilvēkiem vieglāk atrast ko viņi meklē, izmantojot Flickr meklēšanu, un mēs plānojam to integrēt Flickr citos foršos veidos nākotnē. Mēs strādājam arī pie citām novatoriskām datorredzes un attēlu atpazīšanas tehnoloģijām, kas Flickr dalībniekiem atvieglos fotoattēlu atrašanu un kārtošanu. Autors atpazīstot fotoattēlā redzamo saturu, lietotājiem turpmāk nebūs manuāli jāatzīmē tajā esošais, izmantojot tekstu, jo programmatūra varēs automātiski atlasīt šīs lietas.

Tas nav ideāls, kā parāda šī attēla augšupielāde. Flickr nevarēja noteikt, kur tas tika uzņemts, jo trūkst GPS informācijas, taču tas arī domāja, ka šis slavenais interneta kaķis ir putns.
Tas nav ideāls, kā liecina šī attēla augšupielāde. Flickr nevarēja noteikt, kur tas tika uzņemts, jo trūkst GPS informācijas, taču tas arī domāja, ka šis slavenais interneta kaķis ir putns.

Uzlabojiet savu dzīvesveiduDigitālās tendences palīdz lasītājiem sekot līdzi steidzīgajai tehnoloģiju pasaulei, izmantojot visas jaunākās ziņas, jautrus produktu apskatus, ieskatu saturošus rakstus un unikālus ieskatus.