„Flickr“ inžinieriai labai daug dirbo kurdami naujas įrankis gali pasakyti, ar nuotrauka buvo padaryta nacionaliniame parke ir ar joje yra paukštis. Tiesiog įkeliate vaizdą ir per kelias sekundes „Flickr“ pateikia rezultatus. Turbūt klausiate, kodėl „Flickr“ skiria pinigų, laiko ir išteklių tam, ką mūsų akys gali lengvai atpažinti? Nors naujasis „Flickr parkas arba paukštis“ funkcija atrodo beprasmė, ji iš tikrųjų parodo sudėtingą vaizdo atpažinimo programinę įrangą, kurią „Flickr“ naudoja savo paieškos algoritmuose. Tai, ką mums, žmonėms, gali atrodyti nesunku, kompiuteriams yra šiek tiek sudėtingiau, tačiau ši funkcija parodo, kiek toli pažengė programinė įranga ir kokia bus vaizdų paieškos ateitis.
Rekomenduojami vaizdo įrašai
Nustatyti, ar vaizdas buvo nufotografuotas parke, yra gana lengva, jei yra įterpti GPS duomenys. „Flickr“ suderina GPS informaciją su įrašais duomenų bazėje ir gali pasakyti tikslų parko, kuriame buvo padaryta nuotrauka, pavadinimą. Jei informacijos nėra, rezultatai pateikiami kaip klaustukai; Viename įkeltame paveikslėlyje „Flickr“ neturėjo GPS duomenų, kad galėtų veikti, tačiau galėjo pasakyti, kad jis buvo padarytas patalpoje.
Susijęs:„Yahoo“ pagaliau išleidžia „Flickr“, skirtą „iPad“.
Atpažinti paukštį (ar bet ką kitą) vaizde yra labiau įtraukiama. „Flickr“ sako, kad jos „Vision“ komanda „dirbo maždaug pastaruosius metus, kad galėtų tai padaryti atpažinti daugiau nei 1000 dalykų vaizduose naudojant gilieji konvoliuciniai neuroniniai tinklai“, o vienas iš dalykų, kuriuos jos programinė įranga puikiai atlieka, yra paukščių paieška. Metodas yra šiek tiek techniškas paaiškinti (galite perskaityti daugiau apie tai čia), bet paprasčiau tariant, programinė įranga suderina įvesties vaizdą (paukščio vaizdą) su vaizdų sluoksniais ir sluoksniais; vienas sluoksnis „gali atpažinti pagrindines vaizdo ypatybes, pvz., trumpas tiesias linijas, kampus ir mažus apskritimo lankus“, o kitas sluoksnis yra sudėtingesnių formų, o „kiti sluoksniai gali atpažinti aukštesnio lygio sąvokas, tokias kaip akys ir snapai“.
„Flickr“ teigia, kad „Vision“ komanda „jau taiko šį gilų tinklą Flickr nuotraukoms, kad padėtų žmonėms lengviau rasti ko jie ieško naudodami „Flickr“ paiešką, ir planuojame integruoti jį į „Flickr“ kitais įdomiais būdais. ateitis. Mes taip pat dirbame su kitomis naujoviškomis kompiuterinio matymo ir vaizdo atpažinimo technologijomis, kurios palengvins „Flickr“ nariams galimybę rasti ir tvarkyti savo nuotraukas. Autorius atpažindami, kas yra nuotraukoje, naudotojams ateityje nereikės rankiniu būdu žymėti to, kas yra jose, naudodami tekstą, nes programinė įranga galės automatiškai atrinkti tuos dalykus.
Atnaujinkite savo gyvenimo būdąSkaitmeninės tendencijos padeda skaitytojams stebėti sparčiai besivystantį technologijų pasaulį – pateikiamos visos naujausios naujienos, smagios produktų apžvalgos, įžvalgūs vedamieji leidiniai ir unikalūs žvilgsniai.