Flickr „Park or Bird“ zobrazuje softvér na rozpoznávanie obrázkov

flickrs jednoduchý nástroj park bird vlastne demo komplexné rozpoznávanie obrázkov flickr
Z toho pramení dôvod vytvorenia tohto nového nástroja komiks xkcd, ktorá postavila inžinierov spoločnosti Flickr pred výzvu.

Inžinieri spoločnosti Flickr na vývoji skutočne tvrdo pracovali nový nástroj ktorý dokáže zistiť, či bola fotografia nasnímaná v národnom parku a či obsahuje vtáka. Jednoducho nahráte obrázok a do niekoľkých sekúnd Flickr vráti výsledky. Určite sa pýtate, prečo by Flickr venoval peniaze, čas a zdroje niečomu, čo si naše oči môžu ľahko vybrať? Zatiaľ čo nové „Flickr Park alebo Bird“ funkcia sa zdá byť zbytočná, v skutočnosti demonštruje zložitý softvér na rozpoznávanie obrázkov, ktorý Flickr používa vo svojich vyhľadávacích algoritmoch. To, čo sa nám ľuďom môže zdať ľahké rozoznať, je pre počítače o niečo komplikovanejšie, no táto funkcia ukazuje, ako ďaleko softvér pokročil a aká bude budúcnosť vyhľadávania obrázkov.

Odporúčané videá

Určiť, či bola snímka nasnímaná v parku, je pomerne jednoduché, ak sú v nej vložené údaje GPS. Flickr porovnáva informácie GPS so záznamami v databáze a môže vám povedať presný názov parku, kde bola fotografia odfotená. Ak neexistujú žiadne informácie, výsledky sa vrátia ako otázniky; na jednom obrázku, ktorý sme odovzdali, Flickr nemal žiadne údaje GPS, ktoré by bolo možné spracovať, ale dokázal zistiť, že bol nasnímaný v interiéri.

Súvisiace:Yahoo konečne uvádza na trh Flickr pre iPad

Rozpoznanie vtáka (alebo čohokoľvek iného) na obrázku je zložitejšie. Flickr hovorí, že jeho tím Vision „pracuje približne posledný rok na tom, aby to dokázal rozpoznať viac ako 1000 vecí v obrázkoch pomocou hlboké konvolučné neurónové siete“ a jednou z vecí, v ktorých je jeho softvér dobrý, je vyhľadávanie vtákov. Metóda je trochu technická na vysvetlenie (môžete si o nej prečítať viac tu), ale jednoducho povedané, softvér porovnáva vstupný obrázok (obrázok vtáka) s vrstvami a vrstvami obrázkov; jedna vrstva „môže rozpoznať najzákladnejšie prvky obrazu, ako sú krátke rovné čiary, rohy a malé kruhové oblúky“, zatiaľ čo iná vrstva má zložitejšie tvary a „ďalšie vrstvy môžu rozpoznať koncepty vyššej úrovne, ako sú oči a zobáky.“

Flickr hovorí, že jeho tím Vision „už používa túto hlbokú sieť na fotografie Flickr, aby ľuďom pomohol ľahšie nájsť čo hľadajú prostredníctvom vyhľadávania Flickr, a plánujeme ho integrovať do Flickru inými skvelými spôsobmi budúcnosti. Pracujeme aj na ďalších inovatívnych technológiách počítačového videnia a rozpoznávania obrazu, ktoré členom Flickru uľahčia vyhľadávanie a organizovanie ich fotografií.“ Autor: Keďže používatelia rozpoznávajú, čo je na fotke, v budúcnosti nebudú musieť ručne označovať, čo je na nich, pomocou textu, pretože softvér bude môcť tieto veci automaticky vybrať.

Nie je to dokonalé, ako ukazuje tento nahraný obrázok. Flickr nedokázal určiť, kde bola zastrelená kvôli chýbajúcim informáciám GPS, ale tiež si myslel, že táto slávna internetová mačka je vták.
Nie je to dokonalé, ako ukazuje tento nahraný obrázok. Flickr nedokázal určiť, kde bol zastrelený kvôli chýbajúcim informáciám GPS, ale tiež si myslel, že táto slávna internetová mačka je vták.

Zlepšite svoj životný štýlDigitálne trendy pomáhajú čitateľom mať prehľad o rýchlo sa rozvíjajúcom svete technológií so všetkými najnovšími správami, zábavnými recenziami produktov, užitočnými úvodníkmi a jedinečnými ukážkami.