Flickr „Park or Bird“ ukazuje software pro rozpoznávání obrázků

flickrs jednoduchý nástroj park bird ve skutečnosti demo komplexní rozpoznávání obrazu flickr
Z toho pramení důvod pro vytvoření tohoto nového nástroje komiks xkcd, která postavila inženýry Flickru před výzvu.

Inženýři Flickru na vývoji opravdu tvrdě pracovali nový nástroj to může zjistit, zda byla fotografie pořízena v národním parku a zda obsahuje ptáka. Jednoduše nahrajete obrázek a během několika sekund Flickr vrátí výsledky. Určitě se ptáte, proč by Flickr věnoval peníze, čas a zdroje něčemu, co si naše oči mohou snadno vybrat? Zatímco nový „Flickr Park nebo BirdFunkce se zdá být zbytečná, ve skutečnosti demonstruje komplexní software pro rozpoznávání obrázků, který Flickr používá ve svých vyhledávacích algoritmech. To, co se nám lidem může zdát snadné rozpoznat, je pro počítače o něco složitější, přesto tato funkce ukazuje, jak daleko software došel a jaká bude budoucnost vyhledávání obrázků.

Doporučená videa

Určit, zda byl snímek pořízen v parku, je poměrně snadné, pokud jsou v něm vložená data GPS. Flickr porovnává informace GPS se záznamy v databázi a může vám sdělit přesný název parku, kde byla fotografie pořízena. Pokud nejsou žádné informace, výsledky jsou vráceny jako otazníky; na jednom obrázku, který jsme nahráli, neměl Flickr žádná data GPS, která by mohla fungovat, ale dokázal rozpoznat, že byl pořízen uvnitř.

Příbuzný:Yahoo konečně zavádí Flickr pro iPad

Rozpoznání ptáka (nebo čehokoli jiného) na obrázku je složitější. Flickr říká, že jeho tým Vision „pracoval zhruba poslední rok, aby toho byl schopen rozpoznat více než 1000 věcí v obrázcích pomocí hluboké konvoluční neuronové sítě“ a jednou z věcí, ve kterých je jeho software dobrý, je vyhledávání ptáků. Metoda je trochu technická na vysvětlení (můžete si o ní přečíst více tady), ale jednoduše řečeno, software porovnává vstupní obrázek (obrázek ptáka) s vrstvami a vrstvami obrázků; jedna vrstva „může rozpoznat nejzákladnější prvky obrazu, jako jsou krátké rovné čáry, rohy a malé kruhové oblouky“, zatímco další vrstva má složitější tvary a „další vrstvy mohou rozpoznat koncepty vyšší úrovně, jako jsou oči a zobáky."

Flickr říká, že jeho tým Vision „již používá tuto hlubokou síť na fotografie Flickr, aby lidem pomohl snadněji je najít co hledají prostřednictvím vyhledávání na Flickru, a plánujeme to integrovat do Flickru dalšími skvělými způsoby budoucnost. Pracujeme také na dalších inovativních technologiích počítačového vidění a rozpoznávání obrazu, které členům Flickru usnadní vyhledávání a uspořádání jejich fotografií.“ Podle Díky rozpoznání toho, co je na fotce, uživatelé v budoucnu nebudou muset ručně označovat, co je na nich, pomocí textu, protože software bude schopen tyto věci vybrat automaticky.

Není to dokonalé, jak ukazuje tento nahraný obrázek. Flickr nemohl určit, kde byl pořízen kvůli chybějícím informacím GPS, ale také si myslel, že tato slavná internetová kočka je pták.
Není to dokonalé, jak ukazuje tento nahraný obrázek. Flickr nemohl určit, kde byl pořízen kvůli chybějícím informacím GPS, ale také si myslel, že tato slavná internetová kočka je pták.

Upgradujte svůj životní stylDigitální trendy pomáhají čtenářům mít přehled o rychle se měnícím světě technologií se všemi nejnovějšími zprávami, zábavnými recenzemi produktů, zasvěcenými úvodníky a jedinečnými náhledy.