Flickr „Парк или птица“ показва софтуер за разпознаване на изображения

flickrs прост инструмент за паркиране на птици всъщност демо комплексно разпознаване на изображения flickr
Причината за създаването на този нов инструмент произтича от това xkcd комикс, което постави инженерите на Flickr пред предизвикателство.

Инженерите на Flickr са работили много усилено в разработването нов инструмент които могат да разберат дали снимката е заснета в национален парк и дали съдържа птица. Просто качвате изображение и след няколко секунди Flickr връща резултатите. Сигурно се питате защо Flickr отделя пари, време и ресурси за нещо, което очите ни могат лесно да разберат? Докато новият „Flickr парк или птица” изглежда безсмислена, тя всъщност демонстрира сложен софтуер за разпознаване на изображения, който Flickr използва в своите алгоритми за търсене. Това, което може да изглежда лесно за нас, хората, е малко по-сложно за компютрите, но функцията показва докъде е стигнал софтуерът и какво ще бъде бъдещето на търсенето на изображения.

Препоръчани видеоклипове

Определянето дали дадено изображение е направено в парк е относително лесно, стига да има вградени GPS данни. Flickr съпоставя GPS информацията със записи в база данни и може да ви каже точното име на парка, където е направена снимката. Ако няма информация, резултатите се връщат като въпросителни; в едно изображение, което качихме, Flickr няма GPS данни, които да обработва, но успя да разбере, че е направено на закрито.

Свързани:Yahoo най-накрая пуска Flickr за iPad

Разпознаването на птица (или нещо друго по този въпрос) в изображение е по-сложно. Flickr казва, че неговият екип Vision „работи през последната година или повече, за да може разпознава повече от 1000 неща в изображения с помощта дълбоки конволюционни невронни мрежи”, а едно от нещата, в които софтуерът му е добър, е намирането на птици. Методът е малко технически за обяснение (можете да прочетете повече за него тук), но просто казано, софтуерът съпоставя входно изображение (изображение на птица) със слоеве и слоеве изображения; един слой „може да разпознае най-основните характеристики на изображението, като къси прави линии, ъгли и малки кръгови дъги,“ докато друг слой има по-сложни форми и „по-нататъшните слоеве могат да разпознаят понятия от по-високо ниво, като очи и клюнове.”

Flickr казва, че екипът на Vision „вече прилага тази дълбока мрежа към снимки на Flickr, за да помогне на хората да ги намират по-лесно това, което търсят чрез търсенето във Flickr, и планираме да го интегрираме във Flickr по други готини начини в бъдеще. Работим и върху други иновативни технологии за компютърно зрение и разпознаване на изображения, които ще улеснят членовете на Flickr да намират и организират своите снимки.“ от разпознавайки какво има на снимка, потребителите в бъдеще няма да трябва ръчно да маркират какво има в тях с текст, тъй като софтуерът ще може да избира тези неща автоматично.

Не е перфектно, както показва това качване на изображение. Flickr не можа да определи къде е заснет поради липсваща GPS информация, но също така реши, че тази известна интернет котка е птица.
Не е перфектно, както показва това качване на изображение. Flickr не можа да определи къде е заснет поради липсваща GPS информация, но също така реши, че тази известна интернет котка е птица.

Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.