Инженерите на Flickr са работили много усилено в разработването нов инструмент които могат да разберат дали снимката е заснета в национален парк и дали съдържа птица. Просто качвате изображение и след няколко секунди Flickr връща резултатите. Сигурно се питате защо Flickr отделя пари, време и ресурси за нещо, което очите ни могат лесно да разберат? Докато новият „Flickr парк или птица” изглежда безсмислена, тя всъщност демонстрира сложен софтуер за разпознаване на изображения, който Flickr използва в своите алгоритми за търсене. Това, което може да изглежда лесно за нас, хората, е малко по-сложно за компютрите, но функцията показва докъде е стигнал софтуерът и какво ще бъде бъдещето на търсенето на изображения.
Препоръчани видеоклипове
Определянето дали дадено изображение е направено в парк е относително лесно, стига да има вградени GPS данни. Flickr съпоставя GPS информацията със записи в база данни и може да ви каже точното име на парка, където е направена снимката. Ако няма информация, резултатите се връщат като въпросителни; в едно изображение, което качихме, Flickr няма GPS данни, които да обработва, но успя да разбере, че е направено на закрито.
Свързани:Yahoo най-накрая пуска Flickr за iPad
Разпознаването на птица (или нещо друго по този въпрос) в изображение е по-сложно. Flickr казва, че неговият екип Vision „работи през последната година или повече, за да може разпознава повече от 1000 неща в изображения с помощта дълбоки конволюционни невронни мрежи”, а едно от нещата, в които софтуерът му е добър, е намирането на птици. Методът е малко технически за обяснение (можете да прочетете повече за него тук), но просто казано, софтуерът съпоставя входно изображение (изображение на птица) със слоеве и слоеве изображения; един слой „може да разпознае най-основните характеристики на изображението, като къси прави линии, ъгли и малки кръгови дъги,“ докато друг слой има по-сложни форми и „по-нататъшните слоеве могат да разпознаят понятия от по-високо ниво, като очи и клюнове.”
Flickr казва, че екипът на Vision „вече прилага тази дълбока мрежа към снимки на Flickr, за да помогне на хората да ги намират по-лесно това, което търсят чрез търсенето във Flickr, и планираме да го интегрираме във Flickr по други готини начини в бъдеще. Работим и върху други иновативни технологии за компютърно зрение и разпознаване на изображения, които ще улеснят членовете на Flickr да намират и организират своите снимки.“ от разпознавайки какво има на снимка, потребителите в бъдеще няма да трябва ръчно да маркират какво има в тях с текст, тъй като софтуерът ще може да избира тези неща автоматично.
Надградете начина си на животDigital Trends помага на читателите да следят забързания свят на технологиите с всички най-нови новини, забавни ревюта на продукти, проницателни редакционни статии и единствени по рода си кратки погледи.