Flickr „Park or Bird” prezentuje oprogramowanie do rozpoznawania obrazów

proste narzędzie do rozpoznawania ptaków w parku Flickrs faktycznie demonstruje złożone narzędzie do rozpoznawania obrazów Flickr
Z tego wynika powód stworzenia tego nowego narzędzia komiks xkcd, co postawiło inżynierów Flickr przed wyzwaniem.

Inżynierowie Flickr naprawdę ciężko pracowali nad rozwojem nowe narzędzie dzięki temu można stwierdzić, czy zdjęcie zostało zrobione w parku narodowym i czy przedstawia ptaka. Po prostu przesyłasz obraz, a w ciągu kilku sekund Flickr zwraca wyniki. Pewnie zastanawiasz się, dlaczego Flickr miałby poświęcać pieniądze, czas i zasoby na coś, co nasze oczy mogą łatwo dostrzec? Podczas gdy nowy „Flickr Park lub Ptak” wydaje się bezcelowa, w rzeczywistości demonstruje złożone oprogramowanie do rozpoznawania obrazów, które Flickr wykorzystuje w swoich algorytmach wyszukiwania. To, co może wydawać się łatwe do rozpoznania dla nas, ludzi, jest nieco bardziej skomplikowane dla komputerów, ale ta funkcja pokazuje, jak daleko rozwinęło się oprogramowanie i jaka będzie przyszłość wyszukiwania obrazów.

Polecane filmy

Ustalenie, czy zdjęcie zostało zrobione w parku, jest stosunkowo łatwe, o ile w obrazie znajdują się dane GPS. Flickr porównuje informacje GPS z zapisami w bazie danych i może podać dokładną nazwę parku, w którym zrobiono zdjęcie. Jeśli nie ma informacji, wyniki są zwracane jako znaki zapytania; na jednym z przesłanych przez nas zdjęć Flickr nie miał danych GPS, które mógłby wykorzystać, ale stwierdził, że zostało zrobione w pomieszczeniu.

Powiązany:Yahoo w końcu udostępnia Flickr dla iPada

Rozpoznanie ptaka (lub czegokolwiek innego) na obrazie jest bardziej skomplikowane. Flickr twierdzi, że jego zespół ds. wizji „pracował nad tym mniej więcej przez ostatni rok rozpoznać ponad 1000 rzeczy w obrazach za pomocą głębokie splotowe sieci neuronowe”, a jedną z rzeczy, w których jego oprogramowanie jest dobre, jest wyszukiwanie ptaków. Wyjaśnienie tej metody jest nieco techniczne (możesz przeczytać więcej na ten temat Tutaj), mówiąc najprościej, oprogramowanie dopasowuje obraz wejściowy (obraz ptaka) do kolejnych warstw obrazów; jedna warstwa „może rozpoznawać najbardziej podstawowe cechy obrazu, takie jak krótkie linie proste, narożniki i małe okrągłe łuki” podczas gdy inna warstwa ma bardziej złożone kształty, a „kolejne warstwy mogą rozpoznawać pojęcia wyższego poziomu, takie jak oczy i dzioby.

Flickr twierdzi, że jego zespół Vision „już stosuje tę głęboką sieć do zdjęć Flickr, aby ułatwić ludziom ich znajdowanie czego szukają w wyszukiwarce Flickr, i planujemy zintegrować to z Flickrem na inne fajne sposoby w przyszły. Pracujemy także nad innymi innowacyjnymi technologiami widzenia komputerowego i rozpoznawania obrazów, które ułatwią użytkownikom Flickr znajdowanie i porządkowanie zdjęć”. Przez rozpoznając, co jest na zdjęciu, użytkownicy w przyszłości nie będą musieli ręcznie oznaczać tego, co jest na zdjęciu, ponieważ oprogramowanie będzie mogło automatycznie wybierać te elementy.

Nie jest idealnie, jak pokazuje ten przesłany obraz. Flickr nie mógł ustalić, gdzie zostało zrobione zdjęcie ze względu na brak informacji GPS, ale pomyślał też, że ten słynny internetowy kot to ptak.
Nie jest idealnie, jak pokazuje ten przesłany obraz. Flickr nie mógł ustalić, gdzie zostało zrobione zdjęcie ze względu na brak informacji GPS, ale pomyślał też, że ten słynny internetowy kot to ptak.

Ulepsz swój styl życiaDigital Trends pomaga czytelnikom śledzić szybko rozwijający się świat technologii dzięki najnowszym wiadomościom, zabawnym recenzjom produktów, wnikliwym artykułom redakcyjnym i jedynym w swoim rodzaju zajawkom.