Flickr «Park or Bird» демонстрирует программное обеспечение для распознавания изображений

flickrs простой инструмент для парка птиц на самом деле демо сложное распознавание изображений flickr
Причина создания этого нового инструмента проистекает из этого. xkcd комикс, что поставило перед инженерами Flickr сложную задачу.

Инженеры Flickr очень усердно работали над разработкой новый инструмент это может сказать, была ли фотография сделана в национальном парке и есть ли на ней птица. Вы просто загружаете изображение, и через пару секунд Flickr возвращает результаты. Вы, должно быть, спрашиваете, почему Flickr тратит деньги, время и ресурсы на то, что наши глаза могут легко различить? В то время как новый «Flickr Park или птицаЭта функция кажется бессмысленной, на самом деле она демонстрирует сложное программное обеспечение для распознавания изображений, которое Flickr использует в своих алгоритмах поиска. То, что может показаться простым для понимания нам, людям, немного сложнее для компьютеров, однако эта функция показывает, как далеко продвинулось программное обеспечение и каким будет будущее поиска изображений.

Рекомендуемые видео

Определить, было ли изображение сделано в парке, относительно легко, если на него встроены данные GPS. Flickr сопоставляет данные GPS с записями в базе данных и может сообщить вам точное название парка, где была сделана фотография. Если информация отсутствует, результаты возвращаются в виде вопросительных знаков; На одном изображении, которое мы загрузили, у Flickr не было данных GPS, но он смог определить, что оно было снято в помещении.

Связанный:Yahoo наконец-то выпустила Flickr для iPad

Распознавание птицы (или чего-либо еще) на изображении является более сложной задачей. Flickr сообщает, что его команда Vision «последний год или около того работала над тем, чтобы иметь возможность распознавать более 1000 вещей в изображениях с использованием глубокие сверточные нейронные сети», и одна из вещей, в которых его программное обеспечение хорошо справляется, — это поиск птиц. Этот метод требует немного технического объяснения (подробнее об этом можно прочитать здесь). здесь), а проще говоря, программное обеспечение сопоставляет входное изображение (изображение птицы) со слоями и слоями изображений; один слой «может распознавать самые основные особенности изображения, такие как короткие прямые линии, углы и небольшие круговые дуги». в то время как другой слой имеет более сложные формы, и «дальнейшие слои могут распознавать концепции более высокого уровня, такие как глаза и клювы».

Flickr утверждает, что его команда Vision «уже применяет эту глубокую сеть к фотографиям Flickr, чтобы помочь людям легче находить то, что они ищут через поиск на Flickr, и мы планируем интегрировать это в Flickr другими интересными способами в будущее. Мы также работаем над другими инновационными технологиями компьютерного зрения и распознавания изображений, которые облегчат участникам Flickr поиск и систематизацию своих фотографий». К распознавая, что находится на фотографии, пользователям в будущем не придется вручную помечать то, что на них, с помощью текста, поскольку программное обеспечение сможет выбирать эти объекты автоматически.

Это не идеально, как показывает эта загрузка изображения. Flickr не смог определить место съемки из-за отсутствия данных GPS, но также решил, что это знаменитое интернет-кошачье — птица.
Это не идеально, как показывает эта загрузка изображения. Flickr не смог определить место съемки из-за отсутствия данных GPS, но также решил, что это знаменитое интернет-кошачье — птица.

Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.