Инженеры Flickr очень усердно работали над разработкой новый инструмент это может сказать, была ли фотография сделана в национальном парке и есть ли на ней птица. Вы просто загружаете изображение, и через пару секунд Flickr возвращает результаты. Вы, должно быть, спрашиваете, почему Flickr тратит деньги, время и ресурсы на то, что наши глаза могут легко различить? В то время как новый «Flickr Park или птицаЭта функция кажется бессмысленной, на самом деле она демонстрирует сложное программное обеспечение для распознавания изображений, которое Flickr использует в своих алгоритмах поиска. То, что может показаться простым для понимания нам, людям, немного сложнее для компьютеров, однако эта функция показывает, как далеко продвинулось программное обеспечение и каким будет будущее поиска изображений.
Рекомендуемые видео
Определить, было ли изображение сделано в парке, относительно легко, если на него встроены данные GPS. Flickr сопоставляет данные GPS с записями в базе данных и может сообщить вам точное название парка, где была сделана фотография. Если информация отсутствует, результаты возвращаются в виде вопросительных знаков; На одном изображении, которое мы загрузили, у Flickr не было данных GPS, но он смог определить, что оно было снято в помещении.
Связанный:Yahoo наконец-то выпустила Flickr для iPad
Распознавание птицы (или чего-либо еще) на изображении является более сложной задачей. Flickr сообщает, что его команда Vision «последний год или около того работала над тем, чтобы иметь возможность распознавать более 1000 вещей в изображениях с использованием глубокие сверточные нейронные сети», и одна из вещей, в которых его программное обеспечение хорошо справляется, — это поиск птиц. Этот метод требует немного технического объяснения (подробнее об этом можно прочитать здесь). здесь), а проще говоря, программное обеспечение сопоставляет входное изображение (изображение птицы) со слоями и слоями изображений; один слой «может распознавать самые основные особенности изображения, такие как короткие прямые линии, углы и небольшие круговые дуги». в то время как другой слой имеет более сложные формы, и «дальнейшие слои могут распознавать концепции более высокого уровня, такие как глаза и клювы».
Flickr утверждает, что его команда Vision «уже применяет эту глубокую сеть к фотографиям Flickr, чтобы помочь людям легче находить то, что они ищут через поиск на Flickr, и мы планируем интегрировать это в Flickr другими интересными способами в будущее. Мы также работаем над другими инновационными технологиями компьютерного зрения и распознавания изображений, которые облегчат участникам Flickr поиск и систематизацию своих фотографий». К распознавая, что находится на фотографии, пользователям в будущем не придется вручную помечать то, что на них, с помощью текста, поскольку программное обеспечение сможет выбирать эти объекты автоматически.
Обновите свой образ жизниDigital Trends помогает читателям быть в курсе быстро меняющегося мира технологий благодаря всем последним новостям, забавным обзорам продуктов, содержательным редакционным статьям и уникальным кратким обзорам.