Flickr «Парк або птах» демонструє програмне забезпечення для розпізнавання зображень

flickr простий парк птахів інструмент насправді демо складне розпізнавання зображень flickr
Причина створення цього нового інструменту випливає з цього комікс xkcd, що поставило перед інженерами Flickr виклик.

Інженери Flickr дуже багато працювали над розробкою новий інструмент який може визначити, чи зроблено фото в національному парку, і чи є на ньому птах. Ви просто завантажуєте зображення, і протягом кількох секунд Flickr повертає результати. Ви, мабуть, запитуєте, чому Flickr витрачає гроші, час і ресурси на те, що наше око може легко виділити? У той час як новий "Flickr Park або Bird” функція здається безглуздою, вона насправді демонструє складне програмне забезпечення для розпізнавання зображень, яке Flickr використовує у своїх пошукових алгоритмах. Те, що здається нам, людям, легко розпізнати, для комп’ютерів дещо складніше, але ця функція показує, наскільки далеко просунулося програмне забезпечення та яким буде майбутнє пошуку зображень.

Рекомендовані відео

Визначити, чи було зроблено зображення в парку, відносно легко, якщо вбудовані дані GPS. Flickr зіставляє дані GPS із записами в базі даних і може повідомити вам точну назву парку, де було зроблено фото. Якщо інформації немає, результати повертаються у вигляді знаків питання; на одному зображенні, яке ми завантажили, Flickr не мав GPS-даних для обробки, але він зміг визначити, що воно зроблено в приміщенні.

пов'язані:Yahoo нарешті запускає Flickr для iPad

Розпізнавання птаха (або будь-чого іншого) на зображенні є більш складним. Flickr каже, що його команда Vision «працювала останній рік або близько того, щоб мати можливість розпізнати більше 1000 речей у зображеннях за допомогою глибокі згорткові нейронні мережі”, і одна з речей, у якій добре вміє його програмне забезпечення, це пошук птахів. Метод трохи технічний, щоб пояснити (ви можете прочитати про нього докладніше тут), а простіше кажучи, програмне забезпечення зіставляє вхідне зображення (зображення птаха) із шарами й шарами зображень; один шар «може розпізнавати найпростіші характеристики зображення, такі як короткі прямі лінії, кути та малі круглі дуги», у той час як інший шар має більш складні форми, і «подальші шари можуть розпізнавати поняття вищого рівня, як-от очі та дзьоби».

Flickr каже, що його команда Vision «вже застосовує цю глибоку мережу до фотографій Flickr, щоб допомогти людям їх легше знаходити те, що вони шукають через пошук Flickr, і ми плануємо інтегрувати це у Flickr іншими цікавими способами в майбутнє. Ми також працюємо над іншими інноваційними технологіями комп’ютерного зору та розпізнавання зображень, які полегшать користувачам Flickr пошук і впорядкування своїх фотографій». за розпізнаючи те, що зображено на фотографії, користувачам у майбутньому не доведеться вручну позначати те, що на них, за допомогою тексту, оскільки програмне забезпечення зможе вибирати ці речі автоматично.

Це не ідеально, як показує це завантажене зображення. Flickr не зміг визначити, де це було знято через відсутність даних GPS, але він також вважав, що цей відомий котячий в Інтернеті є птахом.
Це не ідеально, як показує це завантажене зображення. Flickr не зміг визначити, де це було знято через відсутність даних GPS, але він також вважав, що цей відомий котячий в Інтернеті є птахом.

Оновіть свій спосіб життяDigital Trends допомагає читачам стежити за динамічним світом технологій завдяки всім останнім новинам, цікавим оглядам продуктів, проникливим редакційним статтям і унікальним у своєму роді коротким оглядам.