Flickr 'Park or Bird' muestra el software de reconocimiento de imágenes

flickrs herramienta simple para pájaros en el parque en realidad demostración de reconocimiento de imágenes complejo flickr
El motivo de la creación de esta nueva herramienta surge de esto comic xkcd, lo que supuso un desafío para los ingenieros de Flickr.

Los ingenieros de Flickr han trabajado muy duro para desarrollar una nueva herramienta que puede determinar si una fotografía fue tomada en un parque nacional y si contiene un pájaro. Simplemente carga una imagen y, en un par de segundos, Flickr le devuelve los resultados. Debes preguntarte por qué Flickr dedicaría dinero, tiempo y recursos a algo que nuestros ojos pueden distinguir fácilmente. Mientras que el nuevo “Parque Flickr o PájaroAunque esta característica parezca inútil, en realidad demuestra el complejo software de reconocimiento de imágenes que Flickr está empleando en sus algoritmos de búsqueda. Lo que podría parecer fácil de discernir para los humanos es un poco más complicado para las computadoras; sin embargo, la función muestra hasta qué punto ha avanzado el software y cómo será el futuro de la búsqueda de imágenes.

Vídeos recomendados

Determinar si una imagen fue tomada en un parque es relativamente fácil, siempre que los datos del GPS estén integrados. Flickr compara la información del GPS con los registros de una base de datos y puede indicarle el nombre exacto del parque donde se tomó la foto. Si no hay información, los resultados se devuelven como signos de interrogación; En una imagen que subimos, Flickr no tenía datos de GPS con los que trabajar, pero pudo decir que fue tomada en interiores.

Relacionado:Yahoo finalmente lanza Flickr para iPad

Reconocer un pájaro (o cualquier otra cosa) en una imagen es más complicado. Flickr dice que su equipo de Visión “ha estado trabajando durante el último año para poder reconocer más de 1.000 cosas en imágenes usando redes neuronales convolucionales profundas”, y una de las cosas en las que su software es bueno es en encontrar aves. El método es un poco técnico de explicar (puedes leer más sobre él). aquí), pero en pocas palabras, el software compara una imagen de entrada (imagen de un pájaro) con capas y capas de imágenes; una capa "podría reconocer las características más básicas de la imagen, como líneas rectas cortas, esquinas y pequeños arcos circulares". mientras que otra capa tiene formas más complejas, y “capas adicionales podrían reconocer conceptos de nivel superior, como ojos y picos”.

Flickr dice que su equipo Vision “ya está aplicando esta red profunda a las fotografías de Flickr para ayudar a las personas a encontrar más fácilmente lo que buscan a través de la búsqueda en Flickr, y planeamos integrarlo en Flickr de otras formas interesantes en el futuro. futuro. También estamos trabajando en otras tecnologías innovadoras de visión por computadora y reconocimiento de imágenes que facilitarán a los miembros de Flickr encontrar y organizar sus fotografías”. Por Al reconocer lo que hay en una foto, los usuarios en el futuro no tendrán que etiquetar manualmente lo que hay en ellas usando texto, ya que el software podrá seleccionar esas cosas automáticamente.

No es perfecto, como muestra esta imagen cargada. Flickr no pudo determinar dónde fue filmada debido a que faltaba información del GPS, pero también pensó que este famoso felino de Internet es un pájaro.
No es perfecto, como muestra esta carga de imagen. Flickr no pudo determinar dónde fue filmada debido a que faltaba información del GPS, pero también pensó que este famoso felino de Internet es un pájaro.

Mejora tu estilo de vidaDigital Trends ayuda a los lectores a mantenerse al tanto del vertiginoso mundo de la tecnología con las últimas noticias, reseñas divertidas de productos, editoriales interesantes y adelantos únicos.