Flickr ‘Park or Bird’ mostra software de reconhecimento de imagem

ferramenta simples park bird do flickrs, na verdade, demonstração de reconhecimento de imagem complexo flickr
A razão para a criação desta nova ferramenta decorre deste quadrinhos xkcd, o que apresentou um desafio aos engenheiros do Flickr.

Os engenheiros do Flickr trabalharam muito no desenvolvimento uma nova ferramenta que pode dizer se uma foto foi tirada em um parque nacional e se contém um pássaro. Você simplesmente carrega uma imagem e, em alguns segundos, o Flickr retorna os resultados. Você deve estar se perguntando por que o Flickr dedicaria dinheiro, tempo e recursos a algo que nossos olhos podem detectar facilmente? Enquanto o novo “Flickr Parque ou Pássaro”O recurso parece inútil, na verdade demonstra um software complexo de reconhecimento de imagem que o Flickr está empregando em seus algoritmos de busca. O que pode parecer fácil para nós, humanos, discernirmos é um pouco mais complicado para os computadores, mas o recurso mostra o quão longe o software avançou e como será o futuro da pesquisa de imagens.

Vídeos recomendados

Determinar se uma imagem foi tirada em um parque é relativamente fácil, desde que os dados do GPS estejam incorporados. O Flickr combina as informações do GPS com os registros de um banco de dados e pode informar o nome exato do parque onde a foto foi tirada. Se não houver informações, os resultados serão retornados como pontos de interrogação; em uma imagem que carregamos, o Flickr não tinha dados de GPS para trabalhar, mas foi capaz de dizer que foi tirada em um ambiente interno.

Relacionado:Yahoo finalmente lança Flickr para iPad

Reconhecer um pássaro (ou qualquer outra coisa) em uma imagem é mais complicado. O Flickr diz que sua equipe de Visão “tem trabalhado há cerca de um ano para poder reconhecer mais de 1.000 coisas em imagens usando redes neurais convolucionais profundas”, e uma das coisas em que seu software é bom é encontrar pássaros. O método é um pouco técnico para explicar (você pode ler mais sobre ele aqui), mas simplesmente, o software compara uma imagem de entrada (imagem de um pássaro) com camadas e mais camadas de imagens; uma camada “pode reconhecer os recursos mais básicos da imagem, como linhas retas curtas, cantos e pequenos arcos circulares”, enquanto outra camada tem formas mais complexas, e “camadas adicionais podem reconhecer conceitos de nível superior, como olhos e bicos.”

O Flickr diz que sua equipe Vision “já está aplicando essa rede profunda às fotos do Flickr para ajudar as pessoas a encontrarem com mais facilidade o que eles procuram por meio da pesquisa do Flickr, e planejamos integrá-lo ao Flickr de outras maneiras interessantes no futuro. Também estamos trabalhando em outras tecnologias inovadoras de visão computacional e reconhecimento de imagem que tornarão mais fácil para os membros do Flickr encontrar e organizar suas fotos.” Por reconhecendo o que há em uma foto, os usuários no futuro não terão que marcar manualmente o que há nelas usando texto, pois o software será capaz de selecionar essas coisas automaticamente.

Não é perfeito, como mostra este upload de imagem. O Flickr não conseguiu determinar onde foi filmado devido à falta de informações de GPS, mas também pensou que este famoso felino da Internet era um pássaro.
Não é perfeito, como mostra este upload de imagem. O Flickr não conseguiu determinar onde foi filmado devido à falta de informações de GPS, mas também pensou que este famoso felino da Internet era um pássaro.

Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.