Os engenheiros do Flickr trabalharam muito no desenvolvimento uma nova ferramenta que pode dizer se uma foto foi tirada em um parque nacional e se contém um pássaro. Você simplesmente carrega uma imagem e, em alguns segundos, o Flickr retorna os resultados. Você deve estar se perguntando por que o Flickr dedicaria dinheiro, tempo e recursos a algo que nossos olhos podem detectar facilmente? Enquanto o novo “Flickr Parque ou Pássaro”O recurso parece inútil, na verdade demonstra um software complexo de reconhecimento de imagem que o Flickr está empregando em seus algoritmos de busca. O que pode parecer fácil para nós, humanos, discernirmos é um pouco mais complicado para os computadores, mas o recurso mostra o quão longe o software avançou e como será o futuro da pesquisa de imagens.
Vídeos recomendados
Determinar se uma imagem foi tirada em um parque é relativamente fácil, desde que os dados do GPS estejam incorporados. O Flickr combina as informações do GPS com os registros de um banco de dados e pode informar o nome exato do parque onde a foto foi tirada. Se não houver informações, os resultados serão retornados como pontos de interrogação; em uma imagem que carregamos, o Flickr não tinha dados de GPS para trabalhar, mas foi capaz de dizer que foi tirada em um ambiente interno.
Relacionado:Yahoo finalmente lança Flickr para iPad
Reconhecer um pássaro (ou qualquer outra coisa) em uma imagem é mais complicado. O Flickr diz que sua equipe de Visão “tem trabalhado há cerca de um ano para poder reconhecer mais de 1.000 coisas em imagens usando redes neurais convolucionais profundas”, e uma das coisas em que seu software é bom é encontrar pássaros. O método é um pouco técnico para explicar (você pode ler mais sobre ele aqui), mas simplesmente, o software compara uma imagem de entrada (imagem de um pássaro) com camadas e mais camadas de imagens; uma camada “pode reconhecer os recursos mais básicos da imagem, como linhas retas curtas, cantos e pequenos arcos circulares”, enquanto outra camada tem formas mais complexas, e “camadas adicionais podem reconhecer conceitos de nível superior, como olhos e bicos.”
O Flickr diz que sua equipe Vision “já está aplicando essa rede profunda às fotos do Flickr para ajudar as pessoas a encontrarem com mais facilidade o que eles procuram por meio da pesquisa do Flickr, e planejamos integrá-lo ao Flickr de outras maneiras interessantes no futuro. Também estamos trabalhando em outras tecnologias inovadoras de visão computacional e reconhecimento de imagem que tornarão mais fácil para os membros do Flickr encontrar e organizar suas fotos.” Por reconhecendo o que há em uma foto, os usuários no futuro não terão que marcar manualmente o que há nelas usando texto, pois o software será capaz de selecionar essas coisas automaticamente.
Atualize seu estilo de vidaDigital Trends ajuda os leitores a manter o controle sobre o mundo acelerado da tecnologia com as últimas notícias, análises divertidas de produtos, editoriais criteriosos e prévias únicas.