Flickr 'Park or Bird'는 이미지 인식 소프트웨어를 선보입니다.

Flickrs 간단한 공원 새 도구는 실제로 복잡한 이미지 인식을 데모합니다.
이 새로운 도구를 만든 이유는 다음과 같습니다. xkcd 만화, 이는 Flickr의 엔지니어들에게 도전 과제를 안겨주었습니다.

Flickr의 엔지니어들은 개발에 정말 열심히 노력했습니다. 새로운 도구 사진이 국립공원에서 촬영되었는지, 새가 포함되어 있는지를 알 수 있습니다. 이미지를 업로드하기만 하면 몇 초 내에 Flickr가 결과를 반환합니다. Flickr가 왜 우리 눈으로 쉽게 찾아낼 수 있는 것에 돈, 시간, 자원을 투자하는지 궁금하시죠? 새로운 "플리커 파크 또는 버드” 기능은 무의미해 보이지만 실제로 Flickr가 검색 알고리즘에 사용하는 복잡한 이미지 인식 소프트웨어를 보여줍니다. 우리 인간이 쉽게 식별할 수 있는 것은 컴퓨터의 경우 약간 더 복잡하지만 이 기능은 소프트웨어가 얼마나 멀리 왔는지, 이미지 검색의 미래가 어떤 것인지 보여줍니다.

추천 동영상

GPS 데이터가 내장되어 있는 한, 이미지가 공원에서 촬영되었는지 확인하는 것은 상대적으로 쉽습니다. Flickr는 GPS 정보를 데이터베이스 기록과 일치시켜 사진이 촬영된 공원의 정확한 이름을 알려줄 수 있습니다. 정보가 없으면 결과는 물음표로 반환됩니다. 우리가 업로드한 한 이미지에서 Flickr는 작업할 GPS 데이터가 없었지만 실내에서 촬영된 것임을 알 수 있었습니다.

관련된:야후, 드디어 아이패드용 플리커 출시

이미지에서 새(또는 그 밖의 모든 것)를 인식하는 것은 더 복잡합니다. Flickr는 자사의 Vision 팀이 "지난 1년 동안 노력해 왔습니다. 1,000가지 이상의 것을 인식한다 사용하는 이미지에서 깊은 컨벌루션 신경망,” 소프트웨어가 잘하는 것 중 하나는 새를 찾는 것입니다. 이 방법은 설명하기에는 약간 기술적입니다(자세한 내용을 읽을 수 있음). 여기), 그러나 간단히 말해서 소프트웨어는 입력 이미지(새 이미지)를 이미지 레이어와 일치시킵니다. 한 레이어는 "짧은 직선, 모서리, 작은 원호와 같은 가장 기본적인 이미지 특징을 인식할 수 있습니다." 다른 레이어에는 더 복잡한 모양이 있고 "추가 레이어는 눈과 같은 더 높은 수준의 개념을 인식할 수 있습니다. 부리.”

Flickr는 자사의 Vision 팀이 “이미 Flickr 사진에 이 딥 네트워크를 적용하여 사람들이 더 쉽게 사진을 찾을 수 있도록 돕고 있습니다. Flickr 검색을 통해 무엇을 찾고 있는지 그리고 우리는 이를 다른 멋진 방법으로 Flickr에 통합할 계획입니다. 미래. 우리는 또한 Flickr 회원들이 사진을 더 쉽게 찾고 정리할 수 있도록 해주는 다른 혁신적인 컴퓨터 비전 및 이미지 인식 기술도 개발하고 있습니다.” 에 의해 사진에 있는 내용을 인식하면 소프트웨어가 자동으로 해당 내용을 선택할 수 있으므로 미래의 사용자는 텍스트를 사용하여 사진에 있는 내용을 수동으로 태그할 필요가 없습니다.

이 이미지 업로드에서 볼 수 있듯이 완벽하지는 않습니다. Flickr는 GPS 정보가 누락되어 촬영 장소를 확인할 수 없었지만 이 유명한 인터넷 고양이는 새라고 생각했습니다.
이 이미지 업로드에서 볼 수 있듯이 완벽하지는 않습니다. Flickr는 GPS 정보가 누락되어 촬영 장소를 확인할 수 없었지만 이 유명한 인터넷 고양이는 새라고 생각했습니다.

당신의 라이프스타일을 업그레이드하세요Digital Trends는 독자들이 모든 최신 뉴스, 재미있는 제품 리뷰, 통찰력 있는 사설 및 독특한 미리보기를 통해 빠르게 변화하는 기술 세계를 계속해서 살펴볼 수 있도록 도와줍니다.