Flickr 'Park veya Kuş' Görüntü Tanıma Yazılımını Gösteriyor

flickrs basit park kuşu aracı aslında karmaşık görüntü tanıma flickr'ın tanıtımını yapıyor
Bu yeni aracın yaratılmasının nedeni bundan kaynaklanıyor xkcd çizgi romanBu, Flickr'ın mühendislerini zorlu bir görevle karşı karşıya getirdi.

Flickr'ın mühendisleri geliştirme aşamasında gerçekten çok çalıştılar. yeni bir araç Bu, bir fotoğrafın milli parkta mı çekildiğini ve içinde kuş olup olmadığını anlayabilir. Sadece bir görsel yüklersiniz ve birkaç saniye içinde Flickr sonuçları döndürür. Flickr'ın neden gözümüzün kolayca seçebileceği bir şeye para, zaman ve kaynak ayırdığını soruyor olmalısınız? Yeniyken “Flickr Parkı veya Kuş" özelliği anlamsız gibi görünse de aslında Flickr'ın arama algoritmalarında kullandığı karmaşık görüntü tanıma yazılımını gösteriyor. Biz insanlar için ayırt edilmesi kolay görünen şey, bilgisayarlar için biraz daha karmaşıktır; ancak bu özellik, yazılımın ne kadar ilerlediğini ve görsel aramanın geleceğinin nasıl olacağını gösteriyor.

Önerilen Videolar

GPS verileri gömülü olduğu sürece, bir görüntünün parkta çekilip çekilmediğini belirlemek nispeten kolaydır. Flickr, GPS bilgilerini veritabanındaki kayıtlarla eşleştirir ve size fotoğrafın çekildiği parkın tam adını söyleyebilir. Bilgi yoksa sonuçlar soru işareti olarak döndürülür; Yüklediğimiz bir fotoğrafta Flickr'ın kullanacağı GPS verisi yoktu ancak fotoğrafın iç mekanda çekildiğini anlayabiliyordu.

İlgili:Yahoo nihayet iPad için Flickr'ı kullanıma sunuyor

Bir görüntüdeki bir kuşu (veya bu konuda herhangi bir şeyi) tanımak daha karmaşıktır. Flickr, Vizyon ekibinin "geçen yıldır çalıştığını" söylüyor 1000'den fazla şeyi tanır kullanarak görüntülerde derin evrişimli sinir ağları,” ve yazılımının iyi olduğu şeylerden biri de kuşları bulmak. Yöntemin açıklaması biraz tekniktir (bununla ilgili daha fazlasını okuyabilirsiniz) Burada), ancak basitçe söylemek gerekirse, yazılım bir girdi görüntüsünü (bir kuş görüntüsü) katmanlar ve görüntü katmanlarıyla eşleştirir; bir katman "kısa düz çizgiler, köşeler ve küçük dairesel yaylar gibi en temel görüntü özelliklerini tanıyabilir" diğer katman daha karmaşık şekillere sahipken, "daha sonraki katmanlar gözler ve gözler gibi daha üst düzey kavramları tanıyabilir" gagalar.”

Flickr, Vision ekibinin "insanların daha kolay bulmasına yardımcı olmak için bu derin ağı zaten Flickr fotoğraflarına uyguladığını" söylüyor. Flickr araması aracılığıyla aradıkları şeyi ve biz bunu Flickr'a başka harika yöntemlerle entegre etmeyi planlıyoruz. gelecek. Ayrıca Flickr üyelerinin fotoğraflarını bulmasını ve düzenlemesini kolaylaştıracak diğer yenilikçi bilgisayar görüşü ve görüntü tanıma teknolojileri üzerinde de çalışıyoruz." İle Bir fotoğrafın içinde ne olduğunu tanıyan kullanıcılar, gelecekte metin kullanarak fotoğrafta ne olduğunu manuel olarak etiketlemek zorunda kalmayacak, çünkü yazılım bu şeyleri otomatik olarak seçebilecek.

Bu resim yüklemesinin gösterdiği gibi mükemmel değil. Flickr, eksik GPS bilgisi nedeniyle fotoğrafın nerede çekildiğini belirleyemedi ancak aynı zamanda bu ünlü İnternet kedisinin bir kuş olduğunu da düşündü.
Bu resim yüklemesinin gösterdiği gibi mükemmel değil. Flickr, eksik GPS bilgisi nedeniyle fotoğrafın nerede çekildiğini belirleyemedi ancak aynı zamanda bu ünlü internet kedisinin bir kuş olduğunu da düşündü.

Yaşam tarzınızı yükseltinDigital Trends, en son haberler, eğlenceli ürün incelemeleri, anlayışlı başyazılar ve türünün tek örneği olan ön bakışlarla okuyucuların teknolojinin hızlı tempolu dünyasını takip etmelerine yardımcı olur.