Flickr 'Park or Bird' Memamerkan Perangkat Lunak Pengenalan Gambar

flickrs alat taman burung sederhana sebenarnya demo pengenalan gambar yang kompleks flickr
Alasan pembuatan alat baru ini berasal dari ini komik xkcd, yang memberikan tantangan kepada para insinyur Flickr.

Para insinyur Flickr telah bekerja sangat keras dalam pengembangannya alat baru yang dapat mengetahui apakah suatu foto diambil di taman nasional, dan apakah foto tersebut menampilkan seekor burung. Anda cukup mengunggah gambar, dan dalam beberapa detik Flickr mengembalikan hasilnya. Anda pasti bertanya mengapa Flickr mencurahkan uang, waktu, dan sumber daya untuk sesuatu yang mudah dilihat oleh mata kita? Sedangkan yang baru “Flickr Park atau Burung” Fitur ini sepertinya tidak ada gunanya, ini sebenarnya menunjukkan perangkat lunak pengenalan gambar kompleks yang digunakan Flickr dalam algoritma pencariannya. Apa yang tampak mudah bagi kita manusia untuk membedakannya, ternyata sedikit lebih rumit untuk komputer, namun fitur ini menunjukkan sejauh mana kemajuan perangkat lunak dan seperti apa masa depan pencarian gambar nantinya.

Video yang Direkomendasikan

Menentukan apakah suatu gambar diambil di taman relatif mudah, asalkan data GPS tertanam. Flickr mencocokkan informasi GPS dengan catatan dalam database, dan dapat memberi tahu Anda nama persis taman tempat foto itu diambil. Jika tidak ada info, hasilnya dikembalikan sebagai tanda tanya; dalam satu gambar yang kami unggah, Flickr tidak memiliki data GPS untuk digunakan, namun Flickr dapat mengetahui bahwa gambar tersebut diambil di dalam ruangan.

Terkait:Yahoo akhirnya meluncurkan Flickr untuk iPad

Mengenali seekor burung (atau apa pun) dalam sebuah gambar lebih melibatkan. Flickr mengatakan tim Visinya “telah bekerja selama setahun terakhir ini untuk dapat mencapainya mengenali lebih dari 1.000 hal dalam gambar menggunakan jaringan saraf konvolusional yang dalam,” dan salah satu keunggulan perangkat lunaknya adalah menemukan burung. Metodenya agak teknis untuk dijelaskan (Anda dapat membaca lebih lanjut Di Sini), namun sederhananya, perangkat lunak mencocokkan gambar masukan (gambar burung) dengan lapisan demi lapisan gambar; satu lapisan “mungkin mengenali fitur gambar paling dasar, seperti garis lurus pendek, sudut, dan busur lingkaran kecil,” sementara lapisan lain memiliki bentuk yang lebih kompleks, dan “lapisan selanjutnya mungkin mengenali konsep tingkat yang lebih tinggi, seperti mata dan paruh.”

Flickr mengatakan tim Vision-nya “telah menerapkan jaringan mendalam ini pada foto-foto Flickr untuk membantu orang lebih mudah menemukannya apa yang mereka cari melalui pencarian Flickr, dan kami berencana untuk mengintegrasikannya ke Flickr dengan cara keren lainnya di masa depan. Kami juga sedang mengerjakan teknologi visi komputer dan pengenalan gambar inovatif lainnya yang akan memudahkan anggota Flickr menemukan dan mengatur foto mereka.” Oleh mengenali apa yang ada di dalam foto, pengguna di masa depan tidak perlu menandai secara manual apa yang ada di dalamnya menggunakan teks, karena perangkat lunak akan dapat memilih hal-hal tersebut secara otomatis.

Memang belum sempurna, seperti yang terlihat pada unggahan gambar ini. Flickr tidak dapat menentukan di mana pengambilan gambarnya karena hilangnya informasi GPS, tetapi Flickr juga mengira kucing internet terkenal ini adalah seekor burung.
Memang tidak sempurna, seperti yang terlihat pada unggahan gambar ini. Flickr tidak dapat menentukan lokasi pengambilan gambar karena tidak adanya informasi GPS, tetapi Flickr juga mengira kucing internet terkenal ini adalah seekor burung.

Tingkatkan gaya hidup AndaTren Digital membantu pembaca mengawasi dunia teknologi yang bergerak cepat dengan semua berita terkini, ulasan produk yang menyenangkan, editorial yang berwawasan luas, dan cuplikan unik.