يعرض برنامج Flickr "Park or Bird" برنامج التعرف على الصور

click fraud protection
أداة فليكر البسيطة لحديقة الطيور هي في الواقع عرض توضيحي معقد للتعرف على الصور فليكر
سبب إنشاء هذه الأداة الجديدة ينبع من هذا كوميدي xkcd، الأمر الذي شكل تحديًا لمهندسي Flickr.

لقد عمل مهندسو Flickr بجد في التطوير أداة جديدة يمكنه معرفة ما إذا كانت الصورة قد تم التقاطها في حديقة وطنية، وما إذا كانت تحتوي على طائر. ما عليك سوى تحميل صورة، وفي غضون ثوانٍ قليلة، يقوم Flickr بإرجاع النتائج. لا بد أنك تتساءل لماذا يخصص موقع Flickr المال والوقت والموارد لشيء يمكن لأعيننا أن تلتقطه بسهولة؟ بينما الجديد "فليكر بارك أو الطيور"تبدو هذه الميزة عديمة الجدوى، فهي في الواقع توضح برنامج التعرف على الصور المعقد الذي يستخدمه Flickr في خوارزميات البحث الخاصة به. ما قد يبدو سهلاً بالنسبة لنا نحن البشر أن ندركه هو أكثر تعقيدًا قليلاً بالنسبة لأجهزة الكمبيوتر، ومع ذلك فإن هذه الميزة توضح المدى الذي وصلت إليه البرامج وكيف سيكون شكل مستقبل البحث عن الصور.

مقاطع الفيديو الموصى بها

يعد تحديد ما إذا كانت الصورة قد تم التقاطها في حديقة أمرًا سهلاً نسبيًا، طالما أن بيانات نظام تحديد المواقع العالمي (GPS) مضمنة. يقوم Flickr بمطابقة معلومات نظام تحديد المواقع العالمي (GPS) مع السجلات الموجودة في قاعدة البيانات، ويمكنه إخبارك بالاسم الدقيق للحديقة التي تم التقاط الصورة فيها. إذا لم تكن هناك معلومات، يتم إرجاع النتائج كعلامات استفهام؛ في إحدى الصور التي قمنا بتحميلها، لم يكن لدى Flickr بيانات نظام تحديد المواقع العالمي (GPS) للعمل عليها، لكنه كان قادرًا على معرفة أنه تم التقاطها في الداخل.

متعلق ب:ياهو تطلق أخيرًا تطبيق Flickr لأجهزة iPad

يعد التعرف على الطائر (أو أي شيء آخر في هذا الشأن) في الصورة أمرًا أكثر تعقيدًا. يقول فليكر إن فريق الرؤية الخاص به "كان يعمل طوال العام الماضي أو نحو ذلك ليكون قادرًا على ذلك التعرف على أكثر من 1000 شيء في الصور باستخدام الشبكات العصبية التلافيفية العميقة"، وأحد الأشياء التي يجيدها برنامجها هو العثور على الطيور. الطريقة تقنية بعض الشيء في الشرح (يمكنك قراءة المزيد عنها هنا)، ولكن ببساطة، يقوم البرنامج بمطابقة الصورة المدخلة (صورة طائر) مع طبقات وطبقات من الصور؛ طبقة واحدة "قد تتعرف على معظم ميزات الصورة الأساسية، مثل الخطوط المستقيمة القصيرة، والزوايا، والأقواس الدائرية الصغيرة". بينما تحتوي طبقة أخرى على أشكال أكثر تعقيدًا، و"قد تتعرف الطبقات الإضافية على مفاهيم ذات مستوى أعلى، مثل العيون والأشياء". مناقير."

يقول Flickr إن فريق Vision الخاص به "يقوم بالفعل بتطبيق هذه الشبكة العميقة على صور Flickr لمساعدة الأشخاص في العثور عليها بسهولة أكبر ما يبحثون عنه عبر بحث Flickr، ونحن نخطط لدمجه في Flickr بطرق أخرى رائعة في مستقبل. نحن نعمل أيضًا على تقنيات مبتكرة أخرى للرؤية الحاسوبية والتعرف على الصور التي ستسهل على أعضاء Flickr العثور على صورهم وتنظيمها. بواسطة من خلال التعرف على ما هو موجود في الصورة، لن يضطر المستخدمون في المستقبل إلى وضع علامة يدويًا على ما هو موجود في الصورة باستخدام النص، حيث سيكون البرنامج قادرًا على اختيار هذه الأشياء تلقائيًا.

إنها ليست مثالية، كما يظهر تحميل الصورة هذا. لم يتمكن موقع Flickr من تحديد مكان التصوير بسبب فقدان معلومات نظام تحديد المواقع العالمي (GPS)، ولكنه يعتقد أيضًا أن هذا القط الشهير على الإنترنت هو طائر.
إنها ليست مثالية، كما يظهر تحميل الصورة هذا. لم يتمكن موقع Flickr من تحديد مكان التصوير بسبب فقدان معلومات نظام تحديد المواقع العالمي (GPS)، ولكنه يعتقد أيضًا أن هذا القط الشهير على الإنترنت هو طائر.

ترقية نمط حياتكتساعد الاتجاهات الرقمية القراء على متابعة عالم التكنولوجيا سريع الخطى من خلال أحدث الأخبار ومراجعات المنتجات الممتعة والمقالات الافتتاحية الثاقبة ونظرات خاطفة فريدة من نوعها.