Flickr「Park or Bird」が画像認識ソフトウェアを披露

flickrs シンプルな公園の鳥ツールは実際に複雑な画像認識をデモします flickr
この新しいツールを作成した理由は次のとおりです。 コミック、これは Flickr のエンジニアに課題を突きつけました。

Flickr のエンジニアは開発に非常に熱心に取り組んできました 新しいツール これにより、写真が国立公園で撮影されたかどうか、鳥が含まれているかどうかがわかります。 画像をアップロードするだけで、数秒以内に Flickr が結果を返します。 なぜ Flickr が私たちの目で簡単に見つけられるものにお金、時間、リソースを費やすのかと疑問に思われたのではないでしょうか? 新しい「Flickr パークまたはバード」機能は無意味に思えますが、実際には Flickr が検索アルゴリズムに採用している複雑な画像認識ソフトウェアを示しています。 私たち人間にとっては簡単に識別できるように見えるものでも、コンピューターにとっては少し複雑ですが、この機能はソフトウェアがどこまで進歩し、画像検索の将来がどうなるかを示しています。

おすすめ動画

GPS データが埋め込まれている限り、画像が公園で撮影されたものであるかどうかを判断するのは比較的簡単です。 Flickr は GPS 情報をデータベース内の記録と照合し、写真が撮影された公園の正確な名前を教えてくれます。 情報がない場合、結果は疑問符として返されます。 私たちがアップロードした 1 つの画像では、Flickr には機能する GPS データがありませんでしたが、屋内で撮影されたものであることがわかりました。

関連している:Yahoo、ついにiPad向けFlickrを公開

画像内の鳥 (またはその他の何か) を認識するには、さらに複雑な作業が必要です。 Flickr は、ビジョン チームが「ここ 1 年ほど、 1,000以上のものを認識する を使用した画像で 深い畳み込みニューラルネットそのソフトウェアが得意なことの 1 つは鳥を見つけることです。 この方法を説明するには少し技術的になります (詳しくはこちらをご覧ください) ここ) ですが、簡単に言えば、このソフトウェアは入力画像 (鳥の画像) を画像のレイヤーと照合します。 1 つのレイヤーは「短い直線、角、小さな円弧などの最も基本的な画像の特徴を認識する可能性があります。」 一方、別の層はより複雑な形状を持ち、「さらなる層は目や目などのより高いレベルの概念を認識する可能性があります」 くちばし。

Flickr は、ビジョン チームが「すでにこのディープ ネットワークを Flickr の写真に適用して、人々がより簡単に見つけられるようにしている」と述べています。 彼らは Flickr 検索を通じて何を探しているのかを知ることができ、私たちはそれを他のクールな方法で Flickr に統合する予定です。 未来。 私たちは、Flickr メンバーが写真を見つけて整理しやすくする、その他の革新的なコンピューター ビジョンや画像認識テクノロジーにも取り組んでいます。」 による 写真に写っているものを認識することで、ソフトウェアが自動的に写真に写っているものを選択できるようになるため、将来ユーザーはテキストを使用して写真に写っているものを手動でタグ付けする必要がなくなります。

このアップロードされた画像が示すように、これは完璧ではありません。 Flickrは、GPS情報が欠落しているため、撮影された場所を特定できなかったが、この有名なインターネット上のネコ科動物は鳥であるとも考えた。
このアップロードされた画像が示すように、これは完璧ではありません。 Flickr は、GPS 情報が欠落しているため、撮影された場所を特定できませんでしたが、この有名なインターネット上のネコ科動物は鳥であると考えていました。

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。