Die Ingenieure von Flickr haben bei der Entwicklung wirklich hart gearbeitet ein neues Werkzeug So kann festgestellt werden, ob ein Foto in einem Nationalpark aufgenommen wurde und ob ein Vogel darauf zu sehen ist. Sie laden einfach ein Bild hoch und innerhalb weniger Sekunden liefert Flickr die Ergebnisse zurück. Sie fragen sich bestimmt, warum Flickr Geld, Zeit und Ressourcen für etwas aufwendet, das unsere Augen leicht erkennen können? Während das neue „Flickr Park oder Bird„Die Funktion erscheint sinnlos, sie demonstriert tatsächlich die komplexe Bilderkennungssoftware, die Flickr in seinen Suchalgorithmen verwendet. Was für uns Menschen leicht zu erkennen erscheint, ist für Computer etwas komplizierter, dennoch zeigt die Funktion, wie weit die Software fortgeschritten ist und wie die Zukunft der Bildsuche aussehen wird.
Empfohlene Videos
Die Feststellung, ob ein Bild in einem Park aufgenommen wurde, ist relativ einfach, solange GPS-Daten eingebettet sind. Flickr gleicht die GPS-Informationen mit Aufzeichnungen in einer Datenbank ab und kann Ihnen den genauen Namen des Parks nennen, in dem das Foto aufgenommen wurde. Wenn keine Informationen vorhanden sind, werden die Ergebnisse als Fragezeichen zurückgegeben. Bei einem Bild, das wir hochgeladen haben, hatte Flickr keine GPS-Daten zur Auswertung, konnte aber erkennen, dass es in Innenräumen aufgenommen wurde.
Verwandt:Yahoo führt endlich Flickr für das iPad ein
Das Erkennen eines Vogels (oder irgendetwas anderem) in einem Bild ist aufwändiger. Flickr sagt, dass sein Vision-Team „seit etwa einem Jahr daran gearbeitet hat, dies zu erreichen.“ mehr als 1.000 Dinge erkennen in Bildern mit tiefe Faltungs-Neuronale Netze„Und seine Software ist unter anderem gut darin, Vögel zu finden. Die Methode ist etwas technisch zu erklären (Sie können mehr darüber lesen). Hier), aber einfach ausgedrückt gleicht die Software ein Eingabebild (Bild eines Vogels) mit mehreren Bildebenen ab; Eine Ebene „erkennt möglicherweise die grundlegendsten Bildmerkmale wie kurze gerade Linien, Ecken und kleine Kreisbögen“. während eine andere Ebene komplexere Formen hat und „weitere Ebenen möglicherweise Konzepte höherer Ebene erkennen, wie Augen und.“ Schnäbel.“
Flickr sagt, dass sein Vision-Team „dieses tiefe Netzwerk bereits auf Flickr-Fotos anwendet, um Menschen das Auffinden zu erleichtern.“ Was sie über die Flickr-Suche suchen, und wir planen, es auf andere coole Arten in Flickr zu integrieren Zukunft. Wir arbeiten auch an anderen innovativen Computer-Vision- und Bilderkennungstechnologien, die es Flickr-Mitgliedern erleichtern, ihre Fotos zu finden und zu organisieren.“ Von Durch das Erkennen dessen, was auf einem Foto zu sehen ist, müssen Benutzer in Zukunft nicht mehr manuell markieren, was darin enthalten ist, indem sie Text verwenden, da die Software in der Lage sein wird, diese Dinge automatisch herauszusuchen.
Werten Sie Ihren Lebensstil aufDigital Trends hilft Lesern mit den neuesten Nachrichten, unterhaltsamen Produktrezensionen, aufschlussreichen Leitartikeln und einzigartigen Einblicken, den Überblick über die schnelllebige Welt der Technik zu behalten.