Flickr 'Park or Bird' pronkt met beeldherkenningssoftware

flickrs eenvoudige parkvogeltool demonstreert eigenlijk complexe beeldherkenning flickr
De reden voor het creëren van deze nieuwe tool komt hieruit voort xkcd-strip, wat de ingenieurs van Flickr voor een uitdaging stelde.

De ingenieurs van Flickr hebben heel hard gewerkt aan de ontwikkeling een nieuw instrument die kan uitwijzen of een foto in een nationaal park is gemaakt en of er een vogel op staat. U uploadt eenvoudig een afbeelding en binnen een paar seconden retourneert Flickr de resultaten. Je vraagt ​​je vast af waarom Flickr geld, tijd en middelen zou besteden aan iets dat onze ogen gemakkelijk kunnen opmerken? Terwijl de nieuwe “Flickr Park of Vogel'-functie lijkt zinloos, maar demonstreert in feite de complexe beeldherkenningssoftware die Flickr gebruikt in zijn zoekalgoritmen. Wat voor ons mensen misschien gemakkelijk te onderscheiden lijkt, is iets ingewikkelder voor computers, maar de functie laat zien hoe ver software is gekomen en hoe de toekomst van het zoeken naar afbeeldingen eruit zal zien.

Aanbevolen video's

Bepalen of een foto in een park is gemaakt, is relatief eenvoudig, zolang er GPS-gegevens in zijn opgenomen. Flickr vergelijkt de GPS-informatie met gegevens in een database en kan u de exacte naam vertellen van het park waar de foto is gemaakt. Als er geen informatie is, worden de resultaten geretourneerd als vraagtekens; in één afbeelding die we hebben geüpload, had Flickr geen GPS-gegevens om uit te werken, maar kon wel zien dat deze binnenshuis was genomen.

Verwant:Yahoo introduceert eindelijk Flickr voor iPad

Het herkennen van een vogel (of wat dan ook) in een afbeelding is ingewikkelder. Flickr zegt dat het Vision-team “het afgelopen jaar heeft gewerkt om dit te kunnen doen Herken meer dan 1.000 dingen in afbeeldingen gebruiken diepe convolutionele neurale netten”, en een van de dingen waar de software goed in is, is het vinden van vogels. De methode is een beetje technisch uit te leggen (je kunt er meer over lezen hier), maar simpel gezegd vergelijkt de software een invoerafbeelding (afbeelding van een vogel) met lagen en lagen afbeeldingen; één laag “herkent mogelijk de meest elementaire beeldkenmerken, zoals korte rechte lijnen, hoeken en kleine cirkelbogen”, terwijl een andere laag complexere vormen heeft, en “verdere lagen concepten van een hoger niveau kunnen herkennen, zoals ogen en snavels.”

Flickr zegt dat het Vision-team “dit diepe netwerk al toepast op Flickr-foto’s, zodat mensen ze gemakkelijker kunnen vinden waar ze naar op zoek zijn via de zoekfunctie van Flickr, en we zijn van plan dit op andere coole manieren in Flickr te integreren in de toekomst. We werken ook aan andere innovatieve computervisie- en beeldherkenningstechnologieën die het voor Flickr-leden gemakkelijker zullen maken om hun foto's te vinden en te ordenen.' Door Door te herkennen wat er op een foto staat, hoeven gebruikers in de toekomst niet meer handmatig te taggen wat er op de foto staat, omdat de software die dingen er automatisch uit kan halen.

Het is niet perfect, zoals deze afbeeldingsupload laat zien. Flickr kon niet bepalen waar de foto was genomen vanwege ontbrekende GPS-informatie, maar dacht ook dat deze beroemde internetkat een vogel was.
Het is niet perfect, zoals deze afbeeldingsupload laat zien. Flickr kon niet bepalen waar de foto was genomen vanwege ontbrekende GPS-informatie, maar dacht ook dat deze beroemde internetkat een vogel was.

Upgrade uw levensstijlMet Digital Trends kunnen lezers de snelle technische wereld in de gaten houden met het laatste nieuws, leuke productrecensies, inzichtelijke redactionele artikelen en unieke sneak peeks.