Flickr 'Park or Bird' viser software til billedgenkendelse

flickrs simple park bird tool faktisk demo kompleks billedgenkendelse flickr
Årsagen til at skabe dette nye værktøj stammer fra dette xkcd tegneserie, som stillede Flickrs ingeniører over for en udfordring.

Flickrs ingeniører har arbejdet rigtig hårdt med at udvikle et nyt værktøj der kan fortælle, om et billede er taget i en nationalpark, og om det indeholder en fugl. Du uploader blot et billede, og inden for et par sekunder returnerer Flickr resultaterne. Du må spørge, hvorfor Flickr ville bruge penge, tid og ressourcer på noget, vores øjne nemt kan udvælge? Mens den nye "Flickr Park eller BirdFunktionen virker meningsløs, den demonstrerer faktisk kompleks billedgenkendelsessoftware, som Flickr anvender i sine søgealgoritmer. Hvad der kan virke let for os mennesker at gennemskue, er lidt mere kompliceret for computere, men funktionen viser, hvor langt software er kommet, og hvordan fremtiden for billedsøgning vil se ud.

Anbefalede videoer

Det er relativt nemt at afgøre, om et billede er taget i en park, så længe GPS-data er indlejret. Flickr matcher GPS-informationen med registreringer i en database og kan fortælle dig det nøjagtige navn på parken, hvor billedet blev taget. Hvis der ikke er information, returneres resultaterne som spørgsmålstegn; i et billede, vi uploadede, havde Flickr ingen GPS-data at arbejde ud fra, men det var i stand til at fortælle, at det var taget indendørs.

Relaterede:Yahoo lancerer endelig Flickr til iPad

At genkende en fugl (eller noget andet for den sags skyld) i et billede er mere involveret. Flickr siger, at dets Vision-team "har arbejdet det sidste år eller deromkring for at være i stand til det genkende mere end 1.000 ting i billeder ved hjælp af dybe foldede neurale net,” og en af ​​de ting, dens software er god til, er at finde fugle. Metoden er lidt teknisk at forklare (du kan læse mere om den her), men enkelt sagt matcher softwaren et inputbillede (billede af en fugl) mod lag og lag af billeder; et lag "genkender muligvis de mest grundlæggende billedfunktioner, såsom korte lige linjer, hjørner og små cirkelbuer," mens et andet lag har mere komplekse former, og "yderligere lag genkender muligvis begreber på højere niveau, som øjne og næb."

Flickr siger, at dets Vision-team "allerede anvender dette dybe netværk på Flickr-billeder for at hjælpe folk med at finde hvad de leder efter via Flickr-søgning, og vi planlægger at integrere det i Flickr på andre fede måder i fremtid. Vi arbejder også på andre innovative computersyns- og billedgenkendelsesteknologier, der vil gøre det nemmere for Flickr-medlemmer at finde og organisere deres billeder." Ved ved at genkende, hvad der er på et billede, behøver brugere i fremtiden ikke manuelt at mærke, hvad der er i dem ved hjælp af tekst, da softwaren vil være i stand til at udvælge disse ting automatisk.

Det er ikke perfekt, som dette billede upload viser. Flickr kunne ikke bestemme, hvor den blev skudt på grund af manglende GPS-information, men den troede også, at denne berømte internetkat var en fugl.
Det er ikke perfekt, som denne billedupload viser. Flickr kunne ikke bestemme, hvor den blev skudt på grund af manglende GPS-information, men den troede også, at denne berømte internetkat var en fugl.

Opgrader din livsstilDigital Trends hjælper læserne med at holde styr på den hurtige teknologiske verden med alle de seneste nyheder, sjove produktanmeldelser, indsigtsfulde redaktionelle artikler og enestående smugkig.