Gli ingegneri di Flickr hanno lavorato davvero duramente per lo sviluppo un nuovo strumento che può dire se una foto è stata scattata in un parco nazionale e se contiene un uccello. Basta caricare un'immagine e entro un paio di secondi Flickr restituisce i risultati. Ti starai chiedendo perché Flickr dedicherebbe denaro, tempo e risorse a qualcosa che i nostri occhi possono facilmente individuare? Mentre il nuovo “Flickr Park o Bird" sembra inutile, in realtà dimostra il complesso software di riconoscimento delle immagini che Flickr sta utilizzando nei suoi algoritmi di ricerca. Ciò che potrebbe sembrare facile da discernere per noi umani è leggermente più complicato per i computer, ma la funzionalità mostra quanta strada ha fatto il software e quale sarà il futuro della ricerca di immagini.
Video consigliati
Determinare se un'immagine è stata scattata in un parco è relativamente semplice, purché siano incorporati i dati GPS. Flickr confronta le informazioni GPS con i record di un database e può dirti il nome esatto del parco in cui è stata scattata la foto. Se non sono presenti informazioni, i risultati vengono restituiti come punti interrogativi; in un'immagine che abbiamo caricato, Flickr non aveva dati GPS su cui lavorare, ma era in grado di dire che era stata scattata in interni.
Imparentato:Yahoo finalmente lancia Flickr per iPad
Riconoscere un uccello (o qualsiasi altra cosa) in un'immagine è più complicato. Flickr afferma che il suo team Vision “ha lavorato nell'ultimo anno circa per poterlo fare riconoscere più di 1.000 cose nelle immagini utilizzando reti neurali convoluzionali profonde”, e una delle cose in cui il suo software è bravo è trovare gli uccelli. Il metodo è un po’ tecnico da spiegare (puoi leggere di più a riguardo Qui), ma in parole povere, il software confronta un'immagine di input (l'immagine di un uccello) con strati e strati di immagini; un livello "potrebbe riconoscere le caratteristiche più basilari dell'immagine, come brevi linee rette, angoli e piccoli archi circolari", mentre un altro strato ha forme più complesse e “ulteriori strati potrebbero riconoscere concetti di livello superiore, come occhi e becchi”.
Flickr afferma che il suo team Vision “sta già applicando questa rete profonda alle foto di Flickr per aiutare le persone a trovarle più facilmente cosa stanno cercando tramite la ricerca su Flickr e prevediamo di integrarlo in Flickr in altri modi interessanti nel futuro. Stiamo anche lavorando su altre tecnologie innovative di visione artificiale e di riconoscimento delle immagini che renderanno più semplice per i membri di Flickr trovare e organizzare le proprie foto”. Di Riconoscendo cosa c'è in una foto, gli utenti in futuro non dovranno taggare manualmente cosa c'è dentro usando il testo, poiché il software sarà in grado di individuare quelle cose automaticamente.
Migliora il tuo stile di vitaDigital Trends aiuta i lettori a tenere d'occhio il frenetico mondo della tecnologia con tutte le ultime notizie, divertenti recensioni di prodotti, editoriali approfonditi e anteprime uniche nel loro genere.