Το Flickr 'Park or Bird' εμφανίζει το λογισμικό αναγνώρισης εικόνων

flickrs απλό εργαλείο πουλιών πάρκου στην πραγματικότητα επίδειξη σύνθετης αναγνώρισης εικόνας flickr
Ο λόγος για τη δημιουργία αυτού του νέου εργαλείου πηγάζει από αυτό xkcd κόμικ, το οποίο παρουσίασε στους μηχανικούς του Flickr μια πρόκληση.

Οι μηχανικοί του Flickr έχουν εργαστεί πολύ σκληρά για την ανάπτυξη ένα νέο εργαλείο που μπορεί να πει αν μια φωτογραφία τραβήχτηκε σε εθνικό πάρκο και αν περιέχει ένα πουλί. Απλώς ανεβάζετε μια εικόνα και μέσα σε λίγα δευτερόλεπτα το Flickr επιστρέφει τα αποτελέσματα. Πρέπει να ρωτάτε γιατί το Flickr αφιέρωσε χρήματα, χρόνο και πόρους σε κάτι που μπορεί εύκολα να ξεχωρίσει τα μάτια μας; Ενώ το νέο «Flickr Park ή BirdΤο χαρακτηριστικό φαίνεται άσκοπο, στην πραγματικότητα δείχνει πολύπλοκο λογισμικό αναγνώρισης εικόνων που χρησιμοποιεί το Flickr στους αλγόριθμους αναζήτησής του. Αυτό που μπορεί να φαίνεται εύκολο για εμάς τους ανθρώπους να διακρίνουμε είναι ελαφρώς πιο περίπλοκο για τους υπολογιστές, ωστόσο η δυνατότητα δείχνει πόσο μακριά έχει προχωρήσει το λογισμικό και πώς θα είναι το μέλλον της αναζήτησης εικόνων.

Προτεινόμενα βίντεο

Ο προσδιορισμός εάν μια φωτογραφία τραβήχτηκε σε πάρκο είναι σχετικά εύκολος, αρκεί να είναι ενσωματωμένα δεδομένα GPS. Το Flickr αντιστοιχίζει τις πληροφορίες GPS με τις εγγραφές σε μια βάση δεδομένων και μπορεί να σας πει το ακριβές όνομα του πάρκου όπου τραβήχτηκε η φωτογραφία. Εάν δεν υπάρχουν πληροφορίες, τα αποτελέσματα επιστρέφονται ως ερωτηματικά. Σε μια εικόνα που ανεβάσαμε, το Flickr δεν είχε δεδομένα GPS για να λειτουργήσει, αλλά ήταν σε θέση να πει ότι τραβήχτηκε σε εσωτερικούς χώρους.

Σχετίζεται με:Η Yahoo λανσάρει επιτέλους το Flickr για iPad

Η αναγνώριση ενός πουλιού (ή οτιδήποτε άλλο για αυτό το θέμα) σε μια εικόνα είναι περισσότερο εμπλοκή. Το Flickr λέει ότι η ομάδα του Vision «εργάζεται τον τελευταίο χρόνο για να μπορέσει αναγνωρίζουν περισσότερα από 1.000 πράγματα σε εικόνες χρησιμοποιώντας βαθιά συνελικτικά νευρωνικά δίκτυα», και ένα από τα πράγματα στα οποία είναι καλό το λογισμικό της είναι η εύρεση πουλιών. Η μέθοδος είναι λίγο τεχνική για να εξηγηθεί (μπορείτε να διαβάσετε περισσότερα σχετικά εδώ), αλλά με απλά λόγια, το λογισμικό αντιστοιχίζει μια εικόνα εισόδου (εικόνα ενός πουλιού) με επίπεδα και στρώματα εικόνων. ένα στρώμα "μπορεί να αναγνωρίσει τα πιο βασικά χαρακτηριστικά εικόνας, όπως σύντομες ευθείες γραμμές, γωνίες και μικρά κυκλικά τόξα", ενώ ένα άλλο στρώμα έχει πιο πολύπλοκα σχήματα και «περισσότερα στρώματα μπορεί να αναγνωρίσουν έννοιες υψηλότερου επιπέδου, όπως μάτια και ράμφη."

Το Flickr λέει ότι η ομάδα του Vision «εφαρμόζει ήδη αυτό το βαθύ δίκτυο στις φωτογραφίες του Flickr για να βοηθήσει τους ανθρώπους να βρίσκουν πιο εύκολα αυτό που αναζητούν μέσω της αναζήτησης Flickr και σκοπεύουμε να το ενσωματώσουμε στο Flickr με άλλους ωραίους τρόπους στο μελλοντικός. Εργαζόμαστε επίσης σε άλλες καινοτόμες τεχνολογίες όρασης και αναγνώρισης εικόνας από υπολογιστή που θα διευκολύνουν τα μέλη του Flickr να βρίσκουν και να οργανώνουν τις φωτογραφίες τους». Με αναγνωρίζοντας τι υπάρχει σε μια φωτογραφία, οι χρήστες στο μέλλον δεν θα χρειάζεται να επισημάνουν με μη αυτόματο τρόπο αυτό που περιέχει χρησιμοποιώντας κείμενο, καθώς το λογισμικό θα μπορεί να επιλέγει αυτά τα πράγματα αυτόματα.

Δεν είναι τέλειο, όπως δείχνει αυτή η μεταφόρτωση εικόνας. Το Flickr δεν μπορούσε να προσδιορίσει πού τραβήχτηκε λόγω έλλειψης πληροφοριών GPS, αλλά σκέφτηκε επίσης ότι αυτό το διάσημο αιλουροειδές του Διαδικτύου είναι πουλί.
Δεν είναι τέλειο, όπως δείχνει αυτή η μεταφόρτωση εικόνας. Το Flickr δεν μπορούσε να προσδιορίσει πού τραβήχτηκε λόγω έλλειψης πληροφοριών GPS, αλλά σκέφτηκε επίσης ότι αυτό το διάσημο αιλουροειδές του Διαδικτύου είναι πουλί.

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.