Croudsourcing κλειδί για τους νικητές του διαγωνισμού Netflix

Το Πραγματικό Χάος της BellKor

Αν αναβάλλετε μετά από τρεις ώρες δουλειάς, φανταστείτε πόσο δύσκολο είναι να συνεχίσετε να επιστρέφετε σε ένα έργο κατά τη διάρκεια τριών ετών.

Αυτό ακριβώς έκαναν επτά μηχανικοί, ερευνητές και επιστήμονες από όλο τον κόσμο σε μια προσπάθεια να βελτιώσουν τον αλγόριθμο προτάσεων ταινιών του Netflix κατά 10 τοις εκατό ή περισσότερο. Και η επιμέλειά τους απέδωσε πρόσφατα όταν η εταιρεία ενοικίασης ταινιών βράβευσε 1 εκατομμύριο δολάρια στην ομάδα Pragmatic Chaos της BellKor.

Προτεινόμενα βίντεο

Η ομάδα υπέβαλε την τελική της φόρμουλα περίπου 20 λεπτά πριν τελειώσει ο διαγωνισμός στα τέλη Ιουλίου, νικώντας τον στενό ανταγωνιστή The Ensemble. Περισσότερα από 50.000 άτομα συμμετείχαν από το βραβείο κατά τη διάρκεια του τριετούς διαγωνισμού.

Σχετίζεται με

  • Η νέα καρτέλα My Netflix φαίνεται να κάνει τη ροή εν κινήσει λίγο πιο εύκολη
  • Το Netflix σκοτώνει το βασικό σχέδιο στις ΗΠΑ και το Ηνωμένο Βασίλειο, καθώς οι διαφημίσεις αποφέρουν περισσότερα έσοδα
  • Δοκιμή ταχύτητας Netflix: πώς να ελέγξετε αν μπορείτε να κάνετε ροή 4K Ultra HD

Η Μέθοδος για την Τρέλα

Το BellKor's Pragmatic Chaos είναι ένας συνδυασμός τριών ομάδων (BellKor, PragmaticTheory και Big Chaos) που ένωσαν τις δυνάμεις τους για να ολοκληρώσουν την υποβολή τους στον διαγωνισμό. Τα μέλη είναι οι: Bob Bell και Chris Volinsky, του τμήματος στατιστικής έρευνας της AT&T research. Andreas Töscher και Michael Jahrer, ερευνητές μηχανικής μάθησης και ιδρυτές του συνιστώ την έρευνα και τη διαβούλευση στην Αυστρία? ο ηλεκτρολόγος μηχανικός Martin Piotte και ο μηχανικός λογισμικού Martin Chabbert από το Μόντρεαλ, ιδρυτές του Πραγματική Θεωρία; και Yehuda Koren, ανώτερος ερευνητής στο Yahoo! Ερευνήστε το Ισραήλ. Συναντήθηκαν για πρώτη φορά τη Δευτέρα, Σεπτ. 21, όταν το Netflix ανακοίνωσε τους νικητές.

Το Pragmatic Chaos της BellKor έγινε η πρώτη ομάδα που ξεπέρασε το 10 τοις εκατό τον Ιούνιο, γεγονός που πυροδότησε μια περίοδο 30 ημερών κατά την οποία άλλοι διαγωνιζόμενοι μπορούσαν να προσπαθήσουν να κερδίσουν το σκορ τους. Η αντίπαλη ομάδα, The Ensemble, υπέβαλε τη λύση της στα τέλη Ιουλίου λίγα λεπτά πριν από τη λήξη της προθεσμίας. Η νικητήρια συμμετοχή της BellKor βελτίωσε το υπάρχον σύστημα του Netflix κατά 10,06%.

Η προσπάθεια να παραχθεί μια μείωση 10 τοις εκατό στο ριζικό μέσο τετραγωνικό σφάλμα (RMSE) των δεδομένων δοκιμής σε σύγκριση με Το Cinematch, η τεχνολογία που χρησιμοποιεί αυτή τη στιγμή το Netflix για να προτείνει ταινίες στα μέλη, βασίστηκε σε συνεργασία φιλτράρισμα. Η μεθοδολογία εξετάζει την προηγούμενη συμπεριφορά χρηστών που μοιράζονται τα ίδια μοτίβα αξιολόγησης για να διατυπώσει μια πρόβλεψη για άλλους χρήστες. Χρησιμοποιώντας ένα σύνολο δεδομένων από ένα εκατομμύριο ταινίες, το Pragmatic Chaos της BellKor δούλεψε αλγόριθμους και βασίστηκε σε «μια ποικιλία μοντέλων που συμπληρώνουν το ένα τα μειονεκτήματα του άλλου», σύμφωνα με ένα από τα άρθρα που δημοσίευσε η ομάδα BellKor.

Περιλάμβαναν μοντέλα πλησιέστερου γείτονα (τα οποία προσδιορίζουν ζεύγη αντικειμένων που τείνουν να βαθμολογούνται παρόμοια από έναν χρήστη προβλέπουν βαθμολογίες για ένα μη αξιολογημένο στοιχείο) και λανθάνοντες παράγοντες (οι οποίοι διερευνούν κρυφά χαρακτηριστικά που εξηγούν το παρατηρούμενο ακροαματικότητα). Η ομάδα κοίταξε επίσης πίσω από τις βαθμολογίες για να αποκαλύψει πρόσθετα δεδομένα, όπως ποιες ταινίες βαθμολόγησε ένα άτομο.

Η ομάδα κατάφερε να προσδιορίσει ότι:

  • Οι θεατές χρησιμοποιούν διαφορετικά κριτήρια για να αξιολογήσουν ταινίες που είδαν πριν από πολύ καιρό σε σύγκριση με αυτές που είδαν πρόσφατα. και
  • ορισμένες ταινίες φαίνεται να αυξάνονται στους θεατές με την πάροδο του χρόνου και οι θεατές βαθμολογούν τις ταινίες διαφορετικά σε διαφορετικές ημέρες της εβδομάδας.

Χρησιμοποιώντας αυτές τις πληροφορίες, η ομάδα δημιούργησε ένα τρισδιάστατο μοντέλο που επικεντρώθηκε στο πώς ο χρόνος επηρεάζει τη σχέση μεταξύ ανθρώπων και ταινιών.

Ένας νικηφόρος συνδυασμός

Ενώ η μεθοδολογία πίσω από τη λύση είναι σημαντική, ίσως πιο ενδιαφέρουσα ήταν η ένδειξη του διαγωνισμού ότι το crowdsourcing μπορεί να παράγει καλύτερα αποτελέσματα από το να ψάχνεις στο εσωτερικό.

Ο Chris Volinsky της ομάδας BellKor's λέει ότι το Netflix έκανε μια έξυπνη κίνηση «συνειδητοποιώντας ότι υπήρχε μια ερευνητική κοινότητα εκεί έξω που εργαζόταν σε αυτού του είδους τα μοντέλα και πεινούσε για δεδομένα.

«Το Netflix είχε τα δεδομένα, αλλά μόνο λίγοι άνθρωποι εργάζονται για το πρόβλημα», λέει. «Το βραβείο συνέδεε αυτά τα δύο με έναν τρόπο που ήταν ευαίσθητος στα ιδιόκτητα δεδομένα τους… Αυτό το μοντέλο δεν λειτουργεί για κάθε τομέα — λειτούργησε εδώ επειδή τα δεδομένα ήταν ενδιαφέροντα και ήταν συναρπαστικά θέμα. Ο καθένας μπορεί να σχετίζεται με ταινίες. Ένας παρόμοιος διαγωνισμός για, ας πούμε, αυτόματη μετάφραση γλώσσας, μπορεί να μην δημιουργήσει τόσο μεγάλο πάθος».

Ο Andreas Töscher, αρχικά της ομάδας Big Chaos, συμφώνησε ότι περιμένουν περισσότεροι διαγωνισμοί όπως αυτός του Netflix. Μίλησε για τον απομακρυσμένο χαρακτήρα της ιδιαίτερης εμπειρίας του crowdsourcing της ομάδας του - πριν από τη Δευτέρα, δεν είχε καν μιλήσει με τους συμπαίκτες του πόσο μάλλον να τους κοιτάξει. «Ήταν υπέροχο που γνώρισα την υπόλοιπη ομάδα, μετά από συνεργασία για πάνω από μισό χρόνο. Δεν είχαμε ποτέ τηλέφωνο. Από τον Μάρτιν και τον Μάρτιν, δεν είχαμε δει φωτογραφίες μέχρι πριν από μία εβδομάδα».

Ο Martin Chabbert, ο οποίος ήταν αρχικά μέλος της ομάδας PragmaticTheory, λέει ότι ενώ ήταν δύσκολο να επικεντρωθείς στον διαγωνισμό ενώ ταχυδακτυλουργώντας τις επαγγελματικές και οικογενειακές ευθύνες, ήταν πιο δύσκολο να αποφύγεις τη σύνδεση στον υπολογιστή για να δοκιμάσεις μια νέα ιδέα για το έργο. Ενώ το μηχανολογικό του υπόβαθρο βοήθησε τις προσπάθειες της ομάδας, το να μην κολλήσει από τις θεωρητικές πτυχές της εργασίας βοήθησε εξίσου.

«Νομίζω ότι ένα από τα σημαντικά χαρακτηριστικά για να είσαι επιτυχημένος σε αυτόν τον τομέα είναι η ικανότητα να μεταφράζεις τη διαίσθηση για την ανθρώπινη συμπεριφορά σε ένα πραγματικό μαθηματικό και αλγοριθμικό μοντέλο», λέει ο Chabbert. «Πολλοί άνθρωποι έχουν ιδέες για το τι πρέπει να αποτυπωθεί, αλλά το κλειδί είναι να βρεθεί ο κατάλληλος τρόπος για να το αποτυπώσει. Πιστεύω ότι κάναμε καλή δουλειά σε αυτό. Επίσης, μη προερχόμενοι από ακαδημαϊκό υπόβαθρο, ήμασταν πολύ συγκεντρωμένοι στο έργο που είχαμε, παρά προσπαθώντας να βρει πράγματα που είχαν θεωρητική βάση ή που θα προωθούσαν αναγκαστικά τον στρατηγό επιστήμη."

Ο πατέρας τεσσάρων παιδιών λέει ότι κάθε ένα από τα μέλη της ομάδας του σίγουρα έφερε κάτι που συνέβαλε στο νικητήριο σκορ. Οι αλγόριθμοι και τα έγγραφα του μέλους της Team BellKor, Yehuda Koren, ήταν πρωταρχικής σημασίας, ενώ η διαχείριση όλων των μοντέλων και των συνόλων προβλέψεων που προέρχονταν από κάθε υποομάδα αποδείχτηκε κλειδί από το BigChaos. Ο Chabbert και ο Martin Piotte πιστώνουν την «ρεαλιστική» προσέγγισή τους για την παραγωγή μιας μεγάλης ποικιλίας πρωτότυπων μοντέλων και συνδυασμών.

Ο Volinsky λέει ότι ο οργανισμός AT&T IP κατέχει την πνευματική ιδιοκτησία των εφευρέσεων από τον ανταγωνισμό, αλλά θα εξετάσει το ενδεχόμενο να αναζητήσει ευκαιρίες για να τους χορηγήσει εξωτερικά άδεια. Και οι τρεις συμπαίκτες λένε ότι θα σκεφτούν να μπουν Ο δεύτερος διαγωνισμός του Netflix, το οποίο θα επικεντρωθεί στη δημιουργία προφίλ γεύσης για μεμονωμένους χρήστες βάσει δημογραφικών δεδομένων και δεδομένων χρήσης.

Η Lauren Fritsky είναι ανεξάρτητος συγγραφέας και επαγγελματίας blogger με έδρα εκτός Φιλαδέλφειας. Η δουλειά της έχει εμφανιστεί σε πολλές εφημερίδες και περιοδικά και σε ιστότοπους όπως η AOL και το CNN.

Συστάσεις των συντακτών

  • Καλύτερες προσφορές Netflix: Παρακολουθήστε τα πιο πρόσφατα πρωτότυπα του Netflix δωρεάν
  • Πόσο κοστίζει το Netflix; Μια ανάλυση των σχεδίων του streamer
  • Πώς να παρακολουθήσετε το Netflix σε 4K σε οποιαδήποτε συσκευή
  • Οι μπάρες ήχου 2023 της TCL είναι προσιτές, αλλά δεν διαθέτουν ένα βασικό χαρακτηριστικό
  • Ξεχρεώνω! Το Netflix ξεκινά την καταστολή της κοινής χρήσης λογαριασμών στις Η.Π.Α.

Αναβαθμίστε τον τρόπο ζωής σαςΤο Digital Trends βοηθά τους αναγνώστες να παρακολουθούν τον γρήγορο κόσμο της τεχνολογίας με όλα τα τελευταία νέα, διασκεδαστικές κριτικές προϊόντων, διορατικά editorial και μοναδικές κρυφές ματιές.