Croudsourcing-avain Netflix-kilpailun voittajille

Jos viivyttelet kolmen tunnin työn jälkeen, kuvittele kuinka vaikeaa on palata projektiin kolmen vuoden aikana.

Juuri näin seitsemän insinööriä, tutkijaa ja tiedemiestä ympäri maailmaa teki yrittääkseen parantaa Netflixin elokuvasuositusalgoritmia 10 prosentilla tai enemmän. Ja heidän ahkeruutensa kannatti äskettäin, kun elokuvavuokraamo myönsi miljoona dollaria BellKorin Pragmatic Chaos -tiimille.

Suositellut videot

Joukkue toimitti lopullisen kaavansa noin 20 minuuttia ennen kuin kilpailu päättyi heinäkuun lopulla ja voitti läheisen kilpailijan The Ensemblen. Yli 50 000 ihmistä kilpaili palkinnosta kolmivuotisen kilpailun aikana.

Liittyvät

Uusi My Netflix -välilehti näyttää helpottavan suoratoistoa tien päällä
Netflix tappaa perussuunnitelman Yhdysvalloissa ja Isossa-Britanniassa, koska mainokset tuovat lisää tuloja
Netflixin nopeustesti: kuinka tarkistaa, voitko suoratoistaa 4K Ultra HD: tä

Menetelmä hullutukseen

BellKorin Pragmatic Chaos on kolmen joukkueen (BellKor, PragmaticTheory ja Big Chaos) yhdistelmä, jotka yhdistivät voimansa viimeistelläkseen ilmoittautumisensa kilpailuun. Jäsenet ovat: Bob Bell ja Chris Volinsky, AT&T-tutkimuksen tilastotutkimusosastosta; Andreas Töscher ja Michael Jahrer, koneoppimisen tutkijat ja perustajat

commendo tutkimus ja konsultointi Itävallassa; sähköinsinööri Martin Piotte ja ohjelmistoinsinööri Martin Chabbert Montrealista, perustajat Pragmaattinen teoria; ja Yehuda Koren, vanhempi tutkija osoitteessa Yahoo! Tutki Israelia. He tapasivat ensimmäisen kerran maanantaina syyskuussa. 21. päivänä, kun Netflix julkisti voittajat.

BellKorin Pragmatic Chaosista tuli ensimmäinen joukkue, joka ylitti 10 prosenttia kesäkuussa, mikä herätti 30 päivän ajanjakson, jonka aikana muut kilpailijat saattoivat yrittää voittaa pisteensä. Kilpailijatiimi The Ensemble lähetti ratkaisunsa heinäkuun lopulla vain minuutteja ennen määräaikaa. BellKorin voitto paransi Netflixin nykyistä järjestelmää 10,06 prosenttia.

Yritys saada aikaan 10 prosentin vähennys testitietojen keskimääräiseen neliövirheeseen (RMSE) verrattuna Cinematch, tekniikka, jota Netflix käyttää tällä hetkellä suositellakseen elokuvia jäsenilleen, perustui yhteistyöhön suodatus. Menetelmä tarkastelee samaa luokitusmallia käyttävien käyttäjien aiempaa käyttäytymistä ennusteen laatimiseksi muille käyttäjille. BellKorin pragmaattinen kaaos, joka käytti miljoonan elokuvan tietojoukkoa, toimi algoritmeja ja hyödynsi ”erilaisia malleista, jotka täydentävät toistensa puutteita”, todetaan yhdessä tiimin julkaisemista papereista BellKor.

Ne sisälsivät lähimpien naapurimallien (jotka tunnistavat tuoteparit, jotka käyttäjät yleensä arvioivat samalla tavalla ennustaa luokittelemattoman kohteen arvioita) ja piileviä tekijöitä (jotka tutkivat piilotettuja ominaisuuksia, jotka selittävät havaitun arvosanat). Tiimi tutki myös luokituksia saadakseen lisätietoa, kuten mitä elokuvia henkilö arvioi.

Ryhmä pystyi päättämään, että:

katsojat käyttävät erilaisia kriteerejä arvioidakseen elokuvia, joita he ovat nähneet kauan sitten, verrattuna äskettäin näkemiinsä elokuviin; ja
Jotkut elokuvat näyttävät kasvavan katsojien parissa ajallaan ja katsojat arvioivat elokuvat eri tavalla viikon eri päivinä.

Näiden tietojen perusteella tiimi loi kolmiulotteisen mallin, joka keskittyi siihen, miten aika vaikuttaa ihmisten ja elokuvien väliseen suhteeseen.

Voittava yhdistelmä

Vaikka ratkaisun taustalla oleva metodologia on tärkeä, ehkä mielenkiintoisempi oli kilpailun viittaus siihen, että joukkoistaminen voi tuottaa parempia tuloksia kuin talon sisäinen etsiminen.

Chris Volinsky BellKor’s-tiimistä sanoo, että Netflix teki älykkään liikkeen, kun "tajusi, että siellä oli tutkimusyhteisö, joka työskenteli tämäntyyppisten mallien parissa ja kaipasi dataa.

"Netflixillä oli tiedot, mutta vain kourallinen ihmisiä työskentelee ongelman parissa", hän sanoo. ”Palkinto yhdisti nämä kaksi tavalla, joka oli herkkä heidän omistamilleen tiedoille… Tämä malli ei toimi kaikilla verkkotunnuksilla – se toimi täällä, koska tiedot olivat mielenkiintoisia ja vakuuttavia aihe. Jokainen voi samaistua elokuviin. Samanlainen kilpailu esimerkiksi automaattisesta kielenkäännöksestä ei ehkä synnytä yhtä paljon intohimoa.

Andreas Töscher, alun perin Big Chaos -tiimistä, oli samaa mieltä siitä, että Netflixin kaltaisia kilpailuja on tulossa lisää. Hän puhui tiiminsä erityisen joukkohankintakokemuksen syrjäisestä luonteesta – ennen maanantaita hän ei ollut edes puhunut joukkuetovereidensa kanssa saati heidän katselemisestaan. ”Oli hienoa tavata muu tiimi yli puolen vuoden yhteistyön jälkeen. Meillä ei ole koskaan ollut puhelinsoittoa. Martinista ja Martinista olimme nähneet kuvia vasta viikko sitten.

Martin Chabbert, joka oli alun perin osa PragmaticTheory-tiimiä, sanoo, että vaikka oli vaikeaa keskittyä kilpailuun. Jongleering työ- ja perhevelvollisuuksien välillä oli vaikeampaa välttää kirjautumasta tietokoneeseen testatakseen uutta ideaa hanke. Vaikka hänen insinööritaustansa auttoi tiimin ponnisteluja, työn teoreettisiin puoliin jääminen auttoi yhtä paljon.

"Uskon, että yksi tärkeimmistä ominaisuuksista menestyä tällä alalla on kyky kääntää intuitio ihmisen käyttäytymisestä todelliseksi matemaattiseksi ja algoritmiseksi malliksi", Chabbert sanoo. ”Monilla ihmisillä on ideoita siitä, mitä pitäisi kuvata, mutta avain on löytää oikea tapa vangita se. Uskon, että teimme siinä hyvää työtä. Lisäksi, koska emme tulleet akateemisesta taustasta, keskityimme enemmän käsillä olevaan tehtävään kuin yrittää löytää asioita, joilla oli teoreettista pohjaa tai jotka välttämättä edistäisivät yleistä tiede."

Neljän lapsen isä sanoo, että jokainen joukkueensa jäsen toi varmasti jotain, mikä vaikutti voittopisteeseen. Team BellKor -jäsenen Yehuda Korenin algoritmit ja paperit olivat ensiarvoisen tärkeitä, kun taas BigChaosin kaikkien kunkin alatiimin mallien ja ennustusjoukkojen hallinta osoittautui avainasemassa. Chabbert ja Martin Piotte arvostavat "pragmaattista" lähestymistapaansa laajan valikoiman alkuperäisiä malleja ja yhdistelmiä tuottaessa.

Volinsky sanoo, että AT&T IP -organisaatio omistaa immateriaalioikeudet kilpailijan keksintöihin, mutta harkitsisi mahdollisuutta lisensoida niitä ulkopuolelta. Kaikki kolme joukkuetoveria sanovat harkitsevansa osallistumista Netflixin toinen kilpailu, joka keskittyy makuprofiilien luomiseen yksittäisille käyttäjille demografisten ja käyttötietojen perusteella.

Lauren Fritsky on freelance-kirjoittaja ja ammattibloggaaja, joka asuu Philadelphian ulkopuolella. Hänen töitään on esiintynyt useissa sanoma- ja aikakauslehdissä sekä sivustoilla, kuten AOL ja CNN.

Toimittajien suositukset

Parhaat Netflix-tarjoukset: Katso uusimmat Netflix-alkuperäiskappaleet ilmaiseksi
Paljonko Netflix maksaa? Katkos striimaajan suunnitelmista
Kuinka katsoa Netflixiä 4K-muodossa millä tahansa laitteella
TCL: n 2023 soundbarit ovat edullisia, mutta niistä puuttuu keskeinen ominaisuus
Maksa! Netflix aloittaa tilien jakamisen tukahduttamisen Yhdysvalloissa.

Päivitä elämäntapasiDigital Trends auttaa lukijoita pysymään tekniikan nopeatempoisessa maailmassa uusimpien uutisten, hauskojen tuotearvostelujen, oivaltavien toimitusten ja ainutlaatuisten kurkistusten avulla.

Croudsourcing-avain Netflix-kilpailun voittajille

Toimittajien suositukset

Luokat

Viimeaikaiset

Nomadin kestävässä latauskaapelissa on sisäänrakennettu akku

Lego City Undercover on menossa Xbox Onelle, PS4:lle, Switchille

Ikkunallinen viestituki Windows 10 Outlook Mailille