Croudsourcing võti Netflixi konkursi võitjatele

BellKori pragmaatiline kaos

Kui viivitate pärast kolmetunnist tööd, kujutage ette, kui raske on kolme aasta jooksul projekti juurde tagasi tulla.

Täpselt seda tegid seitse inseneri, teadlast ja teadlast kogu maailmast, et Netflixi filmisoovitusalgoritmi 10 protsenti või rohkem parandada. Ja nende hoolsus tasus hiljuti vilja, kui filmilaenutusfirma andis meeskonnale BellKori Pragmatic Chaos miljon dollarit.

Soovitatud videod

Meeskond esitas oma lõpliku valemi umbes 20 minutit enne võistluse lõppu juuli lõpus, edestades lähikonkurendi The Ensemble'i. Kolmeaastase võistluse jooksul võistles auhinnale üle 50 000 inimese.

Seotud

  • Uus vahekaart Minu Netflix muudab voogesituse liikvel olles pisut lihtsamaks
  • Netflix hävitab põhiplaani USA-s ja Ühendkuningriigis, kuna reklaamid toovad rohkem tulu
  • Netflixi kiiruskatse: kuidas kontrollida, kas saate 4K Ultra HD voogesitust

Meetod hullumeelsuseni

BellKori pragmaatiline kaos on kombinatsioon kolmest meeskonnast (BellKor, PragmaticTheory ja Big Chaos), kes ühendasid jõud, et lõpetada konkursile esitamine. Liikmed on: Bob Bell ja Chris Volinsky, AT&T teadusuuringute statistikauuringute osakonnast; Andreas Töscher ja Michael Jahrer, masinõppe uurijad ja asutajad

commendo uuringud ja konsultatsioonid Austrias; elektriinsener Martin Piotte ja tarkvarainsener Martin Chabbert Montrealist, asutajad Pragmaatiline teooria; ja Yehuda Koren, vanemteadur Yahoo! Uurige Iisraeli. Esimest korda kohtusid nad esmaspäeval, septembris. 21, kui Netflix kuulutas välja võitjad.

BellKori Pragmatic Chaos sai juunis esimeseks meeskonnaks, kes ületas 10 protsenti, mis tekitas 30-päevase perioodi, mille jooksul teised võistlejad said proovida oma tulemust ületada. Rivaalide meeskond The Ensemble esitas oma lahenduse juuli lõpus vaid mõni minut enne tähtaega. BellKori võidutöö parandas Netflixi olemasolevat süsteemi 10,06 protsenti.

Katse vähendada katseandmete ruutkeskmise vea (RMSE) 10 protsenti võrreldes Cinematch, tehnoloogia, mida Netflix praegu liikmetele filmide soovitamiseks kasutab, põhines koostööl filtreerimine. Metoodikas vaadeldakse sama reitingumustriga kasutajate varasemat käitumist, et koostada teistele kasutajatele ennustus. Kasutades miljonist filmist koosnevat andmekogumit, töötas BellKori pragmaatiline kaos algoritme ja kasutas „mitmesugust mudelitest, mis täiendavad üksteise puudujääke,“ seisab ühes meeskonna avaldatud artiklis BellKor.

Need hõlmasid lähimate naabrite mudeleid (mis tuvastavad üksuste paare, mida kasutaja kipub sarnaselt hindama ennustada reitinguta üksuse hinnanguid) ja varjatud tegureid (mis uurivad peidetud funktsioone, mis selgitavad vaadeldavat objekti). hinnangud). Meeskond uuris ka hinnanguid, et leida lisaandmeid, näiteks milliseid filme inimene hindas.

Meeskond suutis kindlaks teha, et:

  • vaatajad kasutavad erinevaid kriteeriume, et hinnata filme, mida nad nägid kaua aega tagasi, võrreldes nendega, mida nad hiljuti nägid; ja
  • tundub, et mõned filmid kasvavad vaatajate hulgas aja jooksul ja vaatajad hindavad filme erinevatel nädalapäevadel erinevalt.

Seda teavet kasutades lõi meeskond kolmemõõtmelise mudeli, mis keskendus sellele, kuidas aeg mõjutab inimeste ja filmide vahelisi suhteid.

Võidukombinatsioon

Kuigi lahenduse taga olev metoodika on oluline, oli võib-olla huvitavam võistluse märge, et ühishanke kasutamine võib anda paremaid tulemusi kui majasisene otsimine.

Chris Volinsky meeskonnast BellKor ütleb, et Netflix tegi nutika sammu, "mõistes, et seal on teadlaskond, kes töötas seda tüüpi mudelite kallal ja nälgib andmeid.

"Netflixil olid andmed olemas, kuid probleemi kallal töötab vaid käputäis inimesi," ütleb ta. "Auhind ühendas need kaks viisil, mis oli tundlik nende varaliste andmete suhtes … See mudel ei tööta iga domeeni puhul – see töötas siin, sest andmed olid huvitavad ja mõjusid teema. Igaüks suudab filmidega suhestuda. Sarnane konkurss näiteks automaatse keeletõlke jaoks ei pruugi tekitada nii palju kirge.

Andreas Töscher, kes oli algselt meeskonnast Big Chaos, nõustus, et varuks on rohkem võistlusi, nagu Netflix. Ta rääkis oma meeskonna konkreetse rahvahulga hankimise kogemuse kaugest olemusest – enne esmaspäeva polnud ta isegi oma meeskonnakaaslastega rääkinud, rääkimata nende silma vaatamisest. „Pärast üle pooleaastast koostööd oli suurepärane kohtumine ülejäänud meeskonnaga. Meil ei olnud kordagi telefonikõnet. Martinist ja Martinist olime pilte näinud alles nädal tagasi.

Martin Chabbert, kes oli algselt osa PragmaticTheory meeskonda, ütleb, et kuigi võistlusele oli raske keskenduda. töö ja perekondlike kohustustega žongleerides oli raskem vältida arvutisse logimist, et katsetada uut ideed. projekt. Kuigi tema inseneritaust aitas meeskonna pingutusi kaasa, aitas töö teoreetilistest aspektidest takerdumine samavõrra kaasa.

"Ma arvan, et üks olulisi omadusi selles valdkonnas edu saavutamiseks on võime muuta intuitsioon inimkäitumise kohta tegelikuks matemaatiliseks ja algoritmiliseks mudeliks," ütleb Chabbert. "Paljudel inimestel on ideid selle kohta, mida tuleks jäädvustada, kuid võti on selle jäädvustamiseks õige viisi leidmine. Usun, et tegime sellega head tööd. Lisaks, kuna me ei olnud pärit akadeemilisest taustast, keskendusime pigem käsilolevale ülesandele püüdes leida asju, millel oleks teoreetiline alus või mis viiksid tingimata üldisi edasi teadus."

Nelja lapse isa ütleb, et iga tema meeskonnaliige tõi kindlasti kaasa midagi, mis võiduskoorile kaasa aitas. Team BellKori liikme Yehuda Koreni algoritmid ja paberid olid ülimalt tähtsad, samas kui BigChaose kõigi mudelite ja ennustuskomplektide haldamine igast alammeeskonnast osutus võtmetähtsusega. Chabbert ja Martin Piotte tunnustavad oma "pragmaatilist" lähenemisviisi suure hulga originaalmudelite ja kombinatsioonide loomisel.

Volinsky ütleb, et AT&T IP-organisatsioonile kuulub konkursi leiutiste intellektuaalomand, kuid ta kaaluks võimaluste otsimist nende väliseks litsentsimiseks. Kõik kolm meeskonnakaaslast ütlevad, et kaaluvad osalemist Netflixi teine ​​võistlus, mis keskendub demograafiliste ja kasutusandmete põhjal individuaalsete kasutajate maitseprofiilide loomisele.

Lauren Fritsky on väljaspool Philadelphiat asuv vabakutseline kirjanik ja professionaalne blogija. Tema tööd on ilmunud mitmetes ajalehtedes ja ajakirjades ning sellistel saitidel nagu AOL ja CNN.

Toimetajate soovitused

  • Parimad Netflixi pakkumised: vaadake uusimaid Netflixi originaale tasuta
  • Kui palju Netflix maksab? Striimija plaanide jaotus
  • Kuidas vaadata Netflixi 4K-s mis tahes seadmes
  • TCL-i 2023 heliribad on taskukohased, kuid neil puudub põhifunktsioon
  • Maksa ära! Netflix alustab USA-s kontode jagamise mahasurumist.

Uuenda oma elustiiliDigitaalsed suundumused aitavad lugejatel hoida silma peal kiirel tehnikamaailmal kõigi viimaste uudiste, lõbusate tooteülevaadete, sisukate juhtkirjade ja ainulaadsete lühiülevaadetega.