Ha halogatja három óra munka után, képzelje el, milyen nehéz három éven keresztül visszatérni egy projekthez.
Pontosan ezt tette hét mérnök, kutató és tudós a világ minden tájáról annak érdekében, hogy a Netflix filmajánló algoritmusát legalább 10 százalékkal javítsák. Szorgalmasságuk pedig meghozta gyümölcsét a közelmúltban, amikor a filmkölcsönző cég 1 millió dollárt ítélt oda a BellKor Pragmatic Chaos csapatának.
Ajánlott videók
A csapat körülbelül 20 perccel a verseny vége előtt nyújtotta be végső formuláját, még július végén, megelőzve közeli versenytársát, a The Ensemble-t. A három évig tartó verseny során több mint 50 000 ember versengett a díjért.
Összefüggő
- Az új My Netflix lap úgy tűnik, hogy megkönnyíti a streamelést útközben
- A Netflix megöli a Basic tervet az Egyesült Államokban és az Egyesült Királyságban, mivel a hirdetések több bevételt hoznak
- Netflix sebességteszt: hogyan ellenőrizheti, hogy képes-e 4K Ultra HD streamelésre
Az őrület módszere
A BellKor's Pragmatic Chaos három csapat (BellKor, PragmaticTheory és Big Chaos) kombinációja, amelyek egyesítették erőiket, hogy befejezzék a versenyre való beküldésüket. A tagok: Bob Bell és Chris Volinsky, az AT&T kutatás statisztikai kutatási osztályának munkatársai; Andreas Töscher és Michael Jahrer, a gépi tanulás kutatói és alapítói
commendo kutatás és tanácsadás Ausztriában; Martin Piotte villamosmérnök és Martin Chabbert montreali szoftvermérnök, a cég alapítói Pragmatikai elmélet; és Yehuda Koren, vezető kutató Jehu! Kutatás Izrael. Szeptember hétfőn találkoztak először. 21-én, amikor a Netflix kihirdette a nyerteseket.A BellKor Pragmatic Chaos lett az első csapat, amely júniusban túllépte a 10 százalékot, ami egy 30 napos időszakot indított el, amely alatt más versenyzők megpróbálhatták felülmúlni pontszámukat. A rivális csapat, a The Ensemble július végén nyújtotta be megoldását néhány perccel a határidő előtt. A BellKor nyertes pályázata 10,06 százalékkal javította a Netflix meglévő rendszerét.
Az a kísérlet, hogy 10 százalékkal csökkentsék a tesztadatok négyzetes középhibáját (RMSE) a A Cinematch, a technológia, amelyet a Netflix jelenleg arra használ, hogy filmeket ajánljon a tagoknak, együttműködésre támaszkodott szűrő. A módszertan az azonos értékelési mintákat osztó felhasználók korábbi viselkedését vizsgálja, hogy előrejelzést fogalmazzon meg a többi felhasználó számára. A BellKor Pragmatic Chaos egy egymillió filmből álló adatkészlet felhasználásával algoritmusokat dolgozott ki, és „különféle olyan modellek, amelyek kiegészítik egymás hiányosságait” – áll a csapat egyik publikációjában BellKor.
Tartalmazták a legközelebbi szomszéd modelleket (amelyek olyan elempárokat azonosítanak, amelyeket a felhasználó hasonlóképpen értékel megjósolni egy nem minősített elem értékelését) és látens tényezőket (amelyek a megfigyelést magyarázó rejtett jellemzőket vizsgálják meg). értékelések). A csapat az értékelések mögé is bekukkantott, hogy további adatokat tárjon fel, például, hogy egy személy milyen filmeket értékelt.
A csapatnak sikerült megállapítania, hogy:
- a nézők különböző kritériumokat használnak a régen látott filmek értékelésére, mint a közelmúltban látottakra; és
- úgy tűnik, hogy egyes filmek idővel megnőnek a nézők körében, és a nézők eltérően értékelik a filmeket a hét különböző napjain.
Ezen információk felhasználásával a csapat egy háromdimenziós modellt hozott létre, amely arra összpontosított, hogy az idő hogyan befolyásolja az emberek és a filmek közötti kapcsolatot.
Nyerő kombináció
Bár a megoldás mögötti módszertan fontos, talán érdekesebb volt a verseny azon jelzése, hogy a crowdsourcing jobb eredményeket hozhat, mint a házon belüli keresés.
Chris Volinsky, a BellKor csapatának munkatársa szerint a Netflix okos lépést tett, amikor rájött, hogy létezik egy kutatóközösség, amely ilyen modelleken dolgozott, és kiéhezett az adatokra.
„A Netflix birtokában voltak az adatok, de csak néhány ember dolgozik a problémán” – mondja. „A nyeremény olyan módon kapcsolta össze a kettőt, hogy az érzékeny volt a védett adataikra… Ez a modell nem működik minden domain esetében – itt működött, mert az adatok érdekesek voltak, és meggyőzőek voltak téma. Mindenki tud kötődni a filmekhez. Egy hasonló verseny, mondjuk az automatikus nyelvi fordításért, talán nem generál akkora szenvedélyt.”
Andreas Töscher, aki eredetileg a Big Chaos csapat tagja, egyetértett abban, hogy további, a Netflixhez hasonló versenyek várnak rád. Beszélt csapata sajátos crowdsourcing tapasztalatának távoli természetéről – hétfő előtt még a csapattársaival sem beszélt, nemhogy a szemükről. „Nagyszerű volt találkozni a csapat többi tagjával, több mint fél éves közös munka után. Soha nem telefonáltunk. Martintól és Martintól egészen egy héttel ezelőttig nem láttunk képeket.”
Martin Chabbert, aki eredetileg a PragmaticTheory csapat tagja volt, azt mondja, hogy bár nehéz volt a versenyre koncentrálni, miközben A munka és a családi kötelezettségek zsonglőrködése során nehezebb volt elkerülni, hogy bejelentkezzenek a számítógépre, hogy kipróbálhassanak egy új ötletet a projekt. Míg mérnöki előélete segítette a csapat munkáját, a munka elméleti vonatkozásaiban való elmerülés sem segített.
„Úgy gondolom, hogy ezen a területen a siker egyik fontos tulajdonsága az a képesség, hogy az emberi viselkedéssel kapcsolatos intuíciót tényleges matematikai és algoritmikus modellekké alakítsuk” – mondja Chabbert. „Sok embernek van ötlete, hogy mit kellene megörökíteni, de a kulcs az, hogy megtaláljuk a megfelelő módot a rögzítéshez. Úgy gondolom, hogy jó munkát végeztünk ebben. Továbbá, mivel nem akadémiai háttérből származtunk, inkább az aktuális feladatra koncentráltunk, mintsem olyan dolgokat próbálnak megtalálni, amelyeknek elméleti alapjaik vannak, vagy amelyek szükségszerűen előmozdítják az általánost tudomány."
A négygyermekes édesapa azt mondja, csapatának mindegyik tagja hozott valamit, ami hozzájárult a győzelemhez. A Team BellKor tagja, Yehuda Koren algoritmusai és papírjai voltak a legfontosabbak, míg a BigChaos által az egyes alcsapatoktól érkező modellek és előrejelzési készletek kezelése kulcsfontosságúnak bizonyult. Chabbert és Martin Piotte „pragmatikus” megközelítésüknek tulajdonítja az eredeti modellek és kombinációk széles skáláját.
Volinsky szerint az AT&T IP szervezet a versenytárs találmányainak szellemi tulajdonát birtokolja, de fontolóra venné, hogy keressen lehetőségeket ezek külső licencelésére. Mindhárom csapattárs azt mondta, hogy fontolóra veszi a nevezést A Netflix második versenye, amely a demográfiai és használati adatok alapján egyéni felhasználók ízlésprofiljainak létrehozására fog összpontosítani.
Lauren Fritsky szabadúszó író és professzionális blogger, Philadelphián kívül. Munkái számos újságban és magazinban, valamint olyan oldalakon jelentek meg, mint az AOL és a CNN.
Szerkesztői ajánlások
- Legjobb Netflix-ajánlatok: Nézze meg a legújabb Netflix eredetiket ingyen
- Mennyibe kerül a Netflix? A streamer terveinek bontása
- Hogyan nézhetsz Netflixet 4K-ban bármilyen eszközön
- A TCL 2023-as hangsávjai megfizethetőek, de nem rendelkeznek egy kulcsfontosságú funkcióval
- Fizess, fizetnék, fizessünk! A Netflix megkezdi a fiókmegosztás elleni fellépést az Egyesült Államokban.
Frissítse életmódjátA Digital Trends segítségével az olvasók nyomon követhetik a technológia rohanó világát a legfrissebb hírekkel, szórakoztató termékismertetőkkel, éleslátó szerkesztőségekkel és egyedülálló betekintésekkel.