Кључ за Цроудсоурцинг за победнике Нетфлик такмичења

Прагматични хаос БеллКор-а

Ако одуговлачите након три сата рада, замислите колико је тешко враћати се пројекту током три године.

То је управо оно што је седам инжењера, истраживача и научника из целог света урадило у покушају да побољша Нетфлик-ов алгоритам за препоруке филмова за 10 или више процената. А њихова марљивост се недавно исплатила када је компанија за изнајмљивање филмова доделила милион долара тиму БеллКор Прагматиц Цхаос.

Препоручени видео снимци

Тим је поднео своју коначну формулу око 20 минута пре него што се такмичење завршило крајем јула, победивши блиског конкурента Тхе Енсембле. Више од 50.000 људи се такмичило за награду током трогодишњег такмичења.

Повезан

  • Нова картица Мој Нетфлик изгледа да чини стриминг у покрету мало лакшим
  • Нетфлик убија основни план у САД и Великој Британији јер огласи доносе више прихода
  • Нетфлик тест брзине: како проверити да ли можете да стримујете 4К Ултра ХД

Метод до лудила

БеллКор'с Прагматиц Цхаос је комбинација три тима (БеллКор, ПрагматицТхеори и Биг Цхаос) који су удружили снаге како би завршили своје учешће на такмичењу. Чланови су: Боб Белл и Цхрис Волински, из одељења за истраживање статистике у АТ&Т ресеарцх; Андреас Тосцхер и Мицхаел Јахрер, ​​истраживачи машинског учења и оснивачи

цоммендо истраживање и консалтинг у Аустрији; инжењер електротехнике Мартин Пиотте и софтверски инжењер Мартин Цхабберт из Монтреала, оснивачи Прагматиц Тхеори; и Иехуда Корен, виши научни научник у Иахоо! Истражите Израел. Први пут су се срели у понедељак, 9. 21, када је Нетфликс прогласио победнике.

БеллКор-ов Прагматични хаос постао је први тим који је у јуну премашио 10 процената, што је изазвало период од 30 дана током којег су други такмичари могли да покушају да надмаше свој резултат. Ривалски тим, Тхе Енсембле, поднео је своје решење крајем јула само неколико минута пре истека рока. БеллКор-ов победнички унос побољшао је постојећи Нетфлик-ов систем за 10,06 процената.

Покушај да се произведе 10-постотно смањење средње квадратне грешке (РМСЕ) тестних података у поређењу са Цинематцх, технологија коју Нетфлик тренутно користи да препоручи филмове члановима, ослања се на сарадњу филтрирање. Методологија посматра прошло понашање корисника који деле исте обрасце оцењивања да би се формулисало предвиђање за друге кориснике. Користећи скуп података од милион филмова, БеллКор-ов Прагматични хаос је радио алгоритме и ослањао се на „различите модела који међусобно допуњују недостатке“, наводи се у једном од радова које је тим објавио БеллКор.

Они су укључивали моделе најближих суседа (који идентификују парове ставки које корисник обично оцењује на сличан начин као предвиђају оцене за неоцењени артикал) и латентне факторе (који испитују скривене карактеристике које објашњавају уочено оцене). Тим је такође завирио иза рејтинга како би открио додатне податке, попут филмова које је особа оценила.

Тим је успео да утврди да:

  • гледаоци користе различите критеријуме да оцењују филмове које су гледали давно у поређењу са онима које су недавно гледали; и
  • изгледа да неки филмови временом расту код гледалаца и гледаоци различито оцењују филмове у различитим данима у недељи.

Користећи те информације, тим је направио тродимензионални модел који се фокусирао на то како време утиче на однос између људи и филмова.

Добитна комбинација

Иако је методологија која стоји иза решења важна, можда је интересантнија била индикација такмичења да цровдсоурцинг може дати боље резултате од тражења у кући.

Крис Волински из тима БеллКор каже да је Нетфлик направио паметан потез „схвативши да постоји истраживачка заједница која ради на оваквим моделима и гладује за подацима.

„Нетфлик је имао податке, али само неколико људи ради на проблему“, каже он. „Награда је повезала ово двоје на начин који је био осетљив на њихове власничке податке... Овај модел не функционише за сваки домен — овде је функционисало јер су подаци били занимљиви и били су убедљиви тема. Свако се може повезати са филмовима. Слично такмичење за, рецимо, аутоматско превођење језика, можда неће изазвати толико страсти."

Андреас Тошер, првобитно из тима Биг Цхаос, сложио се да се спрема још такмичења попут Нетфлик-а. Говорио је о удаљеној природи посебног искуства свог тима у скупу – пре понедељка, није чак ни разговарао са својим саиграчима, а камоли да их је погледао. „Било је сјајно упознати остатак тима, након што смо радили заједно више од пола године. Никада нисмо имали телефонски позив. Од Мартина и Мартина, нисмо видели слике до пре недељу дана.

Мартин Шаберт, који је првобитно био део тима ПрагматицТхеори, каже да је било тешко фокусирати се на такмичење док жонглирајући са послом и породичним обавезама, било је теже избећи пријављивање на рачунар да би се тестирала нова идеја за пројекат. Док је његова инжењерска позадина помогла напорима тима, једнако је помогло и то да се не заглави теоријски аспекти рада.

„Мислим да је један од важних квалитета за успех у овој области способност да се интуиција о људском понашању преведе у стварни математички и алгоритамски модел“, каже Шаберт. „Многи људи имају идеје о томе шта би требало да буде снимљено, али кључ је у проналажењу одговарајућег начина да се то ухвати. Верујем да смо у томе урадили добар посао. Такође, не долазећи из академске позадине, били смо веома фокусирани на задатак који је пред нама, а не покушавајући да пронађе ствари које су имале теоријско утемељење или које би нужно унапредиле опште Наука."

Отац четворо деце каже да је сваки од чланова његовог тима сигурно донео нешто што је допринело победничком резултату. Алгоритми и документи члана тима БеллКор Иехуде Корен били су најважнији, док се БигЦхаосово управљање свим моделима и скуповима предвиђања који долазе из сваког подтима показало кључним. Цхабберт и Мартин Пиотте приписују свој „прагматични“ приступ за стварање широког спектра оригиналних модела и комбинација.

Волински каже да АТ&Т ИП организација поседује интелектуалну својину проналазака из конкуренције, али да би размотрила могућност тражења могућности да их лиценцира екстерно. Сва тројица саиграча кажу да ће размислити о уласку Нетфлик-ово друго такмичење, који ће се фокусирати на креирање профила укуса за појединачне кориснике на основу демографских података и података о коришћењу.

Лаурен Фритски је слободни писац и професионални блогер са седиштем ван Филаделфије. Њен рад се појавио у неколико новина и часописа и на сајтовима као што су АОЛ и ЦНН.

Препоруке уредника

  • Најбоље Нетфлик понуде: Бесплатно гледајте најновије Нетфлик оригинале
  • Колико кошта Нетфлик? Слом планова стримера
  • Како гледати Нетфлик у 4К на било ком уређају
  • ТЦЛ-ове звучне траке 2023 су приступачне, али им недостаје кључна карактеристика
  • Платити! Нетфлик почиње сузбијање дељења налога у САД

Надоградите свој животни стилДигитални трендови помажу читаоцима да прате брзи свет технологије са свим најновијим вестима, забавним рецензијама производа, проницљивим уводницима и јединственим кратким прегледима.

Категорије

Скорашњи