クラウドソーシングがNetflixコンテスト受賞者の鍵

BellKor のプラグマティック カオス

3 時間作業した後で先延ばしにする場合、3 年間にわたってプロジェクトに戻り続けることがどれほど難しいかを想像してみてください。

それはまさに、Netflix の映画推奨アルゴリズムを 10% 以上改善するために、世界中から集まった 7 人のエンジニア、研究者、科学者が行ったことです。 そして最近、映画レンタル会社が BellKor チームの Pragmatic Chaos に 100 万ドルを授与したことで、彼らの勤勉さが報われました。

おすすめ動画

チームは7月下旬にコンテストが終了する約20分前に最終的なフォーミュラを提出し、僅差のライバルであるThe Ensembleを破った。 3 年間のコンテスト中に 50,000 人以上の人々が賞を争った。

関連している

  • 新しい My Netflix タブにより、外出先でのストリーミングが少し簡単になりそうです
  • 広告収入が増えるため、Netflixは米国と英国でベーシックプランを廃止
  • Netflix スピードテスト: 4K Ultra HD をストリーミングできるかどうかを確認する方法

狂気へのメソッド

BellKor の Pragmatic Chaos は、コンテストへの提出を完了するために力を合わせた 3 つのチーム (BellKor、Pragmatic Theory、Big Chaos) の組み合わせです。 メンバーは次のとおりです。AT&T リサーチの統計調査部門のボブ ベルとクリス ボリンスキー。 Andreas Töscher 氏と Michael Jahrer 氏、機械学習研究者であり、 研究とコンサルティングを表彰する オーストリアで。 電気エンジニアのマーティン・ピオット氏とソフトウェアエンジニアのマーティン・チャバート氏(モントリオール在住)、 プラグマティック理論; とイェフダ・コーレン上級研究員 ヤフー! イスラエルを研究する. 彼らは9月の月曜日に初めて会った。 Netflixが受賞者を発表したのは21日だった。

BellKor の Pragmatic Chaos は 6 月に 10 パーセントを超えた最初のチームとなり、他の出場者が自分のスコアを上回ることができる 30 日間の期間が設けられました。 ライバルチームの The Ensemble は、7 月下旬、締め切りの数分前にソリューションを提出しました。 BellKor の受賞作品は、Netflix の既存システムを 10.06 パーセント改善しました。

テストデータの二乗平均平方根誤差 (RMSE) を、従来と比較して 10% 削減する試み。 Cinematch は、Netflix が現在メンバーに映画を勧めるために使用しているテクノロジーであり、共同作業を活用しています。 フィルタリング。 この方法では、同じ評価パターンを共有するユーザーの過去の行動を調べて、他のユーザーの予測を立てます。 BellKor の Pragmatic Chaos は、100 万本の映画のデータセットを使用してアルゴリズムを実行し、「さまざまな」 チームが発表した論文の1つによると、「互いの欠点を補うモデルの組み合わせ」 ベルコール.

これらには、最近傍モデル (ユーザーによって同様に評価される傾向がある項目のペアを特定する) が含まれていました。 未評価項目の評価を予測します)と潜在的要因(観察された項目を説明する隠れた特徴を調査します) 評価)。 チームはまた、評価の裏を覗いて、人がどの映画を評価したかなどの追加データを明らかにしました。

チームは次のことを確認できました。

  • 視聴者は、昔見た映画と最近見た映画を評価する際に異なる基準を使用します。 そして
  • 一部の映画は時間の経過とともに視聴者の興味を引くようであり、視聴者の映画の評価は曜日によって異なります。

その情報を使用して、チームは時間が人々と映画の関係にどのような影響を与えるかに焦点を当てた 3 次元モデルを作成しました。

勝利の組み合わせ

ソリューションの背後にある方法論は重要ですが、おそらくより興味深いのは、社内で検討するよりもクラウドソーシングがより良い結果を生み出す可能性があるというコンテストの指摘でした。

チーム BellKor の Chris Volinsky 氏は、Netflix は「この種のモデルに取り組み、データに飢えている研究コミュニティが存在することに気づいて、賢明な行動をとった」と述べています。

「Netflix はデータを持っていましたが、この問題に取り組んでいる人はほんの一握りです」と彼は言います。 「この賞は、彼らの独自データに配慮した方法でこの 2 人を結びつけました…このモデルは すべてのドメインで機能するわけではありません。データが興味深いものであり、説得力があったため、ここでは機能しました。 トピック。 誰もが映画に共感できます。 たとえば自動言語翻訳に関する同様の競争は、それほどの情熱を生まないかもしれない。」

元チーム Big Chaos のアンドレアス・テッシャー氏は、Netflix のような競争がさらに増えることに同意しました。 彼は、チーム特有のクラウドソーシング体験の遠隔性について語った。月曜日までは、チームメイトに目を向けることはおろか、チームメイトと話すことすらなかった。 「半年以上一緒に仕事をしてきたので、チームの他のメンバーと会うことができてとてもうれしかったです。 私たちは電話をかけたことは一度もありませんでした。 マーティンとマーティンからは、一週間前まで写真を見ていなかったんです。」

もともと Pragmatic Theory チームの一員だった Martin Chabbert 氏は、コンテストに集中するのは大変だったが、 仕事と家族の責任を両立させると、新しいアイデアをテストするためにコンピュータにログオンすることを避けることが難しくなりました。 プロジェクト。 彼のエンジニアリングの経歴はチームの取り組みに役立ちましたが、作業の理論的側面に囚われないことも同様に役に立ちました。

「この分野で成功するための重要な資質の 1 つは、人間の行動についての直観を実際の数学的およびアルゴリズム モデルに変換する能力だと思います」とチャバート氏は言います。 「何を撮影すべきかについて多くの人がアイデアを持っていますが、重要なのはそれを撮影する適切な方法を見つけることです。 私たちはその点で良い仕事をしたと信じています。 また、私たちは学歴の出身ではなかったので、物事を考えるのではなく、目の前の仕事に非常に集中していました。 理論的な根拠があるもの、または必然的に一般的な概念を前進させるものを見つけようとしています 科学。"

4人の子供の父親である彼は、チームのメンバーそれぞれが確かに勝利のスコアに貢献する何かをもたらしたと語った。 Team BellKor メンバーの Yehuda Koren のアルゴリズムと論文が最も重要でしたが、BigChaos によるすべてのモデルと各サブチームからの予測セットの管理が鍵であることが判明しました。 Chabbert と Martin Piotte は、さまざまなオリジナル モデルや組み合わせを生み出したのは、彼らの「実用的な」アプローチだと信じています。

Volinsky氏は、AT&T IP組織が競合発明の知的財産を所有しているが、それらを外部にライセンス供与する機会を模索することを検討すると述べた。 チームメイト3人全員が出場を検討すると述べている Netflixの2回目のコンテスト、人口統計データと使用状況データに基づいて、個々のユーザーの嗜好プロファイルを作成することに焦点を当てます。

Lauren Fritsky は、フィラデルフィア郊外に拠点を置くフリーライター兼プロブロガーです。 彼女の作品は、いくつかの新聞や雑誌、AOL や CNN などのサイトに掲載されています。

編集者のおすすめ

  • Netflix のお得なセール: 最新の Netflix オリジナル作品を無料で視聴
  • Netflixの料金はいくらですか? ストリーマーの計画の内訳
  • あらゆるデバイスで 4K で Netflix を視聴する方法
  • TCLの2023年サウンドバーは手頃な価格だが、重要な機能が欠けている
  • 支払え! Netflixが米国でアカウント共有の取り締まりを開始

ライフスタイルをアップグレードするDigital Trends は、読者が最新ニュース、楽しい製品レビュー、洞察力に富んだ社説、ユニークなスニーク ピークをすべて提供して、ペースの速いテクノロジーの世界を監視するのに役立ちます。