नेटफ्लिक्स प्रतियोगिता विजेताओं के लिए क्राउडसोर्सिंग कुंजी

बेलकोर की व्यावहारिक अराजकता

यदि आप तीन घंटे के काम के बाद विलंब करते हैं, तो कल्पना करें कि तीन वर्षों के दौरान किसी प्रोजेक्ट पर वापस आना कितना कठिन है।

नेटफ्लिक्स की मूवी अनुशंसा एल्गोरिदम को 10 प्रतिशत या उससे अधिक बेहतर बनाने के प्रयास में दुनिया भर के सात इंजीनियरों, शोधकर्ताओं और वैज्ञानिकों ने ठीक यही किया। और उनकी मेहनत हाल ही में रंग लाई जब मूवी रेंटल कंपनी ने टीम बेलकोर की प्रैग्मैटिक कैओस को $1 मिलियन का पुरस्कार दिया।

अनुशंसित वीडियो

जुलाई के अंत में प्रतियोगिता समाप्त होने से लगभग 20 मिनट पहले टीम ने करीबी प्रतिद्वंद्वी द एन्सेम्बल को हराकर अपना अंतिम फॉर्मूला प्रस्तुत किया। तीन साल की प्रतियोगिता के दौरान 50,000 से अधिक लोगों ने पुरस्कार के लिए प्रतिस्पर्धा की।

संबंधित

  • नया माई नेटफ्लिक्स टैब चलते-फिरते स्ट्रीमिंग को थोड़ा आसान बनाता है
  • नेटफ्लिक्स ने यू.एस., यू.के. में बेसिक प्लान ख़त्म कर दिया क्योंकि विज्ञापन अधिक राजस्व लाते हैं
  • नेटफ्लिक्स स्पीड टेस्ट: कैसे जांचें कि आप 4K अल्ट्रा एचडी स्ट्रीम कर सकते हैं या नहीं

पागलपन की विधि

बेलकोर का प्रैग्मैटिक कैओस तीन टीमों (बेलकोर, प्रैग्मैटिक थ्योरी और बिग कैओस) का एक संयोजन है जो प्रतियोगिता में अपनी अधीनता समाप्त करने के लिए एकजुट हुए। सदस्य हैं: एटी एंड टी अनुसंधान में सांख्यिकी अनुसंधान विभाग के बॉब बेल और क्रिस वोलिंस्की; एंड्रियास टॉशर और माइकल जाहरर, मशीन लर्निंग शोधकर्ता और संस्थापक

सराहनीय अनुसंधान और परामर्श ऑस्ट्रिया में; मॉन्ट्रियल के इलेक्ट्रिकल इंजीनियर मार्टिन पियोटे और सॉफ्टवेयर इंजीनियर मार्टिन चैबर्ट, के संस्थापक व्यावहारिक सिद्धांत; और येहुदा कोरेन, वरिष्ठ शोध वैज्ञानिक याहू! इज़राइल पर शोध करें. वे पहली बार सोमवार, सितम्बर को मिले। 21, जब नेटफ्लिक्स ने विजेताओं की घोषणा की।

बेलकोर की प्रैग्मैटिक कैओस जून में 10 प्रतिशत को पार करने वाली पहली टीम बन गई, जिसने 30 दिनों की अवधि शुरू की, जिसके दौरान अन्य प्रतियोगी अपने स्कोर को पार करने की कोशिश कर सकते थे। प्रतिद्वंद्वी टीम, द एन्सेम्बल ने समय सीमा से कुछ मिनट पहले जुलाई के अंत में अपना समाधान प्रस्तुत किया। बेलकोर की विजयी प्रविष्टि ने नेटफ्लिक्स की मौजूदा प्रणाली में 10.06 प्रतिशत का सुधार किया।

की तुलना में परीक्षण डेटा के मूल माध्य वर्ग त्रुटि (आरएमएसई) में 10 प्रतिशत की कमी लाने का प्रयास सिनेमैच, वह तकनीक जिसे नेटफ्लिक्स वर्तमान में सदस्यों को फिल्मों की अनुशंसा करने के लिए उपयोग करता है, सहयोगात्मकता पर आधारित है छानना. यह कार्यप्रणाली अन्य उपयोगकर्ताओं के लिए पूर्वानुमान तैयार करने के लिए समान रेटिंग पैटर्न साझा करने वाले उपयोगकर्ताओं के पिछले व्यवहार को देखती है। दस लाख फिल्मों के डेटासेट का उपयोग करते हुए, बेलकोर के प्रैग्मैटिक कैओस ने एल्गोरिदम पर काम किया और "विविधता" पर काम किया। टीम द्वारा प्रकाशित पत्रों में से एक के अनुसार, ऐसे मॉडल जो एक-दूसरे की कमियों को पूरा करते हैं बेलकोर.

उनमें निकटतम पड़ोसी मॉडल शामिल थे (जो उन वस्तुओं के जोड़े की पहचान करते हैं जिन्हें उपयोगकर्ता द्वारा समान रूप से रेट किया जाता है किसी अनरेटेड आइटम के लिए रेटिंग की भविष्यवाणी करें) और अव्यक्त कारक (जो छिपी हुई विशेषताओं की जांच करते हैं जो देखे गए की व्याख्या करते हैं रेटिंग्स)। टीम ने अतिरिक्त डेटा को उजागर करने के लिए रेटिंग के पीछे भी नज़र डाली, जैसे कि किसी व्यक्ति ने कौन सी फिल्में रेट कीं।

टीम यह निर्धारित करने में सक्षम थी:

  • दर्शक हाल ही में देखी गई फिल्मों की तुलना में बहुत समय पहले देखी गई फिल्मों को रेट करने के लिए विभिन्न मानदंडों का उपयोग करते हैं; और
  • कुछ फिल्में समय के साथ दर्शकों के बीच बढ़ती जाती हैं और दर्शक सप्ताह के अलग-अलग दिनों में फिल्मों को अलग-अलग रेटिंग देते हैं।

उस जानकारी का उपयोग करके, टीम ने एक त्रि-आयामी मॉडल बनाया जो इस बात पर केंद्रित था कि समय लोगों और फिल्मों के बीच संबंधों को कैसे प्रभावित करता है।

एक विजयी संयोजन

जबकि समाधान के पीछे की कार्यप्रणाली महत्वपूर्ण है, शायद अधिक दिलचस्प प्रतियोगिता का संकेत था कि क्राउडसोर्सिंग इन-हाउस की तुलना में बेहतर परिणाम दे सकती है।

टीम बेलकोर के क्रिस वोलिंस्की का कहना है कि नेटफ्लिक्स ने "यह महसूस करके एक स्मार्ट कदम उठाया कि वहां एक शोध समुदाय था जो इस प्रकार के मॉडल पर काम करता था और डेटा के लिए भूखा था।

उनका कहना है, ''नेटफ्लिक्स के पास डेटा था, लेकिन केवल कुछ मुट्ठी भर लोग ही इस समस्या पर काम कर रहे हैं।'' “पुरस्कार ने इन दोनों को इस तरह से जोड़ा जो उनके मालिकाना डेटा के प्रति संवेदनशील था… यह मॉडल हर डोमेन के लिए काम नहीं करता - इसने यहां काम किया क्योंकि डेटा दिलचस्प था, और यह सम्मोहक था विषय। हर कोई फिल्मों से जुड़ाव महसूस कर सकता है। मान लीजिए, स्वचालित भाषा अनुवाद के लिए एक समान प्रतियोगिता, उतना जुनून पैदा नहीं कर सकती है।

मूल रूप से बिग कैओस टीम के एंड्रियास टॉशर इस बात से सहमत थे कि नेटफ्लिक्स जैसी और भी प्रतियोगिताएं आने वाली हैं। उन्होंने अपनी टीम के विशेष क्राउडसोर्सिंग अनुभव की दूरस्थ प्रकृति के बारे में बात की - सोमवार से पहले, उन्होंने अपने साथियों से बात तक नहीं की थी, उन पर नज़र रखना तो दूर की बात थी। “आधे साल से अधिक समय तक एक साथ काम करने के बाद टीम के बाकी सदस्यों से मिलना बहुत अच्छा रहा। हमने कभी टेलीफोन कॉल नहीं की। मार्टिन और मार्टिन से, हमने एक सप्ताह पहले तक तस्वीरें नहीं देखी थीं।"

मार्टिन चैबर्ट, जो मूल रूप से प्रैग्मैटिकथ्योरी टीम का हिस्सा थे, कहते हैं कि जबकि प्रतियोगिता पर ध्यान केंद्रित करना कठिन था काम और पारिवारिक ज़िम्मेदारियों को संभालते हुए, किसी नए विचार का परीक्षण करने के लिए कंप्यूटर पर लॉगिंग करने से बचना कठिन था परियोजना। जहां उनकी इंजीनियरिंग पृष्ठभूमि ने टीम के प्रयासों में मदद की, वहीं काम के सैद्धांतिक पहलुओं से न उलझने से भी उतनी ही मदद मिली।

"मुझे लगता है कि इस क्षेत्र में सफल होने के लिए महत्वपूर्ण गुणों में से एक मानव व्यवहार के बारे में अंतर्ज्ञान को वास्तविक गणितीय और एल्गोरिथम मॉडल में अनुवाद करने की क्षमता है," चैबर्ट कहते हैं। “बहुत से लोगों के पास विचार हैं कि क्या कैप्चर किया जाना चाहिए, लेकिन कुंजी इसे कैप्चर करने का उचित तरीका ढूंढना है। मेरा मानना ​​है कि हमने इसमें अच्छा काम किया। साथ ही, अकादमिक पृष्ठभूमि से नहीं होने के कारण, हम काम के बजाय काम पर अधिक ध्यान केंद्रित कर रहे थे उन चीजों को खोजने की कोशिश करना जिनका सैद्धांतिक आधार हो या जो आवश्यक रूप से सामान्य को आगे बढ़ाएँ विज्ञान।"

चार बच्चों के पिता का कहना है कि उनकी टीम का प्रत्येक सदस्य निश्चित रूप से कुछ न कुछ लेकर आया जिसने विजयी स्कोर में योगदान दिया। टीम बेलकोर के सदस्य येहुदा कोरेन के एल्गोरिदम और कागजात सर्वोपरि थे, जबकि प्रत्येक उप-टीम से आने वाले सभी मॉडलों और भविष्यवाणी सेटों का बिगकैओस प्रबंधन महत्वपूर्ण साबित हुआ। चैबर्ट और मार्टिन पियोटे ने मूल मॉडलों और संयोजनों की एक विस्तृत श्रृंखला तैयार करने के लिए अपने "व्यावहारिक" दृष्टिकोण को श्रेय दिया।

वोलिंस्की का कहना है कि एटी एंड टी आईपी संगठन प्रतिस्पर्धा से प्राप्त आविष्कारों की बौद्धिक संपदा का मालिक है, लेकिन उन्हें बाहरी रूप से लाइसेंस देने के अवसरों की तलाश पर विचार करेगा। टीम के तीनों साथियों का कहना है कि वे प्रवेश पर विचार करेंगे नेटफ्लिक्स की दूसरी प्रतियोगिता, जो जनसांख्यिकीय और उपयोग डेटा के आधार पर व्यक्तिगत उपयोगकर्ताओं के लिए स्वाद प्रोफ़ाइल बनाने पर ध्यान केंद्रित करेगा।

लॉरेन फ्रिट्स्की फिलाडेल्फिया के बाहर स्थित एक स्वतंत्र लेखक और पेशेवर ब्लॉगर हैं। उनका काम कई समाचार पत्रों और पत्रिकाओं और एओएल और सीएनएन जैसी साइटों पर छपा है।

संपादकों की सिफ़ारिशें

  • सर्वश्रेष्ठ नेटफ्लिक्स डील: नवीनतम नेटफ्लिक्स मूल निःशुल्क देखें
  • नेटफ्लिक्स की लागत कितनी है? स्ट्रीमर की योजनाओं का विवरण
  • किसी भी डिवाइस पर 4K में नेटफ्लिक्स कैसे देखें
  • टीसीएल के 2023 साउंडबार किफायती हैं, लेकिन उनमें एक प्रमुख विशेषता का अभाव है
  • भुगतान करें! नेटफ्लिक्स ने यू.एस. में खाता साझाकरण पर कार्रवाई शुरू की

अपनी जीवनशैली को उन्नत करेंडिजिटल ट्रेंड्स पाठकों को सभी नवीनतम समाचारों, मजेदार उत्पाद समीक्षाओं, व्यावहारिक संपादकीय और एक तरह की अनूठी झलक के साथ तकनीक की तेज़ गति वाली दुनिया पर नज़र रखने में मदद करता है।

श्रेणियाँ

हाल का

सोनी का स्मार्ट लाइफलॉग कैमरा जल्द ही आ रहा है

सोनी का स्मार्ट लाइफलॉग कैमरा जल्द ही आ रहा है

सोनी इस साल के IFA टेक शो में वियरेबल्स को लेकर...

एमटीवी, वेरिज़ोन और यूनिवर्सल के साथ वास्तविक समझौते

एमटीवी, वेरिज़ोन और यूनिवर्सल के साथ वास्तविक समझौते

ऐसा लगता है कि आज वह दिन है जब हर कोई यूनिवर्स...

स्माइली 25 साल की हो गई

स्माइली 25 साल की हो गई

हालाँकि निश्चित रूप से जानने का कोई वास्तविक त...