एक्सेल में मल्टीपल रिग्रेशन का उपयोग कैसे करें
छवि क्रेडिट: फिजकेस/आईस्टॉक/गेटी इमेजेज
एक्सेल डेटा विश्लेषण के लिए एक शक्तिशाली उपकरण है, चाहे आप के बीच एक साधारण संबंध के साथ काम कर रहे हों एक स्वतंत्र चर और एक आश्रित चर या कई स्वतंत्र चर हैं विचार करना। एक्सेल में एक बहुभिन्नरूपी विश्लेषण करने के तरीके के बारे में सीखना - एक बहु प्रतिगमन के रूप में - और यदि आपके पास काम करने के लिए जटिल डेटा है तो परिणामों की व्याख्या करना आवश्यक है। अच्छी खबर यह है कि एक्सेल इन कार्यों को संभालने के लिए अच्छी तरह से स्थापित है, और आपको केवल यह जानने की जरूरत है कि एक फ़ंक्शन आपके डेटा को समझने के लिए कैसे काम करता है।
एकाधिक प्रतिगमन क्या है?
मल्टीपल रिग्रेशन एक समीकरण को ढूंढकर एक से अधिक स्वतंत्र चर को एक आश्रित चर से जोड़ने का एक तरीका है जो बताता है कि प्रत्येक के साथ प्रश्न में चर कैसे बदलता है। एक अधिक बुनियादी लेकिन समान उपकरण रैखिक प्रतिगमन है, जिसका उद्देश्य एक स्वतंत्र के बीच की कड़ी की जांच करना है चर, जैसे मोटापा, कैंसर के जोखिम जैसे निर्भर चर पर, लेकिन चीजें शायद ही कभी होती हैं सीधा। उदाहरण के साथ जारी रखते हुए, प्रति दिन धूम्रपान करने वाली सिगरेट की संख्या भी कैंसर के खतरे से संबंधित है, साथ ही आप कितनी शराब पीते हैं। किसी व्यक्ति के लिए कैंसर के जोखिम की विश्वसनीय भविष्यवाणी के साथ आने के लिए, आपको इन सभी कारकों (और अधिक) को ध्यान में रखना होगा।
दिन का वीडियो
बहु प्रतिगमन के लिए प्रयुक्त समीकरण का सामान्य रूप है:
यू^ = ए + बी1एक्स1 + बी2एक्स2 + बी3एक्स3 …
ऐसा यू^ प्रेक्षण के लिए अपेक्षित मान है, the बी1 और इसी तरह के बीच सीधी रेखा संबंध के ढलान का प्रतिनिधित्व करते हैं एक्स1 तथा यू^, और एक्स1 और इसी तरह विश्लेषण में शामिल चर हैं। NS ए आपको बिंदु बताता है आप-अवरोध। एक बहु प्रतिगमन में गुणांकों के मूल्यों को चुनना शामिल है (बी1 और इसी तरह) जो अपेक्षित मूल्य के बीच अंतर को कम करता है यू^ और मनाया मूल्य यू, आपको मॉडल और डेटा के बीच सर्वश्रेष्ठ फिट प्रदान करता है।
एकाधिक प्रतिगमन आपको क्या बताता है?
एकाधिक प्रतिगमन कई चर और एक परिणाम के बीच संबंध पर संख्यात्मक मान डालते हैं, इसलिए आप इसका उपयोग भविष्यवाणियों के लिए, अनुमान लगाने के लिए कर सकते हैं परिणाम के लिए विभिन्न चर के सापेक्ष योगदान, या कुछ अन्य उद्देश्यों के लिए जैसे गणितीय में उपयोग करने के लिए सबसे अधिक प्रासंगिक चर का चयन करना आदर्श।
उदाहरण के लिए, मान लें कि आपके पास एक निश्चित शहर (आपका आश्रित चर) में घरों की कीमतों पर डेटा है, साथ ही इस तरह की जानकारी भी है क्या इसमें एक पूल है, कितने वर्ग फुट में है, इसमें कितने शयनकक्ष हैं, कितने स्नानघर हैं, और कितने गैरेज हैं है। एक बहु प्रतिगमन आपको यह देखने में सक्षम करेगा कि इनमें से प्रत्येक कारक घर की कीमत से कैसे संबंधित है, इसलिए – बाद आपने देखा कि वे कीमत से कैसे संबंधित हैं - आप इन बिंदुओं के आधार पर घर की कीमत का अनुमान लगाने के लिए अपने समीकरण का उपयोग कर सकते हैं अकेला।
आप एक्सेल में इस प्रकार के प्रतिगमन विश्लेषण का उपयोग यह देखने के लिए भी कर सकते हैं कि कैसे कई का एक विशिष्ट कारक - जैसे क्या घर में एक पूल है - अन्य सभी चर रहने पर आश्रित चर (घर की कीमतों) को प्रभावित करता है लगातार। यदि आप गुणांक (जिन्हें "आंशिक प्रतिगमन गुणांक" कहा जाता है) को मानक आंशिक प्रतिगमन गुणांक में परिवर्तित करते हैं, जो दर्शाता है कि कितने मानक विचलन हैं यू यदि आप संगत चर को एक मानक विचलन से बदलते हैं, तो समीकरण आपको यह भी बताता है कि परिणाम निर्धारित करने में कौन से कारक अधिक महत्वपूर्ण हैं।
एक्सेल में मल्टीपल रिग्रेशन कैसे करें
आप एक्सेल में एक बिल्ट-इन फ़ंक्शन का उपयोग करके एक बहुभिन्नरूपी प्रतिगमन कर सकते हैं जो के माध्यम से सुलभ है डेटा विश्लेषण के तहत उपकरण आंकड़े टैब और विश्लेषण समूह। क्लिक डेटा विश्लेषण और के लिए विकल्प खोजें वापसी खुलने वाली विंडो में, उसे हाइलाइट करें और क्लिक करें ठीक है. पर क्लिक करें सेल चुनें के बगल में आइकन इनपुट वाई रेंज फ़ील्ड और फिर अपने आश्रित चर के परिणामों वाले कॉलम का चयन करें। फिर, के लिए भी ऐसा ही करें इनपुट एक्स रेंज फ़ील्ड लेकिन अपने स्वतंत्र चर के लिए एकाधिक कॉलम चुनें। इन स्तंभों को एक दूसरे के बगल में होना चाहिए, इसलिए यदि वे नहीं हैं, तो आपको प्रतिगमन उत्पन्न करने से पहले उन्हें स्थानांतरित करना होगा।
रिग्रेशन विंडो में कई अतिरिक्त विकल्प हैं जिन्हें आप अपनी आवश्यकताओं के अनुरूप प्रक्रिया को तैयार करने के लिए चुन सकते हैं। उदाहरण के लिए, यदि आप चाहें तो 95 प्रतिशत के अलावा एक आत्मविश्वास स्तर सेट कर सकते हैं, अवशिष्ट प्रदर्शित करना चुन सकते हैं और निर्दिष्ट कर सकते हैं कि आपकी कार्यपुस्तिका में आउटपुट कहाँ रखा गया है। यह अंतिम विकल्प स्वतः ही. पर सेट हो जाता है नई वर्कशीट प्लाई, इसलिए परिणाम एक नई शीट पर दिखाई देते हैं, लेकिन आप अपनी आवश्यकताओं के अनुरूप इसे या किसी अन्य विकल्प को बदल सकते हैं। इसके अतिरिक्त, जाँच करें लेबल box यदि आपके स्वतंत्र चर के कॉलम में शीर्ष पर लेबल हैं, तो ये आउटपुट में प्रदर्शित होते हैं।
क्लिक ठीक है एक्सेल में अपना रिग्रेशन विश्लेषण उत्पन्न करने और नई शीट पर ले जाने के लिए।
एक्सेल से रिग्रेशन आउटपुट
एक्सेल में एक से अधिक प्रतिगमन करने के बाद आपके द्वारा प्रस्तुत किए गए आउटपुट के तीन मुख्य खंड हैं: प्रतिगमन आँकड़े, एनोवा और अनुमानित प्रतिगमन रेखा पर विवरण। प्रतिगमन आँकड़ों में बहु सहसंबंध गुणांक ("एकाधिक R") शामिल होता है जो -1 से +1 तक सहसंबंध की दिशा और शक्ति को दर्शाता है। निर्धारण का गुणांक, "आर स्क्वायर", आपको बताता है कि निर्भर चर में भिन्नता का कितना प्रतिशत (दशमलव के रूप में) स्वतंत्र चर द्वारा समझाया गया है। "समायोजित आर स्क्वायर" आपको व्याख्यात्मक शक्ति का संकेत देता है, लेकिन इसकी व्याख्या करना सीधा नहीं है, और "मानक त्रुटि" आपको देखे गए परिणामों और आपके प्रतिगमन के बीच भिन्नता का एक माप देता है रेखा।
एनोवा अनुभाग में प्रतिगमन रेखा द्वारा बताई गई भिन्नता की मात्रा के बारे में सांख्यिकीय जानकारी है, "एसएस रिग्रेशन" के साथ आपको लाइन द्वारा बताई गई राशि, और "एसएस अवशिष्ट" राशि का प्रतिनिधित्व करने वाला नहीं व्याख्या की। "एमएस" खंड "मीन स्क्वायर" के लिए खड़ा है, और "एफ स्टेटिस्टिक" एक महत्वपूर्ण परिणाम के परीक्षण के लिए उपयोग किया जाने वाला परीक्षण आंकड़ा है, जिसमें "महत्वपूर्ण एफ" अनुभाग आपको पी-वैल्यू देता है।
अंत में, अंतिम खंड आपको अनुमानित प्रतिगमन रेखा की विशेषताओं के बारे में बताता है, विशेष रूप से, के मूल्यों के बारे में गुणांक, चाहे वे निर्भर चर से महत्वपूर्ण रूप से जुड़े हों, और उनमें कितनी भिन्नता हो सकती है। सकारात्मक गुणांक प्रश्न में चर और आश्रित चर के बीच एक सकारात्मक संबंध दिखाते हैं, इसलिए जब एक बढ़ता है, तो दूसरा भी करता है। ऋणात्मक मानों का अर्थ है कि जैसे-जैसे स्वतंत्र चर बढ़ता है, आश्रित चर घटता जाता है। इसलिए, यदि घर की कीमतों पर "स्क्वायर फ़ुटेज" गुणांक 300 है, तो इसका मतलब है कि एक अतिरिक्त वर्ग फुट जगह घर की लागत को औसतन $300 बढ़ा देती है।
एकाधिक प्रतिगमन की मान्यताएं और सीमाएं
यह याद रखना महत्वपूर्ण है कि एकाधिक प्रतिगमन केवल एक उपकरण है, और अधिकांश उपकरणों की तरह, आप इसे केवल कुछ परिस्थितियों में ही उपयोग कर सकते हैं, और कुछ चीजें हैं जो यह नहीं कर सकती हैं।
सबसे महत्वपूर्ण सीमाओं में से एक यह है कि परिणामों के आधार पर कार्य-कारण का निष्कर्ष कठिन है। एक उदाहरण के रूप में, यदि आपके पास आग से हुई क्षति के साथ कई प्रतिगमन हैं और कई संभावित हैं प्रासंगिक कारक, आपको संभावित रूप से मौजूद अग्निशामकों की संख्या और के बीच एक महत्वपूर्ण कड़ी मिल जाएगी किया गया नुकसान। इसका मतलब यह नहीं है कि अग्निशामक वजह नुकसान क्योंकि एक अन्य कारक जैसे कि मॉडल में शामिल नहीं आग का आकार इन दोनों टिप्पणियों की व्याख्या कर सकता है।
इस प्रकार के एक्सेल में एक बहुभिन्नरूपी विश्लेषण की दो महत्वपूर्ण धारणाएँ रैखिकता और सामान्यता की धारणाएँ हैं। आप आश्रित और स्वतंत्र चर के बीच एक रैखिक संबंध मान रहे हैं, इसलिए आपको यह जांचना चाहिए कि विश्लेषण करने से पहले यह मान्य होने की संभावना है। आप जाँच करने के लिए प्रत्येक चर के बीच संबंध को व्यक्तिगत रूप से देख सकते हैं, लेकिन यह एक आदर्श रणनीति नहीं है। इसी तरह, परीक्षण मानता है कि चर सामान्य रूप से वितरित किए जाते हैं, इसलिए आपको परीक्षण करने से पहले सामान्यता के लिए प्रत्येक के परिणामों की जांच करनी चाहिए।