आउटलेयर चरम मूल्य हैं जो सांख्यिकीय विश्लेषण के परिणामों को तिरछा कर सकते हैं और गलत निष्कर्ष बना सकते हैं।
सांख्यिकीय विश्लेषण में आउटलेयर चरम मूल्य हैं जो अधिकांश डेटा सेट के साथ फिट नहीं लगते हैं। यदि हटाया नहीं जाता है, तो इन चरम मूल्यों का किसी भी निष्कर्ष पर एक बड़ा प्रभाव हो सकता है जो कि से निकाला जा सकता है प्रश्न में डेटा, क्योंकि वे सहसंबंध गुणांक और गलत में सर्वोत्तम फिट की रेखाओं को तिरछा कर सकते हैं दिशा। एसपीएसएस कई सांख्यिकीय विश्लेषण सॉफ्टवेयर प्रोग्रामों में से एक है जिसका उपयोग डेटा सेट की व्याख्या करने और बाहरी मूल्यों को पहचानने और हटाने के लिए किया जा सकता है।
खोजपूर्ण डेटा विश्लेषण
चरण 1
"विश्लेषण करें" पर क्लिक करें। "वर्णनात्मक सांख्यिकी" और उसके बाद "एक्सप्लोर करें" चुनें।
दिन का वीडियो
चरण 2
आश्रित चर डेटा वाले कॉलम को "आश्रित सूची" लेबल वाले बॉक्स में खींचें और छोड़ें। ओके पर क्लिक करें।"
चरण 3
व्यक्तिगत डेटा बिंदुओं को हटाकर स्टेम-एंड-लीफ प्लॉट्स या बॉक्स प्लॉट्स में SPSS द्वारा पहचाने गए किसी भी आउटलेयर को हटा दें। वैकल्पिक रूप से, आप इन डेटा बिंदुओं को बाहर करने के लिए एक फ़िल्टर सेट कर सकते हैं।
चरण 4
"डेटा" का चयन करें और फिर "मामलों का चयन करें" और उस शर्त पर क्लिक करें जिसमें आउटलेयर हैं जिन्हें आप बाहर करना चाहते हैं। इस शर्त के लिए एक मान निर्धारित करें जिसमें केवल आउटलेयर और गैर-बाहरी डेटा बिंदुओं में से कोई भी शामिल नहीं है।
चरण 5
"चयन करें" बॉक्स में "यदि शर्त संतुष्ट है" चुनें और उसके ठीक नीचे "अगर" बटन पर क्लिक करें। आउटलेर्स को बाहर करने के लिए नियम दर्ज करें जिसे आपने पिछले चरण में ऊपरी दाईं ओर स्थित बॉक्स में निर्धारित किया था। उदाहरण के लिए, यदि आप "ऊंचाई" की स्थिति से 74.5 इंच से ऊपर के मापों को बाहर कर रहे थे, तो आप "ऊंचाई <= 74.5" दर्ज करेंगे। फ़िल्टर को सक्रिय करने के लिए "जारी रखें" और "ओके" पर क्लिक करें।
प्रतिगमन विश्लेषण
चरण 1
"विश्लेषण" मेनू में, "प्रतिगमन" और फिर "रैखिक" चुनें। उन आश्रित और स्वतंत्र चरों का चयन करें जिनका आप विश्लेषण करना चाहते हैं।
चरण 2
"सहेजें" पर क्लिक करें और फिर "कुक की दूरी" चुनें। कुक की दूरी के लिए परिकलित मान आपकी डेटा फ़ाइल में "COO-1" लेबल वाले चर के रूप में सहेजे जाएंगे।
चरण 3
"बॉक्सप्लॉट" के बाद "ग्राफ़" का चयन करके एक बॉक्सप्लॉट चलाएँ। "सरल" पर क्लिक करें और "अलग चर के सारांश" चुनें। प्रवेश करना "COO-1" को "बॉक्सेस रिप्रेजेंटेटिव" लेबल वाले बॉक्स में डालें और फिर एक आईडी या नाम दर्ज करें जिससे "लेबल केस बाय" में मामलों की पहचान की जा सके। डिब्बा।
चरण 4
आउटपुट फ़ाइल में बॉक्सप्लॉट को डबल-क्लिक करके बड़ा करें। उन मामलों पर ध्यान दें जो काली रेखाओं से परे हैं—ये आपके बाहरी कारक हैं। आप सभी आउटलेयर या केवल एक्सट्रीम आउटलेयर को हटाना चुन सकते हैं, जो एक स्टार (*) द्वारा चिह्नित हैं।
चरण 5
डेटा फ़ाइल में वापस जाएं और उन मामलों का पता लगाएं जिन्हें मिटाने की आवश्यकता है। नीचे से ऊपर की ओर काम करते हुए, ग्रे कॉलम में सबसे बाईं ओर की संख्या को हाइलाइट करें, ताकि पूरी पंक्ति का चयन किया जा सके। "संपादित करें" पर क्लिक करें और "साफ़ करें" चुनें। प्रत्येक बाहरी के लिए इस चरण को दोहराएं जिसे आपने बॉक्सप्लॉट से पहचाना है।
चेतावनी
धारा 2, चरण 5 में मामलों को मिटाते समय, हमेशा डेटा फ़ाइल के नीचे से ऊपर की ओर काम करें क्योंकि जब आप किसी मामले को मिटाते हैं तो आईडी नंबर बदल जाते हैं। यदि आप ऊपर से नीचे तक काम करते हैं, तो आप गलत मामलों को मिटा देंगे।