एक्सेल में आउटलेर्स फंक्शन का उपयोग कैसे करें

प्रोजेक्ट पर काम कर रहे सॉफ्टवेयर इंजीनियर

छवि क्रेडिट: nd3000/iStock/GettyImages

जब आप डेटा का विश्लेषण कर रहे होते हैं, तो आउटलेयर परिणामों को कम कर सकते हैं और उन्हें कम विश्वसनीय बना सकते हैं। उदाहरण के लिए, यदि आपका एक या अधिक मान अधिकांश डेटा की तुलना में काफी अधिक हैं, तो वे माध्य को उच्च बना देते हैं, जो संपूर्ण डेटा को प्रतिबिंबित नहीं कर सकता है। इसलिए, इन बाहरी डेटा बिंदुओं को हटाना विश्वसनीय सांख्यिकीय गणना करने में एक महत्वपूर्ण कदम है। कोई समर्पित आउटलेयर फ़ंक्शन नहीं होने के कारण, एक्सेल में बाहरी परीक्षण करने का सबसे आसान तरीका इसका उपयोग करना है आउटलेर्स की पहचान करने के लिए इंटरक्वेर्टाइल रेंज, लेकिन आप उसी का अनुमान लगाने के लिए ट्रिमियन फ़ंक्शन का भी उपयोग कर सकते हैं नतीजा।

इंटरक्वेर्टाइल रेंज की गणना

डेटा की इंटरक्वेर्टाइल रेंज एक बॉक्स-एंड-व्हिस्कर प्लॉट, या अधिक पर "बॉक्स" द्वारा कवर की गई रेंज है ठीक है, डेटा के पहले चतुर्थक के लिए मान को तीसरे से घटाने का परिणाम चतुर्थक एक्सेल में आपके डेटा के लिए किसी भी चतुर्थक की गणना करने के लिए एक अंतर्निहित सुविधा है। एक अतिरिक्त सेल ढूंढें और "=QUARTILE([data range], [quartile number])" टाइप करें और सेल की रेंज डालें आपके डेटा के लिए जहां यह "[डेटा श्रेणी]" कहता है और वह चतुर्थक जहां वह कहता है "[चतुर्थक" संख्या]।"

दिन का वीडियो

उदाहरण के लिए, यदि आपके पास कक्ष A2 से A101 में डेटा है और आप पहले चतुर्थक के लिए मान चाहते हैं, तो आप मान ज्ञात करने के लिए "=QUARTILE(A2:A101, 1)" दर्ज करें। तर्क के पहले भाग के लिए, आप अपने माउस से संबंधित कोशिकाओं को हाइलाइट कर सकते हैं, लेकिन अल्पविराम के बाद, आपको अपने इच्छित चतुर्थक की संख्या लिखनी होगी। समान डेटा वाले तीसरे चतुर्थक के लिए, आप परिणाम प्राप्त करने के लिए "=QUARTILE(A2:A101, 3)" टाइप करें।

एक अन्य खाली सेल का उपयोग करते हुए, पहले चतुर्थक सेल के मान को तीसरे क्वार्टाइल सेल के मान से घटाएं। यदि पहला चतुर्थक कक्ष C2 में है और तीसरा चतुर्थक कक्ष D2 में है, तो परिणाम प्राप्त करने के लिए "=D2-C2" टाइप करें। यह इंटरक्वेर्टाइल रेंज है।

एक्सेल में बाहरी विश्लेषण

आउटलेयर का पता लगाने के लिए, अब आप आउटलेयर फॉर्मूले में इंटरक्वेर्टाइल रेंज का उपयोग कर सकते हैं, जिसमें कहा गया है कि डेटा की ऊपरी सीमा का मान है तृतीय चतुर्थक प्लस इंटरक्वार्टाइल रेंज का 1.5 गुना, और निचली सीमा पहले चतुर्थक का मान घटाकर इंटरक्वार्टाइल का 1.5 गुना है श्रेणी।

यदि प्रथम चतुर्थक मान C2 में है, तो तृतीय चतुर्थक मान कक्ष D2 में है, और अंतःचतुर्थक श्रेणी है सेल E2 में, आप निचली सीमा को खोजने के लिए "=C2-(1.5 * E2)" टाइप करेंगे और ऊपरी को खोजने के लिए "=D2+(1.5 * E2)" टाइप करेंगे। सीमा सामान्य तौर पर, आप निचली सीमा का पता लगाने के लिए "=[पहला चतुर्थक] - (1.5 * [इंटरक्वेर्टाइल रेंज])" दर्ज करते हैं और ऊपरी सीमा को खोजने के लिए "=[तीसरा चतुर्थक] + (1.5 * [इंटरक्वेर्टाइल रेंज])" दर्ज करते हैं।

निचली सीमा से नीचे या ऊपरी सीमा से ऊपर कुछ भी बाहरी है।

एक्सेल में बाहरी परीक्षण को समाप्त करने के लिए, तार्किक "OR" फ़ंक्शन का उपयोग करके यह पहचानें कि आपके डेटा वर्ग में कौन से मान कुशल तरीके से आउटलेयर हैं। वर्ग कोष्ठकों में मात्राओं के स्थान पर प्रासंगिक सेल संदर्भों के साथ, आउटलेयर खोजने के लिए "=OR([डेटा सेल]>[ऊपरी सीमा], [डेटा सेल]$F$2, A2

यदि A2 में मान ऊपरी सीमा से ऊपर या निचली सीमा से नीचे है, तो यह "TRUE" प्रदर्शित करता है, यह दर्शाता है कि मान एक बाहरी है। आप सूत्र के साथ कक्ष के निचले दाएं कोने पर क्लिक करके इस सूत्र को नीचे खींच सकते हैं और इसे नीचे खींच रहा है ताकि यह अंतिम डेटा सेल के बगल में समाप्त हो जाए ताकि प्रत्येक पर समान गणना की जा सके डेटा बिंदु।

आप डेटा को हाइलाइट भी कर सकते हैं, और "होम" टैब के "शैलियों" अनुभाग में "सशर्त स्वरूपण" पर जा सकते हैं यदि आप आउटलेर्स के लिए स्वरूपण बदलना चाहते हैं। "नया नियम" चुनें और "कौन से कक्षों को प्रारूपित करना है यह निर्धारित करने के लिए एक सूत्र का उपयोग करें" विकल्प को हाइलाइट करें। पिछले पैराग्राफ की तरह ही फॉर्मूला टाइप करें और फिर आउटलेर्स के लिए यूनिक फॉर्मेटिंग चुनने के लिए "फॉर्मेट" विकल्प पर क्लिक करें।

ट्रिमियन का उपयोग करना

"ट्रिमियन" फ़ंक्शन आउटलेर्स की पहचान करने का एक आसान तरीका है। फ़ंक्शन का उपयोग करने के लिए "= TRIMMEAN ([डेटा श्रेणी], [ट्रिम करने का अनुपात])" टाइप करें, जिसमें "[डेटा श्रेणी]" और एक दशमलव के स्थान पर डेटा युक्त कक्षों की श्रेणी है। आप जिस प्रतिशत को ट्रिम करना चाहते हैं, वह "[ट्रिम करने का अनुपात]" कहता है। यह ऊपर और नीचे के चरम मानों को हटा देता है और फिर उनके आधार पर माध्य की गणना करता है शेष। इसलिए, यदि आपने 10 प्रतिशत काटा है, तो यह माध्य की गणना करने से पहले शीर्ष 5 प्रतिशत और नीचे के 5 प्रतिशत को हटा देगा।

यदि डेटा A2 से A101 तक चलता है और आप चरम 5 प्रतिशत मानों को ट्रिम करना चाहते हैं, तो आप समायोजित माध्य खोजने के लिए "=TRIMMEAN(A2:A101, 0.05)" दर्ज करें। आप इसके बजाय "=TRIMMEAN(A2:A101, 0.15)" लिखकर 15 प्रतिशत ट्रिम कर सकते हैं।

श्रेणियाँ

हाल का

SHS को XLS में कैसे बदलें

SHS को XLS में कैसे बदलें

जब उपयोगकर्ता ड्रैग और ड्रॉप करता है या डेस्कटॉ...

पृष्ठभूमि के साथ एक्सेल स्प्रेडशीट कैसे प्रिंट करें

पृष्ठभूमि के साथ एक्सेल स्प्रेडशीट कैसे प्रिंट करें

ग्रिडलाइन्स आपको प्रत्येक सेल के बॉर्डर की पहच...

एक्सेल फाइल को पासवर्ड कैसे प्रोटेक्ट करें

एक्सेल फाइल को पासवर्ड कैसे प्रोटेक्ट करें

पासवर्ड सुरक्षा व्यक्तिगत कंप्यूटर फ़ाइलों को ...