როგორ გამოვიყენოთ Outliers ფუნქცია Excel-ში

პროექტზე მომუშავე პროგრამული უზრუნველყოფის ინჟინრები

სურათის კრედიტი: nd3000/iStock/GettyImages

როდესაც თქვენ აანალიზებთ მონაცემებს, გამოკვეთილმა მონაცემებმა შეიძლება შეცვალოს შედეგები და გახადოს ისინი ნაკლებად სანდო. მაგალითად, თუ თქვენი ერთი ან მეტი მნიშვნელობა არსებითად უფრო მაღალია, ვიდრე მონაცემების უმეტესობა, ისინი საშუალოს უფრო მაღალს ხდიან, რაც შეიძლება არ ასახავდეს მონაცემებს მთლიანობაში. მაშასადამე, ამ დაშორებული მონაცემების პუნქტების ამოღება მნიშვნელოვანი ნაბიჯია საიმედო სტატისტიკური გამოთვლების შესასრულებლად. ექსკლუზიური ფუნქციის გარეშე, Excel-ში გამოკვეთის ტესტის ჩასატარებლად ყველაზე მარტივი გზა არის მისი გამოყენება კვარტლთაშორისი დიაპაზონი უკიდეგანოების იდენტიფიცირებისთვის, მაგრამ თქვენ ასევე შეგიძლიათ გამოიყენოთ Trimmean ფუნქცია იგივეს მიახლოებისთვის შედეგი.

ინტერკვარტილური დიაპაზონის გამოთვლა

მონაცემთა ინტერკვარტილური დიაპაზონი არის დიაპაზონი, რომელსაც ფარავს „ყუთი“ ყუთისა და ულვაშის ნაკვეთზე, ან მეტი. ზუსტად, შედეგების გამოკლების შედეგი მონაცემების პირველი კვართლისთვის მესამედან მეოთხედი. Excel შეიცავს ჩაშენებულ ფუნქციას თქვენი მონაცემების ნებისმიერი კვარტლის გამოსათვლელად. იპოვეთ სათადარიგო უჯრედი და აკრიფეთ "=QUARTILE([მონაცემთა დიაპაზონი], [კვარტილის ნომერი])" და ჩადეთ უჯრედების დიაპაზონი თქვენი მონაცემებისთვის, სადაც ნათქვამია „[მონაცემთა დიაპაზონი]“ და თქვენთვის სასურველი კვარტლი სადაც ნათქვამია „[კვარტილი ნომერი]."

დღის ვიდეო

მაგალითად, თუ გაქვთ მონაცემები A2-დან A101-მდე უჯრედებში და გსურთ მნიშვნელობა პირველი კვარტილისთვის, მნიშვნელობის საპოვნელად შეიყვანთ "=QUARTILE(A2:A101, 1)". არგუმენტის პირველი ნაწილისთვის შეგიძლიათ მაუსით მონიშნოთ შესაბამისი უჯრედები, მაგრამ მძიმის შემდეგ უნდა დაწეროთ თქვენთვის სასურველი კვარტილის რაოდენობა. იგივე მონაცემების მქონე მესამე მეოთხედისთვის, შედეგის მისაღებად აკრიფეთ "=QUARTILE(A2:A101, 3)".

სხვა ცარიელი უჯრედის გამოყენებით, გამოაკლეთ პირველი მეოთხედი უჯრედის მნიშვნელობა მესამე მეოთხედის უჯრედის მნიშვნელობას. თუ პირველი მეოთხედი არის C2 უჯრედში, ხოლო მესამე მეოთხედი არის D2 უჯრედში, აკრიფეთ "=D2-C2" შედეგის მისაღებად. ეს არის ინტერკვარტილური დიაპაზონი.

Outlier ანალიზი Excel-ში

outliers-ის საპოვნელად, ახლა შეგიძლიათ გამოიყენოთ ინტერკვარტილური დიაპაზონი outlier ფორმულაში, რომელიც აცხადებს, რომ მონაცემთა ზედა ზღვარი არის მნიშვნელობა მესამე მეოთხედი პლუს 1,5-ჯერ ინტერკვარტილის დიაპაზონზე, ხოლო ქვედა ზღვარი არის პირველი მეოთხედის მნიშვნელობა მინუს 1,5-ჯერ ინტერკვარტილს. დიაპაზონი.

თუ პირველი მეოთხედის მნიშვნელობა არის C2-ში, მესამე კვარტლის მნიშვნელობა არის D2 უჯრედში, ხოლო კვარტლთაშორისი დიაპაზონი არის უჯრედში E2, თქვენ უნდა აკრიფოთ "=C2-(1.5 * E2)" ქვედა ლიმიტის საპოვნელად და "=D2+(1.5 * E2)" ზედა საპოვნელად. ზღვარი. ზოგადად, ქვედა ლიმიტის საპოვნელად შეყავთ "=[პირველი მეოთხედი] – (1.5 * [კვარტლთაშორისი დიაპაზონი])" და ზედა ლიმიტის საპოვნელად „=[მესამე მეოთხედი] + (1.5 * [კვარტლთაშორისი დიაპაზონი])".

ყველაფერი ქვედა ზღვარზე ქვემოთ ან ზედა ზღვარზე ზემოთ არის გამოკვეთილი.

Excel-ში გამორიცხული ტესტის დასასრულებლად გამოიყენეთ ლოგიკური "OR" ფუნქცია, რათა დაადგინოთ, თუ რომელი მნიშვნელობებია თქვენი მონაცემთა კლასში, ეფექტური გზით. შეიყვანეთ "=OR([მონაცემთა უჯრედი]>[ზედა ლიმიტი], [მონაცემთა უჯრედი]$F$2, A2

თუ A2-ის მნიშვნელობა არის ზედა ზღვარს ზემოთ ან ქვედა ზღვარზე ქვემოთ, ის აჩვენებს "TRUE", რაც მიუთითებს, რომ მნიშვნელობა არის გარე. თქვენ შეგიძლიათ გადაიტანოთ ეს ფორმულა ქვემოთ უჯრედის ქვედა მარჯვენა კუთხეში დაწკაპუნებით ფორმულით და გადაათრიეთ ქვემოთ ისე, რომ იგი დაასრულოს საბოლოო მონაცემთა უჯრედის გვერდით, რათა შეასრულოს იგივე გამოთვლა თითოეულზე მონაცემთა წერტილი.

თქვენ ასევე შეგიძლიათ მონიშნოთ მონაცემები და გადახვიდეთ "პირობითი ფორმატირება" ჩანართში "სტილები" განყოფილებაში, თუ გსურთ შეცვალოთ ფორმატირება გარედან. აირჩიეთ "ახალი წესი" და მონიშნეთ "გამოიყენეთ ფორმულა, რათა დადგინდეს რომელი უჯრედების ფორმატირება". აკრიფეთ იგივე ფორმულა, როგორც წინა აბზაცში და შემდეგ დააწკაპუნეთ "ფორმატი" ოფციაზე, რათა აირჩიოთ უნიკალური ფორმატირება გარედან.

Trimmean-ის გამოყენება

"Trimmean" ფუნქცია არის უფრო მარტივი გზა ამოცნობის იდენტიფიცირებისთვის. ფუნქციის გამოსაყენებლად აკრიფეთ „=TRIMMEAN([მონაცემთა დიაპაზონი], [პროპორცია შემცირებისადმი])“ უჯრედების დიაპაზონით, რომლებიც შეიცავს მონაცემებს „[მონაცემთა დიაპაზონი]“ და ათწილადის ნაცვლად. პროცენტი, რომლის მორთვაც გსურთ იქ, სადაც წერია "[პროპორცია მორთვის]." ეს ამოიღებს უკიდურეს მნიშვნელობებს ზედა და ქვედა ნაწილში და შემდეგ ითვლის საშუალოს მათზე დაყრდნობით დარჩენილი. ასე რომ, თუ 10 პროცენტს მოაჭრით, ის ამოიღებს ზედა 5 პროცენტს და ქვედა 5 პროცენტს საშუალოს გამოთვლამდე.

თუ მონაცემები გადის A2-დან A101-მდე და გსურთ ამოჭრათ მნიშვნელობების უკიდურესი 5 პროცენტი, შედით "=TRIMMEAN(A2:A101, 0.05)" მორგებული საშუალო საპოვნელად. შეგიძლიათ 15 პროცენტის მოჭრა დაწეროთ „=TRIMMEAN(A2:A101, 0.15)“ ნაცვლად.

კატეგორიები

Ბოლო

რამდენ ხანს მუშაობს როუტერები?

რამდენ ხანს მუშაობს როუტერები?

ქსელის როუტერი კომპიუტერული ქსელის განუყოფელი ...

როგორ მოვახდინოთ RF სკანირება მობილური ტელეფონის სიგნალებისთვის

როგორ მოვახდინოთ RF სკანირება მობილური ტელეფონის სიგნალებისთვის

RF სკანერი დაგეხმარებათ ახლომდებარე მობილური ტ...

როგორ გააკეთოთ შეცდომების მწმენდავი

როგორ გააკეთოთ შეცდომების მწმენდავი

შექმენით თქვენი საკუთარი რადიოსიხშირული მოწყობ...