Πίστωση εικόνας: nd3000/iStock/GettyImages
Όταν αναλύετε δεδομένα, οι ακραίες τιμές μπορεί να παραμορφώσουν τα αποτελέσματα και να τα καταστήσουν λιγότερο αξιόπιστα. Για παράδειγμα, εάν μία ή περισσότερες από τις τιμές σας είναι σημαντικά υψηλότερες από την πλειονότητα των δεδομένων, κάνουν τον μέσο όρο υψηλότερο, κάτι που μπορεί να μην αντικατοπτρίζει τα δεδομένα στο σύνολό τους. Η αφαίρεση αυτών των απομακρυσμένων σημείων δεδομένων είναι, επομένως, ένα σημαντικό βήμα για την εκτέλεση αξιόπιστων στατιστικών υπολογισμών. Χωρίς αποκλειστική λειτουργία ακραίων τιμών, ο ευκολότερος τρόπος για να εκτελέσετε μια δοκιμή ακραίων τιμών στο Excel είναι να χρησιμοποιήσετε το εύρος μεταξύ τεταρτημορίων για να προσδιορίσετε ακραίες τιμές, αλλά μπορείτε επίσης να χρησιμοποιήσετε τη συνάρτηση Trimmean για να προσεγγίσετε το ίδιο αποτέλεσμα.
Υπολογισμός του διατεταρτημορίου εύρους
Το διατεταρτημόριο εύρος δεδομένων είναι το εύρος που καλύπτεται από το "κουτί" σε μια γραφική παράσταση κουτιού και μουστάκι, ή περισσότερο ακριβώς, το αποτέλεσμα της αφαίρεσης της τιμής για το πρώτο τεταρτημόριο των δεδομένων από αυτό του τρίτου τεταρτημόριο. Το Excel περιέχει μια ενσωματωμένη δυνατότητα για τον υπολογισμό οποιουδήποτε τεταρτημορίου για τα δεδομένα σας. Βρείτε ένα εφεδρικό κελί και πληκτρολογήστε "=QUARTILE([εύρος δεδομένων], [αριθμός τεταρτημορίου])" και βάλτε το εύρος των κελιών για τα δεδομένα σας όπου λέει "[εύρος δεδομένων]" και το τεταρτημόριο που θέλετε όπου λέει "[τεταρτημόριο αριθμός]."
Το βίντεο της ημέρας
Για παράδειγμα, εάν έχετε δεδομένα στα κελιά A2 έως A101 και θέλετε την τιμή για το πρώτο τεταρτημόριο, εισαγάγετε "=QUARTILE(A2:A101, 1)" για να βρείτε την τιμή. Για το πρώτο μέρος του επιχειρήματος, μπορείτε να επισημάνετε τα σχετικά κελιά με το ποντίκι σας, αλλά μετά το κόμμα, πρέπει να γράψετε τον αριθμό του τεταρτημορίου που θέλετε. Για το τρίτο τεταρτημόριο με τα ίδια δεδομένα, πληκτρολογήστε "=QUARTILE(A2:A101, 3)" για να λάβετε το αποτέλεσμα.
Χρησιμοποιώντας ένα άλλο κενό κελί, αφαιρέστε την τιμή του πρώτου τεταρτημορίου από την τιμή του τρίτου τεταρτημορίου. Εάν το πρώτο τεταρτημόριο βρίσκεται στο κελί C2 και το τρίτο τεταρτημόριο στο κελί D2, πληκτρολογήστε "=D2-C2" για να λάβετε το αποτέλεσμα. Αυτό είναι το διατεταρτημόριο.
Outlier Analysis στο Excel
Για να βρείτε ακραίες τιμές, μπορείτε τώρα να χρησιμοποιήσετε το διατεταρτημόριο εύρος στον τύπο ακραίων τιμών, ο οποίος δηλώνει ότι το ανώτερο όριο των δεδομένων είναι η τιμή του τρίτο τεταρτημόριο συν 1,5 φορές το διατεταρτημόριο και το κατώτερο όριο είναι η τιμή του πρώτου τεταρτημορίου μείον 1,5 φορές το μεσοτεταρτημόριο εύρος.
Εάν η τιμή του πρώτου τεταρτημορίου είναι στο C2, η τιμή του τρίτου τεταρτημορίου βρίσκεται στο κελί D2 και το εύρος του διατεταρτημορίου είναι στο κελί E2, θα πληκτρολογήσετε "=C2-(1.5 * E2)" για να βρείτε το κατώτερο όριο και "=D2+(1.5 * E2)" για να βρείτε το ανώτερο όριο. Γενικά, πληκτρολογείτε "=[πρώτο τεταρτημόριο] – (1,5 * [διατεταρτημόριο εύρος])" για να βρείτε το κατώτερο όριο και "=[τρίτο τεταρτημόριο] + (1,5 * [εύρος μεταξύ τεταρτημορίων])" για να βρείτε το ανώτερο όριο.
Οτιδήποτε κάτω από το κατώτερο όριο ή πάνω από το ανώτερο όριο είναι ακραίο.
Για να ολοκληρώσετε τη δοκιμή ακραίων τιμών στο Excel, χρησιμοποιήστε τη λογική συνάρτηση "OR" για να προσδιορίσετε ποιες τιμές στην κατηγορία δεδομένων σας είναι ακραίες τιμές με αποτελεσματικό τρόπο. Εισαγάγετε "=OR([κελί δεδομένων]>[ανώτατο όριο], [κελί δεδομένων]$F$2, A2
Εάν η τιμή στο A2 είναι πάνω από το ανώτερο όριο ή κάτω από το κατώτερο όριο, εμφανίζει "TRUE", υποδεικνύοντας ότι η τιμή είναι ακραία. Μπορείτε να σύρετε αυτόν τον τύπο προς τα κάτω κάνοντας κλικ στην κάτω δεξιά γωνία του κελιού με τον τύπο και σύροντάς το προς τα κάτω έτσι ώστε να τελειώσει δίπλα στο τελικό κελί δεδομένων για να εκτελέσει τον ίδιο υπολογισμό σε κάθε σημείο δεδομένων.
Μπορείτε επίσης να επισημάνετε τα δεδομένα και να μεταβείτε στην "Μορφοποίηση υπό όρους" στην ενότητα "Στυλ" της καρτέλας "Αρχική σελίδα", εάν θέλετε να αλλάξετε τη μορφοποίηση για τις ακραίες τιμές. Επιλέξτε "Νέος κανόνας" και επισημάνετε την επιλογή "Χρησιμοποιήστε έναν τύπο για να καθορίσετε ποια κελιά θα μορφοποιήσετε". Πληκτρολογήστε τον ίδιο τύπο όπως στην προηγούμενη παράγραφο και, στη συνέχεια, κάντε κλικ στην επιλογή "Μορφοποίηση" για να επιλέξετε τη μοναδική μορφοποίηση για ακραίες τιμές.
Χρησιμοποιώντας το Trimmean
Η συνάρτηση "Trimmean" είναι ένας απλούστερος τρόπος αναγνώρισης ακραίων τιμών. Πληκτρολογήστε "=TRIMMEAN([εύρος δεδομένων], [αναλογία προς περικοπή])" για να χρησιμοποιήσετε τη συνάρτηση, με το εύρος κελιών που περιέχει δεδομένα στη θέση του "[εύρος δεδομένων]" και ένα δεκαδικό ποσοστό που θέλετε να περικόψετε εκεί που λέει "[αναλογία προς περικοπή]." Αυτό αφαιρεί τις ακραίες τιμές στην κορυφή και στο κάτω μέρος και στη συνέχεια υπολογίζει τη μέση τιμή βάσει αυτών παραμένων. Έτσι, εάν περικόψατε το 10 τοις εκατό, θα αφαιρούσε το επάνω 5 τοις εκατό και το κάτω 5 τοις εκατό πριν υπολογίσετε τον μέσο όρο.
Εάν τα δεδομένα εκτελούνται από A2 έως A101 και θέλετε να περικόψετε το ακραίο 5 τοις εκατό των τιμών, εισαγάγετε "=TRIMMEAN(A2:A101, 0,05)" για να βρείτε τον προσαρμοσμένο μέσο όρο. Θα μπορούσατε να περικόψετε το 15 τοις εκατό γράφοντας αντ 'αυτού "=TRIMMEAN(A2:A101, 0,15)".