Οι ακραίες τιμές είναι ακραίες τιμές που μπορούν να παραμορφώσουν τα αποτελέσματα μιας στατιστικής ανάλυσης και να δημιουργήσουν ανακριβή συμπεράσματα.
Οι ακραίες τιμές στις στατιστικές αναλύσεις είναι ακραίες τιμές που δεν φαίνεται να ταιριάζουν με την πλειοψηφία ενός συνόλου δεδομένων. Εάν δεν αφαιρεθούν, αυτές οι ακραίες τιμές μπορούν να έχουν μεγάλη επίδραση σε τυχόν συμπεράσματα που θα μπορούσαν να εξαχθούν από το εν λόγω δεδομένα, επειδή μπορούν να παραμορφώσουν τους συντελεστές συσχέτισης και τις γραμμές της καλύτερης προσαρμογής σε λάθος κατεύθυνση. Το SPSS είναι ένα από τα πολλά προγράμματα λογισμικού στατιστικής ανάλυσης που μπορούν να χρησιμοποιηθούν για την ερμηνεία ενός συνόλου δεδομένων και τον εντοπισμό και την αφαίρεση απομακρυσμένων τιμών.
Διερευνητική Ανάλυση Δεδομένων
Βήμα 1
Κάντε κλικ στο "Ανάλυση". Επιλέξτε "Περιγραφικά στατιστικά στοιχεία" και στη συνέχεια "Εξερεύνηση".
Το βίντεο της ημέρας
Βήμα 2
Σύρετε και αποθέστε τις στήλες που περιέχουν τα δεδομένα εξαρτημένης μεταβλητής στο πλαίσιο με την ένδειξη "Εξαρτημένη λίστα". Κάντε κλικ στο "OK".
Βήμα 3
Αφαιρέστε τυχόν ακραία σημεία που προσδιορίζονται από το SPSS στα διαγράμματα στελέχους και φύλλων ή στα διαγράμματα πλαισίου διαγράφοντας τα μεμονωμένα σημεία δεδομένων. Εναλλακτικά, μπορείτε να ρυθμίσετε ένα φίλτρο για να εξαιρέσετε αυτά τα σημεία δεδομένων.
Βήμα 4
Επιλέξτε "Δεδομένα" και, στη συνέχεια, "Επιλογή περιπτώσεων" και κάντε κλικ σε μια συνθήκη που έχει ακραίες τιμές που θέλετε να εξαιρέσετε. Προσδιορίστε μια τιμή για αυτήν τη συνθήκη που εξαιρεί μόνο τα ακραία σημεία και κανένα από τα μη απομακρυσμένα σημεία δεδομένων.
Βήμα 5
Επιλέξτε "Εάν η κατάσταση είναι ικανοποιημένη" στο πλαίσιο "Επιλογή" και, στη συνέχεια, κάντε κλικ στο κουμπί "Εάν" ακριβώς από κάτω. Εισαγάγετε τον κανόνα για να εξαιρέσετε τις ακραίες τιμές που προσδιορίσατε στο προηγούμενο βήμα στο πλαίσιο επάνω δεξιά. Για παράδειγμα, εάν εξαιρούσατε μετρήσεις πάνω από 74,5 ίντσες από τη συνθήκη "ύψος", θα καταχωρίζατε "ύψος < = 74,5". Κάντε κλικ στο «Συνέχεια» και στο «OK» για να ενεργοποιήσετε το φίλτρο.
Ανάλυση παλινδρόμησης
Βήμα 1
Στο μενού "Analyze", επιλέξτε "Regression" και μετά "Linear". Επιλέξτε τις εξαρτημένες και ανεξάρτητες μεταβλητές που θέλετε να αναλύσετε.
Βήμα 2
Κάντε κλικ στο "Αποθήκευση" και, στη συνέχεια, επιλέξτε "Απόσταση Μάγειρα". Οι τιμές που υπολογίζονται για την απόσταση του Cook θα αποθηκευτούν στο αρχείο δεδομένων σας ως μεταβλητές με την ένδειξη "COO-1".
Βήμα 3
Εκτελέστε ένα τετραγωνίδιο επιλέγοντας "Γραφήματα" και στη συνέχεια "Πλαίσιο". Κάντε κλικ στο "Simple" και επιλέξτε "Summaries of Separate Variables". Εισαγω "COO-1" στο πλαίσιο με την ένδειξη "Πλαίσια αντιπροσωπεύουν" και, στη συνέχεια, εισαγάγετε ένα αναγνωριστικό ή όνομα με το οποίο θα προσδιορίζονται οι περιπτώσεις στο "Περιπτώσεις ετικέτας By" κουτί.
Βήμα 4
Μεγεθύνετε το πλαίσιο στο αρχείο εξόδου κάνοντας διπλό κλικ σε αυτό. Σημειώστε τις περιπτώσεις που βρίσκονται πέρα από τις μαύρες γραμμές—αυτές είναι οι ακραίες σας. Μπορείτε να επιλέξετε να αφαιρέσετε όλα τα ακραία σημεία ή μόνο τα ακραία σημεία, τα οποία σημειώνονται με ένα αστέρι (*).
Βήμα 5
Επιστρέψτε στο αρχείο δεδομένων και εντοπίστε τις περιπτώσεις που πρέπει να διαγραφούν. Δουλεύοντας από κάτω προς τα πάνω, επισημάνετε τον αριθμό στο άκρο αριστερά, στην γκρίζα στήλη, ώστε να επιλεγεί ολόκληρη η σειρά. Κάντε κλικ στο "Επεξεργασία" και επιλέξτε "Εκκαθάριση". Επαναλάβετε αυτό το βήμα για κάθε ακραίο σημείο που έχετε προσδιορίσει από το πλαίσιο.
Προειδοποίηση
Όταν διαγράφετε θήκες στην Ενότητα 2, βήμα 5, να εργάζεστε πάντα από το κάτω μέρος του αρχείου δεδομένων προς τα επάνω, επειδή οι αριθμοί αναγνωριστικού αλλάζουν όταν διαγράφετε μια θήκη. Εάν εργάζεστε από πάνω προς τα κάτω, θα καταλήξετε να σβήσετε τις λάθος περιπτώσεις.