So entfernen Sie Ausreißer in SPSS

...

Ausreißer sind Extremwerte, die die Ergebnisse einer statistischen Analyse verzerren und zu ungenauen Schlussfolgerungen führen können.

Ausreißer in statistischen Analysen sind Extremwerte, die nicht zum Großteil eines Datensatzes zu passen scheinen. Wenn sie nicht entfernt werden, können diese Extremwerte einen großen Einfluss auf alle Schlussfolgerungen haben, die aus den fraglichen Daten, weil sie Korrelationskoeffizienten und Linien der besten Anpassung in die falsche Richtung verzerren können Richtung. SPSS ist eines von mehreren Softwareprogrammen zur statistischen Analyse, die verwendet werden können, um einen Datensatz zu interpretieren und abweichende Werte zu identifizieren und zu entfernen.

Explorative Datenanalyse

Schritt 1

Klicken Sie auf "Analysieren". Wählen Sie "Beschreibende Statistik" gefolgt von "Erkunden".

Video des Tages

Schritt 2

Ziehen Sie die Spalten mit den abhängigen Variablendaten per Drag & Drop in das Feld mit der Bezeichnung "Abhängige Liste". OK klicken."

Schritt 3

Entfernen Sie alle von SPSS identifizierten Ausreißer in den Stamm-und-Blatt-Plots oder Boxplots, indem Sie die einzelnen Datenpunkte löschen. Alternativ können Sie einen Filter einrichten, um diese Datenpunkte auszuschließen.

Schritt 4

Wählen Sie "Daten" und dann "Fälle auswählen" und klicken Sie auf eine Bedingung, die Ausreißer enthält, die Sie ausschließen möchten. Bestimmen Sie einen Wert für diese Bedingung, der nur die Ausreißer und keinen der nicht-ausreißerischen Datenpunkte ausschließt.

Schritt 5

Wählen Sie im Feld "Auswählen" die Option "Wenn Bedingung erfüllt ist" und klicken Sie dann auf die Schaltfläche "Wenn" direkt darunter. Geben Sie die Regel zum Ausschließen von Ausreißern, die Sie im vorherigen Schritt ermittelt haben, in das Feld oben rechts ein. Wenn Sie beispielsweise Messungen über 74,5 Zoll von der Bedingung "Höhe" ausschließen, würden Sie "Höhe < = 74,5" eingeben. Klicken Sie auf "Weiter" und "OK", um den Filter zu aktivieren.

Regressionsanalyse

Schritt 1

Wählen Sie im Menü "Analysieren" "Regression" und dann "Linear". Wählen Sie die abhängigen und unabhängigen Variablen aus, die Sie analysieren möchten.

Schritt 2

Klicken Sie auf "Speichern" und wählen Sie dann "Cook's Distance". Die für Cooks Distanz berechneten Werte werden in Ihrer Datendatei als Variablen mit der Bezeichnung "COO-1" gespeichert.

Schritt 3

Führen Sie einen Boxplot aus, indem Sie "Graphs" gefolgt von "Boxplot" auswählen. Klicken Sie auf "Simple" und wählen Sie "Summaries of Separate Variables". Eintreten "COO-1" in das Feld "Boxen vertreten" ein und geben Sie dann eine ID oder einen Namen ein, anhand derer die Fälle im Feld "Fälle kennzeichnen nach" identifiziert werden. Kasten.

Schritt 4

Vergrößern Sie den Boxplot in der Ausgabedatei, indem Sie darauf doppelklicken. Notieren Sie Fälle, die außerhalb der schwarzen Linien liegen – dies sind Ihre Ausreißer. Sie können wählen, ob Sie alle Ausreißer oder nur die extremen Ausreißer entfernen möchten, die mit einem Stern (*) gekennzeichnet sind.

Schritt 5

Gehen Sie zurück in die Datendatei und suchen Sie die Fälle, die gelöscht werden müssen. Markieren Sie von unten nach oben die Zahl ganz links in der grauen Spalte, damit die gesamte Zeile ausgewählt wird. Klicken Sie auf "Bearbeiten" und wählen Sie "Löschen". Wiederholen Sie diesen Schritt für jeden Ausreißer, den Sie im Boxplot identifiziert haben.

Warnung

Gehen Sie beim Löschen von Fällen in Abschnitt 2, Schritt 5 immer von unten in der Datendatei nach oben vor, da sich die ID-Nummern ändern, wenn Sie einen Fall löschen. Wenn Sie von oben nach unten arbeiten, werden Sie am Ende die falschen Fälle löschen.