Cum să eliminați valorile aberante în SPSS

click fraud protection
...

Valorile aberante sunt valori extreme care pot denatura rezultatele unei analize statistice și pot crea concluzii inexacte.

Valorile aberante din analizele statistice sunt valori extreme care nu par să se potrivească cu majoritatea unui set de date. Dacă nu sunt eliminate, aceste valori extreme pot avea un efect mare asupra oricăror concluzii care ar putea fi trase din datele în cauză, deoarece pot denatura coeficienții de corelație și liniile cele mai potrivite în mod greșit direcţie. SPSS este unul dintre numeroasele programe software de analiză statistică care poate fi utilizat pentru a interpreta un set de date și pentru a identifica și elimina valorile periferice.

Analiza exploratorie a datelor

Pasul 1

Faceți clic pe „Analizați”. Selectați „Statistici descriptive” urmate de „Explorare”.

Videoclipul zilei

Pasul 2

Trageți și plasați coloanele care conțin datele variabilei dependente în caseta etichetată „Lista dependentă”. Faceți clic pe „OK”.

Pasul 3

Eliminați orice valori aberante identificate de SPSS în diagramele cu tulpină și frunze sau în diagramele cu casete prin ștergerea punctelor de date individuale. Alternativ, puteți configura un filtru pentru a exclude aceste puncte de date.

Pasul 4

Selectați „Date”, apoi „Selectați cazuri” și faceți clic pe o condiție care are valori aberante pe care doriți să le excludeți. Determinați o valoare pentru această condiție care exclude numai valorile aberante și niciunul dintre punctele de date neperiferice.

Pasul 5

Alegeți „Dacă condiția este satisfăcută” în caseta „Selectați”, apoi faceți clic pe butonul „Dacă” chiar de sub ea. Introduceți regula pentru a exclude valorile aberante pe care le-ați determinat la pasul anterior în caseta din dreapta sus. De exemplu, dacă excludeți măsurătorile de peste 74,5 inchi din condiția „înălțime”, ați introduce „înălțime < = 74,5”. Faceți clic pe „Continuare” și „OK” pentru a activa filtrul.

Analiza de regresie

Pasul 1

În meniul „Analiza”, selectați „Regresie” și apoi „Liniar”. Selectați variabilele dependente și independente pe care doriți să le analizați.

Pasul 2

Faceți clic pe „Salvare” și apoi selectați „Distanța gătitului”. Valorile calculate pentru distanța lui Cook vor fi salvate în fișierul dvs. de date ca variabile etichetate „COO-1”.

Pasul 3

Rulați un boxplot selectând „Graphs” urmat de „Boxplot”. Faceți clic pe „Simplu” și selectați „Rezumate ale variabilelor separate”. introduce „COO-1” în caseta etichetată „Boxes Represent”, apoi introduceți un ID sau un nume prin care să identificați cazurile în „Etichetare cazuri după” cutie.

Pasul 4

Măriți boxplot-ul din fișierul de ieșire făcând dublu clic pe el. Notați cazurile care se află dincolo de liniile negre - acestea sunt valorile aberante. Puteți alege să eliminați toate valorile aberante sau numai valorile extreme, care sunt marcate cu o stea (*).

Pasul 5

Reveniți în fișierul de date și localizați cazurile care trebuie șterse. Lucrând de jos în sus, evidențiați numărul din extrema stângă, în coloana gri, astfel încât să fie selectat întregul rând. Faceți clic pe „Editați” și selectați „Ștergeți”. Repetați acest pas pentru fiecare valori aberante pe care l-ați identificat din diagrama de casete.

Avertizare

Când ștergeți cazurile din Secțiunea 2, pasul 5, lucrați întotdeauna din partea de jos a fișierului de date în sus, deoarece numerele de identificare se schimbă atunci când ștergeți un caz. Dacă lucrați de sus în jos, veți ajunge să ștergeți cazurile greșite.