A kiugró értékek eltávolítása az SPSS-ben

...

A kiugró értékek szélsőséges értékek, amelyek torzíthatják a statisztikai elemzés eredményeit, és pontatlan következtetéseket vonhatnak le.

A statisztikai elemzésekben a kiugró értékek szélsőséges értékek, amelyek úgy tűnik, nem illeszkednek az adathalmaz többségéhez. Ha nem távolítják el, ezek a szélsőséges értékek nagy hatással lehetnek az ebből levonható következtetésekre szóban forgó adatokat, mert eltorzíthatják a korrelációs együtthatókat és a legjobban illeszkedő vonalakat a rosszban irány. Az SPSS egyike a számos statisztikai elemző szoftvernek, amelyek használhatók egy adathalmaz értelmezésére, valamint a kiugró értékek azonosítására és eltávolítására.

Feltáró adatelemzés

1. lépés

Kattintson az "Elemzés" gombra. Válassza a „Leíró statisztikák”, majd a „Felfedezés” lehetőséget.

A nap videója

2. lépés

Húzza át a függő változó adatait tartalmazó oszlopokat a „Függő lista” mezőbe. Kattintson az "OK" gombra.

3. lépés

Az egyes adatpontok törlésével távolítson el minden, az SPSS által azonosított kiugró értéket a szár- és levéldiagramokból vagy dobozdiagramokból. Alternatív megoldásként beállíthat egy szűrőt, amely kizárja ezeket az adatpontokat.

4. lépés

Válassza az "Adatok", majd a "Cases kiválasztása" lehetőséget, és kattintson arra a feltételre, amelynél vannak kihagyni kívánt értékek. Határozzon meg egy értéket ennek a feltételnek, amely csak a kiugró értékeket zárja ki, a nem kiugró adatpontok egyikét sem.

5. lépés

A "Kiválasztás" mezőben válassza a "Ha a feltétel kielégítő" lehetőséget, majd kattintson az alatta lévő "Ha" gombra. Írja be az előző lépésben meghatározott kiugró értékek kizárására vonatkozó szabályt a jobb felső sarokban található mezőbe. Ha például kizárja a 74,5 hüvelyk feletti méreteket a „magasság” feltételből, akkor a „magasság < = 74,5” értéket kell megadnia. Kattintson a "Folytatás" és az "OK" gombra a szűrő aktiválásához.

Regresszió analízis

1. lépés

Az „Elemzés” menüben válassza a „Regresszió”, majd a „Lineáris” lehetőséget. Válassza ki az elemezni kívánt függő és független változókat.

2. lépés

Kattintson a "Mentés" gombra, majd válassza a "Főzési távolság" lehetőséget. A Cook-távolságra számított értékek „COO-1” címkével ellátott változókként kerülnek mentésre az adatfájlban.

3. lépés

Futtasson egy boxplotot a „Grafikonok”, majd a „Boxplot” kiválasztásával. Kattintson az "Egyszerű" elemre, és válassza a "Különálló változók összefoglalása" lehetőséget. Belép "COO-1" a "Boxes Represent" feliratú mezőbe, majd adjon meg egy azonosítót vagy nevet, amely alapján azonosíthatja az eseteket a "Cases By" mezőben. doboz.

4. lépés

Nagyítsa fel a boxplotot a kimeneti fájlban dupla kattintással. Jegyezze fel azokat az eseteket, amelyek a fekete vonalakon túl vannak – ezek a kiugró értékek. Dönthet úgy, hogy eltávolítja az összes kiugró értéket, vagy csak a szélső kiugró értékeket, amelyeket csillag (*) jelöl.

5. lépés

Menjen vissza az adatfájlba, és keresse meg a törölni kívánt eseteket. Alulról felfelé haladva jelölje ki a bal szélső számot a szürke oszlopban, így a teljes sor ki van jelölve. Kattintson a "Szerkesztés" gombra, és válassza a "Törlés" lehetőséget. Ismételje meg ezt a lépést minden olyan kiugró értéknél, amelyet a boxplotban azonosított.

Figyelem

A 2. szakasz 5. lépésében szereplő esetek törlésekor mindig az adatfájl aljától kezdődően haladjon felfelé, mert az azonosítószámok megváltoznak az esetek törlésekor. Ha felülről lefelé dolgozik, akkor a végén a rossz eseteket törli.