![...](/f/621d172f3b1a1fd75f11f7f3779437fd.jpg)
A kiugró értékek szélsőséges értékek, amelyek torzíthatják a statisztikai elemzés eredményeit, és pontatlan következtetéseket vonhatnak le.
A statisztikai elemzésekben a kiugró értékek szélsőséges értékek, amelyek úgy tűnik, nem illeszkednek az adathalmaz többségéhez. Ha nem távolítják el, ezek a szélsőséges értékek nagy hatással lehetnek az ebből levonható következtetésekre szóban forgó adatokat, mert eltorzíthatják a korrelációs együtthatókat és a legjobban illeszkedő vonalakat a rosszban irány. Az SPSS egyike a számos statisztikai elemző szoftvernek, amelyek használhatók egy adathalmaz értelmezésére, valamint a kiugró értékek azonosítására és eltávolítására.
Feltáró adatelemzés
1. lépés
Kattintson az "Elemzés" gombra. Válassza a „Leíró statisztikák”, majd a „Felfedezés” lehetőséget.
A nap videója
2. lépés
Húzza át a függő változó adatait tartalmazó oszlopokat a „Függő lista” mezőbe. Kattintson az "OK" gombra.
3. lépés
Az egyes adatpontok törlésével távolítson el minden, az SPSS által azonosított kiugró értéket a szár- és levéldiagramokból vagy dobozdiagramokból. Alternatív megoldásként beállíthat egy szűrőt, amely kizárja ezeket az adatpontokat.
4. lépés
Válassza az "Adatok", majd a "Cases kiválasztása" lehetőséget, és kattintson arra a feltételre, amelynél vannak kihagyni kívánt értékek. Határozzon meg egy értéket ennek a feltételnek, amely csak a kiugró értékeket zárja ki, a nem kiugró adatpontok egyikét sem.
5. lépés
A "Kiválasztás" mezőben válassza a "Ha a feltétel kielégítő" lehetőséget, majd kattintson az alatta lévő "Ha" gombra. Írja be az előző lépésben meghatározott kiugró értékek kizárására vonatkozó szabályt a jobb felső sarokban található mezőbe. Ha például kizárja a 74,5 hüvelyk feletti méreteket a „magasság” feltételből, akkor a „magasság < = 74,5” értéket kell megadnia. Kattintson a "Folytatás" és az "OK" gombra a szűrő aktiválásához.
Regresszió analízis
1. lépés
Az „Elemzés” menüben válassza a „Regresszió”, majd a „Lineáris” lehetőséget. Válassza ki az elemezni kívánt függő és független változókat.
2. lépés
Kattintson a "Mentés" gombra, majd válassza a "Főzési távolság" lehetőséget. A Cook-távolságra számított értékek „COO-1” címkével ellátott változókként kerülnek mentésre az adatfájlban.
3. lépés
Futtasson egy boxplotot a „Grafikonok”, majd a „Boxplot” kiválasztásával. Kattintson az "Egyszerű" elemre, és válassza a "Különálló változók összefoglalása" lehetőséget. Belép "COO-1" a "Boxes Represent" feliratú mezőbe, majd adjon meg egy azonosítót vagy nevet, amely alapján azonosíthatja az eseteket a "Cases By" mezőben. doboz.
4. lépés
Nagyítsa fel a boxplotot a kimeneti fájlban dupla kattintással. Jegyezze fel azokat az eseteket, amelyek a fekete vonalakon túl vannak – ezek a kiugró értékek. Dönthet úgy, hogy eltávolítja az összes kiugró értéket, vagy csak a szélső kiugró értékeket, amelyeket csillag (*) jelöl.
5. lépés
Menjen vissza az adatfájlba, és keresse meg a törölni kívánt eseteket. Alulról felfelé haladva jelölje ki a bal szélső számot a szürke oszlopban, így a teljes sor ki van jelölve. Kattintson a "Szerkesztés" gombra, és válassza a "Törlés" lehetőséget. Ismételje meg ezt a lépést minden olyan kiugró értéknél, amelyet a boxplotban azonosított.
Figyelem
A 2. szakasz 5. lépésében szereplő esetek törlésekor mindig az adatfájl aljától kezdődően haladjon felfelé, mert az azonosítószámok megváltoznak az esetek törlésekor. Ha felülről lefelé dolgozik, akkor a végén a rossz eseteket törli.