Ako odstrániť odľahlé hodnoty v SPSS

click fraud protection
...

Odľahlé hodnoty sú extrémne hodnoty, ktoré môžu skresliť výsledky štatistickej analýzy a vytvoriť nepresné závery.

Odľahlé hodnoty v štatistických analýzach sú extrémne hodnoty, ktoré sa nezdajú byť v súlade s väčšinou súboru údajov. Ak sa tieto extrémne hodnoty neodstránia, môžu mať veľký vplyv na akékoľvek závery, ktoré by sa z nich dali vyvodiť príslušné údaje, pretože môžu skresliť korelačné koeficienty a čiary, ktoré najlepšie zapadajú smer. SPSS je jedným z množstva softvérových programov na štatistickú analýzu, ktoré možno použiť na interpretáciu súboru údajov a identifikáciu a odstránenie odľahlých hodnôt.

Prieskumná analýza údajov

Krok 1

Kliknite na „Analyzovať“. Vyberte „Popisná štatistika“ a potom „Preskúmať“.

Video dňa

Krok 2

Presuňte stĺpce obsahujúce údaje závislej premennej do poľa s názvom „Zoznam závislých“. Kliknite na „OK“.

Krok 3

Odstráňte všetky odľahlé hodnoty identifikované pomocou SPSS na grafoch stonky a listu alebo krabicových grafoch vymazaním jednotlivých údajových bodov. Prípadne môžete nastaviť filter na vylúčenie týchto údajových bodov.

Krok 4

Vyberte „Údaje“ a potom „Vybrať prípady“ a kliknite na stav, ktorý má odľahlé hodnoty, ktoré chcete vylúčiť. Určte hodnotu pre túto podmienku, ktorá vylučuje iba odľahlé hodnoty a žiadny z neodľahlých údajových bodov.

Krok 5

V poli "Vybrať" zvoľte "Ak je podmienka splnená" a potom kliknite na tlačidlo "Ak" hneď pod ním. Do poľa vpravo hore zadajte pravidlo na vylúčenie odľahlých hodnôt, ktoré ste určili v predchádzajúcom kroku. Ak by ste napríklad z podmienky „výška“ vylúčili miery nad 74,5 palca, zadali by ste „výška < = 74,5“. Kliknutím na „Pokračovať“ a „OK“ aktivujte filter.

Regresná analýza

Krok 1

V ponuke „Analyzovať“ vyberte „Regresia“ a potom „Lineárne“. Vyberte závislé a nezávislé premenné, ktoré chcete analyzovať.

Krok 2

Kliknite na „Uložiť“ a potom vyberte „Vzdialenosť kuchára“. Hodnoty vypočítané pre Cookovu vzdialenosť sa uložia do vášho dátového súboru ako premenné označené „COO-1“.

Krok 3

Spustite boxplot výberom "Graphs" a následne "Boxplot". Kliknite na „Jednoduché“ a vyberte „Súhrny samostatných premenných“. Zadajte "COO-1" do poľa označeného "Boxes Represent" a potom zadajte ID alebo názov, podľa ktorého identifikujete prípady v "Label Cases By" box.

Krok 4

Boxplot vo výstupnom súbore zväčšíte dvojitým kliknutím. Poznačte si prípady, ktoré ležia za čiernymi čiarami – toto sú vaše odľahlé hodnoty. Môžete sa rozhodnúť odstrániť všetky odľahlé hodnoty alebo len extrémne odľahlé hodnoty, ktoré sú označené hviezdičkou (*).

Krok 5

Vráťte sa do dátového súboru a nájdite prípady, ktoré je potrebné vymazať. Postupujte zdola nahor a zvýraznite číslo úplne vľavo v sivom stĺpci, aby sa vybral celý riadok. Kliknite na „Upraviť“ a vyberte „Vymazať“. Opakujte tento krok pre každú odľahlú hodnotu, ktorú ste identifikovali v rámčeku.

Pozor

Pri vymazávaní puzdier v časti 2, krok 5, vždy pracujte od spodnej časti dátového súboru a posúvajte sa nahor, pretože identifikačné čísla sa pri vymazaní puzdra menia. Ak budete pracovať zhora nadol, skončíte vymazaním nesprávnych prípadov.