Jak odstranit odlehlé hodnoty v SPSS

click fraud protection
...

Odlehlé hodnoty jsou extrémní hodnoty, které mohou zkreslit výsledky statistické analýzy a vytvořit nepřesné závěry.

Odlehlé hodnoty ve statistických analýzách jsou extrémní hodnoty, které se nezdají být v souladu s většinou souboru dat. Pokud nebudou odstraněny, mohou mít tyto extrémní hodnoty velký vliv na jakékoli závěry, které by z nich mohly být vyvozeny dotyčná data, protože mohou zkreslit korelační koeficienty a čáry, které nejlépe zapadnou směr. SPSS je jedním z řady softwarových programů pro statistickou analýzu, které lze použít k interpretaci datové sady a identifikaci a odstranění odlehlých hodnot.

Průzkumná analýza dat

Krok 1

Klikněte na "Analyzovat". Vyberte „Popisné statistiky“ a poté „Prozkoumat“.

Video dne

Krok 2

Přetáhněte sloupce obsahující data závislé proměnné do pole označeného „Seznam závislých“. Klikněte na „OK“.

Krok 3

Odstraňte jakékoli odlehlé hodnoty identifikované pomocí SPSS v grafech stonků a listů nebo krabicových grafech vymazáním jednotlivých datových bodů. Případně můžete nastavit filtr k vyloučení těchto datových bodů.

Krok 4

Vyberte „Data“ a poté „Vybrat případy“ a klikněte na podmínku, která má odlehlé hodnoty, které chcete vyloučit. Určete hodnotu pro tuto podmínku, která vyloučí pouze odlehlé hodnoty a žádný z neodlehlých datových bodů.

Krok 5

V poli "Vybrat" zvolte "Pokud je podmínka splněna" a poté klikněte na tlačítko "Pokud" hned pod ním. Do pole vpravo nahoře zadejte pravidlo pro vyloučení odlehlých hodnot, které jste určili v předchozím kroku. Pokud byste například z podmínky „výška“ vylučovali měření nad 74,5 palce, zadali byste „výška < = 74,5“. Klikněte na "Pokračovat" a "OK" pro aktivaci filtru.

Regresní analýza

Krok 1

V nabídce „Analyzovat“ vyberte „Regrese“ a poté „Lineární“. Vyberte závislé a nezávislé proměnné, které chcete analyzovat.

Krok 2

Klikněte na „Uložit“ a poté vyberte „Vzdálenost kuchaře“. Hodnoty vypočítané pro Cookovu vzdálenost se uloží do vašeho datového souboru jako proměnné označené „COO-1“.

Krok 3

Spusťte boxplot výběrem "Graphs" a následně "Boxplot". Klikněte na „Jednoduché“ a vyberte „Souhrny samostatných proměnných“. Vstupte „COO-1“ do pole označeného „Boxes Represent“ a poté zadejte ID nebo název, podle kterého chcete případy identifikovat v poli „Label Cases By“ krabice.

Krok 4

Dvojitým kliknutím zvětšete boxplot ve výstupním souboru. Poznamenejte si případy, které leží za černými čarami – to jsou vaše odlehlé hodnoty. Můžete se rozhodnout odstranit všechny odlehlé hodnoty nebo pouze ty extrémní, které jsou označeny hvězdičkou (*).

Krok 5

Vraťte se do datového souboru a vyhledejte případy, které je třeba vymazat. Postupem zdola nahoru zvýrazněte číslo zcela vlevo v šedém sloupci, aby byl vybrán celý řádek. Klikněte na „Upravit“ a vyberte „Vymazat“. Opakujte tento krok pro každou odlehlou hodnotu, kterou jste identifikovali z krabicového grafu.

Varování

Při mazání případů v části 2, krok 5, vždy pracujte od spodní části datového souboru a posouvejte se nahoru, protože ID čísla se při mazání případu mění. Pokud budete pracovat shora dolů, nakonec vymažete nesprávná pouzdra.