Odlehlé hodnoty jsou extrémní hodnoty, které mohou zkreslit výsledky statistické analýzy a vytvořit nepřesné závěry.
Odlehlé hodnoty ve statistických analýzách jsou extrémní hodnoty, které se nezdají být v souladu s většinou souboru dat. Pokud nebudou odstraněny, mohou mít tyto extrémní hodnoty velký vliv na jakékoli závěry, které by z nich mohly být vyvozeny dotyčná data, protože mohou zkreslit korelační koeficienty a čáry, které nejlépe zapadnou směr. SPSS je jedním z řady softwarových programů pro statistickou analýzu, které lze použít k interpretaci datové sady a identifikaci a odstranění odlehlých hodnot.
Průzkumná analýza dat
Krok 1
Klikněte na "Analyzovat". Vyberte „Popisné statistiky“ a poté „Prozkoumat“.
Video dne
Krok 2
Přetáhněte sloupce obsahující data závislé proměnné do pole označeného „Seznam závislých“. Klikněte na „OK“.
Krok 3
Odstraňte jakékoli odlehlé hodnoty identifikované pomocí SPSS v grafech stonků a listů nebo krabicových grafech vymazáním jednotlivých datových bodů. Případně můžete nastavit filtr k vyloučení těchto datových bodů.
Krok 4
Vyberte „Data“ a poté „Vybrat případy“ a klikněte na podmínku, která má odlehlé hodnoty, které chcete vyloučit. Určete hodnotu pro tuto podmínku, která vyloučí pouze odlehlé hodnoty a žádný z neodlehlých datových bodů.
Krok 5
V poli "Vybrat" zvolte "Pokud je podmínka splněna" a poté klikněte na tlačítko "Pokud" hned pod ním. Do pole vpravo nahoře zadejte pravidlo pro vyloučení odlehlých hodnot, které jste určili v předchozím kroku. Pokud byste například z podmínky „výška“ vylučovali měření nad 74,5 palce, zadali byste „výška < = 74,5“. Klikněte na "Pokračovat" a "OK" pro aktivaci filtru.
Regresní analýza
Krok 1
V nabídce „Analyzovat“ vyberte „Regrese“ a poté „Lineární“. Vyberte závislé a nezávislé proměnné, které chcete analyzovat.
Krok 2
Klikněte na „Uložit“ a poté vyberte „Vzdálenost kuchaře“. Hodnoty vypočítané pro Cookovu vzdálenost se uloží do vašeho datového souboru jako proměnné označené „COO-1“.
Krok 3
Spusťte boxplot výběrem "Graphs" a následně "Boxplot". Klikněte na „Jednoduché“ a vyberte „Souhrny samostatných proměnných“. Vstupte „COO-1“ do pole označeného „Boxes Represent“ a poté zadejte ID nebo název, podle kterého chcete případy identifikovat v poli „Label Cases By“ krabice.
Krok 4
Dvojitým kliknutím zvětšete boxplot ve výstupním souboru. Poznamenejte si případy, které leží za černými čarami – to jsou vaše odlehlé hodnoty. Můžete se rozhodnout odstranit všechny odlehlé hodnoty nebo pouze ty extrémní, které jsou označeny hvězdičkou (*).
Krok 5
Vraťte se do datového souboru a vyhledejte případy, které je třeba vymazat. Postupem zdola nahoru zvýrazněte číslo zcela vlevo v šedém sloupci, aby byl vybrán celý řádek. Klikněte na „Upravit“ a vyberte „Vymazat“. Opakujte tento krok pro každou odlehlou hodnotu, kterou jste identifikovali z krabicového grafu.
Varování
Při mazání případů v části 2, krok 5, vždy pracujte od spodní části datového souboru a posouvejte se nahoru, protože ID čísla se při mazání případu mění. Pokud budete pracovat shora dolů, nakonec vymažete nesprávná pouzdra.