Odľahlé hodnoty sú extrémne hodnoty, ktoré môžu skresliť výsledky štatistickej analýzy a vytvoriť nepresné závery.
Odľahlé hodnoty v štatistických analýzach sú extrémne hodnoty, ktoré sa nezdajú byť v súlade s väčšinou súboru údajov. Ak sa tieto extrémne hodnoty neodstránia, môžu mať veľký vplyv na akékoľvek závery, ktoré by sa z nich dali vyvodiť príslušné údaje, pretože môžu skresliť korelačné koeficienty a čiary, ktoré najlepšie zapadajú smer. SPSS je jedným z množstva softvérových programov na štatistickú analýzu, ktoré možno použiť na interpretáciu súboru údajov a identifikáciu a odstránenie odľahlých hodnôt.
Prieskumná analýza údajov
Krok 1
Kliknite na „Analyzovať“. Vyberte „Popisná štatistika“ a potom „Preskúmať“.
Video dňa
Krok 2
Presuňte stĺpce obsahujúce údaje závislej premennej do poľa s názvom „Zoznam závislých“. Kliknite na „OK“.
Krok 3
Odstráňte všetky odľahlé hodnoty identifikované pomocou SPSS na grafoch stonky a listu alebo krabicových grafoch vymazaním jednotlivých údajových bodov. Prípadne môžete nastaviť filter na vylúčenie týchto údajových bodov.
Krok 4
Vyberte „Údaje“ a potom „Vybrať prípady“ a kliknite na stav, ktorý má odľahlé hodnoty, ktoré chcete vylúčiť. Určte hodnotu pre túto podmienku, ktorá vylučuje iba odľahlé hodnoty a žiadny z neodľahlých údajových bodov.
Krok 5
V poli "Vybrať" zvoľte "Ak je podmienka splnená" a potom kliknite na tlačidlo "Ak" hneď pod ním. Do poľa vpravo hore zadajte pravidlo na vylúčenie odľahlých hodnôt, ktoré ste určili v predchádzajúcom kroku. Ak by ste napríklad z podmienky „výška“ vylúčili miery nad 74,5 palca, zadali by ste „výška < = 74,5“. Kliknutím na „Pokračovať“ a „OK“ aktivujte filter.
Regresná analýza
Krok 1
V ponuke „Analyzovať“ vyberte „Regresia“ a potom „Lineárne“. Vyberte závislé a nezávislé premenné, ktoré chcete analyzovať.
Krok 2
Kliknite na „Uložiť“ a potom vyberte „Vzdialenosť kuchára“. Hodnoty vypočítané pre Cookovu vzdialenosť sa uložia do vášho dátového súboru ako premenné označené „COO-1“.
Krok 3
Spustite boxplot výberom "Graphs" a následne "Boxplot". Kliknite na „Jednoduché“ a vyberte „Súhrny samostatných premenných“. Zadajte "COO-1" do poľa označeného "Boxes Represent" a potom zadajte ID alebo názov, podľa ktorého identifikujete prípady v "Label Cases By" box.
Krok 4
Boxplot vo výstupnom súbore zväčšíte dvojitým kliknutím. Poznačte si prípady, ktoré ležia za čiernymi čiarami – toto sú vaše odľahlé hodnoty. Môžete sa rozhodnúť odstrániť všetky odľahlé hodnoty alebo len extrémne odľahlé hodnoty, ktoré sú označené hviezdičkou (*).
Krok 5
Vráťte sa do dátového súboru a nájdite prípady, ktoré je potrebné vymazať. Postupujte zdola nahor a zvýraznite číslo úplne vľavo v sivom stĺpci, aby sa vybral celý riadok. Kliknite na „Upraviť“ a vyberte „Vymazať“. Opakujte tento krok pre každú odľahlú hodnotu, ktorú ste identifikovali v rámčeku.
Pozor
Pri vymazávaní puzdier v časti 2, krok 5, vždy pracujte od spodnej časti dátového súboru a posúvajte sa nahor, pretože identifikačné čísla sa pri vymazaní puzdra menia. Ak budete pracovať zhora nadol, skončíte vymazaním nesprávnych prípadov.