Оутлиерс су екстремне вредности које могу искривити резултате статистичке анализе и створити нетачне закључке.
Оутлиерс у статистичким анализама су екстремне вредности које се не уклапају у већину скупа података. Ако се не уклоне, ове екстремне вредности могу имати велики утицај на све закључке који се могу извући из подаци у питању, јер могу да искриве коефицијенте корелације и линије које се најбоље уклапају у погрешно правац. СПСС је један од бројних софтверских програма за статистичку анализу који се могу користити за тумачење скупа података и идентификацију и уклањање ванредних вредности.
Анализа истраживачких података
Корак 1
Кликните на "Анализа". Изаберите „Дескриптивна статистика“, а затим „Истражи“.
Видео дана
Корак 2
Превуците и отпустите колоне које садрже податке зависне променљиве у оквир са ознаком „Листа зависних“. Кликните на „ОК“.
Корак 3
Уклоните све граничне вредности које је идентификовао СПСС у дијаграмима стабљике и листа или дијаграмима оквира брисањем појединачних тачака података. Алтернативно, можете да подесите филтер да искључите ове тачке података.
Корак 4
Изаберите „Подаци“, а затим „Изаберите случајеве“ и кликните на услов који има изузетке које желите да искључите. Одредите вредност за овај услов која искључује само граничне вредности и ниједну од тачака података који нису ван граница.
Корак 5
Изаберите „Ако је услов задовољан“ у пољу „Изабери“, а затим кликните на дугме „Ако“ одмах испод њега. Унесите правило за изузимање изузетака које сте одредили у претходном кораку у оквир у горњем десном углу. На пример, ако сте изузели мере изнад 74,5 инча из услова „висина“, унели бисте „висина < = 74,5“. Кликните на „Настави“ и „ОК“ да бисте активирали филтер.
Регресиона анализа
Корак 1
У менију „Анализа“ изаберите „Регресија“, а затим „Линеарно“. Изаберите зависне и независне променљиве које желите да анализирате.
Корак 2
Кликните на „Сачувај“, а затим изаберите „Кукова удаљеност“. Вредности израчунате за Кукову удаљеност биће сачуване у вашој датотеци података као променљиве са ознаком „ЦОО-1“.
Корак 3
Покрените дијаграм тако што ћете изабрати „Графови“, а затим „Бокплот“. Кликните на „Једноставно“ и изаберите „Резиме засебних променљивих“. Ентер „ЦОО-1“ у поље са ознаком „Кутије представљају“, а затим унесите ИД или име по коме ћете идентификовати случајеве у „Означавање случајева по“ кутија.
Корак 4
Увећајте оквир у излазној датотеци тако што ћете двапут кликнути на њега. Забележите случајеве који се налазе иза црних линија—ово су ваши одступници. Можете одабрати да уклоните све одступања или само екстремне одлике, које су означене звездицом (*).
Корак 5
Вратите се у датотеку са подацима и пронађите случајеве које треба обрисати. Радећи одоздо према горе, означите број крајње лево, у сивој колони, тако да је цео ред изабран. Кликните на „Уреди“ и изаберите „Обриши“. Поновите овај корак за сваки изузетак који сте идентификовали из оквира.
Упозорење
Када бришете случајеве у одељку 2, корак 5, увек радите од дна датотеке са подацима померајући се нагоре јер се ИД бројеви мењају када избришете случај. Ако радите одозго надоле, на крају ћете избрисати погрешне случајеве.