Как да премахнете отклоненията в SPSS

click fraud protection
...

Отклоненията са екстремни стойности, които могат да изкривят резултатите от статистически анализ и да създадат неточни заключения.

Отклоненията в статистическите анализи са екстремни стойности, които изглежда не отговарят на по-голямата част от набора от данни. Ако не бъдат премахнати, тези екстремни стойности могат да имат голям ефект върху всички заключения, които могат да бъдат направени от въпросните данни, тъй като те могат да изкривят коефициентите на корелация и линиите на най-добро съвпадение в погрешно състояние посока. SPSS е една от редицата софтуерни програми за статистически анализ, които могат да се използват за интерпретиране на набор от данни и идентифициране и премахване на отдалечени стойности.

Анализ на проучвателните данни

Етап 1

Кликнете върху "Анализ". Изберете „Описателна статистика“, последвано от „Изследване“.

Видео на деня

Стъпка 2

Плъзнете и пуснете колоните, съдържащи данните за зависимата променлива, в полето с надпис „Списък с зависими“. Щракнете върху „OK“.

Стъпка 3

Премахнете всички отклонения, идентифицирани от SPSS в графиките на стъблото и листата или графиките на кутията, като изтриете отделните точки от данни. Като алтернатива можете да настроите филтър, за да изключите тези точки от данни.

Стъпка 4

Изберете „Данни“ и след това „Избор на случаи“ и щракнете върху условие, което има отклонения, които искате да изключите. Определете стойност за това условие, която изключва само отклоненията и нито една от неотдалечените точки от данни.

Стъпка 5

Изберете „Ако условието е удовлетворено“ в полето „Избор“ и след това щракнете върху бутона „Ако“ точно под него. Въведете правилото за изключване на извънредни стойности, които сте определили в предишната стъпка, в полето в горния десен ъгъл. Например, ако изключвате измервания над 74,5 инча от условието „височина“, ще въведете „височина < = 74,5“. Щракнете върху "Продължи" и "OK", за да активирате филтъра.

Регресионен анализ

Етап 1

В менюто „Анализ“ изберете „Регресия“ и след това „Линеен“. Изберете зависимите и независимите променливи, които искате да анализирате.

Стъпка 2

Щракнете върху „Запазване“ и след това изберете „Разстояние на Кук“. Стойностите, изчислени за разстоянието на Кук, ще бъдат записани във вашия файл с данни като променливи с надпис „COO-1“.

Стъпка 3

Стартирайте полето, като изберете "Графики", последвано от "Контролен график". Кликнете върху „Просто“ и изберете „Резюме на отделни променливи“. Въведете „COO-1“ в полето с надпис „Кутиите представляват“ и след това въведете идентификационен номер или име, с които да идентифицирате случаите в „Етикети за случаи по“ кутия.

Стъпка 4

Увеличете полето в изходния файл, като щракнете двукратно върху него. Отбележете случаите, които се намират отвъд черните линии - това са вашите отклонения. Можете да изберете да премахнете всички отклонения или само крайните отклонения, които са маркирани със звезда (*).

Стъпка 5

Върнете се във файла с данни и намерете случаите, които трябва да бъдат изтрити. Работейки отдолу нагоре, маркирайте числото в крайния ляв край, в сивата колона, така че да бъде избран целият ред. Кликнете върху „Редактиране“ и изберете „Изчистване“. Повторете тази стъпка за всеки отклонение, което сте идентифицирали от графиката.

Внимание

Когато изтривате случаи в раздел 2, стъпка 5, винаги работете от дъното на файла с данни, като се движите нагоре, тъй като идентификационните номера се променят, когато изтриете случай. Ако работите отгоре надолу, в крайна сметка ще изтриете грешните случаи.