Как удалить выбросы в SPSS

...

Выбросы - это экстремальные значения, которые могут исказить результаты статистического анализа и привести к неточным выводам.

Выбросы в статистическом анализе - это экстремальные значения, которые не соответствуют большей части набора данных. Если их не удалить, эти экстремальные значения могут иметь большое влияние на любые выводы, которые могут быть сделаны из данные, о которых идет речь, потому что они могут исказить коэффициенты корреляции и линии наилучшего соответствия в неправильном направление. SPSS - одна из ряда программ статистического анализа, которые можно использовать для интерпретации набора данных, а также выявления и удаления выпадающих значений.

Исследовательский анализ данных

Шаг 1

Щелкните «Анализировать». Выберите «Описательная статистика», а затем «Исследовать».

Видео дня

Шаг 2

Перетащите столбцы, содержащие данные зависимых переменных, в поле с надписью «Зависимый список». Щелкните "ОК".

Шаг 3

Удалите любые выбросы, выявленные SPSS на диаграммах стволовых и листовых диаграмм или коробчатых диаграммах, удалив отдельные точки данных. Кроме того, вы можете настроить фильтр, чтобы исключить эти точки данных.

Шаг 4

Выберите «Данные», а затем «Выбрать случаи» и щелкните условие, в котором есть выбросы, которые вы хотите исключить. Определите значение для этого условия, которое исключает только выбросы и ни одну из неотступающих точек данных.

Шаг 5

Выберите «Если условие удовлетворено» в поле «Выбрать», а затем нажмите кнопку «Если» под ним. Введите правило исключения выбросов, определенных на предыдущем шаге, в поле в правом верхнем углу. Например, если вы исключили измерения выше 74,5 дюймов из условия «высота», вы должны ввести «высота <= 74,5». Нажмите «Продолжить» и «ОК», чтобы активировать фильтр.

Регрессионный анализ

Шаг 1

В меню «Анализ» выберите «Регрессия», а затем «Линейный». Выберите зависимые и независимые переменные, которые вы хотите проанализировать.

Шаг 2

Нажмите «Сохранить», а затем выберите «Cook's Distance». Значения, рассчитанные для расстояния Кука, будут сохранены в вашем файле данных как переменные с пометкой «COO-1».

Шаг 3

Запустите коробчатую диаграмму, выбрав «Графики», а затем «Коробчатую диаграмму». Щелкните «Простой» и выберите «Сводные данные по отдельным переменным». Входить «COO-1» в поле с надписью «Коробки представляют», а затем введите идентификатор или имя, по которому следует идентифицировать дела в поле «Обозначить случаи по». коробка.

Шаг 4

Увеличьте рамку в выходном файле, дважды щелкнув ее. Обратите внимание на случаи, которые выходят за черную линию - это ваши выбросы. Вы можете удалить все выбросы или только крайние выбросы, отмеченные звездочкой (*).

Шаг 5

Вернитесь в файл данных и найдите дела, которые нужно стереть. Работая снизу вверх, выделите номер в крайнем левом углу серого столбца, чтобы выделить всю строку. Щелкните «Редактировать» и выберите «Очистить». Повторите этот шаг для каждого выброса, который вы определили на диаграмме.

Предупреждение

При стирании дел в Разделе 2, шаг 5, всегда работайте снизу файла данных, двигаясь вверх, потому что идентификационные номера меняются, когда вы стираете дело. Если вы будете работать сверху вниз, вы в конечном итоге сотрете неправильные регистры.