Выбросы - это экстремальные значения, которые могут исказить результаты статистического анализа и привести к неточным выводам.
Выбросы в статистическом анализе - это экстремальные значения, которые не соответствуют большей части набора данных. Если их не удалить, эти экстремальные значения могут иметь большое влияние на любые выводы, которые могут быть сделаны из данные, о которых идет речь, потому что они могут исказить коэффициенты корреляции и линии наилучшего соответствия в неправильном направление. SPSS - одна из ряда программ статистического анализа, которые можно использовать для интерпретации набора данных, а также выявления и удаления выпадающих значений.
Исследовательский анализ данных
Шаг 1
Щелкните «Анализировать». Выберите «Описательная статистика», а затем «Исследовать».
Видео дня
Шаг 2
Перетащите столбцы, содержащие данные зависимых переменных, в поле с надписью «Зависимый список». Щелкните "ОК".
Шаг 3
Удалите любые выбросы, выявленные SPSS на диаграммах стволовых и листовых диаграмм или коробчатых диаграммах, удалив отдельные точки данных. Кроме того, вы можете настроить фильтр, чтобы исключить эти точки данных.
Шаг 4
Выберите «Данные», а затем «Выбрать случаи» и щелкните условие, в котором есть выбросы, которые вы хотите исключить. Определите значение для этого условия, которое исключает только выбросы и ни одну из неотступающих точек данных.
Шаг 5
Выберите «Если условие удовлетворено» в поле «Выбрать», а затем нажмите кнопку «Если» под ним. Введите правило исключения выбросов, определенных на предыдущем шаге, в поле в правом верхнем углу. Например, если вы исключили измерения выше 74,5 дюймов из условия «высота», вы должны ввести «высота <= 74,5». Нажмите «Продолжить» и «ОК», чтобы активировать фильтр.
Регрессионный анализ
Шаг 1
В меню «Анализ» выберите «Регрессия», а затем «Линейный». Выберите зависимые и независимые переменные, которые вы хотите проанализировать.
Шаг 2
Нажмите «Сохранить», а затем выберите «Cook's Distance». Значения, рассчитанные для расстояния Кука, будут сохранены в вашем файле данных как переменные с пометкой «COO-1».
Шаг 3
Запустите коробчатую диаграмму, выбрав «Графики», а затем «Коробчатую диаграмму». Щелкните «Простой» и выберите «Сводные данные по отдельным переменным». Входить «COO-1» в поле с надписью «Коробки представляют», а затем введите идентификатор или имя, по которому следует идентифицировать дела в поле «Обозначить случаи по». коробка.
Шаг 4
Увеличьте рамку в выходном файле, дважды щелкнув ее. Обратите внимание на случаи, которые выходят за черную линию - это ваши выбросы. Вы можете удалить все выбросы или только крайние выбросы, отмеченные звездочкой (*).
Шаг 5
Вернитесь в файл данных и найдите дела, которые нужно стереть. Работая снизу вверх, выделите номер в крайнем левом углу серого столбца, чтобы выделить всю строку. Щелкните «Редактировать» и выберите «Очистить». Повторите этот шаг для каждого выброса, который вы определили на диаграмме.
Предупреждение
При стирании дел в Разделе 2, шаг 5, всегда работайте снизу файла данных, двигаясь вверх, потому что идентификационные номера меняются, когда вы стираете дело. Если вы будете работать сверху вниз, вы в конечном итоге сотрете неправильные регистры.