Cómo eliminar valores atípicos en SPSS

...

Los valores atípicos son valores extremos que pueden sesgar los resultados de un análisis estadístico y generar conclusiones inexactas.

Los valores atípicos en los análisis estadísticos son valores extremos que no parecen ajustarse a la mayoría de un conjunto de datos. Si no se eliminan, estos valores extremos pueden tener un gran efecto en cualquier conclusión que pueda extraerse de la datos en cuestión, porque pueden sesgar los coeficientes de correlación y las líneas de mejor ajuste en el dirección. SPSS es uno de varios programas de software de análisis estadístico que se pueden utilizar para interpretar un conjunto de datos e identificar y eliminar valores atípicos.

Análisis de datos exploratorios

Paso 1

Haga clic en "Analizar". Seleccione "Estadísticas descriptivas" seguido de "Explorar".

Video del día

Paso 2

Arrastre y suelte las columnas que contienen los datos de la variable dependiente en el cuadro denominado "Lista de dependientes". Haga clic en Aceptar."

Paso 3

Elimine cualquier valor atípico identificado por SPSS en los diagramas de tallo y hojas o diagramas de caja eliminando los puntos de datos individuales. Alternativamente, puede configurar un filtro para excluir estos puntos de datos.

Paso 4

Seleccione "Datos" y luego "Seleccionar casos" y haga clic en una condición que tenga valores atípicos que desee excluir. Determine un valor para esta condición que excluya solo los valores atípicos y ninguno de los puntos de datos no atípicos.

Paso 5

Elija "Si la condición está satisfecha" en el cuadro "Seleccionar" y luego haga clic en el botón "Si" justo debajo. Ingrese la regla para excluir los valores atípicos que determinó en el paso anterior en el cuadro de la esquina superior derecha. Por ejemplo, si excluye las medidas superiores a 74,5 pulgadas de la condición "altura", debe ingresar "altura <= 74,5". Haga clic en "Continuar" y "Aceptar" para activar el filtro.

Análisis de regresión

Paso 1

En el menú "Analizar", seleccione "Regresión" y luego "Lineal". Seleccione las variables dependientes e independientes que desee analizar.

Paso 2

Haga clic en "Guardar" y luego seleccione "Distancia del cocinero". Los valores calculados para la distancia de Cook se guardarán en su archivo de datos como variables etiquetadas como "COO-1".

Paso 3

Ejecute un diagrama de caja seleccionando "Gráficos" seguido de "Diagrama de caja". Haga clic en "Simple" y seleccione "Resúmenes de variables independientes". Ingresar "COO-1" en la casilla "Las cajas representan" y luego ingrese una ID o un nombre con el que identificar los casos en "Etiquetar casos por". caja.

Paso 4

Agrande el diagrama de caja en el archivo de salida haciendo doble clic en él. Tome nota de los casos que se encuentran más allá de las líneas negras; estos son sus valores atípicos. Puede optar por eliminar todos los valores atípicos o solo los valores atípicos extremos, que están marcados con una estrella (*).

Paso 5

Regrese al archivo de datos y localice los casos que deben borrarse. Trabajando de abajo hacia arriba, resalte el número en el extremo izquierdo, en la columna gris, de modo que se seleccione toda la fila. Haga clic en "Editar" y seleccione "Borrar". Repita este paso para cada valor atípico que haya identificado en el diagrama de caja.

Advertencia

Cuando borre casos en la Sección 2, paso 5, trabaje siempre desde la parte inferior del archivo de datos hacia arriba porque los números de identificación cambian cuando borra un caso. Si trabaja de arriba hacia abajo, acabará borrando los casos equivocados.