Como remover outliers em SPSS

...

Outliers são valores extremos que podem distorcer os resultados de uma análise estatística e criar conclusões imprecisas.

Outliers em análises estatísticas são valores extremos que não parecem se ajustar à maioria de um conjunto de dados. Se não forem removidos, esses valores extremos podem ter um grande efeito em quaisquer conclusões que possam ser tiradas do dados em questão, porque eles podem distorcer coeficientes de correlação e linhas de melhor ajuste no direção. O SPSS é um dos vários programas de software de análise estatística que podem ser usados ​​para interpretar um conjunto de dados e identificar e remover valores atípicos.

Análise Exploratória de Dados

Passo 1

Clique em “Analisar”. Selecione “Estatísticas descritivas” seguido de “Explorar”.

Vídeo do dia

Passo 2

Arraste e solte as colunas que contêm os dados da variável dependente na caixa denominada "Lista de dependentes". Clique OK."

etapa 3

Remova quaisquer valores discrepantes identificados pelo SPSS nos gráficos de caule e folhas ou gráficos de caixa, excluindo os pontos de dados individuais. Como alternativa, você pode configurar um filtro para excluir esses pontos de dados.

Passo 4

Selecione "Dados" e depois "Selecionar casos" e clique em uma condição que tenha outliers que deseja excluir. Determine um valor para esta condição que exclua apenas os outliers e nenhum dos pontos de dados não outliers.

Etapa 5

Escolha "Se a condição for satisfeita" na caixa "Selecionar" e clique no botão "Se" logo abaixo dela. Insira a regra para excluir valores discrepantes que você determinou na etapa anterior na caixa no canto superior direito. Por exemplo, se você excluir medidas acima de 74,5 polegadas da condição "altura", deverá inserir "altura <= 74,5". Clique em "Continuar" e "OK" para ativar o filtro.

Análise de regressão

Passo 1

No menu "Analisar", selecione "Regressão" e depois "Linear". Selecione as variáveis ​​dependentes e independentes que deseja analisar.

Passo 2

Clique em “Salvar” e selecione “Distância do cozinheiro”. Os valores calculados para a distância de Cook serão salvos em seu arquivo de dados como variáveis ​​rotuladas "COO-1".

etapa 3

Execute um boxplot selecionando "Graphs" seguido de "Boxplot". Clique em "Simples" e selecione "Resumos de variáveis ​​separadas". Digitar "COO-1" na caixa "Representar Caixas" e, em seguida, insira uma ID ou nome pelo qual identificar os casos em "Identificar Casos por" caixa.

Passo 4

Aumente o boxplot no arquivo de saída clicando duas vezes nele. Anote os casos que estão além das linhas pretas - esses são os valores discrepantes. Você pode escolher remover todos os outliers ou apenas os extremos, que são marcados por uma estrela (*).

Etapa 5

Volte para o arquivo de dados e localize os casos que precisam ser apagados. Trabalhando de baixo para cima, destaque o número na extremidade esquerda, na coluna cinza, de forma que toda a linha seja selecionada. Clique em "Editar" e selecione "Limpar". Repita esta etapa para cada outlier que você identificou no boxplot.

Aviso

Ao apagar casos na Seção 2, etapa 5, sempre trabalhe a partir da parte inferior do arquivo de dados, movendo-se para cima, porque os números de ID mudam quando você apaga um caso. Se você trabalhar de cima para baixo, acabará apagando as caixas erradas.