Como remover outliers no SPSS

Outliers são valores extremos que podem influenciar os resultados de uma análise estatística e tirar conclusões imprecisas.

Análise exploratória de dados

Passo 1

Clique em "Analisar". Selecione "Estatísticas descritivas" e depois "Explorar".

Passo 2

Arraste e solte as colunas que contêm os dados da variável dependente na caixa que diz "Lista de dependentes". Clique em "OK".

Passo 3

Remova todos os outliers identificados pelo SPSS nos diagramas de fluxo de caixa, excluindo os pontos de dados individuais. Como alternativa, você pode configurar um filtro para excluir esses pontos de dados.

Passo 4

Selecione "Dados" e, em seguida, "Selecionar casos" e clique em uma condição que tenha os valores extremos que você deseja excluir. Determina um valor para essa condição que exclui somente outliers e nenhum dos pontos de dados não distantes.

Passo 5

Selecione a opção "Se a condição for atendida" na caixa "Selecionar" e depois clique no botão "Sim" logo abaixo dela. Insira a regra de exclusão dos valores extremos que foram determinados na etapa anterior na caixa no canto superior direito. Por exemplo, se você excluiu medidas acima de 74, 5 polegadas da condição "altura", deverá inserir "altura <= 74, 5". Clique em "Continuar" e "OK" para ativar o filtro.

Análise de regressão

Passo 1

No menu "Analisar", selecione "Regressão" e depois "Linear". Selecione as variáveis ​​dependentes e independentes que você deseja analisar.

Passo 2

Clique em "Save" e selecione "Cooking distance". Os valores calculados para a distância de cozimento serão salvos no arquivo de dados como variáveis ​​rotuladas como "COO-1".

Passo 3

Execute um diagrama de fluxo de caixa usando a opção "Gráficos", seguida de "Diagrama de fluxo de caixa". Clique em "Simple" e selecione "Abstracts of independent variables". Escreva "COO-1" na caixa "As caixas representam" e insira o ID ou o nome pelo qual identificar os casos na caixa "Marcar casos por".

Passo 4

Aumente o diagrama de caixa no arquivo de saída clicando duas vezes nele. Tome nota dos casos que estão além das linhas pretas, estes são os seus valores extremos. Você pode optar por excluir todos os outliers ou somente outliers, marcados por um asterisco (*).

Passo 5

Volte para o arquivo de dados e localize os casos que precisam ser excluídos. Trabalhe de baixo para cima, selecione o número na extrema esquerda, na coluna cinza, para que toda a linha seja selecionada. Clique em "Editar" e selecione "Excluir". Repita este passo para cada outlier que você definiu no diagrama de caixa.