Como usar variáveis ​​fictícias na regressão do Excel

Carregue a ferramenta de análise de dados dos suplementos do Excel, incluídos em todas as versões do Excel. Você deve fazer isso para conduzir uma regressão ou qualquer outro tipo de análise de dados. Clicar em "Ferramentas" abre um menu suspenso. Selecione “Add-ins” e no menu que se abre, marque “Analysis ToolPak” e clique em “OK”. "Análise de dados" deve aparecer no menu Ferramentas.

Insira os dados que você usará para sua regressão em uma planilha do Excel, codificando quaisquer variáveis ​​fictícias com o valor 1 ou 0, dependendo se o sujeito tem a característica em questão. O gênero é um exemplo de variável dummy, uma vez que os sujeitos de um estudo podem ser apenas homens ou mulheres. Um estudo das notas do vestibular que incluísse o sexo dos sujeitos, por exemplo, poderia codificar as alunas com 1. O uso de variáveis ​​fictícias entre suas variáveis ​​independentes não requer funções especiais no Excel. Lembre-se de que se uma variável dummy tiver apenas duas categorias (como masculino ou feminino), apenas uma variável é necessária para representar as duas categorias.

Codifique variáveis ​​categóricas com mais de duas categorias como múltiplas variáveis ​​dummy, certificando-se de que o número de variáveis ​​seja um a menos que o número de categorias (n-1, em termos estatísticos). Por exemplo, a categoria etnia expressa em cinco níveis (branco, negro, hispânico, asiático, índio americano) exigiria quatro variáveis ​​dummy separadas. Por exemplo, se você estava estudando as notas do exame de admissão à faculdade, poderia criar o seguinte manequim variáveis: negro, hispânico, asiático e índio americano, codificando cada um 1 se o aluno em questão se enquadrar nessa etnia categoria.

Expanda a capacidade do Excel para regressão com variáveis ​​dummy com um add-in que permitirá ao programa conduzir regressões com variáveis ​​dependentes dummy. Um desses programas é o XLStat, disponível para compra e download no fabricante Addinsoft. Programas como este permitem que você conduza regressões nas quais a variável dependente assume os valores de 1 ou 0.

Aviso

Um erro comum entre iniciantes é usar tantas variáveis ​​dummy quantas forem as categorias (como, por exemplo, duas variáveis ​​dummy para masculino e feminino). Tal abordagem criaria multicolinearidade, na qual duas variáveis ​​independentes são altamente correlacionadas, tornando quase impossível determinar seus efeitos separados na variável dependente. Lembre-se de que o número de variáveis ​​dummy deve sempre um a menos que o número de categorias.