Hur man använder dummyvariabler i Excel-regression

click fraud protection

Ladda dataanalysverktyget från Excel-tilläggen, som ingår i alla versioner av Excel. Du måste göra detta för att utföra en regression eller någon annan typ av dataanalys. Genom att klicka på "Verktyg" öppnas en rullgardinsmeny. Välj "Tillägg" och från menyn som öppnas, markera "Analysis ToolPak" och klicka på "OK". "Dataanalys" bör visas i menyn Verktyg.

Ange data du ska använda för din regression i ett Excel-kalkylblad, koda eventuella dummyvariabler med värdet 1 eller 0, beroende på om ämnet har egenskapen i fråga. Kön är ett exempel på en dummyvariabel, eftersom en studies ämnen endast kan vara män eller kvinnor. En studie av poäng för högskoleprov som inkluderade ämnens kön, till exempel, skulle kunna koda kvinnliga studenter med en 1. Att använda dummyvariabler bland dina oberoende variabler kräver inga speciella funktioner i Excel. Kom ihåg att om en dummyvariabel bara har två kategorier (som man eller kvinna), behövs bara en variabel för att representera de två kategorierna.

Koda kategoriska variabler med fler än två kategorier som flera dummyvariabler, se till att antalet variabler är en mindre än antalet kategorier (n-1, i statistiska termer). Till exempel skulle kategorin etnicitet uttryckt som fem nivåer (vit, svart, latinamerikansk, asiatisk, indian) kräva fyra separata dummyvariabler. Om du till exempel studerade poäng för inträdesprov på högskola kan du skapa följande dummy variabler: svart, latinamerikansk, asiatisk och indian, kodar var och en en 1 om eleven i fråga passar den etniska kategori.

Utöka Excels kapacitet för regression med dummyvariabler med ett tillägg som gör att programmet kan utföra regressioner med dummyberoende variabler. Ett sådant program är XLStat, som finns att köpa och ladda ner från tillverkaren Addinsoft. Program som detta låter dig utföra regressioner där den beroende variabeln tar värdena eller antingen 1 eller 0.

Varning

Ett vanligt misstag bland nybörjare är att använda lika många dummyvariabler som det finns kategorier (som till exempel två dummyvariabler för manliga och kvinnliga). Ett sådant tillvägagångssätt skulle skapa multikollinearitet, där två oberoende variabler är starkt korrelerade, vilket gör det nästan omöjligt att bestämma deras separata effekter på den beroende variabeln. Kom ihåg att antalet dummyvariabler alltid ska vara en mindre än antalet kategorier.