Sådan bruges dummy-variabler i Excel-regression

Indlæs dataanalyseværktøjet fra Excel-tilføjelsesprogrammerne, der er inkluderet i alle versioner af Excel. Du skal gøre dette for at udføre en regression eller enhver anden form for dataanalyse. Ved at klikke på "Værktøjer" åbnes en rullemenu. Vælg "Add-ins", og fra menuen, der åbnes, skal du markere "Analysis ToolPak" og klikke på "OK". "Dataanalyse" skulle vises i din Værktøjsmenu.

Indtast de data, du vil bruge til din regression, i et Excel-regneark, og kod eventuelle dummy-variabler med værdien 1 eller 0, afhængigt af om emnet har den pågældende karakteristik. Køn er et eksempel på en dummy-variabel, da en undersøgelses emner kun kan være mænd eller kvinder. En undersøgelse af scorer på universitetets optagelsesprøver, der for eksempel inkluderede fagets køn, kunne kode kvindelige studerende med en 1. Brug af dummy-variabler blandt dine uafhængige variabler kræver ingen specielle funktioner i Excel. Husk, at hvis en dummy-variabel kun har to kategorier (såsom mand eller kvinde), er der kun behov for én variabel til at repræsentere de to kategorier.

Kod kategoriske variabler med mere end to kategorier som flere dummyvariabler, og sørg for, at antallet af variabler er én mindre end antallet af kategorier (n-1, i statistiske termer). For eksempel ville kategorien etnicitet udtrykt som fem niveauer (hvid, sort, latinamerikansk, asiatisk, amerikansk indisk) kræve fire separate dummy-variabler. Hvis du f.eks. læste resultater til optagelsesprøver på universitetet, kunne du oprette følgende dummy variabler: sort, latinamerikansk, asiatisk og indianer, der koder hver for en 1, hvis den pågældende elev passer til den etniske kategori.

Udvid Excels kapacitet til regression med dummy-variabler med et tilføjelsesprogram, der gør det muligt for programmet at udføre regressioner med dummy-afhængige variable. Et sådant program er XLStat, der kan købes og downloades fra producenten Addinsoft. Programmer som dette giver dig mulighed for at udføre regressioner, hvor den afhængige variabel tager værdierne eller enten 1 eller 0.

Advarsel

En almindelig fejl blandt begyndere er at bruge lige så mange dummy-variabler, som der er kategorier (såsom f.eks. to dummy-variabler for mænd og kvinder). En sådan tilgang ville skabe multikollinearitet, hvor to uafhængige variabler er stærkt korrelerede, hvilket gør det næsten umuligt at bestemme deres separate effekter på den afhængige variabel. Husk, at antallet af dummy-variabler altid skal være én mindre end antallet af kategorier.