So verwenden Sie Dummy-Variablen in der Excel-Regression

Laden Sie das Datenanalysetool aus den Excel-Add-Ins, die in allen Excel-Versionen enthalten sind. Sie müssen dies tun, um eine Regression oder eine andere Art von Datenanalyse durchzuführen. Ein Klick auf "Extras" öffnet ein Dropdown-Menü. Wählen Sie "Add-Ins" und aktivieren Sie im sich öffnenden Menü "Analysis ToolPak" und klicken Sie auf "OK". "Datenanalyse" sollte in Ihrem Tools-Menü erscheinen.

Geben Sie die Daten, die Sie für Ihre Regression verwenden werden, in ein Excel-Arbeitsblatt ein und codieren Sie alle Dummy-Variablen mit dem Wert 1 oder 0, je nachdem, ob das Subjekt das fragliche Merkmal hat. Das Geschlecht ist ein Beispiel für eine Dummy-Variable, da die Probanden einer Studie nur männlich oder weiblich sein können. Eine Studie über die Ergebnisse von College-Aufnahmeprüfungen, die beispielsweise das Geschlecht der Fächer beinhaltet, könnte weibliche Studenten mit einer 1 codieren. Die Verwendung von Dummy-Variablen unter Ihren unabhängigen Variablen erfordert keine speziellen Funktionen in Excel. Denken Sie daran, dass, wenn eine Dummy-Variable nur zwei Kategorien hat (wie männlich oder weiblich), nur eine Variable benötigt wird, um die beiden Kategorien darzustellen.

Kodieren Sie kategoriale Variablen mit mehr als zwei Kategorien als mehrere Dummy-Variablen, und stellen Sie sicher, dass die Anzahl der Variablen um eins kleiner ist als die Anzahl der Kategorien (n-1, in statistischer Hinsicht). Beispielsweise würde die Kategorie Ethnizität, die in fünf Stufen (weiß, schwarz, hispanisch, asiatisch, indisch) ausgedrückt wird, vier separate Dummy-Variablen erfordern. Wenn Sie beispielsweise die Noten der College-Aufnahmeprüfung studiert haben, können Sie den folgenden Dummy erstellen Variablen: schwarz, hispanisch, asiatisch und indisch, jeweils mit 1 kodiert, wenn der betreffende Schüler zu dieser ethnischen Gruppe passt Kategorie.

Erweitern Sie die Regressionskapazität von Excel mit Dummy-Variablen mit einem Add-In, das es dem Programm ermöglicht, Regressionen mit Dummy-abhängigen Variablen durchzuführen. Ein solches Programm ist XLStat, das beim Hersteller Addinsoft gekauft und heruntergeladen werden kann. Programme wie dieses ermöglichen es Ihnen, Regressionen durchzuführen, bei denen die abhängige Variable die Werte oder entweder 1 oder 0 annimmt.

Warnung

Ein häufiger Fehler bei Anfängern besteht darin, so viele Dummy-Variablen zu verwenden, wie es Kategorien gibt (wie zum Beispiel zwei Dummy-Variablen für männlich und weiblich). Ein solcher Ansatz würde zu Multikollinearität führen, bei der zwei unabhängige Variablen stark korreliert sind, wodurch es fast unmöglich wäre, ihre getrennten Auswirkungen auf die abhängige Variable zu bestimmen. Denken Sie daran, dass die Anzahl der Dummy-Variablen immer eins weniger als die Anzahl der Kategorien sein sollte.