Hoe dummy-variabelen te gebruiken in Excel-regressie

Laad het hulpprogramma voor gegevensanalyse vanuit de Excel-invoegtoepassingen, die in alle versies van Excel zijn opgenomen. U moet dit doen om een ​​regressie of een ander type gegevensanalyse uit te voeren. Als u op "Extra" klikt, wordt een vervolgkeuzemenu geopend. Selecteer 'Add-ins' en vink 'Analysis ToolPak' in het geopende menu aan en klik op 'OK'. "Data-analyse" zou moeten verschijnen in uw menu Extra.

Voer de gegevens die u voor uw regressie gaat gebruiken in een Excel-werkblad in en codeer eventuele dummyvariabelen met de waarde 1 of 0, afhankelijk van of het onderwerp het kenmerk in kwestie heeft. Geslacht is een voorbeeld van een dummyvariabele, aangezien de proefpersonen van een onderzoek alleen mannelijk of vrouwelijk kunnen zijn. Een onderzoek naar scores voor toelatingsexamens voor een universiteit waarin het geslacht van de proefpersonen is opgenomen, kan bijvoorbeeld vrouwelijke studenten coderen met een 1. Het gebruik van dummy-variabelen tussen uw onafhankelijke variabelen vereist geen speciale functies in Excel. Onthoud dat als een dummyvariabele slechts twee categorieën heeft (zoals mannelijk of vrouwelijk), er slechts één variabele nodig is om de twee categorieën weer te geven.

Codeer categorische variabelen met meer dan twee categorieën als meerdere dummyvariabelen en zorg ervoor dat het aantal variabelen één minder is dan het aantal categorieën (n-1, in statistische termen). Voor de categorie etniciteit, uitgedrukt in vijf niveaus (wit, zwart, Spaans, Aziatisch, Indiaans), zijn bijvoorbeeld vier afzonderlijke dummyvariabelen vereist. Als u bijvoorbeeld de scores voor toelatingsexamens voor de universiteit bestudeert, kunt u de volgende dummy maken: variabelen: zwart, Latijns-Amerikaans, Aziatisch en Indiaas, elk met een 1 als de student in kwestie bij die etnische groep past categorie.

Breid Excel's capaciteit voor regressie uit met dummy-variabelen met een invoegtoepassing waarmee het programma regressies kan uitvoeren met dummy-afhankelijke variabelen. Een zo'n programma is XLStat, beschikbaar voor aankoop en download van de maker, Addinsoft. Met programma's zoals deze kunt u regressies uitvoeren waarbij de afhankelijke variabele de waarden 1 of 0 aanneemt.

Waarschuwing

Een veelgemaakte fout bij beginners is om zoveel dummy-variabelen te gebruiken als er categorieën zijn (zoals bijvoorbeeld twee dummy-variabelen voor mannen en vrouwen). Een dergelijke benadering zou multicollineariteit creëren, waarbij twee onafhankelijke variabelen sterk gecorreleerd zijn, waardoor het bijna onmogelijk is om hun afzonderlijke effecten op de afhankelijke variabele te bepalen. Onthoud dat het aantal dummyvariabelen altijd één minder moet zijn dan het aantal categorieën.