Laadige andmeanalüüsi tööriist Exceli lisandmoodulitest, mis sisalduvad kõigis Exceli versioonides. Peate seda tegema regressiooni või mis tahes muud tüüpi andmete analüüsi läbiviimiseks. Klõpsates "Tööriistad", avaneb rippmenüü. Valige "Lisandmoodulid" ja avanevas menüüs märkige ruut "Analysis ToolPak" ja klõpsake "OK". "Andmete analüüs" peaks ilmuma teie menüüsse Tööriistad.
Sisestage andmed, mida regressiooniks kasutate, Exceli töölehel, kodeerides kõik näivad muutujad väärtusega 1 või 0, olenevalt sellest, kas subjektil on kõnealune omadus. Sugu on näivmuutuja näide, kuna uuringu subjektid võivad olla ainult mehed või naised. Kolledži sisseastumiseksamite skooride uuring, mis hõlmas näiteks subjektide sugu, võiks naisüliõpilasi kodeerida 1-ga. Nähtavate muutujate kasutamine sõltumatute muutujate hulgas ei nõua Excelis erifunktsioone. Pidage meeles, et kui näivmuutujal on ainult kaks kategooriat (näiteks mees või naine), on kahe kategooria esindamiseks vaja ainult ühte muutujat.
Koodeerige enam kui kahe kategooriaga kategooria muutujad mitme näivmuutujana, veendudes, et muutujate arv on kategooriate arvust ühe võrra väiksem (statistilises mõttes n-1). Näiteks viie tasemena väljendatud etnilise kuuluvuse kategooria (valge, must, hispaanlane, Aasia, Ameerika indiaanlane) nõuaks nelja eraldi näivmuutujat. Näiteks kui uurisite kolledži sisseastumiseksamite hindeid, saate luua järgmise mannekeeni muutujad: must, hispaanlane, Aasia ja Ameerika indiaanlane, kodeerides igaüks 1-ga, kui kõnealune õpilane sobib sellele rahvusele kategooria.
Laiendage Exceli dummy-muutujate regressioonivõimet lisandmooduliga, mis võimaldab programmil teha regressioone näivate sõltuvate muutujatega. Üks selline programm on XLStat, mida saab osta ja alla laadida tootjalt Addinsoft. Sellised programmid võimaldavad teil läbi viia regressioone, kus sõltuv muutuja võtab väärtused või kas 1 või 0.
Hoiatus
Algajate tavaline viga on kasutada nii palju näivaid muutujaid, kui on kategooriaid (näiteks kaks näivmuutujat meeste ja naiste jaoks). Selline lähenemine looks multikollineaarsuse, milles kaks sõltumatut muutujat on tugevas korrelatsioonis, mistõttu on peaaegu võimatu määrata nende eraldi mõju sõltuvale muutujale. Pidage meeles, et näivate muutujate arv peaks alati olema ühe võrra väiksem kui kategooriate arv.