Kako uporabljati navidezne spremenljivke v Excelovi regresiji

click fraud protection

Naložite orodje za analizo podatkov iz Excelovih dodatkov, ki so vključeni v vse različice Excela. To morate storiti, če želite izvesti regresijo ali katero koli drugo vrsto analize podatkov. S klikom na "Orodja" se odpre spustni meni. Izberite »Dodatki« in v meniju, ki se odpre, označite »Paket orodij za analizo« in kliknite »V redu«. "Analiza podatkov" bi se morala prikazati v meniju Orodja.

Podatke, ki jih boste uporabili za regresijo, vnesite v Excelov delovni list in kodirajte vse navidezne spremenljivke z vrednostjo 1 ali 0, odvisno od tega, ali ima subjekt zadevno lastnost. Spol je primer navidezne spremenljivke, saj so subjekti študije lahko samo moški ali ženske. Študija rezultatov sprejemnih izpitov na fakulteto, ki je vključevala spol subjektov, bi lahko na primer kodirala študentke z 1. Uporaba navideznih spremenljivk med neodvisnimi spremenljivkami ne zahteva posebnih funkcij v Excelu. Ne pozabite, da če ima navidezna spremenljivka samo dve kategoriji (na primer moški ali ženska), je za predstavitev dveh kategorij potrebna samo ena spremenljivka.

Kodirajte kategorične spremenljivke z več kot dvema kategorijama kot več navideznih spremenljivk, pri čemer poskrbite, da je število spremenljivk za eno manjše od števila kategorij (n-1, v statističnem smislu). Na primer, kategorija etnične pripadnosti, izražena s petimi stopnjami (beli, črni, latinoameriški, azijski, ameriški Indijanci), bi zahtevala štiri ločene navidezne spremenljivke. Če ste na primer preučevali rezultate sprejemnih izpitov na fakulteto, bi lahko ustvarili naslednjo lutko spremenljivke: temnopolti, španski, azijski in ameriški Indijanci, pri čemer vsaka kodira z 1, če zadevni študent ustreza tej etnični pripadnosti kategorijo.

Razširite Excelovo zmogljivost za regresijo z navideznimi spremenljivkami z dodatkom, ki bo programu omogočil izvajanje regresije z navidezno odvisnimi spremenljivkami. Eden takšnih programov je XLStat, ki je na voljo za nakup in prenos pri izdelovalcu Addinsoft. Programi, kot je ta, vam omogočajo izvajanje regres, v katerih odvisna spremenljivka vzame vrednosti ali 1 ali 0.

Opozorilo

Pogosta napaka začetnikov je uporaba toliko lažnih spremenljivk, kolikor je kategorij (kot sta na primer dve lažni spremenljivki za moške in ženske). Takšen pristop bi ustvaril multikolinearnost, pri kateri sta dve neodvisni spremenljivki močno povezani, zaradi česar je skoraj nemogoče določiti njuna ločena učinka na odvisno spremenljivko. Ne pozabite, da mora biti število lažnih spremenljivk vedno za eno manjše od števila kategorij.