Kako koristiti lažne varijable u Excel regresiji

click fraud protection

Učitajte alat za analizu podataka iz programskih dodataka programa Excel, uključenih u sve verzije Excela. To morate učiniti kako biste izvršili regresiju ili bilo koju drugu vrstu analize podataka. Klikom na "Alati" otvara se padajući izbornik. Odaberite "Dodaci" i na izborniku koji se otvori označite "Paket alata za analizu" i kliknite "U redu". "Analiza podataka" trebala bi se pojaviti u vašem izborniku Alati.

Unesite podatke koje ćete koristiti za svoju regresiju u radni list programa Excel, šifrirajući sve lažne varijable s vrijednošću 1 ili 0, ovisno o tome ima li subjekt dotičnu karakteristiku. Spol je primjer lažne varijable, budući da subjekti studije mogu biti samo muškarci ili žene. Studija rezultata prijemnih ispita na fakultetu koja je uključivala spol ispitanika, na primjer, mogla bi kodirati studentice s 1. Korištenje lažnih varijabli među vašim nezavisnim varijablama ne zahtijeva posebne funkcije u Excelu. Zapamtite da ako lažna varijabla ima samo dvije kategorije (kao što je muško ili žensko), potrebna je samo jedna varijabla za predstavljanje dviju kategorija.

Kodirajte kategoričke varijable s više od dvije kategorije kao više lažnih varijabli, pazeći da je broj varijabli za jedan manji od broja kategorija (n-1, u statističkom smislu). Na primjer, kategorija etničke pripadnosti izražena kao pet razina (bijelac, crnac, Hispanjolci, Azijci, američki Indijanci) zahtijevala bi četiri zasebne lažne varijable. Na primjer, ako ste proučavali rezultate prijemnog ispita na fakultetu, mogli biste kreirati sljedeću lutku varijable: crnac, latinoamerikanac, azijski i američki Indijanci, svaki kodira s 1 ako dotični učenik odgovara toj etničkoj pripadnosti kategorija.

Proširite Excelov kapacitet za regresiju s lažnim varijablama s dodatkom koji će programu omogućiti provođenje regresije s lažnim ovisnim varijablama. Jedan takav program je XLStat, dostupan za kupnju i preuzimanje od proizvođača, Addinsoft. Programi poput ovog omogućuju vam da provodite regresije u kojima zavisna varijabla uzima vrijednosti ili 1 ili 0.

Upozorenje

Česta pogreška među početnicima je korištenje onoliko lažnih varijabli koliko postoji kategorija (kao što su, na primjer, dvije lažne varijable za muškarce i žene). Takav pristup stvorio bi multikolinearnost, u kojoj su dvije nezavisne varijable u visokoj korelaciji, što čini gotovo nemogućim određivanje njihovih zasebnih učinaka na ovisnu varijablu. Zapamtite da broj lažnih varijabli uvijek treba za jedan manji od broja kategorija.