Jak používat fiktivní proměnné v regresi Excelu

click fraud protection

Načtěte nástroj pro analýzu dat z doplňků aplikace Excel, které jsou součástí všech verzí aplikace Excel. Musíte to udělat, chcete-li provést regresi nebo jakýkoli jiný typ analýzy dat. Kliknutím na "Nástroje" se otevře rozbalovací nabídka. Vyberte „Doplňky“ a z nabídky, která se otevře, zaškrtněte „Analysis ToolPak“ a klikněte na „OK“. "Analýza dat" by se měla objevit v nabídce Nástroje.

Zadejte data, která použijete pro regresi, do listu aplikace Excel, přičemž jakékoli fiktivní proměnné zakódujte hodnotou 1 nebo 0 v závislosti na tom, zda má subjekt danou charakteristiku. Pohlaví je příkladem fiktivní proměnné, protože subjekty studie mohou být pouze muži nebo ženy. Studie skóre přijímacích zkoušek na vysokou školu, která zahrnovala například pohlaví předmětů, by mohla kódovat studentky s 1. Použití fiktivních proměnných mezi nezávislými proměnnými nevyžaduje žádné speciální funkce v Excelu. Pamatujte, že pokud má fiktivní proměnná pouze dvě kategorie (jako muž nebo žena), stačí k reprezentaci těchto dvou kategorií pouze jedna proměnná.

Kódujte kategorické proměnné s více než dvěma kategoriemi jako více fiktivních proměnných a ujistěte se, že počet proměnných je o jednu menší než počet kategorií (n-1, statisticky). Například kategorie etnicita vyjádřená jako pět úrovní (bílá, černá, hispánská, asijská, indiánská) by vyžadovala čtyři samostatné fiktivní proměnné. Pokud jste například studovali skóre přijímacích zkoušek na vysokou školu, mohli byste vytvořit následující figurínu proměnné: černošský, hispánský, asijský a americký indián, každý s kódováním 1, pokud dotyčný student odpovídá danému etniku kategorie.

Rozšiřte schopnost Excelu pro regresi pomocí fiktivních proměnných pomocí doplňku, který umožní programu provádět regrese s fiktivními závislými proměnnými. Jedním z takových programů je XLStat, který lze zakoupit a stáhnout od výrobce Addinsoft. Programy, jako je tento, vám umožňují provádět regrese, ve kterých závislá proměnná nabývá hodnot nebo buď 1 nebo 0.

Varování

Běžnou chybou mezi začátečníky je použití tolika fiktivních proměnných, kolik je kategorií (jako jsou například dvě fiktivní proměnné pro muže a ženy). Takový přístup by vytvořil multikolinearitu, ve které jsou dvě nezávislé proměnné vysoce korelované, takže je téměř nemožné určit jejich samostatné účinky na závislou proměnnou. Pamatujte, že počet fiktivních proměnných by měl být vždy o jednu menší než počet kategorií.