Cum să utilizați variabile simulate în regresia Excel

Încărcați instrumentul de analiză a datelor din programul de completare Excel, inclus în toate versiunile de Excel. Trebuie să faceți acest lucru pentru a efectua o regresie sau orice alt tip de analiză a datelor. Făcând clic pe „Instrumente” se deschide un meniu derulant. Selectați „Suplimente” și din meniul care se deschide, bifați „Analysis ToolPak” și faceți clic pe „OK”. „Analiza datelor” ar trebui să apară în meniul Instrumente.

Introduceți datele pe care le veți folosi pentru regresie într-o foaie de lucru Excel, codând orice variabile fictive cu valoarea 1 sau 0, în funcție de dacă subiectul are caracteristica în cauză. Sexul este un exemplu de variabilă inactivă, deoarece subiecții unui studiu pot fi doar bărbați sau femei. Un studiu al scorurilor la examenele de admitere la facultate care includea sexul subiecților, de exemplu, ar putea codifica elevele cu un 1. Utilizarea variabilelor fictive printre variabilele independente nu necesită funcții speciale în Excel. Rețineți că, dacă o variabilă inactivă are doar două categorii (cum ar fi bărbat sau femeie), este necesară o singură variabilă pentru a reprezenta cele două categorii.

Codificați variabilele categoriale cu mai mult de două categorii ca variabile fictive multiple, asigurându-vă că numărul de variabile este cu unul mai mic decât numărul de categorii (n-1, în termeni statistici). De exemplu, categoria etniei exprimată ca cinci niveluri (alb, negru, hispanic, asiatic, indian american) ar necesita patru variabile fictive separate. De exemplu, dacă studiați scorurile examenului de admitere la facultate, puteți crea următorul manechin variabile: negru, hispanic, asiatic și indian american, codând fiecare cu 1 dacă elevul în cauză se potrivește acelei etnice categorie.

Extindeți capacitatea Excel de regresie cu variabile fictive cu un add-in care va permite programului să efectueze regresii cu variabile dependente fictive. Un astfel de program este XLStat, disponibil pentru cumpărare și descărcare de la producător, Addinsoft. Programe ca acesta vă permit să efectuați regresii în care variabila dependentă ia valorile fie 1, fie 0.

Avertizare

O greșeală comună în rândul începătorilor este să folosească atâtea variabile fictive câte categorii există (cum ar fi, de exemplu, două variabile fictive pentru bărbați și femei). O astfel de abordare ar crea multicoliniaritate, în care două variabile independente sunt foarte corelate, făcând aproape imposibilă determinarea efectelor lor separate asupra variabilei dependente. Amintiți-vă că numărul de variabile fictive trebuie întotdeauna cu unul mai mic decât numărul de categorii.