Come utilizzare le variabili fittizie nella regressione di Excel

Carica lo strumento di analisi dei dati dai componenti aggiuntivi di Excel, inclusi in tutte le versioni di Excel. È necessario eseguire questa operazione per condurre una regressione o qualsiasi altro tipo di analisi dei dati. Facendo clic su "Strumenti" si apre un menu a discesa. Seleziona "Componenti aggiuntivi" e dal menu che si apre, seleziona "Analysis ToolPak" e fai clic su "OK". "Analisi dei dati" dovrebbe apparire nel menu Strumenti.

Inserisci i dati che utilizzerai per la tua regressione in un foglio di lavoro Excel, codificando eventuali variabili fittizie con il valore 1 o 0, a seconda che il soggetto abbia la caratteristica in questione. Il genere è un esempio di variabile fittizia, poiché i soggetti di uno studio possono essere solo maschi o femmine. Uno studio sui punteggi degli esami di ammissione all'università che includeva il genere dei soggetti, ad esempio, potrebbe codificare le studentesse con un 1. L'utilizzo di variabili fittizie tra le variabili indipendenti non richiede funzioni speciali in Excel. Ricorda che se una variabile fittizia ha solo due categorie (come maschio o femmina), è necessaria una sola variabile per rappresentare le due categorie.

Codificare le variabili categoriali con più di due categorie come variabili fittizie multiple, assicurandosi che il numero di variabili sia inferiore di uno al numero di categorie (n-1, in termini statistici). Ad esempio, la categoria etnia espressa come cinque livelli (bianco, nero, ispanico, asiatico, indiano d'America) richiederebbe quattro variabili fittizie separate. Ad esempio, se stavi studiando i punteggi dell'esame di ammissione all'università, potresti creare il seguente manichino variabili: nero, ispanico, asiatico e indiano d'America, codificando ciascuno un 1 se lo studente in questione si adatta a quell'etnia categoria.

Espandi la capacità di regressione di Excel con variabili fittizie con un componente aggiuntivo che consentirà al programma di eseguire regressioni con variabili dipendenti fittizie. Uno di questi programmi è XLStat, disponibile per l'acquisto e il download dal produttore, Addinsoft. Programmi come questo consentono di condurre regressioni in cui la variabile dipendente assume i valori o 1 o 0.

Avvertimento

Un errore comune tra i principianti è usare tante variabili fittizie quante sono le categorie (come, ad esempio, due variabili fittizie per maschio e femmina). Un tale approccio creerebbe multicollinearità, in cui due variabili indipendenti sono altamente correlate, rendendo quasi impossibile determinare i loro effetti separati sulla variabile dipendente. Ricorda che il numero di variabili fittizie deve sempre essere inferiore di uno al numero di categorie.