Cómo utilizar variables ficticias en la regresión de Excel

Cargue la herramienta de análisis de datos desde los complementos de Excel, incluidos en todas las versiones de Excel. Debe hacer esto para realizar una regresión o cualquier otro tipo de análisis de datos. Al hacer clic en "Herramientas" se abre un menú desplegable. Seleccione "Complementos" y en el menú que se abre, marque "Herramientas de análisis" y haga clic en "Aceptar". "Análisis de datos" debería aparecer en el menú Herramientas.

Ingrese los datos que usará para su regresión en una hoja de cálculo de Excel, codificando cualquier variable ficticia con el valor 1 o 0, dependiendo de si el sujeto tiene la característica en cuestión. El género es un ejemplo de una variable ficticia, ya que los sujetos de un estudio pueden ser solo hombres o mujeres. Un estudio de los puntajes de los exámenes de ingreso a la universidad que incluyan el género de las materias, por ejemplo, podría codificar a las estudiantes con un 1. El uso de variables ficticias entre sus variables independientes no requiere funciones especiales en Excel. Recuerde que si una variable ficticia tiene solo dos categorías (como hombre o mujer), solo se necesita una variable para representar las dos categorías.

Codifique variables categóricas con más de dos categorías como múltiples variables ficticias, asegurándose de que el número de variables sea uno menos que el número de categorías (n-1, en términos estadísticos). Por ejemplo, la categoría etnia expresada en cinco niveles (blanco, negro, hispano, asiático, indio americano) requeriría cuatro variables ficticias separadas. Por ejemplo, si estuviera estudiando los puntajes de los exámenes de ingreso a la universidad, podría crear la siguiente variable ficticia variables: negro, hispano, asiático e indio americano, codificando cada uno con un 1 si el estudiante en cuestión se ajusta a esa etnia categoría.

Amplíe la capacidad de Excel para la regresión con variables ficticias con un complemento que permitirá al programa realizar regresiones con variables dependientes ficticias. Uno de esos programas es XLStat, disponible para su compra y descarga del fabricante, Addinsoft. Programas como este le permiten realizar regresiones en las que la variable dependiente toma los valores o 1 o 0.

Advertencia

Un error común entre los principiantes es utilizar tantas variables ficticias como categorías (como, por ejemplo, dos variables ficticias para hombres y mujeres). Tal enfoque crearía multicolinealidad, en la que dos variables independientes están altamente correlacionadas, haciendo casi imposible determinar sus efectos separados sobre la variable dependiente. Recuerde que el número de variables ficticias siempre debe ser uno menos que el número de categorías.