En finanzas y estadística, el coeficiente de determinación, también conocido como R cuadrado (o R2), es una medida de la relación entre dos conjuntos de datos utilizados en un modelo matemático.
Credito de imagen: ijeab / iStock / GettyImages
En finanzas y estadísticas, la coeficiente de determinación, también conocido como R-cuadrado (o R2) es una medida de la relación entre dos conjuntos de datos utilizados en un modelo matemático. Representa la razón de la varianza en la variable dependiente que se puede predecir a partir de la variable independiente en el modelo. A menudo se usa en análisis de regresión para evaluar predicciones de resultados futuros basados en resultados observados. Puede calcular R-cuadrado en Excel usando la función RSQ.
Coeficiente. de Determinación en Excel
En Microsoft Excel, la función RSQ se utiliza para determinar el valor R cuadrado para dos conjuntos de puntos de datos. La función devuelve el cuadrado del coeficiente de correlación del momento del producto de Pearson, que mide la correlación lineal entre las variables xey. El coeficiente de correlación siempre cae dentro del rango de -1 y +1. El valor devuelto por RSQ en Excel siempre está entre 0 y 1 (dado que se calcula como el cuadrado de un coeficiente de correlación, nunca puede devolver un valor negativo).
Video del día
Sintaxis de la función RSQ
La función RSQ toma dos conjuntos de datos como argumentos, denominados conocido_x y conocido_y. Estos conjuntos de datos pueden tener la forma de una lista de números o una lista o rango de referencias de celda. Por ejemplo, supongamos que desea realizar un análisis de regresión sobre el dinero gastado en publicidad vs. ingresos por ventas, donde los gastos publicitarios mensuales se enumeran en la columna A y los ingresos mensuales se enumeran en la columna B. Puede usar la función RSQ ingresando RSQ (A1: A10, B1: B10), que usa valores en las filas 1 a 10 de las columnas A (costos publicitarios) y B (ingresos).
Uso de las funciones CORREL y PEARSON
Excel también proporciona una forma de calcular el coeficiente de correlación para dos conjuntos de datos utilizando las funciones CORREL y PEARSON. Al igual que la función RSQ, tanto CORREL como PEARSON toman dos rangos de valores de celda como argumentos. Tomar el resultado de CORREL o PEARSON para encontrar el coeficiente de correlación y elevar el resultado al cuadrado es lo mismo que usar la función RSQ para determinar el coeficiente de determinación.
Interpretación de los resultados de RSQ
Las funciones CORREL y PEARSON devuelven valores entre -1 y 1. Ésta es una medida adimensional de correlación positiva o negativa entre los dos conjuntos de datos proporcionados como argumentos. El valor de retorno de la función RSQ está entre 0 y 1, a veces expresado como un porcentaje de 0 a 100. Muchos analistas creen que un resultado RSQ más alto indica un modelo matemático más preciso, mientras que otros dicen que es importante tener en cuenta todos los factores que podrían sesgar un resultado alto o bajo antes de dibujar conclusiones.
Los expertos también dicen que debe evitar comparar valores de R cuadrado para diferentes modelos y conjuntos de datos. En los casos en que existen grandes diferencias entre el tipo de datos que se comparan, los resultados pueden ser engañosos. Hay medidas más complicadas para comparar modelos que los valores de R-cuadrado, como las pruebas F y los criterios de información.
Visualización del análisis de regresión
El gráfico de dispersión de Excel se utiliza con mayor frecuencia para mostrar relaciones entre conjuntos de datos durante los análisis de regresión. El rango de valores para un conjunto de datos se muestra en el eje x horizontal y el rango para el otro conjunto en el eje y vertical. Los puntos de datos se asignan a la intersección de los valores xey mediante el uso de pares de valores de cada conjunto de datos.
Utilizando el ejemplo de publicidad y ventas, donde los costos publicitarios se enumeran en la columna A y los ingresos mensuales en la columna B, el eje horizontal mostraría el rango de ingresos mensuales y el vertical mostraría el rango de publicidad costos. Los puntos de datos en el gráfico se trazarían observando las celdas adyacentes en la columna A y la columna B. El patrón de puntos resultante se puede utilizar para visualizar la cantidad de correlación entre las variables.