En finance et en statistique, le coefficient de détermination, également appelé R au carré (ou R2), est une mesure de la relation entre deux ensembles de données utilisés dans un modèle mathématique.
Crédit d'image : ijeab/iStock/GettyImages
En finance et en statistique, le coefficient de détermination, également appelé R au carré (ou R2) est une mesure de la relation entre deux ensembles de données utilisés dans un modèle mathématique. Il représente le rapport de variance dans la variable dépendante qui peut être prédit à partir de la variable indépendante dans le modèle. Il est souvent utilisé dans les analyses de régression pour évaluer les prédictions des résultats futurs en fonction des résultats observés. Vous pouvez calculer le R au carré dans Excel à l'aide de la fonction RSQ.
Coefficient. de détermination dans Excel
Dans Microsoft Excel, la fonction RSQ est utilisée pour déterminer la valeur R au carré pour deux ensembles de points de données. La fonction renvoie le carré du coefficient de corrélation du moment du produit de Pearson, qui mesure la corrélation linéaire entre les variables x et y. Le coefficient de corrélation est toujours compris entre -1 et +1. La valeur renvoyée par RSQ dans Excel est toujours comprise entre 0 et 1 (puisqu'elle est calculée comme le carré d'un coefficient de corrélation, elle ne peut jamais renvoyer une valeur négative).
Vidéo du jour
Syntaxe de la fonction RSQ
La fonction RSQ prend deux ensembles de données comme arguments, appelés connus_x et connu_y. Ces ensembles de données peuvent se présenter sous la forme d'une liste de nombres ou d'une liste ou d'une plage de références de cellules. Par exemple, supposons que vous vouliez effectuer une analyse de régression sur l'argent dépensé pour la publicité par rapport à l'argent dépensé pour la publicité. revenu des ventes, où les dépenses publicitaires mensuelles sont répertoriées dans la colonne A et le revenu mensuel est répertorié dans la colonne B. Vous pouvez utiliser la fonction RSQ en saisissant RSQ(A1:A10,B1:B10), qui utilise les valeurs des lignes 1 à 10 des colonnes A (coûts publicitaires) et B (revenus).
Utilisation des fonctions CORREL et PEARSON
Excel fournit également un moyen de calculer le coefficient de corrélation pour deux ensembles de données à l'aide des fonctions CORREL et PEARSON. Comme la fonction RSQ, CORREL et PEARSON prennent deux plages de valeurs de cellule comme arguments. Prendre le résultat de CORREL ou PEARSON pour trouver le coefficient de corrélation et élever au carré le résultat revient à utiliser la fonction RSQ pour déterminer le coefficient de détermination.
Interprétation des résultats RSQ
Les fonctions CORREL et PEARSON renvoient des valeurs comprises entre -1 et 1. Il s'agit d'une mesure sans dimension de la corrélation positive ou négative entre les deux ensembles de données fournies comme arguments. La valeur de retour de la fonction RSQ est comprise entre 0 et 1, parfois exprimée en pourcentage de 0 à 100. De nombreux analystes pensent qu'un résultat RSQ plus élevé indique un modèle mathématique plus précis, tandis que d'autres dire qu'il est important d'examiner tous les facteurs qui pourraient fausser un résultat élevé ou faible avant de tirer conclusions.
Les experts disent également que vous devriez éviter de comparer les valeurs R au carré pour différents modèles et ensembles de données. Dans les cas où il existe de grandes différences entre le type de données comparées, les résultats peuvent être trompeurs. Il existe des mesures plus complexes pour comparer des modèles que les valeurs R au carré, telles que les tests F et les critères d'information.
Visualisation de l'analyse de régression
Le graphique en nuage de points Excel est le plus souvent utilisé pour montrer les relations entre des ensembles de données lors d'analyses de régression. La plage de valeurs d'un ensemble de données est indiquée sur l'axe horizontal des x et la plage de l'autre ensemble sur l'axe vertical des y. Les points de données sont mappés à l'intersection des valeurs x et y en utilisant des paires de valeurs de chaque ensemble de données.
En utilisant l'exemple de publicité et de vente, où les coûts publicitaires sont répertoriés dans la colonne A et les revenus mensuels dans la colonne B, l'axe horizontal montrerait la fourchette des revenus mensuels et l'axe vertical montrerait la fourchette des publicités frais. Les points de données dans le graphique seraient tracés en examinant les cellules adjacentes dans les colonnes A et B. Le modèle de points résultant peut être utilisé pour visualiser le degré de corrélation entre les variables.