In finanza e statistica, il coefficiente di determinazione, noto anche come R-squared (o R2) è una misura della relazione tra due set di dati utilizzati in un modello matematico.
Credito immagine: ijeab/iStock/GettyImages
In finanza e statistica, il coefficiente di determinazione, indicato anche come R-quadrato (o R2) è una misura della relazione tra due set di dati utilizzati in un modello matematico. Rappresenta il rapporto di varianza nella variabile dipendente che può essere previsto dalla variabile indipendente nel modello. Viene spesso utilizzato nelle analisi di regressione per valutare le previsioni dei risultati futuri in base ai risultati osservati. Puoi calcolare R-quadrato in Excel usando la funzione RSQ.
Coefficiente. di Determinazione in Excel
In Microsoft Excel, la funzione RSQ viene utilizzata per determinare il valore R al quadrato per due insiemi di punti dati. La funzione restituisce il quadrato del coefficiente di correlazione del momento del prodotto di Pearson, che misura la correlazione lineare tra le variabili x e y. Il coefficiente di correlazione rientra sempre nell'intervallo -1 e +1. Il valore restituito da RSQ in Excel è sempre compreso tra 0 e 1 (poiché è calcolato come il quadrato di un coefficiente di correlazione, non può mai restituire un valore negativo).
Video del giorno
Sintassi della funzione RSQ
La funzione RSQ accetta due set di dati come argomenti, indicati come x_nota e y_nota. Questi set di dati possono essere sotto forma di un elenco di numeri o un elenco o un intervallo di riferimenti di cella. Ad esempio, supponiamo che tu voglia fare un'analisi di regressione sui soldi spesi per la pubblicità rispetto ai soldi spesi per la pubblicità. reddito dalle vendite, dove le spese pubblicitarie mensili sono elencate nella colonna A e le entrate mensili sono elencate nella colonna B. È possibile utilizzare la funzione RSQ immettendo RSQ(A1:A10,B1:B10), che utilizza i valori nelle righe da 1 a 10 dalle colonne A (costi pubblicitari) e B (reddito).
Utilizzo delle funzioni CORRELAZIONE e PEARSON
Excel fornisce anche un modo per calcolare il coefficiente di correlazione per due set di dati utilizzando le funzioni CORRELAZIONE e PERSONA. Come la funzione RSQ, sia CORREL che PEARSON accettano come argomenti due intervalli di valori di cella. Prendere il risultato di CORREL o PEARSON per trovare il coefficiente di correlazione e elevare al quadrato il risultato equivale a utilizzare la funzione RSQ per determinare il coefficiente di determinazione.
Interpretazione dei risultati RSQ
Le funzioni CORRELAZIONE e PEARSON restituiscono valori compresi tra -1 e 1. Questa è una misura adimensionale della correlazione positiva o negativa tra i due insiemi di dati forniti come argomenti. Il valore restituito dalla funzione RSQ è compreso tra 0 e 1, talvolta espresso come percentuale da 0 a 100. Molti analisti ritengono che un risultato RSQ più elevato indichi un modello matematico più accurato, mentre altri dire che è importante esaminare tutti i fattori che potrebbero distorcere un risultato alto o basso prima di disegnare conclusioni.
Gli esperti dicono anche che dovresti evitare di confrontare i valori R-quadrato per diversi modelli e set di dati. Nei casi in cui vi siano ampie differenze tra il tipo di dati confrontati, i risultati possono essere fuorvianti. Esistono misure più complicate per confrontare i modelli rispetto ai valori R-quadrato, come i test F e i criteri di informazione.
Visualizzazione dell'analisi di regressione
Il grafico a dispersione di Excel viene spesso utilizzato per mostrare le relazioni tra insiemi di dati durante le analisi di regressione. L'intervallo di valori per un insieme di dati è mostrato sull'asse orizzontale delle x e l'intervallo per l'altro insieme sull'asse verticale delle y. I punti dati vengono mappati all'intersezione dei valori x e y utilizzando coppie di valori da ogni set di dati.
Utilizzando l'esempio di pubblicità e vendite, in cui i costi degli annunci sono elencati nella colonna A e il reddito mensile nella colonna B, l'asse orizzontale mostrerebbe l'intervallo di reddito mensile e il verticale mostrerebbe l'intervallo di pubblicità costi. I punti dati nel grafico verrebbero tracciati osservando le celle adiacenti nella colonna A e nella colonna B. Il modello di punti risultante può essere utilizzato per visualizzare la quantità di correlazione tra le variabili.