Hur man beräknar R2 Excel

click fraud protection
Investerare som arbetar med nytt startprojekt.

Inom finans och statistik är bestämningskoefficienten, även kallad R-kvadrat (eller R2) ett mått på förhållandet mellan två datamängder som används i en matematisk modell.

Bildkredit: ijeab/iStock/GettyImages

Inom ekonomi och statistik är determinationskoefficient, även kallad R-kvadrat (eller R2) är ett mått på förhållandet mellan två datamängder som används i en matematisk modell. Den representerar variansförhållandet i den beroende variabeln som kan förutsägas från den oberoende variabeln i modellen. Det används ofta i regressionsanalyser för att utvärdera förutsägelser om framtida utfall baserat på observerade utfall. Du kan beräkna R-kvadrat i Excel med RSQ-funktionen.

Koefficient. bestämning i Excel

I Microsoft Excel används RSQ-funktionen för att bestämma R-kvadratvärdet för två uppsättningar datapunkter. Funktionen returnerar kvadraten på Pearsons produktmomentkorrelationskoefficient, som mäter den linjära korrelationen mellan variablerna x och y. Korrelationskoefficienten ligger alltid inom intervallet -1 och +1. Värdet som returneras av RSQ i Excel är alltid mellan 0 och 1 (eftersom det beräknas som kvadraten på en korrelationskoefficient, kan det aldrig returnera ett negativt värde).

Dagens video

RSQ-funktionssyntax

RSQ-funktionen tar två datamängder som argument, hänvisade till som känd_x och känd_y. Dessa datamängder kan vara i form av en lista med nummer eller en lista eller ett område med cellreferenser. Säg till exempel att du ville göra en regressionsanalys av pengar som spenderas för annonsering vs. inkomst från försäljning, där månatliga annonsutgifter anges i kolumn A och månadsinkomster anges i kolumn B. Du kan använda RSQ-funktionen genom att mata in RSQ(A1:A10,B1:B10), som använder värden på raderna 1 till 10 från kolumnerna A (annonskostnader) och B (inkomster).

Använda funktionerna CORREL och PEARSON

Excel ger också ett sätt att beräkna korrelationskoefficienten för två datamängder med funktionerna CORREL och PEARSON. Precis som RSQ-funktionen tar både CORREL och PEARSON två cellvärdenintervall som argument. Att ta resultatet av CORREL eller PEARSON för att hitta korrelationskoefficienten och kvadrera resultatet är detsamma som att använda RSQ-funktionen för att bestämma bestämningskoefficienten.

Tolka RSQ-resultat

Funktionerna CORREL och PEARSON returnerar värden mellan -1 och 1. Detta är ett dimensionslöst mått på positiv eller negativ korrelation mellan de två uppsättningarna av data som tillhandahålls som argument. Returvärdet från RSQ-funktionen är mellan 0 och 1, ibland uttryckt i procent från 0 till 100. Många analytiker tror att ett högre RSQ-resultat indikerar en mer exakt matematisk modell, medan andra säg att det är viktigt att titta på alla faktorer som kan skeva ett högt eller lågt resultat innan du ritar Slutsatser.

Experter säger också att du bör undvika att jämföra R-kvadratvärden för olika modeller och uppsättningar av data. I de fall det är stora skillnader mellan den typ av data som jämförs kan resultaten vara missvisande. Det finns mer komplicerade mått för att jämföra modeller än R-kvadratvärden, såsom F-tester och informationskriterier.

Visualisera regressionsanalys

Excel-spridningsdiagrammet används oftast för att visa samband mellan uppsättningar av data under regressionsanalyser. Värdeintervallet för en uppsättning data visas på den horisontella x-axeln och området för den andra uppsättningen på den vertikala y-axeln. Datapunkter mappas till skärningspunkten mellan x- och y-värden genom att använda värdepar från varje datamängd.

Med hjälp av exemplet med reklam och försäljning, där annonskostnader anges i kolumn A och månadsinkomst i kolumn B, den horisontella axeln skulle visa intervallet för månatlig inkomst och den vertikala skulle visa intervallet för reklam kostar. Datapunkter i diagrammet skulle plottas genom att titta på intilliggande celler i kolumn A och kolumn B. Det resulterande mönstret av punkter kan användas för att visualisera graden av korrelation mellan variablerna.