I finans og statistik er bestemmelseskoefficienten, også kaldet R-kvadrat (eller R2), et mål for forholdet mellem to datasæt, der bruges i en matematisk model.
Billedkredit: ijeab/iStock/GettyImages
Inden for finans og statistik er bestemmelseskoefficient, også omtalt som R-kvadrat (eller R2) er et mål for forholdet mellem to datasæt brugt i en matematisk model. Det repræsenterer variansforholdet i den afhængige variabel, der kan forudsiges ud fra den uafhængige variabel i modellen. Det bruges ofte i regressionsanalyser til at evaluere forudsigelser af fremtidige resultater baseret på observerede resultater. Du kan beregne R-kvadrat i Excel ved hjælp af RSQ-funktionen.
Koefficient. Bestemmelse i Excel
I Microsoft Excel bruges RSQ-funktionen til at bestemme R-kvadratværdien for to sæt datapunkter. Funktionen returnerer kvadratet af Pearson-produktmomentkorrelationskoefficienten, som måler den lineære korrelation mellem variablene x og y. Korrelationskoefficienten falder altid inden for området -1 og +1. Værdien returneret af RSQ i Excel er altid mellem 0 og 1 (da den er beregnet som kvadratet af en korrelationskoefficient, kan den aldrig returnere en negativ værdi).
Dagens video
RSQ funktions syntaks
RSQ-funktionen tager to datasæt som argumenter, kaldet kendt_x og kendt_y. Disse datasæt kan være i form af en liste over tal eller en liste eller et område af cellereferencer. Lad os f.eks. sige, at du ville lave en regressionsanalyse af penge brugt til annoncering vs. indtægter fra salg, hvor månedlige annonceudgifter er angivet i kolonne A, og månedlige indtægter er angivet i kolonne B. Du kan bruge RSQ-funktionen ved at indtaste RSQ(A1:A10,B1:B10), som bruger værdier i række 1 til 10 fra kolonne A (annonceomkostninger) og B (indkomst).
Brug af funktionerne CORREL og PEARSON
Excel giver også en måde at beregne korrelationskoefficienten for to datasæt ved hjælp af funktionerne CORREL og PEARSON. Ligesom RSQ-funktionen tager både CORREL og PEARSON to områder af celleværdier som argumenter. At tage resultatet af CORREL eller PEARSON for at finde korrelationskoefficienten og kvadrere resultatet er det samme som at bruge RSQ-funktionen til at bestemme bestemmelseskoefficienten.
Fortolkning af RSQ-resultater
Funktionerne CORREL og PEARSON returnerer værdier mellem -1 og 1. Dette er et dimensionsløst mål for positiv eller negativ korrelation mellem de to sæt data, der leveres som argumenter. Returværdien fra RSQ-funktionen er mellem 0 og 1, nogle gange udtrykt som en procentdel fra 0 til 100. Mange analytikere mener, at et højere RSQ-resultat indikerer en mere nøjagtig matematisk model, mens andre sige, at det er vigtigt at se på alle de faktorer, der kan skævvride et højt eller lavt resultat, før du tegner konklusioner.
Eksperter siger også, at du bør undgå at sammenligne R-kvadratværdier for forskellige modeller og datasæt. I tilfælde, hvor der er store forskelle mellem den type data, der sammenlignes, kan resultaterne være vildledende. Der er mere komplicerede mål til sammenligning af modeller end R-kvadratværdier, såsom F-tests og informationskriterier.
Visualisering af regressionsanalyse
Excel-punktdiagrammet bruges oftest til at vise sammenhænge mellem datasæt under regressionsanalyser. Værdiintervallet for et sæt data vises på den vandrette x-akse og området for det andet sæt på den lodrette y-akse. Datapunkter kortlægges til skæringspunktet mellem x- og y-værdier ved at bruge værdipar fra hvert datasæt.
Ved at bruge reklame- og salgseksemplet, hvor annonceomkostninger er angivet i kolonne A og månedlig indkomst i kolonne B, den vandrette akse vil vise intervallet for månedlig indkomst, og den lodrette ville vise intervallet for annoncering omkostninger. Datapunkter i diagrammet vil blive plottet ved at se på tilstødende celler i kolonne A og kolonne B. Det resulterende mønster af point kan bruges til at visualisere mængden af korrelation mellem variablerne.