In financiën en statistieken is de determinatiecoëfficiënt, ook wel R-kwadraat (of R2) genoemd, een maatstaf voor de relatie tussen twee gegevenssets die in een wiskundig model worden gebruikt.
Afbeelding tegoed: ijeab/iStock/GettyImages
In financiën en statistiek is de determinatiecoëfficiënt, ook wel aangeduid als R-kwadraat (of R2) is een maat voor de relatie tussen twee datasets die in een wiskundig model worden gebruikt. Het vertegenwoordigt de variantieverhouding in de afhankelijke variabele die kan worden voorspeld op basis van de onafhankelijke variabele in het model. Het wordt vaak gebruikt in regressieanalyses om voorspellingen van toekomstige resultaten te evalueren op basis van waargenomen resultaten. U kunt R-kwadraat in Excel berekenen met behulp van de RSQ-functie.
Coëfficiënt. van bepaling in Excel
In Microsoft Excel wordt de RSQ-functie gebruikt om de R-kwadraatwaarde voor twee sets gegevenspunten te bepalen. De functie retourneert het kwadraat van de Pearson-productmomentcorrelatiecoëfficiënt, die de lineaire correlatie tussen variabelen x en y meet. De correlatiecoëfficiënt valt altijd binnen het bereik van -1 en +1. De waarde die door RSQ in Excel wordt geretourneerd, ligt altijd tussen 0 en 1 (aangezien deze wordt berekend als het kwadraat van een correlatiecoëfficiënt, kan deze nooit een negatieve waarde retourneren).
Video van de dag
Syntaxis van RSQ-functie
De RSQ-functie neemt twee datasets als argumenten, de zogenaamde bekende_x en bekende_y. Deze datasets kunnen de vorm hebben van een lijst met getallen of een lijst of bereik van celverwijzingen. Stel dat u bijvoorbeeld een regressieanalyse wilt uitvoeren op geld dat is uitgegeven aan advertenties versus geld dat is uitgegeven aan advertenties. inkomsten uit verkoop, waarbij de maandelijkse advertentie-uitgaven in kolom A worden vermeld en het maandelijkse inkomen in kolom B. U kunt de functie RSQ gebruiken door RSQ(A1:A10,B1:B10) in te voeren, waarbij waarden in rij 1 tot en met 10 worden gebruikt uit kolommen A (advertentiekosten) en B (inkomsten).
De functies CORREL en PEARSON gebruiken
Excel biedt ook een manier om de correlatiecoëfficiënt voor twee gegevenssets te berekenen met behulp van de functies CORREL en PEARSON. Net als de RSQ-functie nemen zowel CORREL als PEARSON twee reeksen celwaarden als argumenten. Het resultaat van CORREL of PEARSON nemen om de correlatiecoëfficiënt te vinden en het resultaat kwadrateren is hetzelfde als het gebruik van de RSQ-functie om de determinatiecoëfficiënt te bepalen.
RSQ-resultaten interpreteren
De functies CORREL en PEARSON retourneren waarden tussen -1 en 1. Dit is een dimensieloze meting van positieve of negatieve correlatie tussen de twee sets gegevens die als argumenten worden verstrekt. De geretourneerde waarde van de RSQ-functie ligt tussen 0 en 1, soms uitgedrukt als een percentage van 0 tot 100. Veel analisten zijn van mening dat een hoger RSQ-resultaat een nauwkeuriger wiskundig model aangeeft, terwijl anderen zeg dat het belangrijk is om naar alle factoren te kijken die een hoog of laag resultaat kunnen vertekenen voordat je tekent conclusies.
Experts zeggen ook dat je moet vermijden om R-kwadraatwaarden voor verschillende modellen en gegevenssets te vergelijken. In gevallen waarin er grote verschillen zijn tussen het type gegevens dat wordt vergeleken, kunnen de resultaten misleidend zijn. Er zijn ingewikkelder maatregelen voor het vergelijken van modellen dan R-kwadraatwaarden, zoals F-Tests en informatiecriteria.
Regressieanalyse visualiseren
Het Excel-spreidingsdiagram wordt meestal gebruikt om relaties tussen gegevenssets weer te geven tijdens regressieanalyses. Het bereik van waarden voor de ene set gegevens wordt weergegeven op de horizontale x-as en het bereik voor de andere set op de verticale y-as. Gegevenspunten worden toegewezen aan het snijpunt van x- en y-waarden door waardenparen uit elke gegevensset te gebruiken.
Gebruikmakend van het advertentie- en verkoopvoorbeeld, waar advertentiekosten worden vermeld in kolom A en maandelijks inkomen in kolom B, de horizontale as zou het bereik van het maandinkomen tonen en de verticale zou het bereik van advertenties weergeven kosten. Gegevenspunten in de grafiek zouden worden uitgezet door naar aangrenzende cellen in kolom A en kolom B te kijken. Het resulterende puntenpatroon kan worden gebruikt om de mate van correlatie tussen de variabelen te visualiseren.