Jak obliczyć R2 Excel

click fraud protection
Inwestor pracujący nad nowym projektem startupowym.

W finansach i statystyce współczynnik determinacji, określany również jako R-kwadrat (lub R2), jest miarą relacji między dwoma zestawami danych używanymi w modelu matematycznym.

Źródło obrazu: ijeab/iStock/GettyImages

W finansach i statystyce współczynnik determinacji, określany również jako R-kwadrat (lub r2) jest miarą relacji między dwoma zestawami danych używanymi w modelu matematycznym. Reprezentuje stosunek wariancji zmiennej zależnej, który można przewidzieć na podstawie zmiennej niezależnej w modelu. Jest często używany w analizach regresji do oceny przewidywań przyszłych wyników na podstawie zaobserwowanych wyników. Możesz obliczyć R-kwadrat w programie Excel za pomocą funkcji RSQ.

Współczynnik. determinacji w Excelu

W programie Microsoft Excel funkcja RSQ służy do określenia wartości R-kwadrat dla dwóch zestawów punktów danych. Funkcja zwraca kwadrat współczynnika korelacji momentu iloczynu Pearsona, który mierzy liniową korelację między zmiennymi x i y. Współczynnik korelacji zawsze mieści się w przedziale -1 i +1. Wartość zwracana przez RSQ w programie Excel zawsze zawiera się w przedziale od 0 do 1 (ponieważ jest obliczana jako kwadrat współczynnika korelacji, nigdy nie może zwrócić wartości ujemnej).

Wideo dnia

Składnia funkcji RSQ

Funkcja RSQ przyjmuje dwa zestawy danych jako argumenty, określane jako znane_x i znane_y. Te zestawy danych mogą mieć postać listy liczb lub listy lub zakresu odwołań do komórek. Załóżmy na przykład, że chcesz przeprowadzić analizę regresji pieniędzy wydanych na reklamę w porównaniu z dochód ze sprzedaży, gdzie miesięczne wydatki na reklamę są wymienione w kolumnie A, a miesięczny dochód w kolumnie B. Możesz użyć funkcji RSQ, wprowadzając RSQ(A1:A10,B1:B10), która używa wartości w wierszach od 1 do 10 z kolumn A (koszty reklamy) i B (dochód).

Korzystanie z funkcji CORREL i PEARSON

Program Excel umożliwia również obliczenie współczynnika korelacji dla dwóch zestawów danych za pomocą funkcji WSPÓŁRZĘDNOŚĆ i PEARSON. Podobnie jak funkcja RSQ, zarówno KOREKTA, jak i PEARSON przyjmują jako argumenty dwa zakresy wartości komórek. Wzięcie wyniku CORREL lub PEARSON do znalezienia współczynnika korelacji i podniesienie wyniku do kwadratu jest takie samo, jak użycie funkcji RSQ do określenia współczynnika determinacji.

Interpretowanie wyników RSQ

Funkcje CORREL i PEARSON zwracają wartości z przedziału od -1 do 1. Jest to bezwymiarowa miara dodatniej lub ujemnej korelacji między dwoma zestawami danych dostarczonymi jako argumenty. Wartość zwracana przez funkcję RSQ wynosi od 0 do 1, czasami wyrażona jako wartość procentowa od 0 do 100. Wielu analityków uważa, że ​​wyższy wynik RSQ wskazuje na dokładniejszy model matematyczny, podczas gdy inni powiedz, że ważne jest, aby przed losowaniem przyjrzeć się wszystkim czynnikom, które mogą zaburzać wysoki lub niski wynik wnioski.

Eksperci twierdzą również, że należy unikać porównywania wartości R-kwadrat dla różnych modeli i zestawów danych. W przypadkach, w których występują znaczne różnice między typem porównywanych danych, wyniki mogą być mylące. Istnieją bardziej skomplikowane miary do porównywania modeli niż wartości R-kwadrat, takie jak testy F i kryteria informacyjne.

Wizualizacja analizy regresji

Wykres punktowy programu Excel jest najczęściej używany do przedstawiania relacji między zestawami danych podczas analiz regresji. Zakres wartości jednego zestawu danych jest pokazany na poziomej osi x, a zakres drugiego zestawu na pionowej osi y. Punkty danych są mapowane na przecięcie wartości x i y przy użyciu par wartości z każdego zestawu danych.

Korzystając z przykładu reklamy i sprzedaży, gdzie koszty reklamy są wymienione w kolumnie A, a miesięczny dochód w kolumnie B, oś pozioma przedstawiałaby zakres miesięcznych dochodów, a pionowa zakres reklamowy koszty. Punkty danych na wykresie zostaną wykreślone, patrząc na sąsiednie komórki w kolumnie A i kolumnie B. Otrzymany wzór punktów można wykorzystać do wizualizacji stopnia korelacji między zmiennymi.