![Investitor care lucrează la un nou proiect de pornire.](/f/539cf418af529fc514226b8e70d993a7.jpg)
În finanțe și statistică, coeficientul de determinare, denumit și R-pătrat (sau R2) este o măsură a relației dintre două seturi de date utilizate într-un model matematic.
Credit imagine: ijeab/iStock/GettyImages
În finanțe și statistică, the coeficient de determinare, denumit și R-pătrat (sau R2) este o măsură a relației dintre două seturi de date utilizate într-un model matematic. Reprezintă raportul de varianță în variabila dependentă care poate fi prezis din variabila independentă din model. Este adesea folosit în analizele de regresie pentru a evalua previziunile rezultatelor viitoare pe baza rezultatelor observate. Puteți calcula R-pătrat în Excel folosind funcția RSQ.
Coeficient. de determinare în Excel
În Microsoft Excel, funcția RSQ este utilizată pentru a determina valoarea R-pătrat pentru două seturi de puncte de date. Funcția returnează pătratul coeficientului de corelație al momentului produsului Pearson, care măsoară corelația liniară dintre variabilele x și y. Coeficientul de corelație se încadrează întotdeauna în intervalul -1 și +1. Valoarea returnată de RSQ în Excel este întotdeauna între 0 și 1 (deoarece este calculată ca pătrat al unui coeficient de corelare, nu poate returna niciodată o valoare negativă).
Videoclipul zilei
Sintaxa funcției RSQ
Funcția RSQ preia două seturi de date ca argumente, denumite cunoscute_x și cunoscute_y. Aceste seturi de date pot fi sub forma unei liste de numere sau a unei liste sau a unui interval de referințe de celule. De exemplu, să presupunem că doriți să faceți o analiză de regresie a banilor cheltuiți pentru publicitate vs. venituri din vânzări, unde cheltuielile lunare publicitare sunt enumerate în coloana A, iar veniturile lunare sunt enumerate în coloana B. Puteți utiliza funcția RSQ introducând RSQ(A1:A10,B1:B10), care utilizează valorile din rândurile 1 până la 10 din coloanele A (costuri publicitare) și B (venituri).
Folosind funcțiile CORREL și PEARSON
Excel oferă, de asemenea, o modalitate de a calcula coeficientul de corelație pentru două seturi de date folosind funcțiile CORREL și PEARSON. Ca și funcția RSQ, atât CORREL, cât și PEARSON iau ca argumente două intervale de valori ale celulei. Luarea rezultatului CORREL sau PEARSON pentru a găsi coeficientul de corelație și pătrarea rezultatului este aceeași cu utilizarea funcției RSQ pentru a determina coeficientul de determinare.
Interpretarea rezultatelor RSQ
Funcțiile CORREL și PEARSON returnează valori între -1 și 1. Aceasta este o măsură adimensională a corelației pozitive sau negative între cele două seturi de date furnizate ca argumente. Valoarea returnată de la funcția RSQ este între 0 și 1, uneori exprimată ca procent de la 0 la 100. Mulți analiști cred că un rezultat RSQ mai mare indică un model matematic mai precis, în timp ce alții spunem că este important să ne uităm la toți factorii care ar putea denatura un rezultat ridicat sau scăzut înainte de a desena concluzii.
Experții spun, de asemenea, că ar trebui să evitați compararea valorilor R-pătrat pentru diferite modele și seturi de date. În cazurile în care sunt diferențe mari între tipul de date comparate, rezultatele pot fi înșelătoare. Există măsuri mai complicate pentru compararea modelelor decât valorile R-pătrat, cum ar fi testele F și criteriile de informare.
Vizualizarea analizei de regresie
Diagrama de dispersie Excel este folosită cel mai adesea pentru a afișa relațiile dintre seturi de date în timpul analizelor de regresie. Intervalul de valori pentru un set de date este afișat pe axa x orizontală, iar intervalul pentru celălalt set pe axa verticală y. Punctele de date sunt mapate la intersecția valorilor x și y folosind perechi de valori din fiecare set de date.
Folosind exemplul de publicitate și vânzări, unde costurile publicitare sunt enumerate în coloana A și venitul lunar în coloana B, axa orizontală ar arăta intervalul de venit lunar, iar verticală ar arăta gama de publicitate cheltuieli. Punctele de date din diagramă ar fi reprezentate prin urmărirea celulelor adiacente din coloana A și coloana B. Modelul de puncte rezultat poate fi utilizat pentru a vizualiza valoarea corelației dintre variabile.