Στα οικονομικά και τη στατιστική, ο συντελεστής προσδιορισμού, που αναφέρεται επίσης ως R-squared (ή R2) είναι ένα μέτρο της σχέσης μεταξύ δύο συνόλων δεδομένων που χρησιμοποιούνται σε ένα μαθηματικό μοντέλο.
Πίστωση εικόνας: ijeab/iStock/GettyImages
Στα οικονομικά και τη στατιστική, το συντελεστή προσδιορισμού, αναφέρεται επίσης ως R-τετράγωνο (ή R2) είναι ένα μέτρο της σχέσης μεταξύ δύο συνόλων δεδομένων που χρησιμοποιούνται σε ένα μαθηματικό μοντέλο. Αντιπροσωπεύει τον λόγο διακύμανσης στην εξαρτημένη μεταβλητή που μπορεί να προβλεφθεί από την ανεξάρτητη μεταβλητή στο μοντέλο. Συχνά χρησιμοποιείται σε αναλύσεις παλινδρόμησης για την αξιολόγηση προβλέψεων μελλοντικών αποτελεσμάτων με βάση τα παρατηρούμενα αποτελέσματα. Μπορείτε να υπολογίσετε το R-τετράγωνο στο Excel χρησιμοποιώντας τη συνάρτηση RSQ.
Συντελεστής. Προσδιορισμού στο Excel
Στο Microsoft Excel, η συνάρτηση RSQ χρησιμοποιείται για τον προσδιορισμό της τιμής στο τετράγωνο R για δύο σύνολα σημείων δεδομένων. Η συνάρτηση επιστρέφει το τετράγωνο του συντελεστή συσχέτισης ροπών γινομένου Pearson, ο οποίος μετρά τη γραμμική συσχέτιση μεταξύ των μεταβλητών x και y. Ο συντελεστής συσχέτισης βρίσκεται πάντα στο εύρος -1 και +1. Η τιμή που επιστρέφεται από το RSQ στο Excel είναι πάντα μεταξύ 0 και 1 (καθώς υπολογίζεται ως το τετράγωνο ενός συντελεστή συσχέτισης, δεν μπορεί ποτέ να επιστρέψει αρνητική τιμή).
Το βίντεο της ημέρας
Σύνταξη συνάρτησης RSQ
Η συνάρτηση RSQ παίρνει δύο σύνολα δεδομένων ως ορίσματα, που αναφέρονται ως γνωστό_x και γνωστό_y. Αυτά τα σύνολα δεδομένων μπορεί να έχουν τη μορφή λίστας αριθμών ή λίστας ή εύρους αναφορών κελιών. Για παράδειγμα, ας υποθέσουμε ότι θέλετε να κάνετε μια ανάλυση παλινδρόμησης για τα χρήματα που δαπανώνται για διαφήμιση έναντι. έσοδα από πωλήσεις, όπου οι μηνιαίες διαφημιστικές δαπάνες αναφέρονται στη στήλη Α και τα μηνιαία έσοδα στη στήλη Β. Μπορείτε να χρησιμοποιήσετε τη συνάρτηση RSQ εισάγοντας RSQ(A1:A10,B1:B10), η οποία χρησιμοποιεί τιμές στις σειρές 1 έως 10 από τις στήλες A (κόστος διαφήμισης) και B (έσοδο).
Χρήση των συναρτήσεων CORREL και PEARSON
Το Excel παρέχει επίσης έναν τρόπο υπολογισμού του συντελεστή συσχέτισης για δύο σύνολα δεδομένων χρησιμοποιώντας τις συναρτήσεις CORREL και PEARSON. Όπως η συνάρτηση RSQ, τόσο το CORREL όσο και το PEARSON λαμβάνουν δύο εύρη τιμών κελιών ως ορίσματα. Η λήψη του αποτελέσματος του CORREL ή του PEARSON για να βρεθεί ο συντελεστής συσχέτισης και ο τετραγωνισμός του αποτελέσματος είναι το ίδιο με τη χρήση της συνάρτησης RSQ για τον προσδιορισμό του συντελεστή προσδιορισμού.
Ερμηνεία αποτελεσμάτων RSQ
Οι συναρτήσεις CORREL και PEARSON επιστρέφουν τιμές μεταξύ -1 και 1. Αυτό είναι ένα αδιάστατο μέτρο θετικής ή αρνητικής συσχέτισης μεταξύ των δύο συνόλων δεδομένων που παρέχονται ως επιχειρήματα. Η επιστρεφόμενη τιμή από τη συνάρτηση RSQ είναι μεταξύ 0 και 1, μερικές φορές εκφρασμένη ως ποσοστό από 0 έως 100. Πολλοί αναλυτές πιστεύουν ότι ένα υψηλότερο αποτέλεσμα RSQ υποδεικνύει ένα πιο ακριβές μαθηματικό μοντέλο, ενώ άλλοι πείτε ότι είναι σημαντικό να εξετάσετε όλους τους παράγοντες που θα μπορούσαν να παραμορφώσουν ένα υψηλό ή χαμηλό αποτέλεσμα πριν από τη σχεδίαση συμπεράσματα.
Οι ειδικοί λένε επίσης ότι θα πρέπει να αποφεύγετε τη σύγκριση τιμών R-τετράγωνου για διαφορετικά μοντέλα και σύνολα δεδομένων. Σε περιπτώσεις όπου υπάρχουν μεγάλες διαφορές μεταξύ του τύπου των δεδομένων που συγκρίνονται, τα αποτελέσματα μπορεί να είναι παραπλανητικά. Υπάρχουν πιο περίπλοκα μέτρα για τη σύγκριση μοντέλων από τις τιμές R-squared, όπως τα F-Tests και τα κριτήρια πληροφοριών.
Οπτικοποίηση Ανάλυσης Παλινδρόμησης
Το γράφημα διασποράς του Excel χρησιμοποιείται συχνότερα για την εμφάνιση σχέσεων μεταξύ συνόλων δεδομένων κατά τη διάρκεια αναλύσεων παλινδρόμησης. Το εύρος τιμών για ένα σύνολο δεδομένων εμφανίζεται στον οριζόντιο άξονα x και το εύρος για το άλλο σύνολο στον κατακόρυφο άξονα y. Τα σημεία δεδομένων αντιστοιχίζονται στην τομή των τιμών x και y χρησιμοποιώντας ζεύγη τιμών από κάθε σύνολο δεδομένων.
Χρησιμοποιώντας το παράδειγμα διαφήμισης και πωλήσεων, όπου το κόστος διαφήμισης αναφέρεται στη στήλη Α και το μηνιαίο εισόδημα στη στήλη Β, ο οριζόντιος άξονας θα έδειχνε το εύρος του μηνιαίου εισοδήματος και ο κατακόρυφος το εύρος της διαφήμισης δικαστικά έξοδα. Τα σημεία δεδομένων στο γράφημα θα γραφτούν κοιτάζοντας τα γειτονικά κελιά στη στήλη Α και τη στήλη Β. Το προκύπτον μοτίβο σημείων μπορεί να χρησιμοποιηθεί για να απεικονίσει το μέγεθος της συσχέτισης μεταξύ των μεταβλητών.