
Cara Menggunakan Beberapa Regresi di Excel
Kredit Gambar: fizkes/iStock/GettyImages
Excel adalah alat yang ampuh untuk analisis data, baik Anda bekerja dengan hubungan sederhana antara satu variabel bebas dan satu variabel terikat atau ada beberapa variabel bebas untuk mempertimbangkan. Mempelajari cara melakukan analisis multivariat di Excel – dalam bentuk regresi berganda – dan menafsirkan hasilnya sangat penting jika Anda memiliki data yang rumit untuk dikerjakan. Kabar baiknya adalah bahwa Excel telah disiapkan dengan baik untuk menangani tugas-tugas ini, dan Anda hanya perlu mempelajari cara kerja satu fungsi untuk mulai memahami data Anda.
Apa itu Regresi Berganda?
Regresi berganda adalah cara menghubungkan beberapa variabel independen ke variabel dependen tunggal dengan menemukan persamaan yang menjelaskan bagaimana variabel tersebut berubah dengan masing-masing variabel. Alat yang lebih mendasar tetapi serupa adalah regresi linier, yang bertujuan untuk menyelidiki hubungan antara satu independen variabel, seperti obesitas, pada variabel dependen seperti risiko kanker, tetapi hal ini jarang terjadi mudah. Melanjutkan contoh, jumlah batang rokok yang dihisap per hari juga terkait dengan risiko kanker, seperti halnya jumlah alkohol yang Anda minum. Untuk menghasilkan prediksi risiko kanker yang andal bagi seorang individu, Anda perlu mempertimbangkan semua faktor ini (dan lebih banyak lagi).
Video Hari Ini
Bentuk umum persamaan yang digunakan untuk regresi berganda adalah:
kamu^ = sebuah + B1x1 + B2x2 + B3x3 …
Sehingga kamu^ adalah nilai yang diharapkan untuk pengamatan, B1 dan seterusnya mewakili kemiringan hubungan garis lurus antara x1 dan kamu^, dan x1 dan seterusnya adalah variabel-variabel yang termasuk dalam analisis. NS sebuah memberitahu Anda intinya kamu-mencegat. Regresi berganda melibatkan pemilihan nilai koefisien (B1 dan seterusnya) yang meminimalkan perbedaan antara nilai yang diharapkan kamu^ dan nilai yang diamati kamu, memberi Anda kecocokan terbaik antara model dan data.
Apa yang Dikatakan Regresi Berganda?
Regresi berganda menempatkan nilai numerik pada hubungan antara banyak variabel dan hasil, sehingga Anda dapat menggunakannya untuk prediksi, untuk memperkirakan kontribusi relatif dari variabel yang berbeda untuk hasil, atau untuk beberapa tujuan lain seperti memilih variabel yang paling relevan untuk digunakan dalam matematika model.
Misalnya, Anda memiliki data tentang harga rumah di kota tertentu (variabel dependen Anda), bersama dengan informasi seperti apakah memiliki kolam renang, berapa meter persegi yang ditempati, berapa banyak kamar tidur yang dimilikinya, berapa banyak kamar mandi yang dimilikinya, dan berapa banyak garasi yang dimilikinya memiliki. Regresi berganda akan memungkinkan Anda untuk melihat bagaimana masing-masing faktor ini terkait dengan harga rumah, jadi – setelahnya Anda melihat bagaimana hubungannya dengan harga – Anda dapat menggunakan persamaan Anda untuk memprediksi harga rumah berdasarkan poin-poin ini sendiri.
Anda juga dapat menggunakan jenis analisis regresi ini di Excel untuk melihat bagaimana faktor tertentu dari banyak – seperti apakah rumah memiliki kolam – mempengaruhi variabel dependen (harga rumah) jika semua variabel lainnya tetap konstan. Jika Anda mengubah koefisien (disebut "koefisien regresi parsial") menjadi koefisien regresi parsial standar, yang menunjukkan berapa banyak standar deviasi kamu akan berubah jika Anda mengubah variabel yang sesuai dengan satu standar deviasi, maka persamaan tersebut juga memberi tahu Anda faktor mana yang lebih penting dalam menentukan hasilnya.
Bagaimana Melakukan Regresi Berganda di Excel
Anda dapat melakukan regresi multivariat di Excel menggunakan fungsi bawaan yang dapat diakses melalui Analisis data alat di bawah Data tab dan Analisis kelompok. Klik Analisis data dan temukan opsi untuk regresi di jendela yang muncul, sorot dan klik oke. Klik pada pilih sel ikon di samping Masukan Rentang Y bidang dan kemudian pilih kolom yang berisi hasil untuk variabel dependen Anda. Kemudian, lakukan hal yang sama untuk Masukan X Rentang bidang tetapi pilih beberapa kolom untuk variabel independen Anda. Kolom-kolom ini harus bersebelahan, jadi jika tidak, Anda harus memindahkannya sebelum menghasilkan regresi.
Jendela Regresi memiliki serangkaian opsi tambahan yang dapat Anda pilih untuk menyesuaikan proses agar sesuai dengan kebutuhan Anda. Misalnya, Anda bisa mengatur tingkat kepercayaan selain 95 persen jika Anda suka, memilih untuk menampilkan residu dan menentukan di mana output ditempatkan di buku kerja Anda. Opsi terakhir ini secara otomatis disetel ke Lapis Lembar Kerja Baru, sehingga hasilnya ditampilkan pada lembar baru, tetapi Anda dapat mengubah ini atau opsi lain apa pun sesuai dengan kebutuhan Anda. Selain itu, periksa Label kotak jika kolom untuk variabel independen Anda memiliki label di bagian atas, jadi ini ditampilkan di output.
Klik oke untuk menghasilkan analisis regresi Anda di Excel dan dibawa ke lembar baru.
Keluaran Regresi Dari Excel
Ada tiga bagian utama dari output yang Anda tampilkan setelah melakukan regresi berganda di Excel: statistik regresi, ANOVA, dan detail pada perkiraan garis regresi. Statistik regresi mencakup koefisien korelasi berganda ("Multiple R") yang menunjukkan arah dan kekuatan korelasi, dari 1 hingga +1. Koefisien determinasi, "R Square," memberitahu Anda berapa persentase (sebagai desimal) dari variasi variabel dependen yang dijelaskan oleh variabel independen. "Adjusted R Square" memberi Anda indikasi kekuatan penjelas, tetapi tidak mudah untuk ditafsirkan, dan "Kesalahan Standar" memberi Anda ukuran variasi antara hasil yang diamati dan regresi Anda garis.
Bagian ANOVA berisi informasi statistik tentang besarnya variasi yang dijelaskan oleh garis regresi, dengan "SS Regression" memberi tahu Anda jumlah yang dijelaskan oleh baris, dan "SS Residual" mewakili jumlah yang tidak dijelaskan. Bagian "MS" adalah singkatan dari "Mean Square", dan "F Statistic" adalah statistik uji yang digunakan untuk menguji hasil yang signifikan, dengan bagian "Significance F" memberi Anda nilai-P.
Akhirnya, bagian terakhir memberi tahu Anda tentang karakteristik garis regresi yang diperkirakan, khususnya, nilai-nilai koefisien, apakah mereka secara signifikan terkait dengan variabel dependen, dan jumlah variasi yang mungkin ada di dalamnya. Koefisien positif menunjukkan hubungan positif antara variabel yang bersangkutan dan variabel dependen, sehingga ketika salah satu meningkat, yang lain juga. Nilai negatif berarti variabel dependen menurun seiring dengan peningkatan variabel independen. Jadi, jika koefisien "ukuran persegi" pada regresi berganda harga rumah adalah 300, ini berarti tambahan ruang kaki persegi meningkatkan biaya rumah rata-rata sebesar $300.
Asumsi dan Batasan Regresi Berganda
Penting untuk diingat bahwa regresi berganda hanyalah alat, dan seperti kebanyakan alat, Anda hanya dapat menggunakannya dalam beberapa keadaan, dan ada beberapa hal yang tidak dapat dilakukan.
Salah satu batasan terpenting adalah sulitnya menyimpulkan kausalitas berdasarkan hasil. Sebagai contoh, jika Anda memiliki regresi berganda dengan kerusakan yang diakibatkan oleh kebakaran dan banyak kemungkinan lainnya faktor yang relevan, Anda mungkin akan menemukan hubungan yang signifikan antara jumlah petugas pemadam kebakaran yang hadir dan kerusakan dilakukan. Ini tidak berarti bahwa petugas pemadam kebakaran menyebabkan kerusakan karena faktor lain seperti ukuran api yang tidak termasuk dalam model dapat menjelaskan kedua pengamatan ini.
Dua asumsi penting dari analisis multivariat di Excel jenis ini adalah asumsi linearitas dan normalitas. Anda mengasumsikan hubungan linier antara variabel dependen dan independen, jadi Anda harus memeriksa kemungkinan validitasnya sebelum melakukan analisis. Anda dapat melihat hubungan antara setiap variabel satu per satu untuk diperiksa, tetapi ini bukan strategi yang sempurna. Demikian pula, pengujian mengasumsikan bahwa variabel terdistribusi normal, jadi Anda harus memeriksa hasil untuk masing-masing untuk normalitas sebelum melakukan pengujian.