Excel'de Çoklu Regresyon Nasıl Kullanılır

Afrikalı iş kadını dizüstü bilgisayar ekranında proje istatistiklerini analiz ediyor, yakın çekim

Excel'de Çoklu Regresyon Nasıl Kullanılır

Resim Kredisi: fizkes/iStock/GettyImages

İster basit bir ilişkiyle çalışıyor olun, Excel veri analizi için güçlü bir araçtır. bir bağımsız değişken ve bir bağımlı değişken veya birden çok bağımsız değişken var düşünmek. Excel'de çoklu regresyon şeklinde çok değişkenli bir analizin nasıl gerçekleştirileceğini öğrenmek ve üzerinde çalışılacak karmaşık verileriniz varsa sonuçları yorumlamak çok önemlidir. İyi haber şu ki, Excel bu görevleri yerine getirmek için iyi ayarlanmış ve verilerinizi anlamlandırmaya başlamak için yalnızca bir işlevin nasıl çalıştığını öğrenmeniz gerekiyor.

Çoklu Regresyon Nedir?

Çoklu regresyon, söz konusu değişkenin her biri ile nasıl değiştiğini açıklayan bir denklem bularak birden çok bağımsız değişkeni tek bir bağımlı değişkenle ilişkilendirmenin bir yoludur. Daha temel fakat benzer bir araç, bir bağımsız sistem arasındaki bağlantıyı araştırmayı amaçlayan doğrusal regresyondur. obezite gibi değişken, kanser riski gibi bağımlı bir değişkene bağlıdır, ancak işler nadiren böyledir. basit. Örnekle devam edersek, içtiğiniz alkol miktarı kadar günde içilen sigara sayısı da kanser riski ile ilişkilidir. Bir birey için güvenilir bir kanser riski tahmini yapmak için tüm bu faktörleri (ve daha fazlasını) hesaba katmanız gerekir.

Günün Videosu

Çoklu regresyonlar için kullanılan denklemin genel formu şu şekildedir:

Y^ = a + B1x1 + B2x2 + B3x3

Böylece Y^ gözlem için beklenen değerdir, B1 ve benzerleri arasındaki düz çizgi ilişkisinin eğimini temsil eder. x1 ve Y^ ve x1 vb. analize dahil edilen değişkenlerdir. bu a sana işin püf noktasını söyler y-tutmak. Çoklu regresyon, katsayıların değerlerinin seçilmesini içerir (B1 vb) beklenen değer arasındaki farkı en aza indiren Y^ ve gözlemlenen değer Y, size model ve veriler arasında en iyi uyumu sağlar.

Çoklu Regresyon Size Ne Anlatıyor?

Çoklu regresyonlar, çok sayıda değişken ile bir sonuç arasındaki ilişkiye sayısal değerler koyar, böylece onu tahminler için kullanabilirsiniz. farklı değişkenlerin sonuca göreli katkıları veya matematiksel bir çalışmada kullanılacak en uygun değişkenleri seçmek gibi birkaç başka amaç için modeli.

Örneğin, belirli bir şehirdeki evlerin fiyatlarına (bağımlı değişkeniniz) ilişkin verileriniz ve bunun gibi bilgiler olduğunu varsayalım. havuzu olup olmadığı, kaç metrekarelik alanı, kaç yatak odası, kaç banyosu ve kaç garajı var? sahip olmak. Çoklu bir regresyon, bu faktörlerin her birinin evin fiyatıyla nasıl ilişkili olduğuna bakmanızı sağlar, yani – sonra fiyatla nasıl ilişkili olduklarına baktınız – bu noktalara dayalı olarak bir evin fiyatını tahmin etmek için denkleminizi kullanabilirsiniz tek basina.

Excel'de bu tür bir regresyon analizini, belirli bir faktörün nasıl olduğuna bakmak için de kullanabilirsiniz - örneğin: evin havuzu olup olmadığı – diğer tüm değişkenler aynı kalırsa bağımlı değişkeni (ev fiyatlarını) etkiler devamlı. Katsayıları ("kısmi regresyon katsayıları" olarak adlandırılır) kaç standart sapmayı temsil eden standart kısmi regresyon katsayılarına dönüştürürseniz Y karşılık gelen değişkeni bir standart sapma ile değiştirirseniz değişecektir, o zaman denklem size sonucu belirlemede hangi faktörlerin daha önemli olduğunu da söyler.

Excel'de Çoklu Regresyon Nasıl Yapılır?

aracılığıyla erişilebilen yerleşik bir işlevi kullanarak Excel'de çok değişkenli bir regresyon gerçekleştirebilirsiniz. Veri analizi altındaki alet Veri sekmesi ve analiz grup. Tıklamak Veri analizi ve için seçeneği bulun gerileme Açılan pencerede onu vurgulayın ve tıklayın. tamam. Tıkla hücreleri seç yanındaki simge Giriş Y Aralığı alanını seçin ve ardından bağımlı değişkeniniz için sonuçları içeren sütunu seçin. Ardından, aynısını Giriş X Aralığı alan, ancak bağımsız değişkenleriniz için birden çok sütun seçin. Bu sütunların yan yana olması gerekir, yani değillerse, regresyon üretmeden önce onları taşımanız gerekir.

Regresyon penceresi, süreci ihtiyaçlarınıza göre uyarlamak için seçebileceğiniz bir dizi ek seçeneğe sahiptir. Örneğin, isterseniz yüzde 95'ten farklı bir güven düzeyi ayarlayabilir, artıkları görüntülemeyi seçebilir ve çıktının çalışma kitabınızda nereye yerleştirileceğini belirleyebilirsiniz. Bu son seçenek otomatik olarak Yeni Çalışma Sayfası Kat, bu nedenle sonuçlar yeni bir sayfada gösterilir, ancak bunu veya başka bir seçeneği ihtiyaçlarınıza göre değiştirebilirsiniz. Ek olarak, kontrol edin Etiketler Bağımsız değişkenlerinizin sütunlarının üst kısmında etiketler varsa, bunlar çıktıda görüntülenir.

Tıklamak tamam Excel'de regresyon analizinizi oluşturmak ve yeni sayfaya götürülmek için.

Excel'den Regresyon Çıktısı

Excel'de çoklu bir regresyon yaptıktan sonra size sunulan çıktının üç ana bölümü vardır: regresyon istatistikleri, ANOVA ve tahmini regresyon satırında detay. Regresyon istatistikleri, korelasyonun yönünü ve gücünü -1 ​​ile +1 arasında gösteren çoklu korelasyon katsayısını ("Çoklu R") içerir. Belirleme katsayısı, "R Kare", bağımlı değişkendeki varyasyonun yüzde kaçının (ondalık olarak) bağımsız değişkenler tarafından açıklandığını söyler. "Ayarlanmış R Karesi" size açıklayıcı gücün bir göstergesini verir, ancak yorumlaması kolay değildir, ve "Standart Hata", gözlemlenen sonuçlar ile regresyonunuz arasındaki varyasyonun bir ölçüsünü verir astar.

ANOVA bölümü, regresyon doğrusu tarafından açıklanan varyasyon miktarı hakkında istatistiksel bilgiler içerir, "SS Regresyonu" satırın açıkladığı miktarı size söyler ve "SS Kalıntısı" olmayan tutarı temsil eder. açıkladı. "MS" bölümleri "Ortalama Kare" anlamına gelir ve "F Statistic", önemli bir sonucu test etmek için kullanılan test istatistiğidir ve "Significance F" bölümü size P-değerini verir.

Son olarak, son bölüm size tahmini regresyon çizgisinin özellikleri, özellikle de regresyon değerleri hakkında bilgi verir. Katsayılar, bağımlı değişkenle önemli ölçüde bağlantılı olup olmadıkları ve onlarda olabilecek varyasyon miktarı. Pozitif katsayılar, söz konusu değişken ile bağımlı değişken arasında pozitif bir ilişki olduğunu gösterir, yani biri arttığında diğeri de artar. Negatif değerler, bağımsız değişken arttıkça bağımlı değişkenin azaldığı anlamına gelir. Dolayısıyla, bir ev fiyatları çoklu regresyonundaki "metre kare" katsayısı 300 ise, bu, ek bir metrekarelik alanın evin maliyetini ortalama 300 $ artırdığı anlamına gelir.

Çoklu Regresyonun Varsayımları ve Sınırlamaları

Çoklu regresyonun yalnızca bir araç olduğunu ve çoğu araç gibi onu yalnızca bazı durumlarda kullanabileceğinizi ve yapamayacağı bazı şeyler olduğunu hatırlamak önemlidir.

En önemli sınırlamalardan biri, sonuçlara dayanarak nedensellik kurmanın zor olmasıdır. Örnek olarak, bir yangının verdiği hasarla ve birçok potansiyel olarak birden fazla regresyona sahipseniz ilgili faktörler, muhtemelen mevcut itfaiyecilerin sayısı ile itfaiyecilerin sayısı arasında önemli bir bağlantı bulacaksınız. yapılan hasar. Bu, itfaiyecilerin neden oldu modele dahil edilmeyen yangının büyüklüğü gibi başka bir faktör bu iki gözlemi de açıklayabilir.

Excel'de bu türden çok değişkenli bir analizin iki önemli varsayımı, doğrusallık ve normallik varsayımlarıdır. Bağımlı ve bağımsız değişkenler arasında doğrusal bir ilişki olduğunu varsayıyorsunuz, bu nedenle analizi gerçekleştirmeden önce bunun geçerli olup olmadığını kontrol etmelisiniz. Kontrol etmek için her bir değişken arasındaki ilişkiye ayrı ayrı bakabilirsiniz, ancak bu mükemmel bir strateji değildir. Benzer şekilde, test, değişkenlerin normal dağıldığını varsayar, bu nedenle testi yapmadan önce her birinin sonuçlarını normallik açısından kontrol etmelisiniz.