Kuidas kasutada mitut regressiooni Excelis

Aafrika ärinaine analüüsib sülearvuti ekraanil projektistatistikat, lähivõte

Kuidas kasutada mitut regressiooni Excelis

Pildi krediit: fizkes/iStock/GettyImages

Excel on võimas tööriist andmete analüüsimiseks, olenemata sellest, kas töötate lihtsa seosega üks sõltumatu muutuja ja sõltuv muutuja või on mitu sõltumatut muutujat kaaluma. Kui teil on keerulisi andmeid, mida läbi töötada, on oluline õppida, kuidas teha Excelis mitmemõõtmelist analüüsi – mitmekordse regressiooni vormis – ja tõlgendada tulemusi. Hea uudis on see, et Excel on nende ülesannete täitmiseks hästi seadistatud ja andmete mõtestamise alustamiseks peate õppima ainult ühe funktsiooni toimimist.

Mis on mitmekordne regressioon?

Mitmekordne regressioon on viis siduda mitu sõltumatut muutujat ühe sõltuva muutujaga, leides võrrandi, mis kirjeldab, kuidas kõnealune muutuja muutub igaga. Põhilisem, kuid sarnane tööriist on lineaarne regressioon, mille eesmärk on uurida seost ühe sõltumatu vahel muutuja, nagu rasvumine, sõltuvast muutujast nagu vähirisk, kuid asjad on harva sellised otsekohene. Näitet jätkates on ka päevas suitsetatud sigarettide arv seotud vähiriskiga, nagu ka joodav alkoholi kogus. Üksikisiku vähiriski usaldusväärse prognoosi tegemiseks peate võtma arvesse kõiki neid tegureid (ja palju muud).

Päeva video

Mitme regressiooni jaoks kasutatava võrrandi üldine vorm on:

Y^ = a + b1x1 + b2x2 + b3x3

Seega Y^ on vaatluse eeldatav väärtus b1 ja nii edasi esindavad vahelise sirgjoonelise seose kalle x1 ja Y^ ja x1 ja nii edasi on analüüsi kaasatud muutujad. The a ütleb teile asja mõtte y- pealtkuulamine. Mitmekordne regressioon hõlmab koefitsientide väärtuste valimist (b1 ja nii edasi), mis minimeerivad erinevuse eeldatava väärtuse vahel Y^ ja vaadeldud väärtus Y, mis sobib teile mudeli ja andmete vahel kõige paremini.

Mida ütleb teile mitmekordne regressioon?

Mitmed regressioonid annavad arvulised väärtused paljude muutujate ja tulemuse vahelisele seosele, nii et saate seda kasutada prognooside tegemiseks, erinevate muutujate suhteline panus tulemusse või mõnel muul eesmärgil, näiteks matemaatilises analüüsis kasutatavate kõige asjakohasemate muutujate valimine. mudel.

Oletame näiteks, et teil on andmed majade hindade kohta teatud linnas (teie sõltuv muutuja) ja teave, nagu kas sellel on bassein, mitu ruutjalga see võtab enda alla, mitu magamistuba sellel on, mitu vannituba sellel on ja mitu garaaži sellel on on. Mitmekordne regressioon võimaldab teil vaadata, kuidas kõik need tegurid on seotud maja hinnaga, nii et pärast vaatasite, kuidas need on seotud hinnaga – võite oma võrrandi abil ennustada nende punktide põhjal maja hinda üksi.

Seda tüüpi regressioonanalüüsi saate kasutada ka Excelis, et vaadata, kuidas konkreetne tegur paljudest – nt kas majal on bassein – mõjutab sõltuvat muutujat (maja hindu), kui kõik muud muutujad jäävad alles konstantne. Kui teisendate koefitsiendid (nn osalise regressiooni koefitsiendid) standardseteks osalise regressiooni koefitsientideks, mis näitavad, mitut standardhälvet Y muutuks võrra, kui muudad vastavat muutujat ühe standardhälbe võrra, siis võrrand ütleb ka, millised tegurid on tulemuse määramisel olulisemad.

Kuidas teha Excelis mitut regressiooni

Saate Excelis teha mitme muutujaga regressiooni, kasutades sisseehitatud funktsiooni, millele pääseb juurde Andmete analüüs tööriist all Andmed vahekaart ja Analüüs Grupp. Klõpsake Andmete analüüs ja leidke valik regressioon tõstke ilmuvas aknas see esile ja klõpsake Okei. Klõpsake nuppu valige lahtrid ikooni kõrval Sisend Y vahemik välja ja seejärel valige veerg, mis sisaldab teie sõltuva muutuja tulemusi. Seejärel tehke sama Sisend X vahemik välja, kuid valige sõltumatute muutujate jaoks mitu veergu. Need veerud peavad olema kõrvuti, nii et kui neid pole, peate need enne regressiooni loomist teisaldama.

Regressiooniaknas on rida lisavalikuid, mille saate valida, et kohandada protsessi vastavalt oma vajadustele. Näiteks saate soovi korral määrata muu usaldustaseme kui 95 protsenti, valida jääkide kuvamise ja määrata, kuhu töövihikus väljund paigutatakse. See viimane suvand määratakse automaatselt Uus töölehe kiht, nii et tulemused kuvatakse uuel lehel, kuid saate seda või mõnda muud valikut vastavalt oma vajadustele muuta. Lisaks kontrollige Sildid kasti, kui teie sõltumatute muutujate veergudel on sildid ülaosas, nii et need kuvatakse väljundis.

Klõpsake Okei Excelis regressioonianalüüsi genereerimiseks ja uuele lehele suunamiseks.

Exceli regressiooniväljund

Pärast Excelis mitmekordse regressiooni tegemist on väljundis kolm peamist jaotist: regressioonistatistika, ANOVA ja hinnangulise regressioonijoone üksikasjad. Regressioonistatistika sisaldab mitmekordset korrelatsioonikordajat ("Multiple R"), mis näitab korrelatsiooni suunda ja tugevust vahemikus –1 kuni +1. Määramiskoefitsient "R ruut" näitab, mitu protsenti (kümnendkohana) sõltuva muutuja variatsioonist on seletatud sõltumatute muutujatega. "Kohandatud R ruut" annab teile märku seletusjõust, kuid seda ei ole lihtne tõlgendada, ja "Standardne viga" annab teile mõõta vaadeldud tulemuste ja teie regressiooni erinevust rida.

ANOVA jaotis sisaldab statistilist teavet regressioonijoonega seletatava variatsiooni suuruse kohta, "SS-regressioon" näitab teile reaga seletatavat summat ja "SS-i jääk" näitab summat, mis ei ole selgitas. Jaotised "MS" tähistavad "keskmist ruut" ja "F-statistika" on testistatistika, mida kasutatakse olulise tulemuse testimiseks, kusjuures jaotis "Olulisus F" annab teile P-väärtuse.

Viimases jaotises kirjeldatakse hinnangulise regressioonijoone omadusi, eriti koefitsiendid, olenemata sellest, kas need on sõltuva muutujaga märkimisväärselt seotud, ja nende variatsioonide suurus. Positiivsed koefitsiendid näitavad positiivset seost kõnealuse muutuja ja sõltuva muutuja vahel, nii et kui üks suureneb, siis ka teine. Negatiivsed väärtused tähendavad, et sõltuv muutuja väheneb sõltumatu muutuja suurenedes. Seega, kui maja hinna mitmekordse regressiooni koefitsient on 300, tähendab see, et täiendav ruutjalg suurendab maja maksumust keskmiselt 300 dollari võrra.

Mitme regressiooni eeldused ja piirangud

Oluline on meeles pidada, et mitmekordne regressioon on ainult tööriist ja nagu enamik tööriistu, saate seda kasutada ainult teatud juhtudel ja on asju, mida see lihtsalt ei suuda.

Üks olulisemaid piiranguid on see, et tulemuste põhjal on põhjuslikku seost raske teha. Näiteks kui teil on tulekahju tekitatud kahju mitmekordne regressioon ja paljud potentsiaalsed asjakohaste teguritega, leiate tõenäoliselt olulise seose kohalviibivate tuletõrjujate arvu ja tuletõrjujate vahel kahju tehtud. See ei tähenda, et tuletõrjujad põhjustanud kahju, sest teine ​​tegur, nagu mudelisse mittekuuluv tulekahju suurus, võib seletada mõlemat tähelepanekut.

Seda tüüpi Exceli mitmemõõtmelise analüüsi kaks olulist eeldust on lineaarsuse ja normaalsuse eeldused. Eeldate, et sõltuvate ja sõltumatute muutujate vahel on lineaarne seos, seega peaksite enne analüüsi sooritamist kontrollima, kas see tõenäoliselt kehtib. Saate kontrollida iga muutuja vahelist seost eraldi, kuid see pole täiuslik strateegia. Sarnaselt eeldab test, et muutujad on normaalselt jaotatud, seega peaksite enne testi läbiviimist kontrollima iga tulemuste normaalsust.