Kuinka käyttää useaa regressiota Excelissä
Kuvan luotto: fizkes/iStock/GettyImages
Excel on tehokas työkalu tietojen analysointiin riippumatta siitä, työskenteletkö yksinkertaisen suhteen kanssa yksi riippumaton muuttuja ja riippuvainen muuttuja tai siihen on useita riippumattomia muuttujia harkita. Monimuuttuja-analyysin suorittaminen Excelissä – usean regression muodossa – ja tulosten tulkitseminen on välttämätöntä, jos sinulla on monimutkaisia tietoja käsiteltävänä. Hyvä uutinen on, että Excel on hyvin määritetty käsittelemään näitä tehtäviä, ja sinun tarvitsee vain oppia yhden funktion toiminta, jotta tietosi ymmärtäminen alkaa.
Mikä on moninkertainen regressio?
Moniregressio on tapa liittää useita riippumattomia muuttujia yhteen riippuvaiseen muuttujaan etsimällä yhtälö, joka kuvaa kuinka kyseinen muuttuja muuttuu kunkin kanssa. Perustavampi, mutta samankaltainen työkalu on lineaarinen regressio, jolla pyritään tutkimaan yhden riippumattoman välistä yhteyttä muuttuja, kuten liikalihavuus, riippuvaisesta muuttujasta, kuten syöpäriskistä, mutta asiat ovat harvoin tätä suoraviivaista. Jatkaen esimerkkiä, myös vuorokaudessa poltettujen savukkeiden määrä liittyy syöpäriskiin, samoin kuin juomasi alkoholin määrä. Jotta saataisiin luotettava ennuste syöpäriskistä yksilölle, sinun on otettava kaikki nämä tekijät (ja enemmän) huomioon.
Päivän video
Useita regressioita varten käytetyn yhtälön yleinen muoto on:
Y^ = a + b1x1 + b2x2 + b3x3 …
Joten Y^ on havainnon odotusarvo, b1 ja niin edelleen edustavat välisen suoran suhteen kaltevuutta x1 ja Y^, ja x1 ja niin edelleen ovat analyysiin sisältyvät muuttujat. The a kertoo asian pointin y-siepata. Moninkertaiseen regressioon kuuluu kertoimien arvojen valitseminen (b1 ja niin edelleen), jotka minimoivat odotusarvon välisen eron Y^ ja havaittu arvo Y, mikä antaa sinulle parhaan sovituksen mallin ja tietojen välillä.
Mitä moninkertainen regressio kertoo sinulle?
Useat regressiot antavat numeerisia arvoja useiden muuttujien ja tuloksen väliselle yhteydelle, joten voit käyttää sitä ennusteisiin, arvioitaessa eri muuttujien suhteellinen panos tulokseen tai muutamaan muuhun tarkoitukseen, kuten valitsemaan tärkeimmät muuttujat käytettäväksi matemaattisessa malli.
Oletetaan esimerkiksi, että sinulla on tietoja talojen hinnoista tietyssä kaupungissa (riippuvainen muuttujasi) sekä tietoja, kuten onko siinä uima-allas, kuinka monta neliöjalkaa siinä on, kuinka monta makuuhuonetta siinä on, kuinka monta kylpyhuonetta siinä on ja kuinka monta autotallia on. Usein regression avulla voit tarkastella, kuinka kukin näistä tekijöistä liittyy talon hintaan, joten - sen jälkeen katsoit kuinka ne liittyvät hintaan – voit käyttää yhtälöäsi talon hinnan ennustamiseen näiden seikkojen perusteella yksin.
Voit myös käyttää tämäntyyppistä regressioanalyysiä Excelissä tarkastellaksesi, kuinka tietty tekijä monista – kuten onko talossa uima-allas – vaikuttaa riippuvaiseen muuttujaan (asuntojen hintoihin), jos kaikki muut muuttujat säilyvät vakio. Jos muunnat kertoimet (kutsutaan "osittaisregressiokertoimiksi") standardiosittaisregressiokertoimiksi, jotka edustavat kuinka monta keskihajontaa Y muuttuisi jos muutat vastaavaa muuttujaa yhdellä keskihajonnalla, yhtälö kertoo myös mitkä tekijät ovat tärkeämpiä tuloksen määrittämisessä.
Kuinka tehdä useita regressioita Excelissä
Voit suorittaa monimuuttujaregression Excelissä käyttämällä sisäänrakennettua funktiota, joka on käytettävissä Tietojen analysointi työkalu alla Data välilehti ja Analyysi ryhmä. Klikkaus Tietojen analysointi ja löydä vaihtoehto regressio korosta se avautuvassa ikkunassa ja napsauta OK. Klikkaa valitse solut -kuvake vieressä Tulo Y-alue -kenttään ja valitse sitten sarake, joka sisältää riippuvaisen muuttujan tulokset. Tee sitten sama Input X Range kenttään, mutta valitse useat sarakkeet riippumattomille muuttujillesi. Näiden sarakkeiden on oltava vierekkäin, joten jos ne eivät ole, sinun on siirrettävä niitä ennen regression tuottamista.
Regressio-ikkunassa on useita lisävaihtoehtoja, jotka voit valita räätälöidäksesi prosessin tarpeidesi mukaan. Voit esimerkiksi halutessasi asettaa muun luotettavuustason kuin 95 prosenttia, valita jäännösten näyttämisen ja määrittää, mihin tuloste sijoitetaan työkirjassasi. Tämä viimeinen vaihtoehto asetetaan automaattisesti Uusi työarkkikerros, joten tulokset näkyvät uudella arkilla, mutta voit muuttaa tätä tai mitä tahansa muuta vaihtoehtoa tarpeidesi mukaan. Tarkista lisäksi Tarrat ruutuun, jos riippumattomien muuttujien sarakkeissa on otsikot yläreunassa, joten ne näkyvät tulosteessa.
Klikkaus OK luodaksesi regressioanalyysisi Excelissä ja siirtyäksesi uuteen taulukkoon.
Regressiotulostus Excelistä
Tulosteessa, joka esitetään usean Excelin regression suorittamisen jälkeen, on kolme pääosiota: regressiotilastot, ANOVA ja arvioidun regressioviivan yksityiskohdat. Regressiotilastot sisältävät moninkertaisen korrelaatiokertoimen ("Multiple R"), joka näyttää korrelaation suunnan ja voimakkuuden välillä -1 - +1. Determinaatiokerroin, "R-neliö", kertoo, kuinka suuri prosenttiosuus (desimaalilukuna) riippuvaisen muuttujan vaihtelusta on selitetty riippumattomilla muuttujilla. "Säädetty R-neliö" antaa viitteen selittävästä voimasta, mutta sitä ei ole helppo tulkita, ja "Standard Error" antaa sinulle mittarin havaittujen tulosten ja regressiosi välisestä vaihtelusta linja.
ANOVA-osio sisältää tilastotietoja regressioviivan selittämän vaihtelun määrästä, jossa "SS Regression" kertoo sinulle rivillä selitetyn summan ja "SS Residual" edustaa määrää, joka ei ole selitti. "MS"-osat tarkoittavat "keskineliötä", ja "F-tilasto" on testitilasto, jota käytetään merkittävän tuloksen testaamiseen, ja "Significance F" -osio antaa sinulle P-arvon.
Lopuksi viimeinen osa kertoo sinulle arvioidun regressiosuoran ominaisuuksista, erityisesti kertoimet, ovatko ne merkittävästi sidoksissa riippuvaiseen muuttujaan ja kuinka paljon vaihtelua niissä voi olla. Positiiviset kertoimet osoittavat positiivisen suhteen kyseessä olevan muuttujan ja riippuvaisen muuttujan välillä, joten kun toinen kasvaa, toinenkin kasvaa. Negatiiviset arvot tarkoittavat, että riippuva muuttuja pienenee riippumattoman muuttujan kasvaessa. Joten, jos asunnon hintojen moninkertaisen regression "neliömetrin" kerroin on 300, tämä tarkoittaa, että ylimääräinen neliöjalka lisää talon kustannuksia keskimäärin 300 dollarilla.
Multiple Regression oletukset ja rajoitukset
On tärkeää muistaa, että moninkertainen regressio on vain työkalu, ja kuten useimpia työkaluja, voit käyttää sitä vain joissakin olosuhteissa, ja on joitain asioita, joita se ei voi tehdä.
Yksi tärkeimmistä rajoituksista on, että tulosten perusteella on vaikea päätellä syy-yhteyttä. Esimerkiksi, jos sinulla on moninkertainen regressio tulipalon aiheuttaman vahingon ja monien mahdollisten vahinkojen kanssa oleellisia tekijöitä, löydät todennäköisesti merkittävän yhteyden paikalla olevien palomiesten lukumäärän ja palomiesten välillä vahinko tehty. Tämä ei tarkoita, että palomiehet aiheuttanut vahinkoa, koska toinen tekijä, kuten malliin sisältymätön tulipalon koko, voisi selittää nämä molemmat havainnot.
Tämän tyyppisen Excelin monimuuttuja-analyysin kaksi tärkeää oletusta ovat lineaarisuuden ja normaaliuden oletukset. Oletat, että riippuvien ja riippumattomien muuttujien välillä on lineaarinen suhde, joten sinun tulee tarkistaa, että tämä on todennäköisesti voimassa ennen analyysin suorittamista. Voit tarkastella kunkin muuttujan välistä suhdetta erikseen tarkistaaksesi, mutta tämä ei ole täydellinen strategia. Vastaavasti testissä oletetaan, että muuttujat jakautuvat normaalisti, joten sinun tulee tarkistaa jokaisen tulosten normaalius ennen testin suorittamista.