Како користити вишеструку регресију у Екцелу
Кредит за слику: физкес/иСтоцк/ГеттиИмагес
Екцел је моћан алат за анализу података, било да радите са једноставним односом између једна независна варијабла и зависна варијабла или постоји више независних варијабли за размотрити. Учење о томе како да извршите мултиваријантну анализу у Екцел-у – у облику вишеструке регресије – и тумачите резултате је од суштинског значаја ако имате компликоване податке за обраду. Добра вест је да је Екцел добро подешен да се носи са овим задацима и потребно је само да научите како једна функција функционише да бисте почели да схватате своје податке.
Шта је вишеструка регресија?
Вишеструка регресија је начин повезивања више независних променљивих са једном зависном променљивом проналажењем једначине која описује како се дотична променљива мења са сваком од њих. Основнији, али сличнији алат је линеарна регресија, која има за циљ да истражи везу између једног независног варијабла, као што је гојазност, на зависну варијаблу као што је ризик од рака, али ствари су ретко такве право напред. Настављајући са примером, број попушених цигарета дневно је такође повезан са ризиком од рака, као и количина алкохола коју пијете. Да бисте дошли до поузданог предвиђања ризика од рака за појединца, требало би да узмете све ове факторе (и више) у обзир.
Видео дана
Општи облик једначине која се користи за вишеструке регресије је:
И^ = а + б1Икс1 + б2Икс2 + б3Икс3 …
Дакле, И^ је очекивана вредност за посматрање, тхе б1 и тако даље представљају нагиб праволинијског односа између Икс1 и И^, и Икс1 и тако даље су варијабле укључене у анализу. Тхе а говори вам поенту и-пресреће. Вишеструка регресија укључује избор вредности коефицијената (б1 и тако даље) који минимизирају разлику између очекиване вредности И^ и уочену вредност И, што вам даје најбоље уклапање између модела и података.
Шта вам говори вишеструка регресија?
Вишеструке регресије стављају нумеричке вредности на везу између мноштва варијабли и исхода, тако да можете да је користите за предвиђања, за процену релативни допринос различитих варијабли резултату, или за неколико других сврха као што је одабир најрелевантнијих варијабли које ће се користити у математичком модел.
На пример, рецимо да имате податке о ценама кућа у одређеном граду (ваша зависна варијабла), заједно са информацијама као што су да ли има базен, колико квадрата заузима, колико спаваћих соба има, колико купатила има и колико гаража има. Вишеструка регресија би вам омогућила да погледате како је сваки од ових фактора повезан са ценом куће, тако да – након погледали сте како се они односе на цену – могли бисте да користите своју једначину да предвидите цену куће на основу ових тачака сама.
Такође можете да користите ову врсту регресионе анализе у Екцел-у да бисте видели како одређени фактор од многих – као нпр да ли кућа има базен – утиче на зависну променљиву (цене кућа) ако остају све остале варијабле константан. Ако конвертујете коефицијенте (који се називају „коефицијенти делимичне регресије“) у стандардне коефицијенте делимичне регресије, који представљају колико стандардних девијација И би се променило за ако промените одговарајућу променљиву за једну стандардну девијацију, онда вам једначина такође говори који су фактори важнији за одређивање резултата.
Како направити вишеструку регресију у Екцелу
Можете да извршите мултиваријантну регресију у Екцел-у користећи уграђену функцију којој се може приступити преко Анализа података алат испод Подаци картица и Анализа група. Кликните Анализа података и пронађите опцију за регресија у прозору који се појави, означите га и кликните У реду. Кликните на изаберите ћелије икона поред Опсег уноса И поље, а затим изаберите колону која садржи резултате за вашу зависну променљиву. Затим урадите исто за Улаз Кс опсег поље, али изаберите више колона за ваше независне променљиве. Ове колоне морају да буду једна поред друге, па ако нису, морате да их померите пре него што направите регресију.
Прозор Регресије има низ додатних опција које можете изабрати да бисте прилагодили процес својим потребама. На пример, можете подесити ниво поузданости који није 95 процената ако желите, изабрати да прикажете остатке и одредите где се излаз налази у вашој радној свесци. Ова последња опција је аутоматски подешена на Нови радни лист Пли, тако да се резултати приказују на новом листу, али можете променити ову или било коју другу опцију да одговара вашим потребама. Поред тога, проверите Етикете поље ако колоне за ваше независне променљиве имају ознаке на врху, тако да се оне приказују у излазу.
Кликните У реду да бисте генерисали вашу регресиону анализу у Екцел-у и били одведени на нови лист.
Регресијски излаз из Екцел-а
Постоје три главна одељка за излаз који вам је представљен након што урадите вишеструку регресију у Екцел-у: статистика регресије, АНОВА и детаљи на процењеној линији регресије. Статистика регресије укључује коефицијент вишеструке корелације („Мултипле Р“) који показује правац и јачину корелације, од −1 до +1. Коефицијент детерминације, "Р квадрат," вам говори који проценат (као децимални) варијације зависне променљиве је објашњен независним променљивим. „Прилагођени Р квадрат“ вам даје индикацију моћи објашњења, али није једноставно за тумачење, а „Стандардна грешка“ вам даје меру варијације између уочених резултата и ваше регресије линија.
Одељак АНОВА садржи статистичке информације о количини варијације објашњене регресионом линијом, са „СС Регресијом“ која вам говори износ објашњен линијом, а „СС Ресидуал“ представља износ који није објаснио. Одељци „МС“ означавају „средњи квадрат“, а „Ф статистика“ је тест статистика која се користи за тестирање значајног резултата, при чему одељак „Значај Ф“ даје П-вредност.
Коначно, последњи одељак вам говори о карактеристикама процењене регресионе линије, посебно о вредностима коефицијенти, да ли су значајно повезани са зависном променљивом, и количину варијације која може постојати у њима. Позитивни коефицијенти показују позитиван однос између дотичне варијабле и зависне варијабле, тако да када се један повећава, повећава се и други. Негативне вредности значе да се зависна променљива смањује како независна променљива расте. Дакле, ако је коефицијент "квадрата" на вишеструкој регресији цена куће 300, то значи да додатни квадратни метар простора повећава цену куће у просеку за 300 долара.
Претпоставке и ограничења вишеструке регресије
Важно је запамтити да је вишеструка регресија само алат, и као и већину алата, можете је користити само у неким околностима, а постоје неке ствари које једноставно не може да уради.
Једно од најважнијих ограничења је да је тешко закључити узрочност на основу резултата. На пример, ако имате вишеструку регресију са оштећењем изазваном пожаром и многим потенцијалним релевантних фактора, вероватно ћете пронаћи значајну везу између броја присутних ватрогасаца и учињена штета. То не значи да су ватрогасци изазвано штета јер би други фактор као што је величина пожара који није укључен у модел могао да објасни оба ова запажања.
Две важне претпоставке мултиваријантне анализе у Екцелу овог типа су претпоставке линеарности и нормалности. Претпостављате линеарну везу између зависних и независних променљивих, тако да би требало да проверите да ли је ово валидно пре него што извршите анализу. Можете погледати однос између сваке променљиве појединачно да бисте проверили, али ово није савршена стратегија. Слично томе, тест претпоставља да су варијабле нормално распоређене, тако да би требало да проверите резултате за сваку од њих да ли су нормални пре спровођења теста.