Како користити функцију Оутлиерс у Екцел-у

click fraud protection
Софтверски инжењери раде на пројекту

Кредит за слику: нд3000/иСтоцк/ГеттиИмагес

Када анализирате податке, одступања могу искривити резултате и учинити их мање поузданим. На пример, ако је једна или више ваших вредности знатно веће од већине података, оне чине средњу вредност већом, што можда не одражава податке у целини. Уклањање ових удаљених тачака података је, стога, важан корак у извођењу поузданих статистичких прорачуна. Без наменске функције ванредних вредности, најлакши начин да извршите тест одступања у Екцел-у је да користите интерквартилни опсег да бисте идентификовали излазне вредности, али такође можете користити функцију Триммеан да бисте апроксимирали исте резултат.

Израчунавање интерквартилног опсега

Интерквартилни опсег података је опсег покривен „кутијом“ на дијаграму кутија и бркова, или више тачније, резултат одузимања вредности за први квартил података од вредности трећег квартил. Екцел садржи уграђену функцију за израчунавање било ког квартила за ваше податке. Пронађите резервну ћелију и откуцајте „=КУАРТИЛЕ([опсег података], [квартил број])“ и унесите опсег ћелија за ваше податке где пише „[опсег података]“ и квартил који желите где пише „[квартил број]."

Видео дана

На пример, ако имате податке у ћелијама А2 до А101 и желите вредност за први квартил, унесите „=КУАРТИЛЕ(А2:А101, 1)“ да бисте пронашли вредност. За први део аргумента, можете да означите релевантне ћелије помоћу миша, али после зареза треба да упишете број квартила који желите. За трећи квартил са истим подацима укуцате „=КУАРТИЛЕ(А2:А101, 3)“ да бисте добили резултат.

Користећи другу празну ћелију, одузмите вредност прве квартилне ћелије од вредности треће квартилне ћелије. Ако је први квартил у ћелији Ц2, а трећи квартил у ћелији Д2, откуцајте „=Д2-Ц2“ да бисте добили резултат. Ово је интерквартилни опсег.

Оутлиер Аналисис у Екцел-у

Да бисте пронашли излазне вредности, сада можете користити интерквартилни опсег у формули оутлиер-а, који каже да је горња граница података вредност трећи квартил плус 1,5 пута интерквартилни опсег, а доња граница је вредност првог квартила минус 1,5 пута интерквартил домет.

Ако је прва вредност квартила у Ц2, трећа квартилна вредност је у ћелији Д2, а интерквартилни опсег је у ћелији Е2, откуцали бисте "=Ц2-(1,5 * Е2)" да бисте пронашли доњу границу и "=Д2+(1,5 * Е2)" да бисте пронашли горњу лимит. Генерално, уносите „=[први квартил] – (1,5 * [интерквартилни опсег])“ да бисте пронашли доњу границу и „=[трећи квартил] + (1,5 * [интерквартилни опсег])“ да бисте пронашли горњу границу.

Све испод доње границе или изнад горње границе је изван граница.

Да бисте завршили тест одступања у Екцел-у, користите логичку функцију „ИЛИ“ да бисте на ефикасан начин идентификовали које вредности у вашој класи података су одступања. Унесите „=ИЛИ([ћелија са подацима]>[горња граница], [ћелија са подацима]$Ф$2, А2

Ако је вредност у А2 изнад горње границе или испод доње границе, приказује се „ТРУЕ“, што указује да је вредност ван граница. Можете да превучете ову формулу надоле тако што ћете кликнути на доњи десни угао ћелије са формулом и повлачећи га надоле тако да заврши поред коначне ћелије са подацима да би се извршио исти прорачун на свакој Подаци указују.

Такође можете да истакнете податке и да одете на „Условно форматирање“ у одељку „Стилови“ на картици „Почетна“ ако желите да промените форматирање за ванредне вредности. Изаберите „Ново правило“ и означите опцију „Користите формулу да бисте одредили које ћелије желите да форматирате“. Откуцајте исту формулу као у претходном пасусу, а затим кликните на опцију „Формат“ да бисте изабрали јединствено форматирање за одступнике.

Коришћење Триммеана

Функција „Триммеан“ је једноставнији начин за идентификацију одступања. Откуцајте „=ТРИММЕАН([опсег података], [пропорција према скраћивању])“ да бисте користили функцију, са опсегом ћелија које садрже податке уместо „[опсег података]“ и децимала проценат који желите да исечете где пише „[пропорција у односу на исецање].“ Ово уклања екстремне вредности на врху и дну, а затим израчунава средњу вредност на основу њих преосталих. Дакле, ако бисте смањили 10 процената, уклонило би се горњих 5 процената и доњих 5 процената пре израчунавања средње вредности.

Ако се подаци крећу од А2 до А101 и желите да смањите екстремних 5 процената вредности, унесите „=ТРИММЕАН(А2:А101, 0,05)“ да бисте пронашли прилагођену средњу вредност. Можете смањити 15 процената тако што ћете уместо тога написати „=ТРИММЕАН(А2:А101, 0,15)“.