Kā programmā Excel izmantot funkciju Outliers

Programmatūras inženieri, kas strādā pie projekta

Attēla kredīts: nd3000/iStock/GettyImages

Analizējot datus, novirzes var izkropļot rezultātus un padarīt tos mazāk ticamus. Piemēram, ja viena vai vairākas jūsu vērtības ir ievērojami augstākas par lielāko daļu datu, tās padara vidējo augstāku, kas var neatspoguļot datus kopumā. Tāpēc šo attālo datu punktu noņemšana ir svarīgs solis uzticamu statistikas aprēķinu veikšanā. Ja nav speciālas noviržu funkcijas, vienkāršākais veids, kā programmā Excel veikt novirzes testu, ir izmantot starpkvartīls diapazons, lai identificētu novirzes, taču varat arī izmantot Trimmean funkciju, lai to aptuvenu rezultāts.

Interkvartilā diapazona aprēķināšana

Interkvartilais datu diapazons ir diapazons, ko sedz "kaste" lodziņu un ūsu diagrammā vai vairāk precīzi rezultāts, kas iegūts, atņemot pirmās datu kvartiles vērtību no trešās kvartile. Programmā Excel ir iebūvēts līdzeklis, lai aprēķinātu jebkuru datu kvartili. Atrodiet rezerves šūnu un ierakstiet "=QUARTILE([datu diapazons], [kvartiles numurs])" un ievietojiet šūnu diapazonu jūsu datiem, kur ir rakstīts “[datu diapazons]” un vēlamajai kvartilei, kur ir rakstīts “[kvartile numurs]."

Dienas video

Piemēram, ja jums ir dati šūnās A2 līdz A101 un vēlaties vērtību pirmajai kvartilei, ievadiet "=QUARTILE(A2:A101, 1)", lai atrastu vērtību. Argumenta pirmajai daļai attiecīgās šūnas var iezīmēt ar peli, bet aiz komata jāieraksta vēlamās kvartiles numurs. Trešajai kvartilei ar tādiem pašiem datiem ierakstiet "=QUARTILE(A2:A101, 3)", lai iegūtu rezultātu.

Izmantojot citu tukšu šūnu, atņemiet pirmās kvartiles šūnas vērtību no trešās kvartiles šūnas vērtības. Ja pirmā kvartile atrodas šūnā C2 un trešā kvartile ir šūnā D2, ierakstiet "=D2-C2", lai iegūtu rezultātu. Šis ir starpkvartiļu diapazons.

Ārējo atšķirību analīze programmā Excel

Lai atrastu novirzes, tagad varat izmantot starpkvartiļu diapazonu izņēmuma formulā, kas nosaka, ka datu augšējā robeža ir trešā kvartile plus 1,5 reizes starpkvartiles diapazons, un apakšējā robeža ir pirmās kvartiles vērtība mīnus 1,5 reizes starpkvartile diapazons.

Ja pirmā kvartiles vērtība ir C2, trešā kvartiles vērtība ir šūnā D2 un starpkvartiles diapazons ir šūnā E2 ierakstiet "=C2-(1,5 * E2)", lai atrastu apakšējo robežu, un "=D2+(1,5 * E2)", lai atrastu augšējo robežu. ierobežojums. Parasti ievadiet "=[pirmā kvartile] – (1,5 * [starpkvartiles diapazons])", lai atrastu apakšējo robežu, un "=[trešā kvartile] + (1,5 * [starpkvartiles diapazons])", lai atrastu augšējo robežu.

Viss, kas ir zemāks par apakšējo robežu vai pārsniedz augšējo robežu, ir izņēmums.

Lai pabeigtu izņēmuma testu programmā Excel, izmantojiet loģisko funkciju VAI, lai efektīvi noteiktu, kuras vērtības jūsu datu klasē ir novirzes. Ievadiet "=VAI([datu šūna]>[augšējā robeža], [datu šūna]$F$2, A2

Ja vērtība A2 ir virs augšējās robežas vai zem apakšējās robežas, tiek parādīts "TRUE", kas norāda, ka vērtība ir novirze. Varat vilkt šo formulu uz leju, noklikšķinot uz šūnas apakšējā labā stūra ar formulu un velkot to uz leju, lai tā beigtos blakus galīgajai datu šūnai, lai katrai veiktu to pašu aprēķinu datu punkts.

Varat arī izcelt datus un cilnes Sākums sadaļā "Stili" pāriet uz "Nosacītā formatēšana", ja vēlaties mainīt noviržu formatējumu. Izvēlieties "Jauns noteikums" un iezīmējiet opciju "Izmantot formulu, lai noteiktu, kuras šūnas formatēt". Ierakstiet to pašu formulu kā iepriekšējā rindkopā un pēc tam noklikšķiniet uz opcijas Formatēt, lai izvēlētos unikālo formatējumu novirzēm.

Izmantojot Trimmean

Funkcija "Trimmean" ir vienkāršāks veids, kā noteikt novirzes. Ierakstiet "=TRIMMEAN([datu diapazons], [proportion to trim])", lai izmantotu funkciju, un šūnu diapazonu satur datus "[datu diapazons]" vietā un decimāldaļu. procentuālā daļa, kuru vēlaties apgriezt, kur ir rakstīts "[proportion to trim]". Tas noņem galējās vērtības augšpusē un apakšā un pēc tam aprēķina vidējo vērtību, pamatojoties uz tām atlikušie. Tātad, ja jūs samazinātu 10 procentus, pirms vidējās vērtības aprēķināšanas tiktu noņemti augšējie 5 procenti un apakšējie 5 procenti.

Ja dati tiek rādīti no A2 līdz A101 un vēlaties samazināt galējos 5 procentus vērtību, ievadiet "=TRIMMEAN(A2:A101, 0.05)", lai atrastu koriģēto vidējo. Varat apgriezt 15 procentus, tā vietā ierakstot "=TRIMMEAN(A2:A101, 0.15)".