Kako uporabljati funkcijo Outliers v Excelu

Programski inženirji, ki delajo na projektu

Zasluga slike: nd3000/iStock/GettyImages

Ko analizirate podatke, lahko izstopajoči rezultati izkrivijo rezultate in jih naredijo manj zanesljivi. Na primer, če je ena ali več vaših vrednosti bistveno višjih od večine podatkov, naredijo povprečje višje, kar morda ne odraža podatkov kot celote. Odstranitev teh zunanjih podatkovnih točk je zato pomemben korak pri izvajanju zanesljivih statističnih izračunov. Brez namenske funkcije izstopov je najlažji način za izvedbo preizkusa izstopov v Excelu z uporabo interkvartilni razpon za identifikacijo izstopajočih, lahko pa uporabite tudi funkcijo Trimmean za približek enakih rezultat.

Izračun interkvartilnega razpona

Interkvartilni obseg podatkov je obseg, ki ga pokriva "škatla" na grafu škatle in brkov ali več natančno rezultat odštevanja vrednosti prve četrtine podatkov od vrednosti tretjega kvartil. Excel vsebuje vgrajeno funkcijo za izračun katerega koli kvartila za vaše podatke. Poiščite rezervno celico in vnesite "=QUARTILE([obseg podatkov], [kvartilno število])" in vnesite obseg celic za vaše podatke, kjer piše "[obseg podatkov]" in kvartil, ki ga želite, kjer piše "[kvartil številka]."

Video dneva

Na primer, če imate podatke v celicah A2 do A101 in želite vrednost za prvi kvartil, vnesete »=QUARTILE(A2:A101, 1)«, da poiščete vrednost. Za prvi del argumenta lahko z miško označite ustrezne celice, za vejico pa morate zapisati želeno številko kvartila. Za tretji kvartil z enakimi podatki vnesete "=QUARTILE(A2:A101, 3)", da dobite rezultat.

Z drugo prazno celico odštejte vrednost prve kvartilne celice od vrednosti tretje kvartilne celice. Če je prvi kvartil v celici C2 in tretji kvartil v celici D2, vnesite "=D2-C2", da dobite rezultat. To je interkvartilni razpon.

Analiza presežkov v Excelu

Če želite poiskati izstopajoče, lahko zdaj uporabite interkvartilni razpon v formuli izstopa, ki navaja, da je zgornja meja podatkov vrednost tretji kvartil plus 1,5-kratni interkvartilni razpon, spodnja meja pa je vrednost prvega kvartila minus 1,5-kratni interkvartil obseg.

Če je prva vrednost kvartila v C2, je tretja vrednost kvartila v celici D2, interkvartilno območje pa je v celico E2 bi vnesli "=C2-(1,5 * E2)", da bi našli spodnjo mejo, in "=D2+(1,5 * E2)", da bi našli zgornjo omejitev. Na splošno vnesete "=[prvi kvartil] – (1,5 * [medkvartilni obseg])", da poiščete spodnjo mejo, in "=[tretji kvartil] + (1,5 * [medkvartilni obseg])", da poiščete zgornjo mejo.

Vse, kar je pod spodnjo mejo ali nad zgornjo mejo, je presežek.

Če želite dokončati preizkus izstopa v Excelu, uporabite logično funkcijo "ALI", da na učinkovit način ugotovite, katere vrednosti v vašem podatkovnem razredu so izstopajoče. Vnesite "=ALI([podatkovna celica]>[zgornja meja], [podatkovna celica]$F$2, A2

Če je vrednost v A2 nad zgornjo mejo ali pod spodnjo mejo, se prikaže "TRUE", kar pomeni, da je vrednost izstopajoča. To formulo lahko povlečete navzdol tako, da kliknete spodnji desni kot celice s formulo in povlečete navzdol, tako da se konča poleg končne podatkovne celice, da za vsako izvede enak izračun podatkovna točka.

Podatke lahko tudi označite in pojdite na »Pogojno oblikovanje« v razdelku »Slogi« na zavihku »Domov«, če želite spremeniti oblikovanje za izstopajoče. Izberite »Novo pravilo« in označite možnost »Uporabi formulo za določitev, katere celice želite formatirati«. Vnesite isto formulo kot v prejšnjem odstavku in nato kliknite možnost »Oblika«, da izberete edinstveno oblikovanje za izstopajoče.

Uporaba Trimmeana

Funkcija "Trimmean" je enostavnejši način za prepoznavanje izstopajočih. Vnesite "=TRIMMEAN([obseg podatkov], [razmerje do obrezovanja])", da uporabite funkcijo, pri čemer obseg celic vsebuje podatke namesto "[podatkovni obseg]" in decimalko odstotek, ki ga želite obrezati, kjer piše "[razmerje do obreza]." S tem se odstranijo skrajne vrednosti na vrhu in na dnu in nato na podlagi teh izračuna povprečje preostalih. Torej, če bi obrezali 10 odstotkov, bi odstranili zgornjih 5 odstotkov in spodnjih 5 odstotkov, preden bi izračunali povprečje.

Če podatki tečejo od A2 do A101 in želite obrezati skrajnih 5 odstotkov vrednosti, vnesete »= TRIMMEAN(A2:A101, 0,05)«, da poiščete prilagojeno povprečje. Lahko bi zmanjšali 15 odstotkov tako, da namesto tega napišete "=TRIMMEAN(A2:A101, 0,15)".