Vaizdo kreditas: nd3000/iStock/GettyImages
Kai analizuojate duomenis, nuokrypiai gali iškreipti rezultatus ir padaryti juos mažiau patikimus. Pavyzdžiui, jei viena ar daugiau jūsų verčių yra daug didesnės nei daugumos duomenų, jos padidina vidurkį, o tai gali neatspindėti visų duomenų. Todėl šių atokių duomenų taškų pašalinimas yra svarbus žingsnis atliekant patikimus statistinius skaičiavimus. Neturint specialios nuokrypių funkcijos, paprasčiausias būdas atlikti nukrypimų testą programoje „Excel“ yra naudoti tarpkvartilinis diapazonas, kad nustatytumėte nuokrypius, tačiau taip pat galite naudoti funkciją Trimmean, kad apytiksliai tą patį būtų galima nustatyti rezultatas.
Interkvartilinio diapazono apskaičiavimas
Tarpkvartilinis duomenų diapazonas yra diapazonas, kurį apima dėžutės ir ūsų diagramos „dėžutė“ arba daugiau tiksliai rezultatas, atėmus pirmojo duomenų kvartilio reikšmę iš trečiojo kvartilis. „Excel“ yra integruota funkcija, leidžianti apskaičiuoti bet kurį jūsų duomenų kvartilį. Raskite atsarginį langelį ir įveskite „= QUARTILE([duomenų diapazonas], [kvartilio numeris])“ ir įveskite langelių diapazoną jūsų duomenims, kur parašyta „[duomenų diapazonas]“, o norimas kvartilis ten, kur parašyta „[kvartilis numeris]“.
Dienos vaizdo įrašas
Pavyzdžiui, jei turite duomenų langeliuose nuo A2 iki A101 ir norite pirmojo kvartilio reikšmės, įveskite „=QUARTILE(A2:A101, 1)“, kad rastumėte reikšmę. Pirmoje argumento dalyje galite paryškinti atitinkamas ląsteles pele, bet po kablelio reikia parašyti norimo kvartilio numerį. Trečiajame kvartilyje su tais pačiais duomenimis įveskite „=QUARTILE(A2:A101, 3)“, kad gautumėte rezultatą.
Naudodami kitą tuščią langelį, atimkite pirmojo kvartilio langelio vertę iš trečiojo kvartilio langelio vertės. Jei pirmasis kvartilis yra langelyje C2, o trečiasis kvartilis yra langelyje D2, įveskite „=D2-C2“, kad gautumėte rezultatą. Tai yra tarpkvartilis diapazonas.
Išskirtinių dalykų analizė programoje „Excel“.
Norėdami sužinoti nuokrypius, dabar galite naudoti tarpkvartilinį diapazoną nuokrypio formulėje, kuri nurodo, kad viršutinė duomenų riba yra trečiasis kvartilis plius 1,5 karto tarpkvartilis, o apatinė riba yra pirmojo kvartilio vertė atėmus 1,5 tarpkvartilio diapazonas.
Jei pirmoji kvartilio reikšmė yra C2, trečioji kvartilio reikšmė yra langelyje D2, o tarpkvartilio diapazonas yra langelyje E2 įveskite „=C2-(1,5 * E2)“, kad rastumėte apatinę ribą, ir „=D2+(1,5 * E2)“, kad surastumėte viršutinę ribą riba. Paprastai įveskite „=[pirmasis kvartilis] – (1,5 * [tarpkvartilis])“, kad rastumėte apatinę ribą, ir „=[trečiasis kvartilis] + (1,5 * [tarpkvartilis])“, kad rastumėte viršutinę ribą.
Viskas, kas yra žemiau apatinės ribos arba viršija viršutinę ribą, yra išskirtinė.
Norėdami baigti nuokrypių testą programoje „Excel“, naudokite loginę „ARBA“ funkciją, kad efektyviai nustatytumėte, kurios jūsų duomenų klasės reikšmės yra išskirtinės. Įveskite "=ARBA([duomenų langelis]>[viršutinė riba], [duomenų langelis]$F$2, A2
Jei A2 reikšmė yra didesnė už viršutinę ribą arba mažesnė už apatinę ribą, rodoma „TRUE“, o tai reiškia, kad vertė yra išskirtinė. Galite vilkti šią formulę žemyn spustelėdami apatinį dešinįjį langelio kampą su formule ir vilkite jį žemyn, kad jis baigtųsi šalia galutinio duomenų langelio, kad kiekviename būtų atliktas tas pats skaičiavimas duomenų taškas.
Taip pat galite paryškinti duomenis ir eiti į „Sąlyginis formatavimas“, esantį skirtuko „Pagrindinis“ skiltyje „Stiliai“, jei norite pakeisti išskirtinių parametrų formatavimą. Pasirinkite „Nauja taisyklė“ ir pažymėkite parinktį „Naudoti formulę, kad nustatytumėte, kurias langelius formatuoti“. Įveskite tą pačią formulę, kaip ir ankstesnėje pastraipoje, tada spustelėkite parinktį „Formatas“, kad pasirinktumėte unikalų iškrypimų formatavimą.
Naudojant Trimmean
Funkcija „Trimmean“ yra paprastesnis pašalinių verčių nustatymo būdas. Įveskite „=TRIMMEAN([duomenų diapazonas], [proporcija iki apipjaustymo])“, kad galėtumėte naudoti funkciją, o langelių diapazonas su duomenimis vietoje „[duomenų diapazonas]“ ir dešimtainis skaičius procentas, kurį norite apkarpyti, kur parašyta „[proporcija apkarpyti]“. Tai pašalina kraštutines vertes viršuje ir apačioje ir pagal jas apskaičiuoja vidurkį likę. Taigi, jei sumažintumėte 10 procentų, prieš apskaičiuojant vidurkį būtų pašalinti viršutiniai 5 procentai ir apatiniai 5 procentai.
Jei duomenys pateikiami nuo A2 iki A101 ir norite apkarpyti kraštutinius 5 procentus verčių, įveskite „=TRIMMEAN(A2:A101, 0.05)“, kad rastumėte pakoreguotą vidurkį. Galite sumažinti 15 procentų, vietoj to parašydami „=TRIMMEAN(A2:A101, 0.15)“.