Kép jóváírása: nd3000/iStock/GettyImages
Amikor adatokat elemez, a kiugró értékek torzíthatják az eredményeket, és kevésbé megbízhatóak lehetnek. Például, ha egy vagy több értéke lényegesen magasabb, mint az adatok többsége, akkor az átlagot magasabbra teszik, ami esetleg nem tükrözi az adatok egészét. Ezért ezeknek a külső adatpontoknak az eltávolítása fontos lépés a megbízható statisztikai számítások elvégzésében. Mivel nincs dedikált kiugró függvény, a kiugró értékek tesztelésének legegyszerűbb módja az Excelben a interkvartilis tartomány a kiugró értékek azonosításához, de használhatja a Trimmean függvényt is ezek közelítésére eredmény.
Az interkvartilis tartomány kiszámítása
Az adatok interkvartilis tartománya az a tartomány, amelyet a "doboz" fed le egy doboz és bajusz diagramon, vagy több pontosan az az eredmény, amikor az adatok első kvartilisének értékét levonjuk a harmadik értékéből kvartilis. Az Excel beépített szolgáltatást tartalmaz az adatok bármely kvartilisének kiszámításához. Keressen egy tartalék cellát, és írja be a "=QUARTILE([adattartomány], [kvartilisszám])" parancsot, és adja meg a cellák tartományát az adatokhoz ott, ahol ez áll: „[adattartomány]”, és a kívánt kvartilis, ahol ez áll: „[kvartilis szám]."
A nap videója
Például, ha az A2–A101 cellákban adatok vannak, és az első kvartilis értékét szeretné megadni, akkor írja be a "=QUARTILE(A2:A101, 1)" parancsot az érték megkereséséhez. Az argumentum első részében az egérrel kiemelhetjük a megfelelő cellákat, de a vessző után a kívánt kvartilis számát kell beírni. Az azonos adatokkal rendelkező harmadik kvartilishez írja be a "=QUARTILE(A2:A101, 3)" parancsot az eredmény eléréséhez.
Egy másik üres cella használatával vonja ki az első kvartilis cella értékét a harmadik kvartilis cella értékéből. Ha az első kvartilis a C2 cellában, a harmadik kvartilis pedig a D2 cellában található, írja be a "=D2-C2" kifejezést az eredmény eléréséhez. Ez az interkvartilis tartomány.
Outlier elemzés Excelben
A kiugró értékek meghatározásához most már használhatja a kiugró képlet interkvartilis tartományát, amely kimondja, hogy az adatok felső határa a harmadik kvartilis plusz az interkvartilis 1,5-szerese, az alsó határ pedig az első kvartilis értéke mínusz az interkvartilis 1,5-szerese hatótávolság.
Ha az első kvartilis értéke a C2-ben van, a harmadik kvartilis értéke a D2 cellában, az interkvartilis tartomány pedig az E2 cellába írja be: "=C2-(1,5 * E2)" az alsó határérték, a "=D2+(1,5 * E2)" pedig a felső érték kereséséhez. határ. Általában a következőt írja be: "=[első kvartilis] – (1,5 * [interkvartilis tartomány])" az alsó határ, a "=[harmadik kvartilis] + (1,5 * [interkvartilis tartomány])" pedig a felső határ meghatározásához.
Bármi, ami az alsó határ alatt van vagy a felső határ felett, az kiugró érték.
Az Excelben a kiugró értékek tesztelésének befejezéséhez használja a logikai „VAGY” függvényt annak meghatározására, hogy az adatosztályban mely értékek számítanak kiugró értékeknek. Írja be: "=VAGY([adatcella]>[felső határ], [adatcella]$F$2, A2
Ha az A2-ben szereplő érték meghaladja a felső határt vagy az alsó határ alatt van, akkor az „IGAZ” felirat jelenik meg, jelezve, hogy az érték kiugró érték. A képletet lefelé húzhatja, ha a képletet tartalmazó cella jobb alsó sarkába kattint és húzza le úgy, hogy a végső adatcella mellett fejeződjön be, és mindegyiknél ugyanazt a számítást hajtsa végre adatpont.
Kijelölheti az adatokat is, és a "Főoldal" lap "Stílusok" részében a "Feltételes formázás" menüpontra léphet, ha módosítani szeretné a kiugró értékek formázását. Válassza az "Új szabály" lehetőséget, és jelölje ki a "Képlet használata a formázandó cellák meghatározásához" lehetőséget. Írja be ugyanazt a képletet, mint az előző bekezdésben, majd kattintson a "Formátum" lehetőségre a kiugró értékek egyedi formázásának kiválasztásához.
Trimmean használata
A "Trimmean" funkció egy egyszerűbb módja a kiugró értékek azonosításának. A függvény használatához írja be a "=TRIMMEAN([adattartomány], [arány a kivágáshoz])" parancsot, és az adatokat tartalmazó cellatartomány az "[adattartomány]" helyett tizedesjegyet tartalmaz. a levágni kívánt százalékos arányt, ahol a „[levágás aránya]” felirat szerepel. Ez eltávolítja a felső és alsó szélső értékeket, majd ezek alapján kiszámítja az átlagot többi. Tehát ha 10 százalékot levág, akkor az átlag kiszámítása előtt eltávolítja a felső 5 százalékot és az alsó 5 százalékot.
Ha az adatok A2-től A101-ig futnak, és az értékek szélső 5 százalékát szeretné levágni, írja be a "=TRIMMEAN(A2:A101, 0.05)" értéket a korrigált átlag megtalálásához. 15 százalékot levághat, ha helyette "=TRIMMEAN(A2:A101, 0.15)" írja be.