Cara Menggunakan Fungsi Pencilan di Excel

Insinyur perangkat lunak mengerjakan proyek

Kredit Gambar: nd3000/iStock/GettyImages

Saat Anda menganalisis data, outlier dapat mengubah hasil dan membuatnya kurang dapat diandalkan. Misalnya, jika satu atau beberapa nilai Anda jauh lebih tinggi daripada sebagian besar data, nilai tersebut membuat rata-rata lebih tinggi, yang mungkin tidak mencerminkan data secara keseluruhan. Oleh karena itu, menghapus titik-titik data terpencil ini merupakan langkah penting dalam melakukan perhitungan statistik yang andal. Tanpa fungsi outlier khusus, cara termudah untuk melakukan tes outlier di Excel adalah dengan menggunakan rentang interkuartil untuk mengidentifikasi outlier, tetapi Anda juga dapat menggunakan fungsi Trimmean untuk memperkirakan hal yang sama hasil.

Menghitung Jangkauan Interkuartil

Rentang interkuartil data adalah rentang yang dicakup oleh "kotak" pada plot kotak-dan-kumis, atau lebih tepatnya, hasil mengurangkan nilai kuartil pertama data dari kuartil ketiga kuartil. Excel berisi fitur bawaan untuk menghitung kuartil apa pun untuk data Anda. Temukan sel cadangan dan ketik "=QUARTILE([data range], [quartile number])" dan masukkan rentang sel untuk data Anda yang bertuliskan "[rentang data]" dan kuartil yang Anda inginkan bertuliskan "[kuartil nomor]."

Video Hari Ini

Misalnya, jika Anda memiliki data dalam sel A2 hingga A101 dan Anda menginginkan nilai untuk kuartil pertama, masukkan "=QUARTILE(A2:A101, 1)" untuk menemukan nilainya. Untuk bagian pertama dari argumen, Anda dapat menyorot sel yang relevan dengan mouse Anda, tetapi setelah koma, Anda perlu menulis jumlah kuartil yang Anda inginkan. Untuk kuartil ketiga dengan data yang sama, ketik "=QUARTILE(A2:A101, 3)" untuk mendapatkan hasilnya.

Dengan menggunakan sel kosong lainnya, kurangi nilai sel kuartil pertama dari nilai sel kuartil ketiga. Jika kuartil pertama ada di sel C2 dan kuartil ketiga ada di sel D2, ketik "=D2-C2" untuk mendapatkan hasilnya. Ini adalah rentang interkuartil.

Analisis Pencilan di Excel

Untuk menemukan outlier, Anda sekarang dapat menggunakan rentang interkuartil dalam rumus outlier, yang menyatakan bahwa batas atas data adalah nilai dari kuartil ketiga ditambah 1,5 kali jangkauan antarkuartil, dan batas bawahnya adalah nilai kuartil pertama dikurangi 1,5 kali antarkuartil jangkauan.

Jika nilai kuartil pertama ada di C2, nilai kuartil ketiga ada di sel D2, dan rentang antarkuartilnya adalah di sel E2, ketik "=C2-(1.5 * E2)" untuk menemukan batas bawah dan "=D2+(1.5 * E2)" untuk menemukan batas atas membatasi. Secara umum, Anda memasukkan "=[kuartil pertama] – (1,5 * [rentang interkuartil])" untuk menemukan batas bawah dan "=[kuartil ketiga] + (1,5 * [rentang interkuartil])" untuk menemukan batas atas.

Apa pun di bawah batas bawah atau di atas batas atas adalah outlier.

Untuk menyelesaikan tes outlier di Excel, gunakan fungsi logika "ATAU" untuk mengidentifikasi nilai mana di kelas data Anda yang outlier secara efisien. Masukkan "=OR([sel data]>[batas atas], [sel data]$F$2, A2

Jika nilai dalam A2 di atas batas atas atau di bawah batas bawah, ini akan menampilkan "TRUE", yang menunjukkan bahwa nilainya adalah outlier. Anda dapat menyeret rumus ini ke bawah dengan mengklik sudut kanan bawah sel dengan rumus dan menyeretnya ke bawah sehingga selesai di samping sel data akhir untuk melakukan perhitungan yang sama pada masing-masing titik data.

Anda juga dapat menyorot data, dan pergi ke "Pemformatan Bersyarat" di bagian "Gaya" pada tab "Beranda" jika Anda ingin mengubah pemformatan untuk outlier. Pilih "Aturan Baru" dan sorot opsi "Gunakan rumus untuk menentukan sel mana yang akan diformat". Ketik rumus yang sama seperti di paragraf sebelumnya, lalu klik opsi "Format" untuk memilih pemformatan unik untuk outlier.

Menggunakan Trimmean

Fungsi "Trimmean" adalah cara yang lebih sederhana untuk mengidentifikasi outlier. Ketik "=TRIMMEAN([rentang data], [proporsi untuk memangkas])" untuk menggunakan fungsi, dengan rentang sel yang berisi data sebagai ganti "[rentang data]" dan desimal persentase Anda ingin memangkas di mana dikatakan "[proporsi untuk memangkas]." Ini menghilangkan nilai ekstrim di bagian atas dan bawah dan kemudian menghitung rata-rata berdasarkan itu tersisa. Jadi, jika Anda memangkas 10 persen, itu akan menghilangkan 5 persen teratas dan 5 persen terbawah sebelum menghitung rata-rata.

Jika data berjalan dari A2 hingga A101 dan Anda ingin memangkas 5 persen nilai ekstrem, Anda memasukkan "=TRIMMEAN(A2:A101, 0,05)" untuk menemukan rata-rata yang disesuaikan. Anda dapat memangkas 15 persen dengan menulis "=TRIMMEAN(A2:A101, 0,15)" sebagai gantinya.