Pencilan adalah nilai ekstrem yang dapat mengubah hasil analisis statistik dan membuat kesimpulan yang tidak akurat.
Pencilan dalam analisis statistik adalah nilai ekstrem yang tampaknya tidak sesuai dengan sebagian besar kumpulan data. Jika tidak dihilangkan, nilai-nilai ekstrem ini dapat memiliki pengaruh besar pada kesimpulan apa pun yang mungkin diambil dari data tersebut, karena mereka dapat membelokkan koefisien korelasi dan garis yang paling cocok dengan yang salah arah. SPSS adalah salah satu dari sejumlah program perangkat lunak analisis statistik yang dapat digunakan untuk menginterpretasikan kumpulan data dan mengidentifikasi serta menghapus nilai-nilai outlying.
Analisis Data Eksplorasi
Langkah 1
Klik pada "Analisis." Pilih "Statistik Deskriptif" diikuti oleh "Jelajahi."
Video Hari Ini
Langkah 2
Seret dan jatuhkan kolom yang berisi data variabel dependen ke dalam kotak berlabel "Daftar Dependen". Klik "Oke."
Langkah 3
Hapus semua outlier yang diidentifikasi oleh SPSS di plot batang dan daun atau plot kotak dengan menghapus titik data individual. Atau, Anda dapat menyiapkan filter untuk mengecualikan titik data ini.
Langkah 4
Pilih "Data" dan kemudian "Pilih Kasus" dan klik pada kondisi yang memiliki outlier yang ingin Anda kecualikan. Tentukan nilai untuk kondisi ini yang hanya mengecualikan outlier dan tidak ada titik data non-outlying.
Langkah 5
Pilih "Jika Kondisi Puas" di kotak "Pilih" dan kemudian klik tombol "Jika" tepat di bawahnya. Masukkan aturan untuk mengecualikan outlier yang Anda tentukan pada langkah sebelumnya ke dalam kotak di kanan atas. Misalnya, jika Anda mengecualikan pengukuran di atas 74,5 inci dari kondisi "tinggi", Anda akan memasukkan "tinggi < = 74,5". Klik "Lanjutkan" dan "OK" untuk mengaktifkan filter.
Analisis regresi
Langkah 1
Di menu "Analisis", pilih "Regresi" dan kemudian "Linear." Pilih variabel dependen dan independen yang ingin Anda analisis.
Langkah 2
Klik "Simpan" dan kemudian pilih "Jarak Masak." Nilai yang dihitung untuk jarak Cook akan disimpan dalam file data Anda sebagai variabel berlabel "COO-1."
Langkah 3
Jalankan boxplot dengan memilih "Graphs" diikuti oleh "Boxplot." Klik "Sederhana" dan pilih "Ringkasan Variabel Terpisah." Memasuki "COO-1" ke dalam kotak berlabel "Kotak Mewakili," dan kemudian masukkan ID atau nama untuk mengidentifikasi kasus di "Label Kasus Dengan" kotak.
Langkah 4
Perbesar boxplot di file output dengan mengklik dua kali. Catat kasus-kasus yang berada di luar garis hitam—ini adalah outlier Anda. Anda dapat memilih untuk menghapus semua outlier atau hanya outlier ekstrim, yang ditandai dengan bintang (*).
Langkah 5
Kembali ke file data dan temukan kasus yang perlu dihapus. Bekerja dari bawah ke atas, sorot angka di paling kiri, di kolom abu-abu, sehingga seluruh baris dipilih. Klik "Edit" dan pilih "Hapus." Ulangi langkah ini untuk setiap outlier yang telah Anda identifikasi dari boxplot.
Peringatan
Saat menghapus kasus di Bagian 2, langkah 5, selalu bekerja dari bawah file data bergerak ke atas karena nomor ID berubah saat Anda menghapus kasus. Jika Anda bekerja dari atas ke bawah, Anda akhirnya akan menghapus kasus yang salah.