外れ値は、統計分析の結果を歪め、不正確な結論を生み出す可能性のある極端な値です。
統計分析の外れ値は、データセットの大部分に適合しないように見える極端な値です。 削除しない場合、これらの極端な値は、から導き出される可能性のある結論に大きな影響を与える可能性があります。 問題のデータは、相関係数と最適な線を間違って歪める可能性があるためです 方向。 SPSSは、データセットを解釈し、範囲外の値を識別および削除するために使用できる多数の統計分析ソフトウェアプログラムの1つです。
探索的データ分析
ステップ1
「分析」をクリックします。 「記述統計」を選択し、次に「探索」を選択します。
今日のビデオ
ステップ2
従属変数データを含む列を「従属リスト」というラベルの付いたボックスにドラッグアンドドロップします。 「OK」をクリックします。
ステップ3
個々のデータポイントを削除して、幹葉図または箱ひげ図でSPSSによって識別された外れ値を削除します。 または、これらのデータポイントを除外するようにフィルターを設定することもできます。
ステップ4
[データ]、[ケースの選択]の順に選択し、除外する外れ値がある条件をクリックします。 外れ値のみを除外し、非外れ値のデータポイントを除外しないこの条件の値を決定します。
ステップ5
[選択]ボックスで[条件が満たされている場合]を選択し、そのすぐ下にある[場合]ボタンをクリックします。 前の手順で決定した外れ値を除外するルールを右上のボックスに入力します。 たとえば、「高さ」の条件から74.5インチを超える測定値を除外する場合は、「高さ<= 74.5」と入力します。 「続行」と「OK」をクリックして、フィルターをアクティブにします。
回帰分析
ステップ1
[分析]メニューで、[回帰]、[線形]の順に選択します。 分析する従属変数と独立変数を選択します。
ステップ2
「保存」をクリックし、「クックの距離」を選択します。 クックの距離に対して計算された値は、「COO-1」というラベルの付いた変数としてデータファイルに保存されます。
ステップ3
「グラフ」に続いて「箱ひげ図」を選択して箱ひげ図を実行します。 「単純」をクリックし、「個別変数の要約」を選択します。 入力 「BoxesRepresent」というラベルの付いたボックスに「COO-1」を入力し、「LabelCasesBy」でケースを識別するためのIDまたは名前を入力します。 箱。
ステップ4
ダブルクリックして、出力ファイルの箱ひげ図を拡大します。 黒い線の先にあるケースをメモします。これらは外れ値です。 星印(*)でマークされているすべての外れ値を削除するか、極端な外れ値のみを削除するかを選択できます。
ステップ5
データファイルに戻り、消去する必要のあるケースを見つけます。 下から上に向かって、灰色の列の左端の数字を強調表示して、行全体が選択されるようにします。 「編集」をクリックし、「クリア」を選択します。 箱ひげ図から特定した外れ値ごとに、この手順を繰り返します。
警告
セクション2、ステップ5でケースを消去する場合、ケースを消去するとID番号が変わるため、常にデータファイルの下から上に向かって作業してください。 トップダウンで作業すると、間違ったケースを消去してしまいます。