Bildnachweis: nd3000/iStock/GettyImages
Bei der Datenanalyse können Ausreißer die Ergebnisse verzerren und sie weniger zuverlässig machen. Wenn beispielsweise einer oder mehrere Ihrer Werte wesentlich höher sind als die Mehrheit der Daten, erhöhen sie den Mittelwert, was die Daten als Ganzes möglicherweise nicht widerspiegelt. Das Entfernen dieser abgelegenen Datenpunkte ist daher ein wichtiger Schritt bei der Durchführung zuverlässiger statistischer Berechnungen. Ohne dedizierte Ausreißerfunktion ist der einfachste Weg, einen Ausreißertest in Excel durchzuführen, die Verwendung der Interquartilsabstand, um Ausreißer zu identifizieren, aber Sie können auch die Trimmean-Funktion verwenden, um diese anzunähern Ergebnis.
Berechnung des Interquartilbereichs
Der Interquartilbereich der Daten ist der Bereich, der von der "Box" in einem Box-and-Whisker-Plot abgedeckt wird, oder mehr genau das Ergebnis der Subtraktion des Wertes für das erste Quartil der Daten von dem des dritten Quartil. Excel enthält eine integrierte Funktion zum Berechnen eines beliebigen Quartils für Ihre Daten. Suchen Sie eine Ersatzzelle und geben Sie "=QUARTILE([Datenbereich], [Quartilzahl])" ein und geben Sie den Zellenbereich ein für Ihre Daten, wo "[Datenbereich]" steht und das gewünschte Quartil, wo "[Quartil ." steht Nummer]."
Video des Tages
Wenn Sie beispielsweise Daten in den Zellen A2 bis A101 haben und den Wert für das erste Quartil haben möchten, geben Sie "=QUARTILE(A2:A101, 1)" ein, um den Wert zu finden. Für den ersten Teil des Arguments können Sie die entsprechenden Zellen mit der Maus markieren, aber nach dem Komma müssen Sie die Nummer des gewünschten Quartils schreiben. Für das dritte Quartil mit denselben Daten geben Sie "=QUARTILE(A2:A101, 3)" ein, um das Ergebnis zu erhalten.
Ziehen Sie mit einer weiteren leeren Zelle den Wert der Zelle des ersten Quartils vom Wert der Zelle des dritten Quartils ab. Wenn sich das erste Quartil in Zelle C2 und das dritte Quartil in Zelle D2 befindet, geben Sie "=D2-C2" ein, um das Ergebnis zu erhalten. Dies ist der Interquartilsabstand.
Ausreißeranalyse in Excel
Um Ausreißer zu finden, können Sie jetzt den Interquartilabstand in der Ausreißerformel verwenden, der angibt, dass die Obergrenze der Daten der Wert von. ist drittes Quartil plus 1,5-facher Interquartilbereich, und die untere Grenze ist der Wert des ersten Quartils minus 1,5-facher Interquartil Palette.
Wenn der Wert des ersten Quartils in C2 liegt, befindet sich der Wert des dritten Quartils in Zelle D2 und der Interquartilbereich ist In Zelle E2 würden Sie "=C2-(1.5 * E2)" eingeben, um die untere Grenze zu finden, und "=D2+(1.5 * E2)", um die obere zu finden Grenze. Im Allgemeinen geben Sie "=[erstes Quartil] – (1.5 * [Interquartilbereich])" ein, um die Untergrenze zu ermitteln, und "=[drittes Quartil] + (1.5 * [Interquartilbereich])", um die Obergrenze zu ermitteln.
Alles, was unter der unteren Grenze oder über der oberen Grenze liegt, ist ein Ausreißer.
Um den Ausreißertest in Excel abzuschließen, verwenden Sie die logische "ODER"-Funktion, um auf effiziente Weise zu ermitteln, welche Werte in Ihrer Datenklasse Ausreißer sind. Geben Sie "=OR([Datenzelle]>[Obergrenze], [Datenzelle]$F$2, A2
Wenn der Wert in A2 über dem oberen Grenzwert oder unter dem unteren Grenzwert liegt, wird "TRUE" angezeigt, was darauf hinweist, dass der Wert ein Ausreißer ist. Sie können diese Formel nach unten ziehen, indem Sie auf die untere rechte Ecke der Zelle mit der Formel klicken und Ziehen Sie es nach unten, sodass es neben der letzten Datenzelle endet, um dieselbe Berechnung für jede durchzuführen Datenpunkt.
Sie können auch die Daten markieren und im Abschnitt "Stile" der Registerkarte "Startseite" zu "Bedingte Formatierung" gehen, wenn Sie die Formatierung für die Ausreißer ändern möchten. Wählen Sie "Neue Regel" und markieren Sie die Option "Formel verwenden, um zu bestimmen, welche Zellen formatiert werden sollen". Geben Sie dieselbe Formel wie im vorherigen Absatz ein und klicken Sie dann auf die Option "Format", um die eindeutige Formatierung für Ausreißer auszuwählen.
Trimmean verwenden
Die Funktion "Trimmean" ist eine einfachere Möglichkeit, Ausreißer zu identifizieren. Geben Sie "=TRIMMEAN([Datenbereich], [Proportion zum Trimmen])" ein, um die Funktion zu verwenden, wobei der Zellenbereich Daten anstelle von "[Datenbereich]" und eine Dezimalzahl enthält Prozentsatz, den Sie trimmen möchten, wo "[Proportion to trim]" steht. Dadurch werden die Extremwerte oben und unten entfernt und dann der Mittelwert basierend auf diesen berechnet verbleibend. Wenn Sie also 10 Prozent kürzen, werden die oberen 5 Prozent und die unteren 5 Prozent entfernt, bevor der Mittelwert berechnet wird.
Wenn die Daten von A2 bis A101 verlaufen und Sie die extremen 5 Prozent der Werte trimmen möchten, geben Sie "=TRIMMEAN(A2:A101, 0,05)" ein, um den angepassten Mittelwert zu ermitteln. Sie könnten 15 Prozent trimmen, indem Sie stattdessen "=TRIMMEAN(A2:A101, 0.15)" schreiben.