Investor's wiki

Winsorisierter Mittelwert

Winsorisierter Mittelwert

Was ist der winsorisierte Mittelwert?

Der winsorisierte Mittelwert ist eine Mittelwertbildungsmethode, bei der zunächst die kleinsten und größten Werte durch die ihnen am nächsten liegenden Beobachtungen ersetzt werden. Dies geschieht, um die Auswirkung von Ausreißern oder anormalen Extremwerten oder Ausreißern auf die Berechnung zu begrenzen.

Nach dem Ersetzen der Werte wird dann die arithmetische Mittelformel verwendet, um den winsorisierten Mittelwert zu berechnen.

Formel für den winsorisierten Mittelwert

Winsorisierter Mittelwert = xn…xn+1 + </ mtext>xn+2…xnN< /mstyle>wobei: n = Die Anzahl der größten und kleinsten Daten Punkte, die durch ersetzt werden sollen Beobachtungihnen am nächsten< /mtd> N< mtext> = Gesamtzahl der Datenpunkte\begin &\text\ =\ \frac{x_\dots x_{n+1}\ +\ x_{n+2}\dots x_}\ &\textbf\ &\begin n\ =\ &\text{Die Anzahl der größten und kleinsten Daten}\ &\text \ &\text{am nächsten}\end\ &N\ =\ \text \end

Winsorisierte Mittelwerte werden auf zwei Arten ausgedrückt. Ein „kn“ winsorisierter Mittelwert bezieht sich auf die Ersetzung der „k“ kleinsten und größten Beobachtungen, wobei „k“ eine ganze Zahl ist. Ein Winsorized-Mittelwert von „X %“ beinhaltet das Ersetzen eines bestimmten Prozentsatzes von Werten an beiden Enden der Daten.

Der winsorisierte Mittelwert wird erzielt, indem die kleinsten und größten Datenpunkte ersetzt werden, dann alle Datenpunkte summiert und die Summe durch die Gesamtzahl der Datenpunkte geteilt wird.

Was sagt Ihnen die Winsorized-Bedeutung?

Der winsorisierte Mittelwert ist weniger empfindlich gegenüber Ausreißern, da er diese durch weniger extreme Werte ersetzen kann. Das heißt, es ist gegenüber dem arithmetischen Mittel weniger anfällig für Ausreißer. Wenn eine Verteilung jedoch dicke Randbereiche aufweist, hat der Effekt des Entfernens der höchsten und niedrigsten Werte in der Verteilung aufgrund der hohen Variabilität in den Verteilungszahlen wenig Einfluss.

Ein großer Nachteil von Winsorized-Mitteln ist, dass sie natürlich eine gewisse Verzerrung in den Datensatz einführen. Durch die Verringerung des Einflusses von Ausreißern wird die Analyse für eine bessere Analyse modifiziert, entfernt aber auch Informationen über die zugrunde liegenden Daten.

Beispiel für die Verwendung von Winsorized Mean

Lassen Sie uns den winsorisierten Mittelwert für den folgenden Datensatz berechnen: 1, 5, 7, 8, 9, 10, 34. In diesem Beispiel gehen wir davon aus, dass der winsorisierte Mittelwert in der ersten Ordnung ist, in der wir die kleinsten und größten Werte durch ersetzen ihre nächsten Beobachtungen.

Der Datensatz sieht nun wie folgt aus: 5, 5, 7, 8, 9, 10, 10. Der arithmetische Mittelwert des neuen Datensatzes ergibt einen winsorisierten Mittelwert von 7,7 oder (5 + 5 + 7 + 8 + 9 + 10). + 10) geteilt durch 7. Beachten Sie, dass das arithmetische Mittel höher gewesen wäre – 10,6. Der winsorisierte Mittelwert reduziert effektiv den Einfluss des 34-Wertes als Ausreißer.

Oder stellen Sie sich einen 20 % Winsor-Mittelwert vor, der die oberen 10 % und die unteren 10 % nimmt und sie durch den nächstliegenden Wert ersetzt. Wir werden den folgenden Datensatz winsorisieren: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Die beiden kleinste und zwei größte Datenpunkte – 20 % der 20 Datenpunkte – werden durch ihren nächstliegenden Wert ersetzt. Somit lautet der neue Datensatz wie folgt: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Der winsorisierte Mittelwert beträgt 33,9 oder die Gesamtzahl der Daten (678) dividiert durch die Gesamtzahl der Datenpunkte (20).

Winsorisierter Mittelwert vs. getrimmter Mittelwert

Der winsorisierte Mittelwert umfasst das Ändern von Datenpunkten, während der getrimmte Mittelwert das Entfernen von Datenpunkten umfasst. Es ist üblich, dass der winsorisierte Mittelwert und der getrimmte Mittelwert nahe beieinander oder manchmal gleich groß sind.

Höhepunkte

  • Der winsorisierte Mittelwert ist nicht dasselbe wie der getrimmte Mittelwert, bei dem Datenpunkte entfernt werden, anstatt sie zu ersetzen – obwohl die Ergebnisse der beiden tendenziell nahe beieinander liegen.

  • Es mildert die Auswirkungen von Ausreißern, indem es sie durch weniger extreme Werte ersetzt.

  • Der winsorisierte Mittelwert ist eine Mittelungsmethode, bei der die kleinsten und größten Werte eines Datensatzes durch die ihnen am nächsten liegenden Beobachtungen ersetzt werden.