Investor's wiki

Media Winsorizada

Media Winsorizada

¿Qué es la media winsorizada?

La media Winsorizada es un método de promediar que inicialmente reemplaza los valores más pequeños y más grandes con las observaciones más cercanas a ellos. Esto se hace para limitar el efecto de valores atípicos o valores extremos anormales, o valores atípicos, en el cálculo.

Después de reemplazar los valores, la fórmula de la media aritmética se usa para calcular la media winsorizada.

Fórmula para la media Winsorizada

<semántica> Media Winsorizada = xn…xn+1 + </ mtext>xn+2…xnN< /mstyle>donde: n = La cantidad de datos más grandes y más pequeños puntos a ser reemplazados por el observaciónmás cercano a ellos< /mtd> N< mtext> = Número total de puntos de datos\begin &\text\ =\ \frac{x_\dots x_{n+1}\ +\ x_{n+2}\dots x_}\ &\textbf\ &\begin n\ =\ &\text{La cantidad de datos más grandes y más pequeños}\ &\text {puntos a ser reemplazados por la observación}\ &\text{más cercano a ellos}\end\ &N\ =\ \text{Número total de puntos de datos} \end</semántica></matemáticas>

Las medias winsorizadas se expresan de dos formas. Una media winsorizada "kn" se refiere al reemplazo de las observaciones "k" más pequeña y más grande, donde "k" es un número entero. Una media winsorizada "X%" implica reemplazar un porcentaje dado de valores de ambos extremos de los datos.

La media winsorizada se logra reemplazando los puntos de datos más pequeños y más grandes, luego sumando todos los puntos de datos y dividiendo la suma por el número total de puntos de datos.

¿Qué te dice el significado winsorizado?

La media winsorizada es menos sensible a los valores atípicos porque puede reemplazarlos con valores menos extremos. Es decir, es menos susceptible a valores atípicos frente a la media aritmética. Sin embargo, si una distribución tiene colas gruesas, el efecto de eliminar los valores más altos y más bajos de la distribución tendrá poca influencia debido al alto grado de variabilidad en las cifras de distribución .

Una desventaja importante de las medias winsorizadas es que, naturalmente, introducen cierto sesgo en el conjunto de datos. Al reducir la influencia de los valores atípicos, el análisis se modifica para un mejor análisis, pero también elimina información sobre los datos subyacentes.

Ejemplo de cómo usar la media winsorizada

Calculemos la media winsorizada para el siguiente conjunto de datos: 1, 5, 7, 8, 9, 10, 34. En este ejemplo, asumimos que la media winsorizada está en el primer orden, en el que reemplazamos los valores más pequeño y más grande con sus observaciones más cercanas.

El conjunto de datos ahora aparece de la siguiente manera: 5, 5, 7, 8, 9, 10, 10. Tomar un promedio aritmético del nuevo conjunto produce una media winsorizada de 7.7, o (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7. Tenga en cuenta que la media aritmética habría sido mayor: 10,6. La media winsorizada reduce efectivamente la influencia del valor 34 como valor atípico.

O considere una media winsorizada del 20 % que toma el 10 % superior y el 10 % inferior y los reemplaza con su siguiente valor más cercano. Winsorizaremos el siguiente conjunto de datos: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Los dos el más pequeño y los dos puntos de datos más grandes (20 % de los 20 puntos de datos) se reemplazarán con su siguiente valor más cercano. Así, el nuevo conjunto de datos es el siguiente: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. La media winsorizada es 33,9, o el total de los datos (678) dividido por el número total de puntos de datos (20).

Media winsorizada frente a media recortada

La media winsorizada incluye la modificación de puntos de datos, mientras que la media recortada implica la eliminación de puntos de datos. Es común que la media winsorizada y la media recortada estén cerca o, a veces, tengan el mismo valor entre sí.

Reflejos

  • La media winsorizada no es lo mismo que la media recortada, que implica eliminar puntos de datos en lugar de reemplazarlos, aunque los resultados de los dos tienden a ser similares.

  • Mitiga los efectos de los valores atípicos reemplazándolos por valores menos extremos.

  • La media winsorizada es un método de promedio que consiste en reemplazar los valores más pequeños y más grandes de un conjunto de datos con las observaciones más cercanas a ellos.