Investor's wiki

Média Winsorizada

Média Winsorizada

Qual é a média winsorizada?

A média winsorizada é um método de média que substitui inicialmente os valores menores e maiores pelas observações mais próximas a eles. Isso é feito para limitar o efeito de valores atípicos ou extremos anormais, ou valores atípicos, no cálculo.

Após a substituição dos valores, a fórmula da média aritmética é então usada para calcular a média winsorizada.

Fórmula para a média winsorizada

Média Winsorizada = xn…xn+1 + </ mtext>xn+2…xnN< /mstyle>onde:</mtr n = </mrow O número de dados maiores e menores < mrow>pontos a serem substituídos pela observação mais próximo a eles</ mtd> N< mtext> = Número total de pontos de dados\begin &\text\ =\ \frac{x_\dots x_{n+1}\ +\ x_{n+2}\dots x_}\ &\textbf\ &\begin n\ =\ &\text{O número de dados maiores e menores}\ &\texto {pontos a serem substituídos pela observação}\ &\text{mais próximo a eles}\end\ &N\ =\ \text{Número total de pontos de dados} \end

As médias winsorizadas são expressas de duas maneiras. Um meio winsorizado "kn" refere-se à substituição das observações menores e maiores de "k", onde "k" é um número inteiro. Uma média winsorizada "X%" envolve a substituição de uma determinada porcentagem de valores de ambas as extremidades dos dados.

A média winsorizada é obtida substituindo os pontos de dados menores e maiores, somando todos os pontos de dados e dividindo a soma pelo número total de pontos de dados.

O que o meio Winsorized diz a você?

A média winsorizada é menos sensível a outliers porque pode substituí-los por valores menos extremos. Ou seja, é menos suscetível a outliers em relação à média aritmética. No entanto, se uma distribuição tiver caudas gordas, o efeito de remover os valores mais altos e mais baixos da distribuição terá pouca influência devido ao alto grau de variabilidade nos números da distribuição .

Uma grande desvantagem dos meios winsorizados é que eles naturalmente introduzem algum viés no conjunto de dados. Ao reduzir a influência de outliers, a análise é modificada para melhor análise, mas também remove informações sobre os dados subjacentes.

Exemplo de como usar a média winsorizada

Vamos calcular a média winsorizada para o seguinte conjunto de dados: 1, 5, 7, 8, 9, 10, 34. Neste exemplo, assumimos que a média winsorizada está na primeira ordem, na qual substituímos os valores menor e maior com suas observações mais próximas.

O conjunto de dados agora aparece da seguinte forma: 5, 5, 7, 8, 9, 10, 10. Fazer uma média aritmética do novo conjunto produz uma média winsorizada de 7,7, ou (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7. Observe que a média aritmética teria sido maior—10,6. A média winsorizada reduz efetivamente a influência do valor 34 como um outlier.

Ou considere uma média winsorizada de 20% que pega os 10% superiores e os 10% inferiores e os substitui pelo próximo valor mais próximo. Vamos winsorizar o seguinte conjunto de dados: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Os dois o menor e os dois maiores pontos de dados — 20% dos 20 pontos de dados — serão substituídos pelo próximo valor mais próximo. Assim, o novo conjunto de dados é o seguinte: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. A média winsorizada é 33,9, ou o total dos dados (678) dividido pelo número total de pontos de dados (20).

Média Winsorizada vs. Média aparada

A média winsorizada inclui a modificação de pontos de dados, enquanto a média aparada envolve a remoção de pontos de dados. É comum que a média winsorizada e a média aparada sejam próximas ou às vezes iguais em valor uma à outra.

##Destaques

  • A média winsorizada não é a mesma que a média aparada, que envolve a remoção de pontos de dados em vez de substituí-los - embora os resultados dos dois tendam a ser próximos.

  • Atenua os efeitos dos outliers substituindo-os por valores menos extremos.

  • A média winsorizada é um método de média que envolve a substituição dos menores e maiores valores de um conjunto de dados pelas observações mais próximas a eles.