Média Winsorizada
Qual é a média winsorizada?
A média winsorizada é um método de média que substitui inicialmente os valores menores e maiores pelas observações mais próximas a eles. Isso é feito para limitar o efeito de valores atÃpicos ou extremos anormais, ou valores atÃpicos, no cálculo.
Após a substituição dos valores, a fórmula da média aritmética é então usada para calcular a média winsorizada.
Fórmula para a média winsorizada
As médias winsorizadas são expressas de duas maneiras. Um meio winsorizado "kn" refere-se à substituição das observações menores e maiores de "k", onde "k" é um número inteiro. Uma média winsorizada "X%" envolve a substituição de uma determinada porcentagem de valores de ambas as extremidades dos dados.
A média winsorizada é obtida substituindo os pontos de dados menores e maiores, somando todos os pontos de dados e dividindo a soma pelo número total de pontos de dados.
O que o meio Winsorized diz a você?
A média winsorizada é menos sensÃvel a outliers porque pode substituÃ-los por valores menos extremos. Ou seja, é menos suscetÃvel a outliers em relação à média aritmética. No entanto, se uma distribuição tiver caudas gordas, o efeito de remover os valores mais altos e mais baixos da distribuição terá pouca influência devido ao alto grau de variabilidade nos números da distribuição .
Uma grande desvantagem dos meios winsorizados é que eles naturalmente introduzem algum viés no conjunto de dados. Ao reduzir a influência de outliers, a análise é modificada para melhor análise, mas também remove informações sobre os dados subjacentes.
Exemplo de como usar a média winsorizada
Vamos calcular a média winsorizada para o seguinte conjunto de dados: 1, 5, 7, 8, 9, 10, 34. Neste exemplo, assumimos que a média winsorizada está na primeira ordem, na qual substituÃmos os valores menor e maior com suas observações mais próximas.
O conjunto de dados agora aparece da seguinte forma: 5, 5, 7, 8, 9, 10, 10. Fazer uma média aritmética do novo conjunto produz uma média winsorizada de 7,7, ou (5 + 5 + 7 + 8 + 9 + 10 + 10) dividido por 7. Observe que a média aritmética teria sido maior—10,6. A média winsorizada reduz efetivamente a influência do valor 34 como um outlier.
Ou considere uma média winsorizada de 20% que pega os 10% superiores e os 10% inferiores e os substitui pelo próximo valor mais próximo. Vamos winsorizar o seguinte conjunto de dados: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Os dois o menor e os dois maiores pontos de dados — 20% dos 20 pontos de dados — serão substituÃdos pelo próximo valor mais próximo. Assim, o novo conjunto de dados é o seguinte: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. A média winsorizada é 33,9, ou o total dos dados (678) dividido pelo número total de pontos de dados (20).
Média Winsorizada vs. Média aparada
A média winsorizada inclui a modificação de pontos de dados, enquanto a média aparada envolve a remoção de pontos de dados. É comum que a média winsorizada e a média aparada sejam próximas ou às vezes iguais em valor uma à outra.
##Destaques
A média winsorizada não é a mesma que a média aparada, que envolve a remoção de pontos de dados em vez de substituÃ-los - embora os resultados dos dois tendam a ser próximos.
Atenua os efeitos dos outliers substituindo-os por valores menos extremos.
A média winsorizada é um método de média que envolve a substituição dos menores e maiores valores de um conjunto de dados pelas observações mais próximas a eles.