Investor's wiki

Winsorized Ortalama

Winsorized Ortalama

Winsorized Ortalama Nedir?

Winsorized ortalama, başlangıçta en küçük ve en büyük değerleri onlara en yakın gözlemlerle değiştiren bir ortalama alma yöntemidir. Bu, aykırı değerlerin veya anormal uç değerlerin veya aykırı değerlerin hesaplama üzerindeki etkisini sınırlamak için yapılır.

Değerler değiştirildikten sonra, winsorized ortalamayı hesaplamak için aritmetik ortalama formülü kullanılır.

Winsorized Ortalama Formülü

Kazandırılmış Ortalama = xnxn+1 + </ mtext>xn+2xnN< /mstyle>burada:</mtr n = </mrow En büyük ve en küçük veri sayısı < mrow>gözlemle değiştirilecek noktalar onlara en yakın< / mtd> N< mtext> = Toplam veri noktası sayısı\begin &\text\ =\ \frac{x_\dots x_{n+1}\ +\ x_{n+2}\dots x_}\ &\textbf\ &\begin{hizalanmış} n\ =\ &\text{En büyük ve en küçük veri sayısı}\ &\text {gözlemle değiştirilecek noktalar}\ &\text{onlara en yakın}\end{hizalanmış}\ &N\ =\ \text{Toplam veri noktası sayısı} \end{hizalanmış}N = < span class="mspace" style="margin-right:0.2777777777777778em;">Toplam veri noktası sayısı</ span >

Winsorized araçlar iki şekilde ifade edilir. Bir "kn" winsorized aracı, "k" bir tamsayı olduğunda, "k" en küçük ve en büyük gözlemlerin değiştirilmesini ifade eder. Bir "%X" winsorized ortalama, verilerin her iki ucundan belirli bir değer yüzdesinin değiştirilmesini içerir.

Winsorized ortalama, en küçük ve en büyük veri noktalarının değiştirilmesi, ardından tüm veri noktalarının toplanması ve toplamın toplam veri noktası sayısına bölünmesiyle elde edilir.

Winsorized Anlamı Size Ne Anlatıyor?

Winsorized ortalama, aykırı değerlere karşı daha az duyarlıdır çünkü onları daha az uç değerlerle değiştirebilir. Yani, aritmetik ortalamaya karşı aykırı değerlere daha az duyarlıdır. Bununla birlikte, bir dağılımın yağ kuyrukları varsa, dağılımdaki en yüksek ve en düşük değerlerin çıkarılmasının etkisi, dağılım rakamlarındaki yüksek derecede değişkenlik nedeniyle çok az etkiye sahip olacaktır .

Winsorized araçların önemli bir dezavantajı, veri setine doğal olarak bir miktar önyargı getirmeleridir. Aykırı değerlerin etkisini azaltarak, analiz daha iyi analiz için değiştirilir, ancak aynı zamanda temel veriler hakkındaki bilgileri de kaldırır.

Winsorized Mean'in Nasıl Kullanılacağına İlişkin Örnek

Aşağıdaki veri seti için winsorized ortalamasını hesaplayalım: 1, 5, 7, 8, 9, 10, 34. Bu örnekte, winsorized ortalamanın en küçük ve en büyük değerleri değiştirdiğimiz ilk sırada olduğunu varsayıyoruz ​en yakın gözlemleriyle.

Veri kümesi şimdi şu şekilde görünür: 5, 5, 7, 8, 9, 10, 10. Yeni kümenin aritmetik ortalamasını almak, 7.7 veya (5 + 5 + 7 + 8 + 9 + 10) bir winsorized ortalama üretir. + 10) bölü 7'ye bölünür. Aritmetik ortalamanın daha yüksek olacağını dikkate alın - 10.6. Winsorized ortalama, bir aykırı değer olarak 34 değerinin etkisini etkili bir şekilde azaltır.

Ya da en üst %10'u ve en alttaki %10'u alan ve bunları bir sonraki en yakın değerleriyle değiştiren %20'lik bir kazanılmış ortalamayı düşünün. Aşağıdaki veri setini winsorize edeceğiz: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. en küçük ve en büyük iki veri noktası (20 veri noktasının %20'si) bir sonraki en yakın değerleriyle değiştirilecektir. Böylece yeni veri seti şu şekildedir: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Winsorized ortalama 33.9 veya verilerin toplamının (678) toplam veri noktası sayısına (20) bölünmesidir.

Winsorized Ortalamaya Karşı kırpılmış Ortalama

Winsorized ortalama, veri noktalarının değiştirilmesini içerirken, kırpılmış ortalama,. veri noktalarının çıkarılmasını içerir. Winsorized ortalama ve kırpılmış ortalamanın birbirine yakın veya bazen eşit değerde olması yaygındır.

##Öne çıkanlar

  • Winsorized ortalama, veri noktalarının değiştirilmesi yerine çıkarılmasını içeren, kırpılmış ortalama ile aynı değildir - her ne kadar ikisinin sonuçları yakın olma eğiliminde olsa da.

  • Aykırı değerlerin etkilerini daha az uç değerlerle değiştirerek azaltır.

  • Winsorized ortalama, bir veri setinin en küçük ve en büyük değerlerinin kendilerine en yakın gözlemlerle değiştirilmesini içeren bir ortalama alma yöntemidir.