Investor's wiki

Winsorized Mean

Winsorized Mean

Mitä Winsorized tarkoittaa?

Winsorized keskiarvo on menetelmä keskiarvon laskentaan, joka aluksi korvaa pienimmät ja suurimmat arvot niitä lähinnä olevilla havainnoilla. Tämä tehdään poikkeavien arvojen tai poikkeavien ääriarvojen tai poikkeamien vaikutusten rajoittamiseksi laskelmaan.

Kun arvot on vaihdettu, aritmeettisen keskiarvon kaavaa käytetään sitten laskemaan winsorisoitu keskiarvo.

Winsorized Meanin kaava

Vinsoroitu keskiarvo = xn…xn+1 + </ mtext>xn+2…xnN< /mstyle>missä: n = Suurimpien ja pienimpien tietojen määrä pisteet korvataan havaintolähinnä niitä< /mtd> N< mtext> = Tietopisteiden kokonaismäärä\begin &\teksti\ =\ \frac{x_\dots x_{n+1}\ +\ x_{n+2}\dots x_}\ &\textbf\ &\begin n\ =\ &\text{Suurin ja pienimmän datan määrä}\ &\text \ &\teksti{lähinnä niitä}\end\ &N\ =\ \text{Tietopisteiden kokonaismäärä} \end

Winsorized keskiarvot ilmaistaan kahdella tavalla. "Kn" winsoroitu keskiarvo viittaa "k":n pienimmän ja suurimman havainnon korvaamiseen, missä "k" on kokonaisluku. "X%" winsorisoitu keskiarvo sisältää tietyn prosenttiosuuden korvaamisen arvoista datan molemmista päistä.

Winsoroitu keskiarvo saadaan korvaamalla pienin ja suurin datapiste, sitten summaamalla kaikki datapisteet ja jakamalla summa datapisteiden kokonaismäärällä.

Mitä Winsorized tarkoittaa?

Winsoroitu keskiarvo on vähemmän herkkä poikkeaville arvoille, koska se voi korvata ne vähemmän ääriarvoilla. Toisin sanoen se on vähemmän altis poikkeaville aritmeettiseen keskiarvoon verrattuna. Kuitenkin, jos jakaumassa on rasvapyrstöjä, jakauman korkeimman ja pienimmän arvon poistamisella on vain vähän vaikutusta, koska jakautumisluvut vaihtelevat suuresti.

Yksi suuri haittapuoli winsorized-menetelmissä on, että ne luonnollisesti tuovat jonkin verran harhaa tietojoukkoon. Vähentämällä poikkeamien vaikutusta analyysiä muokataan analyysin parantamiseksi, mutta se myös poistaa tiedot taustalla olevista tiedoista.

Esimerkki Winsorized Meanin käytöstä

Lasketaan winsoroitu keskiarvo seuraavalle tietojoukolle: 1, 5, 7, 8, 9, 10, 34. Tässä esimerkissä oletetaan, että winsoroitu keskiarvo on ensimmäisessä järjestyksessä, jossa korvataan pienin ja suurin arvo lähimmät havainnot.

Tietojoukko näyttää nyt seuraavalta: 5, 5, 7, 8, 9, 10, 10. Uuden joukon aritmeettisen keskiarvon ottaminen tuottaa winsorisoidun keskiarvon 7,7 tai (5 + 5 + 7 + 8 + 9 + 10 + 10) jaettuna 7:llä. Huomaa, että aritmeettinen keskiarvo olisi ollut suurempi – 10,6. Winsorisoitu keskiarvo vähentää tehokkaasti 34-arvon vaikutusta poikkeavana arvona.

Tai harkitse 20 %:n winsoroitua keskiarvoa, joka ottaa ylimmän 10 % ja alimman 10 % ja korvaa ne seuraavaksi lähimmällä arvollaan. Winsorisoimme seuraavat tietojoukot: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Nämä kaksi Pienin ja kaksi suurinta datapistettä – 20 % 20 datapisteestä – korvataan niiden seuraavaksi lähimmällä arvolla. Uusi tietojoukko on siis seuraava: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Winsoroitu keskiarvo on 33,9 tai tietojen kokonaismäärä (678) jaettuna datapisteiden kokonaismäärällä (20).

Winsorized Mean vs. Trimmed Mean

Winsoroitu keskiarvo sisältää datapisteiden muokkaamisen, kun taas trimmattu keskiarvo sisältää datapisteiden poistamisen. On yleistä, että winsoroitu keskiarvo ja trimmattu keskiarvo ovat lähellä toisiaan tai joskus samanarvoisia.

Kohokohdat

  • Winsoroitu keskiarvo ei ole sama kuin leikattu keskiarvo, joka edellyttää datapisteiden poistamista eikä korvaamista – vaikka näiden kahden tulokset ovat yleensä lähellä toisiaan.

  • Se lieventää poikkeamien vaikutuksia korvaamalla ne vähemmän äärimmäisillä arvoilla.

  • Winsoroitu keskiarvo on keskiarvomenetelmä, jossa aineiston pienin ja suurin arvo korvataan niitä lähinnä olevilla havainnoilla.