Winsorized Mean
MitÀ Winsorized tarkoittaa?
Winsorized keskiarvo on menetelmÀ keskiarvon laskentaan, joka aluksi korvaa pienimmÀt ja suurimmat arvot niitÀ lÀhinnÀ olevilla havainnoilla. TÀmÀ tehdÀÀn poikkeavien arvojen tai poikkeavien ÀÀriarvojen tai poikkeamien vaikutusten rajoittamiseksi laskelmaan.
Kun arvot on vaihdettu, aritmeettisen keskiarvon kaavaa kÀytetÀÀn sitten laskemaan winsorisoitu keskiarvo.
Winsorized Meanin kaava
Winsorized keskiarvot ilmaistaan kahdella tavalla. "Kn" winsoroitu keskiarvo viittaa "k":n pienimmÀn ja suurimman havainnon korvaamiseen, missÀ "k" on kokonaisluku. "X%" winsorisoitu keskiarvo sisÀltÀÀ tietyn prosenttiosuuden korvaamisen arvoista datan molemmista pÀistÀ.
Winsoroitu keskiarvo saadaan korvaamalla pienin ja suurin datapiste, sitten summaamalla kaikki datapisteet ja jakamalla summa datapisteiden kokonaismÀÀrÀllÀ.
MitÀ Winsorized tarkoittaa?
Winsoroitu keskiarvo on vÀhemmÀn herkkÀ poikkeaville arvoille, koska se voi korvata ne vÀhemmÀn ÀÀriarvoilla. Toisin sanoen se on vÀhemmÀn altis poikkeaville aritmeettiseen keskiarvoon verrattuna. Kuitenkin, jos jakaumassa on rasvapyrstöjÀ, jakauman korkeimman ja pienimmÀn arvon poistamisella on vain vÀhÀn vaikutusta, koska jakautumisluvut vaihtelevat suuresti.
Yksi suuri haittapuoli winsorized-menetelmissÀ on, ettÀ ne luonnollisesti tuovat jonkin verran harhaa tietojoukkoon. VÀhentÀmÀllÀ poikkeamien vaikutusta analyysiÀ muokataan analyysin parantamiseksi, mutta se myös poistaa tiedot taustalla olevista tiedoista.
Esimerkki Winsorized Meanin kÀytöstÀ
Lasketaan winsoroitu keskiarvo seuraavalle tietojoukolle: 1, 5, 7, 8, 9, 10, 34. TÀssÀ esimerkissÀ oletetaan, ettÀ winsoroitu keskiarvo on ensimmÀisessÀ jÀrjestyksessÀ, jossa korvataan pienin ja suurin arvo lÀhimmÀt havainnot.
Tietojoukko nĂ€yttÀÀ nyt seuraavalta: 5, 5, 7, 8, 9, 10, 10. Uuden joukon aritmeettisen keskiarvon ottaminen tuottaa winsorisoidun keskiarvon 7,7 tai (5 + 5 + 7 + 8 + 9 + 10 + 10) jaettuna 7:llĂ€. Huomaa, ettĂ€ aritmeettinen keskiarvo olisi ollut suurempi â 10,6. Winsorisoitu keskiarvo vĂ€hentÀÀ tehokkaasti 34-arvon vaikutusta poikkeavana arvona.
Tai harkitse 20 %:n winsoroitua keskiarvoa, joka ottaa ylimmĂ€n 10 % ja alimman 10 % ja korvaa ne seuraavaksi lĂ€himmĂ€llĂ€ arvollaan. Winsorisoimme seuraavat tietojoukot: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. NĂ€mĂ€ kaksi Pienin ja kaksi suurinta datapistettĂ€ â 20 % 20 datapisteestĂ€ â korvataan niiden seuraavaksi lĂ€himmĂ€llĂ€ arvolla. Uusi tietojoukko on siis seuraava: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Winsoroitu keskiarvo on 33,9 tai tietojen kokonaismÀÀrĂ€ (678) jaettuna datapisteiden kokonaismÀÀrĂ€llĂ€ (20).
Winsorized Mean vs. Trimmed Mean
Winsoroitu keskiarvo sisÀltÀÀ datapisteiden muokkaamisen, kun taas trimmattu keskiarvo sisÀltÀÀ datapisteiden poistamisen. On yleistÀ, ettÀ winsoroitu keskiarvo ja trimmattu keskiarvo ovat lÀhellÀ toisiaan tai joskus samanarvoisia.
Kohokohdat
Winsoroitu keskiarvo ei ole sama kuin leikattu keskiarvo, joka edellyttÀÀ datapisteiden poistamista eikĂ€ korvaamista â vaikka nĂ€iden kahden tulokset ovat yleensĂ€ lĂ€hellĂ€ toisiaan.
Se lieventÀÀ poikkeamien vaikutuksia korvaamalla ne vÀhemmÀn ÀÀrimmÀisillÀ arvoilla.
Winsoroitu keskiarvo on keskiarvomenetelmÀ, jossa aineiston pienin ja suurin arvo korvataan niitÀ lÀhinnÀ olevilla havainnoilla.