Investor's wiki

Winsorized meðaltal

Winsorized meðaltal

Hvað er Winsorized Mean?

Winsorized meðaltal er meðaltalsaðferð sem í upphafi skiptir minnstu og stærstu gildunum út fyrir þær athuganir sem eru næst þeim. Þetta er gert til að takmarka áhrif frávika eða óeðlilegra öfgagilda, eða frávika, á útreikninginn.

Eftir að búið er að skipta út gildunum er reiknuð meðaltalsformúla síðan notuð til að reikna út meðaltalið.

Formúla fyrir Winsorized Mean

Meðaltal = xnxn+1 + mtext>xn+2xnN< /mstyle>þar sem: n = Fjöldi stærstu og minnstu gagna punktum sem á að skipta út fyrir athugunnæst þeim< /mtd> N< mtext> = Heildarfjöldi gagnapunkta\begin &\text\ =\ \frac{x_\dots x_{n+1}\ +\ x_{n+2}\dots x_}\ &\textbf{þar:}\ &\begin n\ =\ &\text{Fjöldi stærstu og minnstu gagna}\ &\text {punktum til að skipta út fyrir athugun}\ &\text{næst þeim}\end\ &N\ =\ \text{Heildarfjöldi gagnapunkta} \end{aligned

Winsorized leiðir eru settar fram á tvo vegu. "kn" vinningsmiðað þýðir að skipta um "k" minnstu og stærstu athuganir, þar sem "k" er heil tala. „X%“ vinnings meðaltal felur í sér að skipta út tilteknu hlutfalli gilda frá báðum endum gagnanna.

Vinnumarkmiðið næst með því að skipta út minnstu og stærstu gagnapunktunum, leggja síðan saman alla gagnapunktana og deila summu með heildarfjölda gagnapunkta.

Hvað þýðir Winsorized að segja þér?

Winsorized meðaltalið er minna viðkvæmt fyrir útlægum vegna þess að það getur komið í stað þeirra fyrir minna öfgagildi. Það er, það er minna næmt fyrir útlægum miðað við reiknað meðaltal. Hins vegar, ef dreifing er með fituhala, munu áhrif þess að fjarlægja hæstu og lægstu gildi dreifingarinnar hafa lítil áhrif vegna mikils breytileika í dreifingartölunum.

Einn helsti ókosturinn við winsorized leiðir er að þeir kynna náttúrulega einhverja hlutdrægni í gagnasafnið. Með því að draga úr áhrifum frávika er greiningunni breytt fyrir betri greiningu en fjarlægir einnig upplýsingar um undirliggjandi gögn.

Dæmi um hvernig á að nota Winsorized Mean

Við skulum reikna út meðaltalið fyrir eftirfarandi gagnasett: 1, 5, 7, 8, 9, 10, 34. Í þessu dæmi gerum við ráð fyrir að meðaltalið sé í fyrstu röð, þar sem við skiptum út minnstu og stærstu gildin fyrir næstu athuganir þeirra.

Gagnamengið birtist nú sem hér segir: 5, 5, 7, 8, 9, 10, 10. Með því að taka reiknað meðaltal af nýja menginu fæst meðaltalið 7,7, eða (5 + 5 + 7 + 8 + 9 + 10) + 10) deilt með 7. Athugið að meðaltalið hefði verið hærra—10,6. Winsorized meðaltalið dregur í raun úr áhrifum 34 gildisins sem fráviks.

Eða íhugaðu 20% vinningsmiðaða meðaltal sem tekur efstu 10% og neðstu 10% og kemur í stað þeirra fyrir næst næst gildi þeirra. Við munum vinna eftirfarandi gagnasett: 2, 4, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 62, 75. Þessir tveir minnstu og tveir stærstu gagnapunktarnir - 20% af 20 gagnapunktunum - verður skipt út fyrir næst næst gildi þeirra. Þannig er nýja gagnasafnið sem hér segir: 7, 7, 7, 8, 11, 14, 18, 23, 23, 27, 35, 40, 49, 50, 55, 60, 61, 61, 61, 61. Vinningsmeðaltalið er 33,9, eða heildarfjölda gagna (678) deilt með heildarfjölda gagnapunkta (20).

Winsorized Mean vs Trimmed Mean

Winsorized meðaltalið felur í sér að breyta gagnapunktum, en klippt meðaltalið felur í sér að fjarlægja gagnapunkta. Algengt er að meðaltalið með vinningnum og klippt meðaltalið séu nálægt eða stundum jöfn að gildi hvort við annað.

Hápunktar

  • Winsorized meðaltalið er ekki það sama og klippt meðaltalið, sem felur í sér að fjarlægja gagnapunkta í stað þess að skipta um þá - þó að niðurstöður þeirra tveggja hafi tilhneigingu til að vera nálægt.

  • Það dregur úr áhrifum útlægra með því að skipta þeim út fyrir minna öfgagildi.

  • Winsorized meðaltal er meðaltalsaðferð sem felur í sér að skipta út minnstu og stærstu gildum gagnasafns fyrir athuganir sem eru næst þeim.