Empirisk regel

Hva er den empiriske regelen?

Den empiriske regelen, også referert til som tresigma - regelen eller 68-95-99.7-regelen, er en statistisk regel som sier at for en normalfordeling vil nesten alle observerte data falle innenfor tre standardavvik (angitt med σ) av gjennomsnitt eller gjennomsnitt (angitt med µ).

Spesielt forutsier den empiriske regelen at 68 % av observasjonene faller innenfor det første standardavviket (µ ± σ), 95 % innenfor de to første standardavvikene (µ ± 2σ), og 99,7 % innenfor de tre første standardavvikene (µ ± σ). 3σ).

Forstå den empiriske regelen

Den empiriske regelen brukes ofte i statistikk for å forutsi endelige utfall. Etter å ha beregnet standardavviket og før innsamling av eksakte data, kan denne regelen brukes som et grovt estimat på utfallet av de forestående dataene som skal samles inn og analyseres.

Denne sannsynlighetsfordelingen kan derfor brukes som en midlertidig heuristikk siden innsamling av de riktige dataene kan være tidkrevende eller til og med umulig i noen tilfeller. Slike hensyn spiller inn når et firma vurderer sine kvalitetskontrolltiltak eller vurderer sin risikoeksponering. For eksempel antar det ofte brukte risikoverktøyet kjent som value-at-risk (VaR) at sannsynligheten for risikohendelser følger en normalfordeling.

Den empiriske regelen brukes også som en grov måte å teste en fordelings "normalitet". Hvis for mange datapunkter faller utenfor de tre standardavviksgrensene, tyder dette på at fordelingen ikke er normal og kan være skjev eller følge en annen fordeling.

Den empiriske regelen er også kjent som tre-sigma-regelen, ettersom "tre-sigma" refererer til en statistisk fordeling av data innenfor tre standardavvik fra gjennomsnittet på en normalfordeling ( klokkekurve ), som indikert av figuren nedenfor.

Eksempler på den empiriske regelen

La oss anta at en populasjon av dyr i en dyrehage er kjent for å være normalfordelt. Hvert dyr lever for å være 13,1 år i gjennomsnitt (gjennomsnitt), og standardavviket for levetiden er 1,5 år. Hvis noen vil vite sannsynligheten for at et dyr vil leve lenger enn 14,6 år, kan de bruke den empiriske regelen. Når du vet at fordelingens gjennomsnitt er 13,1 år gammel, forekommer følgende aldersområder for hvert standardavvik:

Ett standardavvik (µ ± σ): (13,1 - 1,5) til (13,1 + 1,5), eller 11,6 til 14,6
To standardavvik (µ ± 2σ): 13,1 - (2 x 1,5) til 13,1 + (2 x 1,5), eller 10,1 til 16,1
Tre standardavvik (µ ± 3σ): 13,1 - (3 x 1,5) til 13,1 + (3 x 1,5), eller 8,6 til 17,6

Personen som løser dette problemet må beregne den totale sannsynligheten for at dyret lever 14,6 år eller lenger. Den empiriske regelen viser at 68 % av fordelingen ligger innenfor ett standardavvik, i dette tilfellet fra 11,6 til 14,6 år. Dermed ligger de resterende 32 % av fordelingen utenfor dette området. Den ene halvdelen ligger over 14,6 og den andre under 11,6. Så sannsynligheten for at dyret lever mer enn 14,6 er 16% (beregnet som 32% delt på to).

Som et annet eksempel, anta i stedet at et dyr i dyrehagen lever til gjennomsnittlig 10 års alder, med et standardavvik på 1,4 år. Anta at dyrepasseren prøver å finne ut sannsynligheten for at et dyr skal leve i mer enn 7,2 år. Denne fordelingen ser slik ut:

Ett standardavvik (µ ± σ): 8,6 til 11,4 år
To standardavvik (µ ± 2σ): 7,2 til 12,8 år
Tre standardavvik ((µ ± 3σ): 5,8 til 14,2 år

Den empiriske regelen sier at 95 % av fordelingen ligger innenfor to standardavvik. Dermed ligger 5 % utenfor to standardavvik; halvparten over 12,8 år og halvparten under 7,2 år. Dermed er sannsynligheten for å leve i mer enn 7,2 år:

95 % + (5 % / 2) = 97,5 %

##Høydepunkter

Den empiriske regelen sier at 99,7 % av data observert etter en normalfordeling ligger innenfor 3 standardavvik fra gjennomsnittet.

– Under denne regelen faller 68 % av dataene innenfor ett standardavvik, 95 % prosent innenfor to standardavvik, og 99,7 % innenfor tre standardavvik fra gjennomsnittet.

Tre-sigma-grenser som følger den empiriske regelen brukes til å sette øvre og nedre kontrollgrenser i statistiske kvalitetskontrolldiagrammer og i risikoanalyser som VaR.

##FAQ

Hvordan brukes den empiriske regelen?

Den empiriske regelen brukes for å forutse sannsynlige utfall i en normalfordeling. For eksempel vil en statistiker bruke dette til å estimere prosentandelen av tilfeller som faller i hvert standardavvik. Tenk på at standardavviket er 3,1 og gjennomsnittet er lik 10. I dette tilfellet vil det første standardavviket variere mellom (10+3,2)= 13,2 og (10-3,2)= 6,8. Det andre avviket vil falle mellom 10 + (2 X 3,2)= 16,4 og 10 - (2 X 3,2)= 3,6, og så videre.

Hva er den empiriske regelen?

I statistikk sier den empiriske regelen at 99,7 % av dataene skjer innenfor tre standardavvik av gjennomsnittet innenfor en normalfordeling. For dette formål vil 68 % av de observerte dataene forekomme innenfor det første standardavviket, 95 % vil finne sted i det andre avviket og 97,5 % innenfor det tredje standardavviket. Den empiriske regelen forutsier sannsynlighetsfordelingen for et sett med utfall.

Hva er fordelene med den empiriske regelen?

Den empiriske regelen er fordelaktig fordi den fungerer som et middel til å forutsi data. Dette gjelder spesielt når det gjelder store datasett og de der variabler er ukjente. Spesielt innen finans er den empiriske regelen avhengig av aksjekurser, prisindekser og loggverdier av valutakurser, som alle har en tendens til å falle over en klokkekurve eller normalfordeling.