Empirisk regel
Hvad er den empiriske regel?
Den empiriske regel, også kaldet tre-sigma- reglen eller 68-95-99.7-reglen, er en statistisk regel, som siger, at for en normalfordeling vil næsten alle observerede data falde inden for tre standardafvigelser (angivet med σ) af middel eller gennemsnit (angivet med µ).
Især forudsiger den empiriske regel, at 68 % af observationerne falder inden for den første standardafvigelse (µ ± σ), 95 % inden for de to første standardafvigelser (µ ± 2σ) og 99,7 % inden for de første tre standardafvigelser (µ ± σ). 3σ).
Forstå den empiriske regel
Den empiriske regel bruges ofte i statistikker til at forudsige endelige resultater. Efter beregning af standardafvigelsen og før indsamling af nøjagtige data, kan denne regel bruges som et groft skøn over resultatet af de forestående data, der skal indsamles og analyseres.
Denne sandsynlighedsfordeling kan således bruges som en midlertidig heuristik, da indsamling af de relevante data kan være tidskrævende eller endda umuligt i nogle tilfælde. Sådanne overvejelser kommer i spil, når en virksomhed gennemgår sine kvalitetskontrolforanstaltninger eller evaluerer sin risikoeksponering. For eksempel antager det ofte anvendte risikoværktøj kendt som value-at-risk (VaR), at sandsynligheden for risikohændelser følger en normalfordeling.
Den empiriske regel bruges også som en grov måde at teste en fordelings "normalitet". Hvis for mange datapunkter falder uden for de tre standardafvigelsesgrænser, tyder det på, at fordelingen ikke er normal og kan være skæv eller følge en anden fordeling.
Den empiriske regel er også kendt som tre-sigma-reglen, da "tre-sigma" refererer til en statistisk fordeling af data inden for tre standardafvigelser fra middelværdien på en normalfordeling ( klokkekurve ), som angivet af figuren nedenfor.
Eksempler på den empiriske regel
Lad os antage, at en bestand af dyr i en zoologisk have er kendt for at være normalfordelt. Hvert dyr bliver i gennemsnit 13,1 år gammelt (gennemsnit), og standardafvigelsen for levetiden er 1,5 år. Hvis nogen vil vide sandsynligheden for, at et dyr vil leve længere end 14,6 år, kunne de bruge den empiriske regel. Ved at fordelingens gennemsnit er 13,1 år gammel, forekommer følgende aldersintervaller for hver standardafvigelse:
Én standardafvigelse (µ ± σ): (13,1 - 1,5) til (13,1 + 1,5) eller 11,6 til 14,6
To standardafvigelser (µ ± 2σ): 13,1 - (2 x 1,5) til 13,1 + (2 x 1,5) eller 10,1 til 16,1
Tre standardafvigelser (µ ± 3σ): 13,1 - (3 x 1,5) til 13,1 + (3 x 1,5), eller 8,6 til 17,6
Den person, der løser dette problem, skal beregne den samlede sandsynlighed for, at dyret lever 14,6 år eller længere. Den empiriske regel viser, at 68 % af fordelingen ligger inden for én standardafvigelse, i dette tilfælde fra 11,6 til 14,6 år. De resterende 32 % af fordelingen ligger således uden for dette interval. Den ene halvdel ligger over 14,6 og den anden under 11,6. Så sandsynligheden for, at dyret lever mere end 14,6, er 16% (beregnet som 32% divideret med to).
Som et andet eksempel, antag i stedet, at et dyr i den zoologiske have lever til en gennemsnitlig alder af 10 år, med en standardafvigelse på 1,4 år. Antag, at dyrepasseren forsøger at finde ud af sandsynligheden for, at et dyr lever i mere end 7,2 år. Denne fordeling ser således ud:
Én standardafvigelse (µ ± σ): 8,6 til 11,4 år
To standardafvigelser (µ ± 2σ): 7,2 til 12,8 år
Tre standardafvigelser ((µ ± 3σ): 5,8 til 14,2 år
Den empiriske regel siger, at 95 % af fordelingen ligger inden for to standardafvigelser. Således ligger 5 % uden for to standardafvigelser; halvdelen over 12,8 år og halvdelen under 7,2 år. Således er sandsynligheden for at leve i mere end 7,2 år:
95 % + (5 % / 2) = 97,5 %
Højdepunkter
Den empiriske regel siger, at 99,7% af data observeret efter en normalfordeling ligger inden for 3 standardafvigelser af gennemsnittet.
Under denne regel falder 68 % af dataene inden for én standardafvigelse, 95 % inden for to standardafvigelser og 99,7 % inden for tre standardafvigelser fra gennemsnittet.
Tre-sigma-grænser, der følger den empiriske regel, bruges til at sætte de øvre og nedre kontrolgrænser i statistiske kvalitetskontroldiagrammer og i risikoanalyser såsom VaR.
Ofte stillede spørgsmål
Hvordan bruges den empiriske regel?
Den empiriske regel anvendes til at forudse sandsynlige udfald i en normalfordeling. For eksempel ville en statistiker bruge dette til at estimere procentdelen af tilfælde, der falder i hver standardafvigelse. Overvej, at standardafvigelsen er 3,1 og middelværdien er lig med 10. I dette tilfælde vil den første standardafvigelse ligge mellem (10+3,2)= 13,2 og (10-3,2)= 6,8. Den anden afvigelse ville falde mellem 10 + (2 X 3,2) = 16,4 og 10 - (2 X 3,2) = 3,6, og så videre.
Hvad er den empiriske regel?
I statistikken siger den empiriske regel, at 99,7 % af dataene sker inden for tre standardafvigelser af middelværdien inden for en normalfordeling. Til dette formål vil 68% af de observerede data forekomme inden for den første standardafvigelse, 95% vil finde sted i den anden afvigelse og 97,5% inden for den tredje standardafvigelse. Den empiriske regel forudsiger sandsynlighedsfordelingen for et sæt af udfald.
Hvad er fordelene ved den empiriske regel?
Den empiriske regel er fordelagtig, fordi den tjener som et middel til at forudsige data. Dette gælder især, når det kommer til store datasæt og dem, hvor variabler er ukendte. Specifikt inden for finans er den empiriske regel relateret til aktiekurser, prisindekser og logværdier af valutakurser, som alle har en tendens til at falde over en klokkekurve eller normalfordeling.