Empirísk regla
Hver er empirísk regla?
Reynslureglan, einnig kölluð þriggja sigma reglan eða 68-95-99.7 reglan, er tölfræðileg regla sem segir að fyrir normaldreifingu muni næstum öll gögn sem sjást falla innan þriggja staðalfrávika (táknað með σ) frá meðaltal eða meðaltal (táknað með µ).
Einkum spáir reynslureglan því að 68% athugana falli innan fyrsta staðalfráviksins (µ ± σ), 95% innan fyrstu tveggja staðalfrávikanna (µ ± 2σ) og 99,7% innan fyrstu þriggja staðalfrávikanna (µ ± σ) 3σ).
Skilningur á reynslureglunni
Reynslureglan er oft notuð í tölfræði til að spá fyrir um lokaniðurstöður. Eftir að staðalfrávikið hefur verið reiknað út og áður en nákvæmum gögnum er safnað er hægt að nota þessa reglu sem gróft mat á niðurstöðu yfirvofandi gagna sem á að safna og greina.
Þessa líkindadreifingu er því hægt að nota sem bráðabirgðaheuristic þar sem að safna viðeigandi gögnum getur verið tímafrekt eða jafnvel ómögulegt í sumum tilfellum. Slík sjónarmið koma til greina þegar fyrirtæki er að endurskoða gæðaeftirlitsráðstafanir eða meta áhættu sína. Til dæmis gerir áhættutækið sem oft er notað sem kallast value-at-risk (VaR) ráð fyrir að líkur á áhættuatburðum fylgi eðlilegri dreifingu.
Reynslureglan er einnig notuð sem gróf leið til að prófa „eðlileika dreifingar“. Ef of margir gagnapunktar falla utan staðalfráviksmarkanna þriggja bendir það til þess að dreifingin sé ekki eðlileg og gæti verið skekkt eða fylgt einhverri annarri dreifingu.
Reynslureglan er einnig þekkt sem þriggja sigma reglan, þar sem "þriggja sigma" vísar til tölfræðilegrar dreifingar gagna innan þriggja staðalfrávika frá meðaltali á normaldreifingu ( bjöllukúrfa ), eins og sýnt er á myndinni hér að neðan.
Dæmi um reynsluregluna
Gefum okkur að vitað sé að stofn dýra í dýragarði sé eðlilega dreift. Hvert dýr lifir til að verða 13,1 árs að meðaltali (meðaltal) og staðalfrávik líftímans er 1,5 ár. Ef einhver vill vita líkurnar á því að dýr lifi lengur en 14,6 ár gæti hann notað reynsluregluna. Með því að vita að meðaltal dreifingarinnar er 13,1 ára, koma eftirfarandi aldursbil fyrir hvert staðalfrávik:
Eitt staðalfrávik (µ ± σ): (13,1 - 1,5) til (13,1 + 1,5), eða 11,6 til 14,6
Tvö staðalfrávik (µ ± 2σ): 13,1 - (2 x 1,5) til 13,1 + (2 x 1,5), eða 10,1 til 16,1
Þrjú staðalfrávik (µ ± 3σ): 13,1 - (3 x 1,5) til 13,1 + (3 x 1,5), eða, 8,6 til 17,6
Sá sem leysir þetta vandamál þarf að reikna út heildarlíkur þess að dýrið lifi 14,6 ár eða lengur. Reynslureglan sýnir að 68% dreifingarinnar liggja innan eins staðalfráviks, í þessu tilviki, frá 11,6 til 14,6 ár. Þannig eru þau 32% sem eftir eru af dreifingunni utan þessa marks. Annar helmingurinn liggur yfir 14,6 og hinn undir 11,6. Þannig að líkurnar á að dýrið lifi meira en 14,6 eru 16% (reiknað sem 32% deilt með tveimur).
Sem annað dæmi, gerðu ráð fyrir að dýr í dýragarðinum lifi að meðaltali 10 ára aldur, með staðalfrávik upp á 1,4 ár. Gerum ráð fyrir að dýragarðsvörðurinn reyni að reikna út líkurnar á því að dýr lifi í meira en 7,2 ár. Þessi dreifing lítur svona út:
Eitt staðalfrávik (µ ± σ): 8,6 til 11,4 ár
Tvö staðalfrávik (µ ± 2σ): 7,2 til 12,8 ár
Þrjú staðalfrávik ((µ ± 3σ): 5,8 til 14,2 ár
Reynslureglan segir að 95% dreifingarinnar liggi innan tveggja staðalfrávika. Þannig liggja 5% utan tveggja staðalfrávika; helmingur eldri en 12,8 ára og helmingur undir 7,2 ára. Þannig eru líkurnar á að lifa lengur en 7,2 ár:
95% + (5% / 2) = 97,5%
##Hápunktar
Reynslureglan segir að 99,7% gagna sem sjást eftir eðlilega dreifingu liggi innan 3 staðalfrávika frá meðaltalinu.
Samkvæmt þessari reglu falla 68% gagnanna innan eins staðalfráviks, 95% prósenta innan tveggja staðalfrávika og 99,7% innan þriggja staðalfrávika frá meðaltali.
Þriggja sigma mörk sem fylgja reynslureglunni eru notuð til að setja efri og neðri eftirlitsmörk í tölfræðilegum gæðaeftirlitstöflum og í áhættugreiningu eins og VaR.
##Algengar spurningar
Hvernig er reynslureglan notuð?
Reynslureglunni er beitt til að gera ráð fyrir líklegum niðurstöðum í normaldreifingu. Til dæmis myndi tölfræðingur nota þetta til að áætla hlutfall tilvika sem falla í hverju staðalfráviki. Íhuga að staðalfrávikið sé 3,1 og meðaltalið 10. Í þessu tilviki væri fyrsta staðalfrávikið á bilinu (10+3,2)= 13,2 og (10-3,2)= 6,8. Annað frávik myndi falla á milli 10 + (2 X 3,2)= 16,4 og 10 - (2 X 3,2)= 3,6, og svo framvegis.
Hver er empirísk regla?
Í tölfræði segir reynslureglan að 99,7% gagna eigi sér stað innan þriggja staðalfrávika meðaltalsins innan normaldreifingar. Í þessu skyni munu 68% af þeim gögnum sem sést eiga sér stað innan fyrsta staðalfráviksins, 95% eiga sér stað í öðru frávikinu og 97,5% innan þriðja staðalfráviksins. Reynslureglan spáir fyrir um líkindadreifingu fyrir mengi útkomu.
Hverjir eru kostir reynslureglunnar?
Reynslureglan er gagnleg vegna þess að hún þjónar sem leið til að spá fyrir um gögn. Þetta á sérstaklega við þegar kemur að stórum gagnasöfnum og þeim þar sem breytur eru óþekktar. Sérstaklega í fjármálum er reynslureglan í samræmi við hlutabréfaverð, verðvísitölur og loggildi gjaldeyrisgengis, sem allir hafa tilhneigingu til að falla yfir bjölluferil eða eðlilega dreifingu.