Zasada empiryczna

Jaka jest reguła empiryczna?

Reguła empiryczna, zwana również regułą trzech sigma lub regułą 68-95-99,7, jest regułą statystyczną, która mówi, że dla rozkładu normalnego prawie wszystkie obserwowane dane będą mieściły się w trzech odchyleniach standardowych (oznaczonych przez σ) średnia lub średnia (oznaczona przez µ).

W szczególności reguła empiryczna przewiduje, że 68% obserwacji mieści się w obrębie pierwszego odchylenia standardowego (µ ± σ), 95% w obrębie pierwszych dwóch odchyleń standardowych (µ ± 2σ) i 99,7% w obrębie pierwszych trzech odchyleń standardowych (µ ± 3σ).

Zrozumienie zasady empirycznej

Reguła empiryczna jest często wykorzystywana w statystyce do prognozowania wyników końcowych. Po obliczeniu odchylenia standardowego, a przed zebraniem dokładnych danych, regułę tę można wykorzystać jako przybliżone oszacowanie wyniku przyszłych danych, które mają zostać zebrane i przeanalizowane.

Ten rozkład prawdopodobieństwa może być zatem wykorzystany jako tymczasowa heurystyka, ponieważ zebranie odpowiednich danych może być czasochłonne lub nawet niemożliwe w niektórych przypadkach. Takie rozważania wchodzą w grę, gdy firma dokonuje przeglądu swoich środków kontroli jakości lub oceny narażenia na ryzyko. Na przykład często używane narzędzie ryzyka, znane jako wartość zagrożona (VaR), zakłada, że prawdopodobieństwo zdarzeń ryzyka ma rozkład normalny.

Reguła empiryczna jest również używana jako przybliżony sposób testowania „normalności” rozkładu. Jeśli zbyt wiele punktów danych wykracza poza trzy granice odchylenia standardowego, sugeruje to, że rozkład nie jest normalny i może być przekrzywiony lub zgodny z innym rozkładem.

Reguła empiryczna jest również znana jako reguła trzech sigma, ponieważ „trzy sigma” odnosi się do statystycznego rozkładu danych w obrębie trzech standardowych odchyleń od średniej na normalnym rozkładzie ( krzywa dzwonowa ), jak pokazano na poniższym rysunku.

Przykłady reguły empirycznej

Załóżmy, że populacja zwierząt w zoo ma rozkład normalny. Każde zwierzę żyje średnio 13,1 roku (średnia), a odchylenie standardowe długości życia wynosi 1,5 roku. Jeśli ktoś chce poznać prawdopodobieństwo, że zwierzę będzie żyło dłużej niż 14,6 lat, może posłużyć się regułą empiryczną. Wiedząc, że średnia rozkładu wynosi 13,1 lat, dla każdego odchylenia standardowego występują następujące przedziały wiekowe:

Jedno odchylenie standardowe (µ ± σ): (13,1 - 1,5) do (13,1 + 1,5) lub 11,6 do 14,6
Dwa odchylenia standardowe (µ ± 2σ): 13,1 - (2 x 1,5) do 13,1 + (2 x 1,5) lub 10,1 do 16,1
Trzy odchylenia standardowe (µ ± 3σ): 13,1 - (3 x 1,5) do 13,1 + (3 x 1,5) lub 8,6 do 17,6

Osoba rozwiązująca ten problem musi obliczyć całkowite prawdopodobieństwo, że zwierzę przeżyje 14,6 lat lub dłużej. Z reguły empirycznej wynika, że 68% rozkładu mieści się w obrębie jednego odchylenia standardowego, w tym przypadku od 11,6 do 14,6 lat. Zatem pozostałe 32% rozkładu leży poza tym przedziałem. Jedna połowa leży powyżej 14,6, a druga poniżej 11,6. Tak więc prawdopodobieństwo, że zwierzę przeżyje więcej niż 14,6, wynosi 16% (obliczone jako 32% podzielone przez dwa).

Jako inny przykład załóżmy, że zwierzę w zoo żyje średnio 10 lat, z odchyleniem standardowym wynoszącym 1,4 roku. Załóżmy, że opiekun zoo próbuje obliczyć prawdopodobieństwo, że zwierzę będzie żyło dłużej niż 7,2 roku. Ta dystrybucja wygląda następująco:

Jedno odchylenie standardowe (µ ± σ): 8,6 do 11,4 lat
Dwa odchylenia standardowe (µ ± 2σ): 7,2 do 12,8 lat
Trzy odchylenia standardowe ((µ ± 3σ): 5,8 do 14,2 lat

Zasada empiryczna mówi, że 95% rozkładu mieści się w granicach dwóch odchyleń standardowych. Zatem 5% leży poza dwoma odchyleniami standardowymi; połowa powyżej 12,8 roku i połowa poniżej 7,2 roku. Zatem prawdopodobieństwo życia dłużej niż 7,2 lat wynosi:

95% + (5% / 2) = 97,5%

##Przegląd najważniejszych wydarzeń

Reguła empiryczna stwierdza, że 99,7% danych zaobserwowanych w normalnym rozkładzie mieści się w granicach 3 odchyleń standardowych od średniej.
Zgodnie z tą zasadą 68% danych mieści się w obrębie jednego odchylenia standardowego, 95% procent w obrębie dwóch odchyleń standardowych, a 99,7% w obrębie trzech odchyleń standardowych od średniej.
Limity trzech sigma, które są zgodne z regułą empiryczną, są używane do wyznaczania górnych i dolnych granic kontrolnych w statystycznych wykresach kontroli jakości oraz w analizie ryzyka, takiej jak VaR.

##FAQ

Jak używana jest reguła empiryczna?

Zasada empiryczna jest stosowana do przewidywania prawdopodobnych wyników w normalnym rozkładzie. Na przykład, statystyk wykorzystałby to do oszacowania odsetka przypadków, które mieszczą się w każdym odchyleniu standardowym. Weź pod uwagę, że odchylenie standardowe wynosi 3,1, a średnia równa się 10. W tym przypadku pierwsze odchylenie standardowe wynosiłoby między (10+3,2)= 13,2 a (10-3,2)= 6,8. Drugie odchylenie wypadałoby między 10 + (2 X 3,2)= 16,4 a 10 - (2 X 3,2)= 3,6 i tak dalej.

Jaka jest reguła empiryczna?

W statystyce reguła empiryczna mówi, że 99,7% danych występuje w obrębie trzech odchyleń standardowych średniej w rozkładzie normalnym. W tym celu 68% obserwowanych danych wystąpi w ramach pierwszego odchylenia standardowego, 95% w drugim odchyleniu, a 97,5% w trzecim odchyleniu standardowym. Reguła empiryczna przewiduje rozkład prawdopodobieństwa dla zbioru wyników.

Jakie są zalety reguły empirycznej?

Zasada empiryczna jest korzystna, ponieważ służy do prognozowania danych. Jest to szczególnie ważne w przypadku dużych zbiorów danych i tych, w których zmienne są nieznane. W szczególności w finansach zasada empiryczna dotyczy cen akcji, indeksów cen i wartości logarytmicznych kursów forex, które mają tendencję do opadania w poprzek krzywej dzwonowej lub rozkładu normalnego.