Эмпирическое правило
Что такое эмпирическое правило?
Эмпирическое правило, также называемое правилом трех сигм или правилом 68-95-99,7, является статистическим правилом, которое утверждает, что для нормального распределения почти все наблюдаемые данные будут находиться в пределах трех стандартных отклонений (обозначаемых σ) среднее или среднее (обозначается µ).
В частности, эмпирическое правило предсказывает, что 68 % наблюдений попадают в пределы первого стандартного отклонения (µ ± σ), 95 % — в пределах первых двух стандартных отклонений (µ ± 2 σ) и 99,7 % — в пределах первых трех стандартных отклонений (µ ± σ). 3σ).
Понимание эмпирического правила
Эмпирическое правило часто используется в статистике для прогнозирования конечных результатов. После расчета стандартного отклонения и перед сбором точных данных это правило можно использовать в качестве приблизительной оценки результатов предстоящих данных, которые необходимо собрать и проанализировать.
Таким образом, это распределение вероятностей можно использовать в качестве промежуточной эвристики, поскольку сбор соответствующих данных может занять много времени, а в некоторых случаях даже невозможен. Такие соображения вступают в игру, когда фирма пересматривает свои меры контроля качества или оценивает свою подверженность риску. Например, часто используемый инструмент управления рисками, известный как оценка риска (VaR), предполагает, что вероятность рисковых событий подчиняется нормальному распределению.
Эмпирическое правило также используется как грубый способ проверить «нормальность» распределения. Если слишком много точек данных выходит за пределы трех границ стандартного отклонения, это говорит о том, что распределение не является нормальным и может быть асимметричным или соответствовать какому-то другому распределению.
Эмпирическое правило также известно как правило трех сигм, поскольку «три сигмы» относится к статистическому распределению данных в пределах трех стандартных отклонений от среднего значения нормального распределения ( гауссовой кривой ), как показано на рисунке ниже.
Примеры эмпирического правила
Предположим, что известно, что популяция животных в зоопарке распределена нормально. Каждое животное живет в среднем 13,1 года (в среднем), а стандартное отклонение продолжительности жизни составляет 1,5 года. Если кто-то хочет узнать вероятность того, что животное будет жить дольше 14,6 лет, он может использовать эмпирическое правило. Зная, что средний возраст распределения составляет 13,1 года, для каждого стандартного отклонения возникают следующие возрастные диапазоны:
Одно стандартное отклонение (µ ± σ): от (13,1–1,5) до (13,1 + 1,5) или от 11,6 до 14,6.
Два стандартных отклонения (µ ± 2σ): 13,1 - (2 x 1,5) до 13,1 + (2 x 1,5) или 10,1 до 16,1
Три стандартных отклонения (µ ± 3σ): 13,1 - (3 x 1,5) до 13,1 + (3 x 1,5) или от 8,6 до 17,6
Человек, решающий эту задачу, должен вычислить общую вероятность того, что животное проживет 14,6 лет или дольше. Эмпирическое правило показывает, что 68% распределения лежит в пределах одного стандартного отклонения, в данном случае от 11,6 до 14,6 лет. Таким образом, оставшиеся 32% распределения лежат вне этого диапазона. Одна половина лежит выше 14,6, а другая ниже 11,6. Итак, вероятность того, что животное проживет более 14,6 лет, составляет 16% (рассчитывается как 32%, деленное на два).
В качестве другого примера предположим, что животное в зоопарке доживает в среднем до 10 лет со стандартным отклонением 1,4 года. Предположим, смотритель зоопарка пытается вычислить вероятность того, что животное проживет более 7,2 лет. Это распределение выглядит следующим образом:
Одно стандартное отклонение (µ ± σ): от 8,6 до 11,4 лет.
Два стандартных отклонения (µ ± 2σ): от 7,2 до 12,8 лет.
Три стандартных отклонения ((µ ± 3σ): от 5,8 до 14,2 лет
Эмпирическое правило гласит, что 95% распределения находится в пределах двух стандартных отклонений. Таким образом, 5% лежат за пределами двух стандартных отклонений; половина старше 12,8 лет и половина младше 7,2 лет. Таким образом, вероятность прожить более 7,2 лет составляет:
95% + (5%/2) = 97,5%
Особенности
Эмпирическое правило гласит, что 99,7% данных, наблюдаемых в соответствии с нормальным распределением, находятся в пределах 3 стандартных отклонений от среднего значения.
В соответствии с этим правилом 68 % данных попадают в пределы одного стандартного отклонения, 95 % процентов — в пределах двух стандартных отклонений и 99,7 % — в пределах трех стандартных отклонений от среднего значения.
Пределы трех сигм, которые следуют эмпирическому правилу, используются для установки верхнего и нижнего контрольных пределов в диаграммах статистического контроля качества и в анализе рисков, таком как VaR.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Как используется эмпирическое правило?
Эмпирическое правило применяется для прогнозирования вероятных результатов в нормальном распределении. Например, статистик может использовать это для оценки процента случаев, попадающих в каждое стандартное отклонение. Учтите, что стандартное отклонение равно 3,1, а среднее значение равно 10. В этом случае первое стандартное отклонение будет колебаться между (10 + 3,2) = 13,2 и (10-3,2) = 6,8. Второе отклонение будет находиться между 10 + (2 х 3,2) = 16,4 и 10 - (2 х 3,2) = 3,6 и так далее.
Что такое эмпирическое правило?
В статистике эмпирическое правило гласит, что 99,7% данных находятся в пределах трех стандартных отклонений от среднего значения в пределах нормального распределения. С этой целью 68% наблюдаемых данных будут находиться в пределах первого стандартного отклонения, 95% будут иметь место во втором отклонении и 97,5% в пределах третьего стандартного отклонения. Эмпирическое правило предсказывает распределение вероятностей для набора исходов.
Каковы преимущества эмпирического правила?
Эмпирическое правило выгодно, потому что оно служит средством прогнозирования данных. Это особенно верно, когда речь идет о больших наборах данных и тех, где переменные неизвестны. В частности, в финансах эмпирическое правило применимо к ценам на акции, индексам цен и логарифмическим значениям курсов форекс, которые имеют тенденцию падать на кривую нормального распределения.