Проверка гипотезы
Что такое проверка гипотез?
Проверка гипотезы — это действие в статистике, при котором аналитик проверяет предположение относительно параметра совокупности. Методология, используемая аналитиком, зависит от характера используемых данных и цели анализа.
Проверка гипотезы используется для оценки правдоподобия гипотезы с использованием выборочных данных. Такие данные могут поступать от большей совокупности или в результате процесса генерации данных. Слово «популяция» будет использоваться для обоих этих случаев в следующих описаниях.
Как работает проверка гипотез
При проверке гипотезы аналитик проверяет статистическую выборку с целью предоставить доказательства правдоподобия нулевой гипотезы.
Статистические аналитики проверяют гипотезу, измеряя и исследуя случайную выборку анализируемой совокупности. Все аналитики используют случайную выборку населения для проверки двух разных гипотез: нулевой гипотезы и альтернативной гипотезы.
Нулевая гипотеза обычно представляет собой гипотезу о равенстве параметров совокупности; например, нулевая гипотеза может утверждать, что средний доход населения равен нулю. Альтернативная гипотеза эффективно противоположна нулевой гипотезе (например, средний доход населения не равен нулю). Таким образом, они взаимоисключающие,. и только одно из них может быть верным. Однако одна из двух гипотез всегда будет верной.
4 этапа проверки гипотез
Все гипотезы проверяются с использованием четырехэтапного процесса:
Первый шаг аналитика состоит в том, чтобы сформулировать две гипотезы так, чтобы только одна из них была верной.
Следующим шагом является разработка плана анализа, в котором описывается, как будут оцениваться данные.
Третий шаг — выполнить план и физически проанализировать выборочные данные.
Четвертый и последний шаг заключается в анализе результатов и либо отклонении нулевой гипотезы, либо утверждении, что нулевая гипотеза правдоподобна, учитывая данные.
Реальный пример проверки гипотез
Если, например, человек хочет проверить, что у пенни ровно 50 % шансов упасть решкой, нулевая гипотеза будет состоять в том, что 50 % верны, а альтернативная гипотеза будет состоять в том, что 50 % неверны.
Математически нулевая гипотеза будет представлена как Ho: P = 0,5. Альтернативная гипотеза будет обозначаться как «Ха» и будет идентична нулевой гипотезе, за исключением перечеркнутого знака равенства, что означает, что она не равна 50%.
Производится случайная выборка из 100 бросков монеты, после чего проверяется нулевая гипотеза. Если обнаружится, что 100 бросков монеты были распределены как 40 орлов и 60 решек, аналитик предположит, что у пенни нет 50% вероятности выпадения орла, и отклонит нулевую гипотезу и примет альтернативную гипотезу.
Если, с другой стороны, выпало 48 орлов и 52 решки, то вполне вероятно, что монета могла быть честной и все равно давать такой результат. В подобных случаях, когда нулевая гипотеза «принимается», аналитик заявляет, что разница между ожидаемыми результатами (50 орлов и 50 решек) и наблюдаемыми результатами (48 орлов и 52 решки) «объясняется только случайностью».
Особенности
Проверка гипотезы используется для оценки правдоподобия гипотезы с использованием выборочных данных.
Тест предоставляет доказательства правдоподобия гипотезы с учетом данных.
Статистические аналитики проверяют гипотезу, измеряя и исследуя случайную выборку анализируемой совокупности.