Нулевая гипотеза
Что такое нулевая гипотеза?
Нулевая гипотеза — это тип статистической гипотезы, которая предполагает отсутствие статистической значимости в наборе данных наблюдений. Проверка гипотезы используется для оценки достоверности гипотезы с использованием выборочных данных. Иногда его называют просто «нулем», он представлен как H0.
Нулевая гипотеза, также известная как гипотеза, используется в количественном анализе для проверки теорий о рынках, инвестиционных стратегиях или экономике, чтобы решить, является ли идея верной или ложной.
Как работает нулевая гипотеза
Нулевая гипотеза — это тип гипотезы в статистике, которая предполагает, что нет никакой разницы между определенными характеристиками населения или процесса, генерирующего данные. Например, игрока может интересовать, честна ли азартная игра. Если честно, то ожидаемая прибыль за игру равна нулю для обоих игроков. Если игра нечестная, то ожидаемая прибыль положительна для одного игрока и отрицательна для другого. Чтобы проверить, является ли игра честной, игрок собирает данные о доходах от многих повторений игры, вычисляет средний доход на основе этих данных, а затем проверяет нулевую гипотезу о том, что ожидаемый доход не отличается от нуля.
Если средние доходы по данным выборки достаточно далеки от нуля, то игрок отклонит нулевую гипотезу и сделает вывод об альтернативной гипотезе, а именно о том, что ожидаемые доходы за игру отличны от нуля. Если средний заработок по данным выборки близок к нулю, то игрок не отвергнет нулевую гипотезу, а вместо этого сделает вывод, что разница между средним значением по данным и нулем может быть объяснена только случайностью.
Нулевая гипотеза предполагает, что любое различие между выбранными характеристиками, которое вы видите в наборе данных, обусловлено случайностью. Например, если ожидаемый заработок в азартной игре действительно равен нулю, то любая разница между средним заработком в данных и нулем обусловлена случайностью.
Аналитики стараются отвергнуть нулевую гипотезу, потому что это является сильным выводом. Это требует веских доказательств в виде наблюдаемой разницы, которая слишком велика, чтобы ее можно было объяснить исключительно случайностью. Неспособность отвергнуть нулевую гипотезу о том, что результаты можно объяснить только случайностью, является слабым выводом, поскольку он допускает, что могут действовать и другие факторы, помимо случайности, но они могут быть недостаточно сильными, чтобы статистический тест мог их обнаружить.
Нулевая гипотеза может быть только отвергнута, но не доказана.
Альтернативная гипотеза
Важно отметить, что мы проверяем нулевую гипотезу, потому что есть элемент сомнения в ее достоверности. Любая информация, противоречащая заявленной нулевой гипотезе, фиксируется в альтернативной (альтернативной) гипотезе (H1).
Для приведенных выше примеров альтернативной гипотезой будет:
Средний балл учащихся не равен семи.
Среднегодовая доходность паевого фонда не равна 8% в год.
Другими словами, альтернативная гипотеза прямо противоречит нулевой гипотезе.
Примеры нулевой гипотезы
Вот простой пример: директор школы утверждает, что учащиеся ее школы набирают в среднем семь баллов из 10 на экзаменах. Нулевая гипотеза состоит в том, что среднее значение генеральной совокупности равно 7,0. Чтобы проверить эту нулевую гипотезу, мы записываем оценки, скажем, 30 учеников (выборка) из всего студенческого контингента школы (скажем, 300) и вычисляем среднее значение этой выборки.
Затем мы можем сравнить (расчетное) среднее значение выборки с (гипотетическим) средним значением генеральной совокупности, равным 7,0, и попытаться отвергнуть нулевую гипотезу. (Здесь нулевая гипотеза о том, что среднее значение генеральной совокупности равно 7,0, не может быть доказана с использованием выборочных данных. Ее можно только отвергнуть.)
Возьмем другой пример: заявленная годовая доходность определенного взаимного фонда составляет 8%. Предположим, что взаимный фонд существует уже 20 лет. Нулевая гипотеза состоит в том, что средняя доходность взаимного фонда составляет 8%. Мы берем случайную выборку годовых доходов взаимного фонда, скажем, за пять лет (выборка) и вычисляем выборочное среднее. Затем мы сравниваем (рассчитанное) среднее значение выборки с (заявленным) средним значением генеральной совокупности (8%), чтобы проверить нулевую гипотезу.
Для приведенных выше примеров нулевые гипотезы:
Пример A: Учащиеся школы набирают на экзаменах в среднем семь баллов из 10.
Пример B: Среднегодовая доходность взаимного фонда составляет 8% в год.
В целях определения того, следует ли отклонить нулевую гипотезу, предполагается, что нулевая гипотеза (сокращенно H ~ 0 ~) верна в качестве аргумента. Затем в соответствии с этим предположением определяется вероятный диапазон возможных значений рассчитанной статистики (например, средний балл по тестам 30 учащихся) (например, диапазон правдоподобных средних значений может варьироваться от 6,2 до 7,8, если среднее значение генеральной совокупности равно 7,0). Затем, если среднее значение выборки выходит за пределы этого диапазона, нулевая гипотеза отклоняется. В противном случае говорят, что разница «объясняется только случайностью», находясь в пределах диапазона, определяемого только случайностью.
Как проверка нулевой гипотезы используется в инвестициях
В качестве примера, связанного с финансовыми рынками, предположим, что Алиса видит, что ее инвестиционная стратегия обеспечивает более высокую среднюю доходность, чем просто покупка и владение акциями. Нулевая гипотеза утверждает, что между двумя средними доходами нет разницы, и Алиса склонна верить в это до тех пор, пока не сможет прийти к противоречивым результатам.
Опровержение нулевой гипотезы потребует демонстрации статистической значимости, которую можно найти с помощью различных тестов. Альтернативная гипотеза утверждает, что инвестиционная стратегия имеет более высокую среднюю доходность, чем традиционная стратегия «купи и держи».
Одним из инструментов, который может определить статистическую значимость результатов, является p-значение. Значение p представляет собой вероятность того, что разница, столь же большая или превышающая наблюдаемую разницу между двумя средними доходностями, может возникнуть исключительно случайно.
Значение p, меньшее или равное 0,05, часто указывает на наличие доказательств против нулевой гипотезы. Если Алиса проведет один из этих тестов, например, тест с использованием нормальной модели, в результате чего будет выявлена значительная разница между ее доходами и доходами по схеме «купи и держи» (значение p меньше или равно 0,05), она может затем отвергнуть нулевую гипотезу и сделать вывод об альтернативной гипотезе.
Особенности
Проверка нулевой гипотезы лежит в основе принципа фальсификации в науке.
Проверка гипотез предоставляет метод отклонения нулевой гипотезы в пределах определенного уровня достоверности.
Если вы можете отвергнуть нулевую гипотезу, это обеспечивает поддержку альтернативной гипотезы.
Нулевая гипотеза — это тип гипотезы в статистике, которая предполагает, что нет никакой разницы между определенными характеристиками населения или процесса, генерирующего данные.
Альтернативная гипотеза предполагает, что разница есть.
ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ
Как определяется нулевая гипотеза?
Аналитик или исследователь выдвигает нулевую гипотезу на основе исследовательского вопроса или проблемы, на которую они пытаются ответить. В зависимости от вопроса нуль может быть идентифицирован по-разному. Например, если вопрос заключается просто в том, существует ли эффект (например, влияет ли X на Y?), нулевая гипотеза может быть H0: X = 0. Если вместо этого возникает вопрос, совпадает ли X с Y, H0 будет X = Y. Если влияние X на Y положительное, H0 будет X > 0. Если результирующий анализ показывает влияние, которое статистически значимо отличается от нуля, нулевое значение можно отклонить.
Как проверяются статистические гипотезы?
Статистические гипотезы проверяются в четыре этапа. Первый шаг для аналитика состоит в том, чтобы сформулировать две гипотезы так, чтобы только одна из них была верной. Следующим шагом является разработка плана анализа, в котором описывается, как будут оцениваться данные. Третий шаг — выполнить план и физически проанализировать выборочные данные. Четвертый и последний шаг — проанализировать результаты и либо отвергнуть нулевую гипотезу, либо заявить, что наблюдаемые различия можно объяснить только случайностью.
Что такое альтернативная гипотеза?
Альтернативная гипотеза является прямым противоречием нулевой гипотезе. Это означает, что если одна из двух гипотез верна, то другая ложна.
Как нулевая гипотеза используется в финансах?
В финансах нулевая гипотеза используется в количественном анализе. Нулевая гипотеза проверяет предпосылки инвестиционной стратегии, рынков или экономики, чтобы определить, верна она или нет. Например, аналитик может захотеть увидеть, тесно ли связаны две акции, ABC и XYZ. Нулевая гипотеза будет ABC ≠ XYZ.