Investor's wiki

Доверительный интервал

Доверительный интервал

Что такое доверительный интервал?

Доверительный интервал в статистике относится к вероятности того, что параметр совокупности будет находиться между набором значений в течение определенного количества раз.

Понимание доверительных интервалов

Доверительные интервалы измеряют степень неопределенности или уверенности в методе выборки . Они могут принимать любое количество пределов вероятности, наиболее распространенным из которых является уровень достоверности 95% или 99%. Доверительные интервалы определяются с использованием статистических методов, таких как t-критерий.

Статистики используют доверительные интервалы для измерения неопределенности выборочной переменной. Например, исследователь случайным образом выбирает разные образцы из одной и той же совокупности и вычисляет доверительный интервал для каждой выборки, чтобы увидеть, как он может представлять истинное значение переменной совокупности. Результирующие наборы данных все разные; некоторые интервалы включают параметр истинной популяции, а другие нет.

Доверительный интервал — это диапазон значений, ограниченный выше и ниже среднего статистического значения,. который, вероятно, будет содержать неизвестный параметр генеральной совокупности. Уровень достоверности относится к проценту вероятности или уверенности в том, что доверительный интервал будет содержать истинный параметр генеральной совокупности, когда вы делаете случайную выборку много раз. Или, говоря простым языком, «мы на 99% уверены (уровень достоверности), что большинство этих выборок (доверительные интервалы) содержат истинный параметр совокупности».

Самое большое заблуждение относительно доверительных интервалов заключается в том, что они представляют собой процент данных из данной выборки, которые находятся между верхней и нижней границами. Например, можно ошибочно интерпретировать вышеупомянутый 99% доверительный интервал от 70 до 78 дюймов как указание на то, что 99% данных в случайной выборке попадают между этими числами. Это неверно, хотя для такого определения существует отдельный метод статистического анализа. Для этого необходимо определить среднее значение и стандартное отклонение выборки и нанести эти цифры на кривую нормального распределения.

Доверительный интервал и уровень достоверности взаимосвязаны, но это не одно и то же.

Расчет доверительного интервала

Предположим, группа исследователей изучает рост баскетболистов средней школы. Исследователи берут случайную выборку из населения и устанавливают средний рост 74 дюйма.

Среднее значение 74 дюйма является точечной оценкой среднего значения населения. Точечная оценка сама по себе имеет ограниченную полезность, поскольку она не раскрывает неопределенность, связанную с оценкой; у вас нет четкого представления о том, насколько далеко это 74-дюймовое среднее значение выборки может быть от среднего значения генеральной совокупности. Чего не хватает, так это степени неопределенности в этой единственной выборке.

Доверительные интервалы предоставляют больше информации, чем точечные оценки. Установив 95% доверительный интервал, используя среднее значение выборки и стандартное отклонение и предполагая нормальное распределение,. представленное кривой нормального распределения, исследователи получают верхнюю и нижнюю границы, которые содержат истинное среднее значение в 95% случаев.

Предположим, что интервал составляет от 72 дюймов до 76 дюймов. Если исследователи возьмут 100 случайных выборок из популяции баскетболистов средней школы в целом, среднее значение должно быть между 72 и 76 дюймами в 95 из этих выборок.

Если исследователям нужна еще большая уверенность, они могут расширить интервал до 99% достоверности. Это неизменно создает более широкий диапазон, поскольку освобождает место для большего количества выборочных средних. Если они установят 99% доверительный интервал между 70 и 78 дюймами, они могут ожидать, что 99 из 100 оцененных образцов будут содержать среднее значение между этими числами.

С другой стороны, уровень достоверности 90% означает, что мы ожидаем, что 90% интервальных оценок будут включать параметр генеральной совокупности и так далее.

Особенности

  • Чаще всего они строятся с использованием уровней достоверности 95% или 99%.

  • Доверительный интервал отображает вероятность того, что параметр окажется между парой значений около среднего значения.

  • Доверительные интервалы измеряют степень неопределенности или уверенности в методе выборки.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Что является распространенным заблуждением о доверительных интервалах?

Самое большое заблуждение относительно доверительных интервалов заключается в том, что они представляют собой процент данных из данной выборки, которые находятся между верхней и нижней границами. Другими словами, было бы неверным предполагать, что доверительный интервал 99 % означает, что 99 % данных в случайной выборке попадают в эти пределы. На самом деле это означает, что можно быть на 99% уверенным, что диапазон будет содержать среднее значение генеральной совокупности.

Что такое Т-тест?

Доверительные интервалы определяются с использованием статистических методов, таких как t-критерий. Стьюдентный тест — это тип логической статистики, используемый для определения того, существует ли значительная разница между средними значениями двух групп, которая может быть связана с определенными функциями. Для расчета t-критерия требуются три значения ключевых данных. Они включают разницу между средними значениями из каждого набора данных (называемую средней разницей), стандартное отклонение каждой группы и количество значений данных в каждой группе.

Что показывает доверительный интервал?

Доверительный интервал — это диапазон значений, ограниченный выше и ниже среднего статистического значения, который, вероятно, будет содержать неизвестный параметр генеральной совокупности. Уровень достоверности относится к проценту вероятности или уверенности в том, что доверительный интервал будет содержать истинный параметр генеральной совокупности, когда вы делаете случайную выборку много раз.

Как используются доверительные интервалы?

Статистики используют доверительные интервалы для измерения неопределенности выборочной переменной. Например, исследователь случайным образом выбирает разные образцы из одной и той же совокупности и вычисляет доверительный интервал для каждой выборки, чтобы увидеть, как он может представлять истинное значение переменной совокупности. Результирующие наборы данных все разные, где некоторые интервалы включают истинный параметр совокупности, а другие нет.