Выборочное распределение

Что такое выборочное распределение?

Распределение выборки — это вероятностное распределение статистики, полученной из большего числа выборок, взятых из определенной совокупности. Распределение выборки данной совокупности представляет собой распределение частот ряда различных исходов, которые могут иметь место для статистических данных совокупности.

В статистике совокупность — это весь пул, из которого берется статистическая выборка. Популяция может относиться к целой группе людей, объектов, событий, посещений больниц или измерений. Таким образом, можно сказать, что популяция представляет собой совокупное наблюдение субъектов, сгруппированных вместе по общему признаку.

Выборочное распределение представляет собой статистику, полученную путем повторной выборки из большей совокупности.

Он описывает диапазон возможных результатов статистики, таких как среднее значение или режим некоторой переменной, поскольку он действительно существует в совокупности.

Большинство данных, проанализированных исследователями, на самом деле взяты из выборок, а не популяций.

Понимание распределения выборки

Многие данные, полученные и используемые академиками, статистиками, исследователями, маркетологами, аналитиками и т. д., на самом деле являются выборками, а не популяциями. Выборка — это подмножество совокупности. Например, исследователь-медик, который хотел сравнить средний вес всех детей, родившихся в Северной Америке с 1995 по 2005 год, с детьми, родившимися в Южной Америке в тот же период времени, не может в разумные сроки получить данные для всего населения страны. более миллиона родов, произошедших за десятилетний период. Вместо этого они будут использовать только вес, скажем, 100 младенцев на каждом континенте, чтобы сделать вывод. Используемый вес 200 младенцев является выборкой, а рассчитанный средний вес является средним значением выборки.

Теперь предположим, что вместо одной выборки из 100 весов новорожденных с каждого континента медицинский исследователь берет повторяющиеся случайные выборки из общей популяции и вычисляет выборочное среднее для каждой выборочной группы. Итак, для Северной Америки они извлекают данные для 100 весов новорожденных, зарегистрированных в США, Канаде и Мексике, следующим образом: четыре 100 образца из избранных больниц в США, пять 70 образцов из Канады и три 150 образца из Мексики, итого из 1200 гирь новорожденных, сгруппированных в 12 наборов. Они также собирают выборочные данные по 100 весам при рождении в каждой из 12 стран Южной Америки.

Каждая выборка имеет свое собственное выборочное среднее, и распределение выборочных средних известно как выборочное распределение.

Средний вес, рассчитанный для каждого набора выборок, представляет собой выборочное распределение среднего значения. По выборке можно рассчитать не только среднее значение. Другие статистические данные,. такие как стандартное отклонение, дисперсия, доля и диапазон, могут быть рассчитаны на основе выборочных данных. Стандартное отклонение и дисперсия измеряют изменчивость выборочного распределения.

Количество наблюдений в совокупности, количество наблюдений в выборке и процедура, используемая для составления наборов выборки, определяют изменчивость распределения выборки. Стандартное отклонение выборочного распределения называется стандартной ошибкой. В то время как среднее значение выборочного распределения равно среднему значению совокупности, стандартная ошибка зависит от стандартного отклонения совокупности, размера совокупности и размера выборки.

Знание того, насколько среднее значение каждого из наборов выборки отличается друг от друга и от среднего значения совокупности, даст представление о том, насколько близко среднее значение выборки к среднему значению совокупности. Стандартная ошибка выборочного распределения уменьшается по мере увеличения размера выборки.

Особые соображения

Население или один выборочный набор чисел будут иметь нормальное распределение. Однако, поскольку выборочное распределение включает несколько наборов наблюдений, оно не обязательно будет иметь колоколообразную форму.

Следуя нашему примеру, средний вес детей в Северной Америке и Южной Америке имеет нормальное распределение, потому что некоторые дети будут иметь недостаточный вес (ниже среднего) или избыточный вес (выше среднего), при этом большинство детей будут находиться в промежуточном диапазоне (около среднего). ). Если средний вес новорожденных в Северной Америке составляет семь фунтов, средний вес выборки в каждом из 12 наборов выборочных наблюдений, зарегистрированных для Северной Америки, также будет близок к семи фунтам.

Однако, если вы вычертите каждое из средних значений, рассчитанных в каждой из 1200 выборочных групп, результирующая форма может привести к равномерному распределению, но трудно с уверенностью предсказать, какой окажется фактическая форма. Чем больше выборок исследователь использует из совокупности с более чем миллионом значений веса, тем больше график начнет формировать нормальное распределение.