Investor's wiki

Стратифицированная случайная выборка

Стратифицированная случайная выборка

Что такое стратифицированная случайная выборка?

Стратифицированная случайная выборка — это метод выборки, который включает разделение населения на более мелкие подгруппы, известные как страты. При стратифицированной случайной выборке или стратификации страты формируются на основе общих атрибутов или характеристик участников, таких как доход или уровень образования.

Стратифицированная случайная выборка также называется пропорциональной случайной выборкой или квотной случайной выборкой.

Как работает стратифицированная случайная выборка

Завершая анализ или исследование группы объектов со схожими характеристиками, исследователь может обнаружить, что размер популяции слишком велик для завершения исследования. Чтобы сэкономить время и деньги, аналитик может применить более приемлемый подход, выбрав небольшую группу населения. Небольшая группа называется размером выборки,. которая представляет собой подмножество населения, которое используется для представления всего населения. Выборка может быть отобрана из генеральной совокупности несколькими способами, одним из которых является метод стратифицированной случайной выборки.

Стратифицированная случайная выборка включает разделение всего населения на однородные группы, называемые стратами (множественное число от stratum). Затем из каждой страты отбираются случайные выборки. Например, рассмотрим академического исследователя, который хотел бы узнать количество студентов MBA в 2007 году, получивших предложение о работе в течение трех месяцев после выпуска.

Исследователь скоро обнаружит, что за год было почти 200 000 выпускников MBA. Они могут решить просто взять простую случайную выборку из 50 000 выпускников и провести опрос. Более того, они могли бы разделить население на слои и взять случайную выборку из этих слоев. Для этого они будут создавать группы населения на основе пола, возраста, расы, страны гражданства и опыта работы. Случайная выборка из каждой страты берется в количестве, пропорциональном размеру страты по сравнению с населением. Затем эти подмножества страт объединяются для формирования случайной выборки.

Стратифицированная выборка используется для выявления различий между группами в совокупности, в отличие от простой случайной выборки, при которой все члены совокупности рассматриваются как равные с равной вероятностью попадания в выборку

Пример стратифицированной случайной выборки

Предположим, исследовательская группа хочет определить средний балл студентов колледжей в США. Исследовательская группа испытывает трудности со сбором данных обо всех 21 миллионе студентов колледжей; он решает провести случайную выборку населения, используя 4000 студентов.

Теперь предположим, что команда изучает различные атрибуты участников выборки и задается вопросом, есть ли какие-либо различия в среднем балле и специализации студентов. Предположим, выясняется, что 560 студентов изучают английский язык, 1135 — естественные науки, 800 — информатику, 1090 — инженерное дело и 415 — математику. Команда хочет использовать пропорциональную стратифицированную случайную выборку, в которой слой выборки пропорционален случайной выборке в совокупности.

Предположим, команда исследует демографические данные студентов колледжей в США и находит процентное соотношение студентов, изучающих английский язык, 28 % — естественные науки, 24 % — компьютерные науки, 21 % — инженерное дело и 15 %. по специальности математика. Таким образом, в процессе стратифицированной случайной выборки создается пять страт.

Затем команде необходимо подтвердить, что страта населения пропорциональна страте в выборке; однако они обнаруживают, что пропорции не равны. Затем команде необходимо провести повторную выборку 4000 студентов из населения и случайным образом выбрать 480 студентов, изучающих английский язык, 1120 студентов, изучающих естественные науки, 960 студентов, изучающих информатику, 840 инженеров и 600 студентов-математиков.

При этом у него есть пропорциональная стратифицированная случайная выборка студентов колледжей, которая обеспечивает лучшее представление специальностей студентов колледжей в США. Затем исследователи могут выделить конкретную страту, наблюдать за различными исследованиями студентов колледжей США и наблюдать различные средние баллы. .

Простая случайная выборка по сравнению с стратифицированной случайной выборкой

Простые случайные выборки и стратифицированные случайные выборки являются инструментами статистического измерения. Для представления всей совокупности данных используется простая случайная выборка. Стратифицированная случайная выборка делит население на более мелкие группы или страты на основе общих характеристик.

Простая случайная выборка часто используется, когда имеется очень мало информации о совокупности данных, когда совокупность данных имеет слишком много различий, чтобы ее можно было разделить на различные подмножества, или когда среди совокупности данных есть только одна отличительная характеристика.

Например, кондитерская компания может захотеть изучить покупательские привычки своих клиентов, чтобы определить будущее своей линейки продуктов. Если есть 10 000 клиентов, он может выбрать 100 из этих клиентов в качестве случайной выборки. Затем он может применить то, что находит от этих 100 клиентов, к остальной части своей базы. В отличие от стратификации, он выберет 100 участников чисто случайным образом без учета их индивидуальных характеристик.

Пропорциональное и непропорциональное расслоение

Стратифицированная случайная выборка гарантирует, что каждая подгруппа данной совокупности адекватно представлена во всей выборке исследовательского исследования. Расслоение может быть пропорциональным или непропорциональным. В методе пропорциональной стратификации размер выборки каждой страты пропорционален численности населения страты.

Например, если исследователю нужна выборка из 50 000 выпускников с использованием возрастного диапазона, пропорциональная стратифицированная случайная выборка будет получена по следующей формуле: (размер выборки/размер совокупности) x размер страты. В приведенной ниже таблице предполагается, что численность населения составляет 180 000 выпускников программы MBA в год.

TTT

Размер стратовой выборки выпускников МВА в возрасте от 24 до 28 лет рассчитывается как (50 000/180 000) x 90 000 = 25 000. Тот же метод используется для других возрастных групп. Теперь, когда размер выборки страт известен, исследователь может выполнить простую случайную выборку в каждой страте, чтобы выбрать участников своего опроса. Другими словами, 25 000 выпускников в возрасте 24-28 лет будут выбраны случайным образом из всего населения, 16 667 выпускников в возрасте 29-33 лет будут выбраны из населения случайным образом и так далее.

В непропорциональной стратифицированной выборке размер каждой страты не пропорционален ее размеру в совокупности. Исследователь может принять решение о выборке 1/2 выпускников в возрастной группе 34–37 лет и 1/3 выпускников в возрастной группе 29–33 лет.

Важно отметить, что один человек не может вписаться в несколько страт. Каждая сущность должна вписываться только в один слой. Наличие перекрывающихся подгрупп означает, что некоторые лица будут иметь более высокие шансы быть выбранными для обследования, что полностью отрицает концепцию стратифицированной выборки как разновидности вероятностной выборки.

Менеджеры портфелей могут использовать стратифицированную случайную выборку для создания портфелей путем воспроизведения индекса, такого как индекс облигаций.

Преимущества стратифицированной случайной выборки

Основное преимущество стратифицированной случайной выборки состоит в том, что она фиксирует ключевые характеристики генеральной совокупности в выборке. Подобно средневзвешенному, этот метод выборки дает характеристики выборки, которые пропорциональны общей совокупности. Стратифицированная случайная выборка хорошо работает для популяций с различными атрибутами, но в остальном она неэффективна, если невозможно сформировать подгруппы.

Стратификация дает меньшую ошибку в оценке и большую точность, чем метод простой случайной выборки. Чем больше разница между слоями, тем больше выигрыш в точности.

Недостатки стратифицированной случайной выборки

К сожалению, этот метод исследования не может быть использован в каждом исследовании. Недостатком метода является то, что для его правильного использования необходимо выполнение нескольких условий. Исследователи должны идентифицировать каждого члена изучаемой популяции и отнести каждого из них к одной и только одной подгруппе. В результате стратифицированная случайная выборка невыгодна, когда исследователи не могут уверенно классифицировать каждого члена населения в подгруппу. Кроме того, поиск исчерпывающего и окончательного списка всего населения может быть сложной задачей.

Перекрытие может быть проблемой, если есть предметы, которые попадают в несколько подгрупп. Когда выполняется простая случайная выборка, с большей вероятностью будут выбраны те, кто находится в нескольких подгруппах. Результатом может быть искажение или неточное отражение населения.

Приведенные выше примеры упрощают задачу: студенты, выпускники, мужчины и женщины — это четко определенные группы. Однако в других ситуациях это может быть гораздо сложнее. Представьте, что вы включаете такие характеристики, как раса, этническая принадлежность или религия. Процесс сортировки становится более сложным, что делает стратифицированную случайную выборку неэффективным и далеким от идеального методом.

Особенности

  • Стратифицированная случайная выборка отличается от простой случайной выборки, которая включает случайный отбор данных из всей совокупности, поэтому вероятность возникновения каждой возможной выборки одинакова.

  • Стратифицированная случайная выборка предполагает деление всего населения на однородные группы, называемые стратами.

  • Стратифицированная случайная выборка позволяет исследователям получить выборочную совокупность, которая наилучшим образом представляет всю изучаемую совокупность.