Investor's wiki

Образец

Образец

Что такое образец?

Образец относится к меньшей, управляемой версии большей группы. Это подмножество, содержащее характеристики большей совокупности. Выборки используются в статистическом тестировании, когда размеры совокупности слишком велики для того, чтобы тест мог включать всех возможных членов или наблюдения. Выборка должна представлять генеральную совокупность в целом и не отражать какой-либо предвзятости по отношению к конкретному признаку.

Существует несколько методов выборки,. используемых исследователями и статистиками, каждый из которых имеет свои преимущества и недостатки.

Понимание примеров

Выборка – это несмещенное количество наблюдений, взятых из совокупности. Проще говоря, популяция — это общее количество наблюдений (т. е. особей, животных, предметов, данных и т. д.), содержащихся в данной группе или контексте. Другими словами, выборка представляет собой часть, часть или часть всей группы и действует как подмножество генеральной совокупности. Образцы используются в различных условиях, где проводятся исследования. Ученые, маркетологи, правительственные учреждения, экономисты и исследовательские группы входят в число тех, кто использует образцы для своих исследований и измерений.

Использование целых популяций для исследований сопряжено с трудностями. У исследователей могут возникнуть проблемы с получением быстрого доступа ко всем популяциям. Кроме того, из-за характера некоторых исследований у исследователей могут возникнуть трудности со своевременным получением необходимых им результатов. Вот почему используются образцы людей. Использование меньшего числа людей, представляющих все население, может по-прежнему давать достоверные результаты при сокращении времени и ресурсов.

Выборки, используемые исследователями, должны напоминать более широкую совокупность, чтобы делать точные выводы или прогнозы. Все участники выборки должны обладать одинаковыми характеристиками и качествами. Таким образом, если исследование посвящено первокурсникам мужского пола колледжа, выборка должна состоять из небольшого процента мужчин, соответствующих этому описанию. Точно так же, если исследовательская группа проводит исследование режима сна одиноких женщин старше 50 лет, выборка должна включать только женщин из этой демографической группы.

Особые соображения

Рассмотрим группу ученых-исследователей, которые хотят узнать, сколько студентов потратили менее 40 часов на экзамен CFA и все же сдали его. Поскольку более 200 000 человек ежегодно сдают экзамен по всему миру, обращение к каждому участнику экзамена потребует затрат времени и ресурсов.

На самом деле к тому времени, когда данные о популяции будут собраны и проанализированы, пройдет пара лет, что сделает анализ бесполезным, поскольку появится новая популяция. Вместо этого исследователи могут взять выборку населения и получить данные из этой выборки.

Чтобы получить несмещенную выборку, выборка должна быть случайной, чтобы каждый член населения имел равные и вероятные шансы быть добавленным в группу выборки. Это похоже на розыгрыш лотереи и является основой для простой случайной выборки.

Для несмещенной выборки выборка должна быть случайной, чтобы у всех в совокупности были равные шансы быть добавленными в группу.

Типы выборки

Простая случайная выборка

Простая случайная выборка идеальна, если каждый объект в совокупности идентичен. Если исследователям все равно, являются ли их объекты выборки мужчинами или женщинами, или они представляют собой комбинацию обоих полов в той или иной форме, простая случайная выборка может быть хорошим методом отбора.

Допустим, в 2021 году экзамен CFA сдали 200 000 человек, из которых 40% были женщины и 60% мужчины. Таким образом, случайная выборка, составленная из населения, должна состоять из 400 женщин и 600 мужчин, что в сумме составляет 1000 испытуемых.

Но как насчет случаев, когда важно знать соотношение мужчин и женщин, сдавших тест после обучения менее 40 часов? Здесь стратифицированная случайная выборка предпочтительнее простой случайной выборки.

Стратифицированная случайная выборка

Этот тип выборки, также называемый пропорциональной случайной выборкой или квотной случайной выборкой, делит общую совокупность на более мелкие группы. Они известны как слои. Люди внутри страт имеют схожие характеристики.

Что, если бы возраст был важным фактором, который исследователи хотели бы включить в свои данные? Используя метод стратифицированной случайной выборки, они могли создать слои или страты для каждой возрастной группы. Выбор из каждой страты должен быть случайным, чтобы у всех в скобке был вероятный шанс быть включенным в выборку. Например, двум участникам, Алексею и Давиду, 22 и 24 года соответственно. Выборка выборки не может выбрать один из других на основе какого-либо предпочтительного механизма. Они оба должны иметь равные шансы быть выбранными из своей возрастной группы. Слоты могут выглядеть примерно так:

ТТТ

Из таблицы население было разделено на возрастные группы. Например, в 2021 году экзамен CFA сдали 30 000 человек в возрасте от 20 до 24 лет. Используя ту же пропорцию, в выборке будет (30 000 ÷ 200 000) × 1000 = 150 испытуемых, которые попадают в эту группу. Алекс или Дэвид, или оба, или ни один из них, могут быть включены в число 150 случайных участников выборки.

Есть много других страт, которые можно было бы скомпилировать при принятии решения о размере выборки. Некоторые исследователи могут указывать должностные обязанности, страны, семейное положение и т. д. испытуемых при принятии решения о том, как создать выборку.

Примеры образцов

В 2021 году население мира составляло почти 7,9 миллиарда человек, из которых 49,6% составляли женщины и 50% мужчины. Общее количество людей в любой данной стране также может быть численностью населения. Общее количество студентов в городе можно принять за население, а общее количество собак в городе также является численностью населения. Образцы могут быть взяты из этих популяций для исследовательских целей.

Следуя нашему примеру с экзаменом CFA, исследователи могли бы взять выборку из 1000 участников CFA из общего числа 200 000 испытуемых — населения — и запустить необходимые данные по этому числу. Среднее значение этой выборки будет использоваться для оценки среднего числа сдавших экзамен CFA, даже если они учились менее 40 часов.

Отобранная группа выборки не должна быть предвзятой. Это означает, что если среднее значение выборки из 1000 участников экзамена CFA равно 50, среднее значение совокупности из 200 000 участников теста также должно быть приблизительно равно 50.

Особенности

  • В статистике выборка представляет собой аналитическое подмножество большей совокупности.

  • При простой случайной выборке каждый объект совокупности идентичен, тогда как стратифицированная случайная выборка делит всю совокупность на более мелкие группы.

  • Использование образцов позволяет исследователям проводить свои исследования с более управляемыми данными и своевременно.

  • Случайно взятые выборки не имеют большого смещения, если они достаточно велики, но получение такой выборки может быть дорогостоящим и трудоемким.

ЧАСТО ЗАДАВАЕМЫЕ ВОПРОСЫ

Что такое простая случайная выборка?

Этот метод выборки использует респондентов или точки данных, которые выбираются случайным образом из большей совокупности. При достаточно большом размере выборки случайная выборка устраняет систематическую ошибку.

Почему случайные выборки позволяют делать выводы?

Законы статистики подразумевают, что точные измерения и оценки населения могут быть сделаны с использованием выборки. Дисперсионный анализ (ANOVA),. линейная регрессия и более продвинутые методы моделирования действительны благодаря закону больших чисел и центральной предельной теореме.

Почему аналитики используют выборки вместо измерения генеральной совокупности?

Часто совокупность слишком велика или обширна, чтобы измерить каждого члена, а измерение каждого члена было бы дорогостоящим и трудоемким. Выборка позволяет делать выводы о населении с использованием статистических методов.

Какой размер выборки вам нужен?

Это будет зависеть от размера совокупности и типа анализа, который вы хотите провести (например, какие доверительные интервалы вы используете). Анализ мощности — это метод математической оценки наименьшего размера выборки, необходимого в зависимости от ваших потребностей. Еще одно эмпирическое правило заключается в том, что ваша выборка должна быть достаточно большой, но не более чем на 10% больше, чем население.