Investor's wiki

単純ランダムサンプル

単純ランダムサンプル

##単純ランダムサンプルとは何ですか?

単純ランダムサンプルは、母集団のサブセットであり、サブセットの各メンバーが選択される確率は同じです。単純ランダムサンプルは、グループの偏りのない表現であることが意図されています。

##単純ランダムサンプルを理解する

研究者は、いくつかの方法を使用して単純なランダムサンプルを作成できます。抽選方式では、母集団の各メンバーに番号が割り当てられ、その後、番号がランダムに選択されます。

単純なランダムサンプルの例は、250人の従業員の会社から帽子から選ばれた25人の従業員の名前です。この場合、母集団はすべて250人の従業員であり、各従業員が選択される可能性が等しいため、サンプルはランダムです。ランダムサンプリングは、ランダム化比較試験を実施するため、または盲検実験のために科学で使用されます。

250人中25人の従業員の名前が帽子から選ばれる例は、実際の宝くじの方法の例です。 250人の従業員のそれぞれに1から250までの番号が割り当てられ、その後、それらの番号のうち25がランダムに選択されます。

より大きなグループのサブセットを構成する個人はランダムに選択されるため、大規模な母集団セットの各個人は同じ確率で選択されます。これにより、ほとんどの場合、偏りのない、より大きなグループ全体を表すための最大の可能性をもたらすバランスの取れたサブセットが作成されます。

人口が多い場合、手動の宝くじの方法は非常に面倒な場合があります。大規模な母集団からランダムなサンプルを選択するには、通常、コンピューターで生成されたプロセスが必要です。このプロセスでは、宝くじの方法と同じ方法が使用され、番号の割り当てとその後の選択のみが人間ではなくコンピューターによって実行されます。

###エラーの余地

サンプリングエラー)で表されるエラーの余地が必要です。たとえば、1,000人の生徒がいる高校で、左利きの生徒の数を調査する場合、ランダムサンプリングにより、サンプリングされた100人のうち8人が左利きであると判断できます。結論として、高校の学生人口の8%は左利きであり、実際には世界平均は10%に近くなります。

主題に関係なく同じことが当てはまります。緑色の目または身体障害のある学生人口の割合に関する調査は、単純なランダム調査に基づく数学的確率になりますが、常にプラスまたはマイナスの分散があります。 100%の正解率を得る唯一の方法は、1,000人の生徒全員を調査することですが、これは可能ではありますが、実用的ではありません。

##単純ランダムvs.層化ランダムサンプル

単純ランダムサンプルと層化ランダムサンプルは、どちらも統計的測定ツールです。単純ランダムサンプルは、データ母集団全体を表すために使用されます。層化ランダムサンプルは、共通の特性に基づいて、母集団をより小さなグループまたは層に分割します。

単純ランダムサンプルとは異なり、層化ランダムサンプルは、さまざまなサブグループまたはサブセットに簡単に分割できる母集団で使用されます。これらのグループは特定の基準に基づいており、それぞれの要素は、グループのサイズと人口に比例してランダムに選択されます。

このサンプリング方法は、それぞれの異なるグループからの選択があることを意味します。そのサイズは、母集団全体に対する比率に基づいています。しかし、研究者は層が重ならないようにする必要があります。母集団の各ポイントは1つの層にのみ属している必要があるため、各ポイントは相互に排他的です。層が重なると、一部のデータが含まれる可能性が高くなり、サンプルが歪んでしまいます。

##単純ランダムサンプルの長所と短所

単純ランダムサンプルは使いやすいですが、データを役に立たなくする可能性のある重要な欠点があります。

###利点

使いやすさは、単純ランダムサンプリングの最大の利点です。層化ランダムサンプリングや確率サンプリングなどのより複雑なサンプリング方法とは異なり、母集団のメンバーをランダムに選択する前に、母集団をサブ母集団に分割したり、その他の追加の手順を実行したりする必要はありません。

単純ランダムサンプルは、グループの偏りのない表現であることが意図されています。母集団のすべてのメンバーが選択される可能性が等しいため、より大きな母集団からサンプルを選択することは公正な方法と見なされます。

単純ランダムサンプリングは、測量への偏りのないアプローチを目的としていますが、サンプル選択の偏りが発生する可能性があります。より大きな母集団のサンプルセットが十分に包括的でない場合、全母集団の表現は歪められ、追加のサンプリング手法が必要になります。

###デメリット

サンプリングエラーは、サンプルが表すはずの母集団を正確に反映していない場合、単純なランダムサンプルで発生する可能性があります。たとえば、25人の従業員の単純ランダムサンプルでは、人口が125人の女性、125人の男性、125人のノンバイナリーの人々で構成されている場合でも、25人の男性を描くことができます。

このため、研究者が母集団についてほとんど知らない場合は、単純ランダムサンプリングがより一般的に使用されます。研究者がもっと知っている場合は、年齢、人種、性別などの母集団内の違いを説明するのに役立つ層化ランダムサンプリングなどの別のサンプリング手法を使用する方がよいでしょう。他の不利な点は、大規模な集団からのサンプリングの場合、プロセスが他の方法と比較して時間と費用がかかる可能性があるという事実を含みます。

##ハイライト

-サンプリングエラーは、サンプルが表すはずの母集団を正確に反映していない場合、単純なランダムサンプルで発生する可能性があります。

-研究者は、宝くじやランダム抽選などの方法を使用して、単純なランダムサンプルを作成できます。

-単純ランダムサンプルは、母集団全体の小さなランダムな部分を取り、データセット全体を表します。ここで、各メンバーは同じ確率で選択されます。

## よくある質問

###層化ランダムサンプルとは何ですか?

層化ランダムサンプルは、単純な描画とは対照的に、最初に、共有された特性に基づいて、母集団をより小さなグループまたは層に分割します。したがって、層化抽出戦略により、各サブグループのメンバーがデータ分析に含まれるようになります。層化サンプリングは、母集団のすべてのメンバーを同等に扱い、サンプリングされる可能性が等しい単純なランダムサンプリングとは対照的に、母集団内のグループ間の違いを強調するために使用されます。

###単純ランダムサンプルのいくつかの欠点は何ですか?

この手法の不利な点の中には、より多くの人口、より多くの時間、より多くのコストから引き出される可能性のある回答者へのアクセスの取得の難しさ、および特定の状況下でバイアスが依然として発生する可能性があるという事実があります。

###ランダムサンプルはどのように使用されますか?

単純ランダムサンプリングを使用すると、研究者は特定の母集団について一般化して、バイアスを排除できます。統計的手法を使用すると、母集団内のすべての個人からデータを調査または収集することなく、母集団について推論および予測を行うことができます。

###単純ランダムサンプルが単純なのはなぜですか?

単純なランダムサンプリングほど、より多くの母集団から研究サンプルを抽出する簡単な方法はありません。より大きな母集団から完全にランダムに十分な数の被験者を選択すると、調査対象のグループを表すことができるサンプルも得られます。