体系的なサンプリング

##系統抽出とは何ですか？

系統的サンプリングは、確率サンプリング法の一種であり、ランダムな開始点に従って、ただし一定の周期的な間隔で、より多くの母集団からのサンプルメンバーが選択されます。サンプリング間隔と呼ばれるこの間隔は、母集団のサイズを目的のサンプルサイズで割ることによって計算されます。サンプル母集団が事前に選択されているにもかかわらず、周期的な間隔が事前に決定され、開始点がランダムである場合、体系的なサンプリングは依然としてランダムであると見なされます。

##体系的なサンプリングを理解する

単純なランダムサンプリングは非効率的で時間がかかる可能性があるため、統計学者は体系的なサンプリングなどの他の方法に目を向けます。体系的なアプローチによるサンプルサイズの選択は、迅速に行うことができます。固定の開始点が特定されると、参加者の選択を容易にするために一定の間隔が選択されます。

データ操作のリスクが低い場合は、単純なランダムサンプリングよりも体系的なサンプリングの方が適しています。研究者が間隔の長さを操作して目的の結果を得ることができるときにそのようなリスクが高い場合は、単純なランダムサンプリング手法がより適切です。

体系的なサンプリングは、その単純さから、研究者やアナリストに人気があります。研究者は一般に、ランダムな特性がすべての「** n **番目」のデータサンプルに不均衡に存在しない限り、結果はほとんどの正常な集団を代表していると想定します（これはありそうにありません）。言い換えれば、母集団は、選択されたメトリックとともに自然な程度のランダム性を示す必要があります。人口が標準化されたパターンのタイプを持っている場合、非常に一般的なケースを誤って選択するリスクがより明白になります。

体系的なサンプリングでは、他のサンプリング方法と同様に、参加者を選択する前にターゲット母集団を選択する必要があります。実施されている研究の目的に適した任意の数の望ましい特性に基づいて、集団を特定することができます。一部の選択基準には、年齢、性別、人種、場所、教育レベル、および/または職業が含まれる場合があります。

統計的推論のために母集団をサンプリングする方法はいくつかあります。体系的なサンプリングは、ランダムサンプリングの1つの形式です。

##体系的なサンプリングの例

体系的なサンプリングの架空の例として、10,000人の人口で、統計学者が100人ごとにサンプリングを選択するとします。サンプリング間隔は、12時間ごとに抽出する新しいサンプルを選択するなど、体系的にすることもできます。

別の例として、体系的なサンプリングを使用して50,000人の人口から1,000人のランダムなグループを選択する場合は、すべての潜在的な参加者をリストに配置し、開始点を選択する必要があります。リストが作成されると、50,000 / 1,000 = 50であるため、リストの50人ごと（選択した開始点からカウントを開始）が参加者として選択されます。

たとえば、選択した開始点が20の場合、リストの70番目の人が選択され、次に120人が選択されます。リストの最後に到達し、追加の参加者が必要な場合、カウントはリストの最初にループしてカウントを終了します。

体系的なサンプリングを実施するために、研究者は最初に対象集団のサイズを知る必要があります。

##体系的なサンプリングとクラスターサンプリング

体系的なサンプリングとクラスターサンプリングは、サンプルに含まれる母集団からサンプルポイントを取得する方法が異なります。クラスターサンプリングは、母集団をクラスターに分割しますが、体系的なサンプリングは、より大きな母集団からの固定間隔を使用してサンプルを作成します。

体系的なサンプリングでは、母集団からランダムな開始点を選択し、次に、そのサイズに応じて母集団の一定の間隔でサンプルを取得します。クラスターサンプリングは、母集団をクラスターに分割し、各クラスターから単純なランダムサンプルを取得します。

クラスターサンプリングは、他のサンプリング方法よりも精度が低いと見なされます。ただし、サンプルの取得にかかるコストを節約できる場合があります。クラスターサンプリングは、2段階のサンプリング手順です。全人口のリストを完成させることが難しい場合に使用できます。たとえば、食料品店の顧客の全人口を構築してインタビューすることは難しい場合があります。

ただし、人はストアのランダムなサブセットを作成できます。これはプロセスの最初のステップです。 2番目のステップは、それらの店舗の顧客のランダムなサンプルにインタビューすることです。これは、時間とお金を節約できる簡単な手動プロセスです。

##体系的なサンプリングの制限

体系的なサンプリングを実施する際に統計学者が考慮しなければならないリスクの1つは、サンプリング間隔で使用されるリストがどのように編成されているかです。リストに配置された母集団がサンプリング間隔に一致する周期的なパターンで編成されている場合、選択されたサンプルにバイアスがかかる可能性があります。

たとえば、ある会社の人事部門は、従業員のサンプルを選び、会社の方針についてどのように感じているかを尋ねたいと考えています。従業員は20人のチームにグループ化され、各チームはマネージャーが率いています。サンプルサイズの選択に使用されるリストがチームがクラスター化されて編成されている場合、統計担当者は、サンプリング間隔に応じてマネージャーのみを選択する（またはマネージャーをまったく選択しない）リスクがあります。

##ハイライト

-この方法の他の利点には、クラスター化された選択の現象を排除し、データを汚染する可能性が低いことが含まれます。

-サンプリング間隔と呼ばれる固定周期間隔は、母集団のサイズを目的のサンプルサイズで割ることによって計算されます。

-欠点には、特定のパターンの過剰または過少表現、およびデータ操作のリスクの増大が含まれます。

-系統的サンプリングは、一定の周期間隔を持つランダムなサンプルがより多くの母集団から選択される確率サンプリング方法です。

＃＃よくある質問

###体系的なサンプリングの利点は何ですか？

系統抽出は、実施が簡単で理解しやすいため、一般的に研究者に好まれています。結果が通常の母集団の大部分を表すという中心的な仮定は、母集団全体が均等にサンプリングされることを保証します。また、系統抽出は、そのプロセスのために、他のサンプリング方法と比較して、より高度な制御を提供します。系統抽出は、データが汚染される可能性が低いため、リスク要因も低くなります。

###クラスターと系統抽出はどのように異なりますか？

クラスターサンプリングと系統サンプリングは、サンプルに含まれる母集団からサンプルポイントを取得する方法が異なります。クラスターサンプリングは、母集団をクラスターに分割し、各クラスターから単純なランダムサンプルを取得します。体系的なサンプリングでは、母集団からランダムな開始点を選択し、次に、そのサイズに応じて母集団の一定の間隔でサンプルを取得します。クラスターサンプリングは、より安価なプロセスである可能性がありますが、体系的なサンプリングよりも大きなサンプリングエラーの影響を受けやすくなります。

###体系的なサンプリングのデメリットは何ですか？

系統抽出の主な欠点は、母集団のサイズが必要になることです。集団内の特定の参加者数を知らなければ、体系的なサンプリングはうまく機能しません。たとえば、統計家が特定の地域のホームレスの年齢を調べたいが、ホームレスの人数を正確に把握できない場合、人口の規模や出発点はありません。もう1つの欠点は、母集団が自然な量のランダム性を示す必要があることです。そうしないと、同様のインスタンスを選択するリスクが高まり、サンプルの目的が損なわれます。