標本分布
##サンプリング分布とは何ですか?
サンプリング分布は、特定の母集団から抽出された多数のサンプルから取得された統計の確率分布です。特定の母集団のサンプリング分布は、母集団の統計に対して発生する可能性のあるさまざまな結果の範囲の頻度の分布です。
統計では、母集団は、統計サンプルが抽出されるプール全体です。母集団は、人々、オブジェクト、イベント、病院訪問、または測定値のグループ全体を指す場合があります。したがって、母集団は、共通の特徴によってグループ化された被験者の集合的な観察であると言えます。
-サンプリング分布は、より多くの母集団から繰り返しサンプリングすることで得られる統計です。
-統計が実際に母集団に存在するため、ある変数の平均や最頻値など、統計の可能な結果の範囲を説明します。
-研究者によって分析されたデータの大部分は、実際には母集団ではなくサンプルから抽出されています。
##サンプリング分布を理解する
学者、統計家、研究者、マーケティング担当者、アナリストなどによって作成および使用される多くのデータは、実際にはサンプルであり、母集団ではありません。サンプルは母集団のサブセットです。たとえば、1995年から2005年に北米で生まれたすべての赤ちゃんの平均体重を同じ期間内に南アメリカで生まれた赤ちゃんの平均体重と比較したい医学研究者は、妥当な時間内に10年間で100万人以上の出産が発生しました。代わりに、各大陸で、たとえば100人の赤ちゃんの体重だけを使用して結論を出します。使用した200人の赤ちゃんの体重がサンプルであり、計算された平均体重がサンプルの平均です。
ここで、各大陸から100個の新生児の体重のサンプルを1つだけ取得するのではなく、医学研究者が一般集団からランダムなサンプルを繰り返し取得し、各サンプルグループのサンプル平均を計算するとします。したがって、北米の場合、米国、カナダ、およびメキシコで記録された100の新生児体重のデータを次のように取得します。米国の選択された病院からの4つの100サンプル、カナダからの5つの70サンプル、およびメキシコからの3つの150レコード。 12セットにグループ化された新生児の1,200の重みの。また、南米の12か国のそれぞれから100の出生時体重のサンプルデータを収集します。
各サンプルには独自のサンプル平均があり、サンプル平均の分布はサンプル分布と呼ばれます。
各サンプルセットに対して計算された平均重みは、平均のサンプリング分布です。サンプルから平均を計算できるだけではありません。標準偏差、分散、比率、範囲などの他の統計は、サンプルデータから計算できます。標準偏差と分散は、サンプリング分布の変動性を測定します。
母集団内の観測数、サンプル内の観測数、およびサンプルセットを描画するために使用される手順によって、サンプリング分布の変動性が決まります。サンプリング分布の標準偏差は、標準誤差と呼ばれます。サンプリング分布の平均は母集団の平均に等しいが、標準誤差は母集団の標準偏差、母集団のサイズ、およびサンプルのサイズに依存します。
各サンプルセットの平均が互いにどの程度離れているか、および母集団の平均からどれだけ離れているかを知ることで、サンプルの平均が母集団の平均にどれだけ近いかがわかります。サンプリング分布の標準誤差は、サンプルサイズが大きくなるにつれて減少します。
##特別な考慮事項
母集団または数値の1つのサンプルセットは正規分布になります。ただし、サンプリング分布には複数の観測値が含まれているため、必ずしもベルカーブの形状になるとは限りません。
私たちの例に従うと、北米と南米の乳児の人口平均体重は正規分布になっています。これは、一部の乳児が低体重(平均未満)または過体重(平均以上)であり、ほとんどの乳児がその中間(平均付近)であるためです。 )。北米の新生児の平均体重が7ポンドである場合、北米で記録された12セットのサンプル観測のそれぞれのサンプル平均体重も7ポンドに近くなります。
ただし、1,200のサンプルグループのそれぞれで計算された各平均をグラフ化すると、結果の形状は均一な分布になる可能性がありますが、実際の形状がどのようになるかを確実に予測することは困難です。研究者が100万を超える重みの母集団から使用するサンプルが多いほど、グラフは正規分布を形成し始めます。