Investor's wiki

中心極限定理(CLT)

中心極限定理(CLT)

##中心極限定理(CLT)とは何ですか?

確率論では、中心極限定理(CLT)は、すべてのサンプルのサイズが同じであると仮定して、サンプルサイズが大きくなるにつれて、サンプル変数の分布が正規分布(つまり「ベルカーブ」)に近似することを示しています。人口の実際の分布の形の。

言い換えると、CLTは、分散レベルが有限の母集団からのサンプルサイズが十分に大きい場合、同じ母集団からサンプリングされたすべての変数の平均が母集団全体の平均にほぼ等しくなるという統計的前提です。さらに、これらのサンプルは正規分布に近似しており、大数の法則に従って、サンプルサイズが大きくなるにつれて、分散は母集団の分散にほぼ等しくなります。

この概念は1733年にAbrahamdeMoivreによって最初に開発されましたが、ハンガリーの数学者GeorgePólyaが中心極限定理と呼んだ1930年まで正式化されませんでした。

##中心極限定理(CLT)を理解する

中央限界定理によれば、データの実際の分布にもかかわらず、サンプルサイズが大きくなると、データのサンプルの平均は問題の母集団全体の平均に近くなります。言い換えれば、分布が正常であるか異常であるかにかかわらず、データは正確です。

原則として、約30〜50のサンプルサイズは、CLTが保持するのに十分であると見なされます。つまり、サンプル平均の分布はかなり正規分布しています。したがって、取得するサンプルが多いほど、グラフ化された結果は正規分布の形になります。ただし、中心極限定理は、多くの場合、n=8やn=5などのはるかに小さいサンプルサイズでも近似されることに注意してください。

平均標準偏差の平均が母集団平均と標準偏差に等しくなることを示す多数の法則と組み合わせて使用されることがよくあります。これは、集団の特性を正確に予測します。

<!-00C90A54D1584F99732DEE5F5967F4DD->

##中心極限定理の主要コンポーネント

中心極限定理は、いくつかの重要な特性で構成されています。これらの特性は、主にサンプル、サンプルサイズ、およびデータの母集団を中心に展開されます。

  1. **サンプリングは連続しています。**これは、一部のサンプルユニットが以前に選択されたサンプルユニットと共通であることを意味します。

  2. **サンプリングはランダムです。**すべてのサンプルは、選択される統計的可能性が同じになるように、ランダムに選択する必要があります。

  3. **サンプルは独立している必要があります。**1つのサンプルからの選択または結果は、将来のサンプルまたは他のサンプル結果とは関係がない必要があります。

  4. **サンプルを制限する必要があります。**サンプリングを交換せずに行う場合、サンプルは母集団の10%以下である必要があるとよく言われます。一般に、母集団のサイズが大きいほど、サンプルサイズを大きくする必要があります。

  5. **サンプルサイズが増加しています。**より多くのサンプルが選択されると、中心極限定理が適切になります。

##金融における中心極限定理

CLTは、必要な財務データの生成が比較的容易であるため、分析が単純であるため、個々の株式またはより広範なインデックスのリターンを調べるときに役立ちます。その結果、すべてのタイプの投資家は、株式リターンの分析、ポートフォリオの構築、およびリスクの管理をCLTに依存しています。

たとえば、投資家が1,000の株式で構成される株価指数の全体的なリターンを分析したいとします。このシナリオでは、その投資家は単に株式のランダムなサンプルを調査して、インデックス全体の推定リターンを育成することができます。安全のために、中心極限定理が保持するために、さまざまなセクターにわたって少なくとも30〜50のランダムに選択された株式をサンプリングする必要があります。さらに、バイアスを排除するために、以前に選択した株式を別の名前に交換する必要があります。

##ハイライト

-中心極限定理(CLT)は、母集団の分布に関係なく、サンプルサイズが大きくなるにつれて、サンプル平均の分布が正規分布に近似することを示しています。

-30以上のサンプルサイズは、CLTが保持するのに十分であると見なされることがよくあります。

-CLTの重要な側面は、標本平均と標準偏差の平均が母平均と標準偏差に等しくなることです。

-十分に大きいサンプルサイズは、母集団の特性をより正確に予測できます。

-CLTは、ポートフォリオの分布とリターン、リスク、および相関関係の特性を推定するために、大量の証券のコレクションを分析する場合の財務に役立ちます。

## よくある質問

###中心極限定理が役立つのはなぜですか?

中心極限定理は、平均のサンプリング分布がほとんどの場合正規分布であると想定できるため、大規模なデータセットを分析する場合に役立ちます。これにより、統計分析と推論が容易になります。たとえば、投資家は中心極限定理を使用して、個々のセキュリティパフォーマンスデータを集計し、一定期間にわたるセキュリティリターンのより大きな母集団分布を表すサンプル平均の分布を生成できます。

###中心極限定理の公式は何ですか?

中心極限定理には独自の公式はありませんが、サンプルの平均と標準偏差に依存しています。サンプル平均は母集団から収集されるため、標準偏差を使用して、確率分布曲線全体にデータを分散します。

###中心極限定理の最小化サンプルサイズが30であるのはなぜですか?

30のサンプルサイズは、統計全体でかなり一般的です。サンプルサイズが30の場合、多くの場合、結果に対するアサーションを保証するのに十分な数のデータセットの信頼区間が増加します。サンプルサイズが大きいほど、サンプルが母集団セットを表す可能性が高くなります。