中心极限定理 (CLT)

什么是中心极限定理 (CLT)？

在概率论中，中心极限定理 (CLT) 指出，假设所有样本的大小相同，并且无论人口的实际分布形态。

换句话说，CLT 是一个统计前提，即在具有有限方差水平的总体中，给定足够大的样本量，来自同一总体的所有抽样变量的平均值将大约等于整个总体的平均值。此外，根据大数定律，这些样本近似于正态分布，随着样本量的增大，它们的方差近似等于总体的方差。

虽然这个概念最初是由亚伯拉罕·德·莫弗在 1733 年提出的，但直到 1930 年才正式化，当时著名的匈牙利数学家乔治·波利亚将其称为中心极限定理。

根据中心极限定理，尽管数据的实际分布情况如何，随着样本量的增加，数据样本的平均值将更接近总体总体的平均值。换句话说，无论分布是正常的还是异常的，数据都是准确的。

作为一般规则，大约 30-50 的样本大小被认为足以让 CLT 保持，这意味着样本均值的分布是相当正态分布的。因此，一个人的样本越多，图形结果就越呈正态分布。但是请注意，在许多情况下，对于小得多的样本量，例如 n=8 或 n=5，中心极限定理仍将近似。

中心极限定理通常与大数定律结合使用，它指出随着样本量的增长，样本均值和标准差的平均值将更接近于等于总体均值和标准差，这在准确预测人群特征。

中心极限定理由几个关键特征组成。这些特征主要围绕样本、样本大小和数据群体。

##金融中的中心极限定理

CLT 在检查单个股票或更广泛指数的回报时很有用，因为分析很简单，因为生成必要的财务数据相对容易。因此，所有类型的投资者都依赖 CLT 来分析股票收益、构建投资组合和管理风险。

例如，投资者希望分析包含 1,000 个股票的股票指数的总体回报。在这种情况下，该投资者可以简单地研究股票的随机样本来培养总指数的估计回报。为安全起见，应至少从各个行业随机选择 30-50 只股票进行抽样，以使中心极限定理成立。此外，必须将先前选择的股票换成不同的名称，以帮助消除偏见。

＃＃强调

＃＃常问问题

中心极限定理在分析大型数据集时很有用，因为它允许人们假设平均值的抽样分布在大多数情况下是正态分布的。这允许更容易的统计分析和推断。例如，投资者可以使用中心极限定理来汇总单个证券表现数据并生成样本均值分布，以代表一段时间内证券回报的更大总体分布。

中心极限定理没有自己的公式，但它依赖于样本均值和标准差。由于从总体中收集样本均值，因此使用标准差将数据分布在概率分布曲线上。

30 的样本量在统计数据中相当普遍。 30 个样本量通常会增加人口数据集的置信区间，足以保证对您的发现做出断言。您的样本量越大，样本就越有可能代表您的总体集。