中心极限定理 (CLT)
什么是中心极限定理 (CLT)?
在概率论中,中心极限定理 (CLT) 指出,假设所有样本的大小相同,并且无论人口的实际分布形态。
换句话说,CLT 是一个统计前提,即在具有有限方差水平的总体中,给定足够大的样本量,来自同一总体的所有抽样变量的平均值将大约等于整个总体的平均值。此外,根据大数定律,这些样本近似于正态分布,随着样本量的增大,它们的方差近似等于总体的方差。
虽然这个概念最初是由亚伯拉罕·德·莫弗在 1733 年提出的,但直到 1930 年才正式化,当时著名的匈牙利数学家乔治·波利亚将其称为中心极限定理。
了解中心极限定理 (CLT)
根据中心极限定理,尽管数据的实际分布情况如何,随着样本量的增加,数据样本的平均值将更接近总体总体的平均值。换句话说,无论分布是正常的还是异常的,数据都是准确的。
作为一般规则,大约 30-50 的样本大小被认为足以让 CLT 保持,这意味着样本均值的分布是相当正态分布的。因此,一个人的样本越多,图形结果就越呈正态分布。但是请注意,在许多情况下,对于小得多的样本量,例如 n=8 或 n=5,中心极限定理仍将近似。
中心极限定理通常与大数定律结合使用,它指出随着样本量的增长,样本均值和标准差的平均值将更接近于等于总体均值和标准差,这在准确预测人群特征。
中心极限定理的关键组成部分
中心极限定理由几个关键特征组成。这些特征主要围绕样本、样本大小和数据群体。
**抽样是连续的。**这意味着一些样本单位与以前选择的样本单位相同。
**抽样是随机的。**所有样本必须随机选择,以便它们具有相同的统计可能性。
样本应该是独立的。 一个样本的选择或结果不应影响未来的样本或其他样本结果。
样本应该是有限的。 人们经常提到,如果在没有替换的情况下进行抽样,则样本不应超过总体的 10%。一般来说,较大的人口规模需要使用较大的样本规模。
**样本量在增加。**随着选择更多样本,中心极限定理是相关的。
##金融中的中心极限定理
CLT 在检查单个股票或更广泛指数的回报时很有用,因为分析很简单,因为生成必要的财务数据相对容易。因此,所有类型的投资者都依赖 CLT 来分析股票收益、构建投资组合和管理风险。
例如,投资者希望分析包含 1,000 个股票的股票指数的总体回报。在这种情况下,该投资者可以简单地研究股票的随机样本来培养总指数的估计回报。为安全起见,应至少从各个行业随机选择 30-50 只股票进行抽样,以使中心极限定理成立。此外,必须将先前选择的股票换成不同的名称,以帮助消除偏见。
## 强调
中心极限定理 (CLT) 指出,无论总体分布如何,随着样本量变大,样本均值的分布近似于正态分布。
等于或大于 30 的样本量通常被认为足以让 CLT 持有。
CLT 的一个关键方面是样本均值和标准差的平均值将等于总体均值和标准差。
足够大的样本量可以更准确地预测人群的特征。
当分析大量证券以估计投资组合分布和收益、风险和相关性特征时,CLT 在金融领域非常有用。
## 常问问题
为什么中心极限定理有用?
中心极限定理在分析大型数据集时很有用,因为它允许人们假设平均值的抽样分布在大多数情况下是正态分布的。这允许更容易的统计分析和推断。例如,投资者可以使用中心极限定理来汇总单个证券表现数据并生成样本均值分布,以代表一段时间内证券回报的更大总体分布。
中心极限定理的公式是什么?
中心极限定理没有自己的公式,但它依赖于样本均值和标准差。由于从总体中收集样本均值,因此使用标准差将数据分布在概率分布曲线上。
为什么中心极限定理的最小样本量是 30?
30 的样本量在统计数据中相当普遍。 30 个样本量通常会增加人口数据集的置信区间,足以保证对您的发现做出断言。您的样本量越大,样本就越有可能代表您的总体集。