Investor's wiki

置信区间

置信区间

##什么是置信区间?

统计学中的置信区间是指总体参数在一定比例的时间内落在一组值之间的概率。

了解置信区间

置信区间衡量抽样方法中不确定性或确定性的程度。它们可以采用任意数量的概率限制,最常见的是 95% 或 99% 的置信水平。置信区间是使用统计方法进行的,例如t 检验

统计学使用置信区间来衡量样本变量的不确定性。例如,研究人员从同一总体中随机选择不同的样本,并计算每个样本的置信区间,以查看它如何代表总体变量的真实值。结果数据集都是不同的;一些区间包括真实的总体参数,而另一些则不包括。

置信区间是一系列值,在统计数据的平均值上下限,可能包含未知的总体参数。置信水平是指当您多次抽取随机样本时,置信区间将包含真实总体参数的概率或确定性百分比。或者,用白话来说,“我们有 99% 的把握(置信水平)这些样本(置信区间)中的大多数都包含真实的总体参数。”

关于置信区间的最大误解是它们代表了来自给定样本的数据在上限和下限之间的百分比。例如,人们可能会错误地将上述 70 到 78 英寸的 99% 置信区间解释为表明随机样本中 99% 的数据落在这些数字之间。这是不正确的,尽管存在一种单独的统计分析方法来做出这样的决定。这样做涉及识别样本的平均值和标准偏差,并将这些数字绘制在钟形曲线上

置信区间和置信水平相互关联,但并不完全相同。

计算置信区间

假设一组研究人员正在研究高中篮球运动员的身高。研究人员从人群中随机抽取样本,并确定平均身高为 74 英寸。

74 英寸的平均值是总体平均值的点估计。点估计本身的用处有限,因为它不能揭示与估计相关的不确定性;您不太清楚这个 74 英寸的样本平均值可能与总体平均值相差多远。缺少的是这个单一样本的不确定程度。

置信区间提供比点估计更多的信息。通过使用样本的均值和标准差建立 95% 的置信区间,并假设由钟形曲线表示的正态分布,研究人员得出了包含 95% 时间真实均值的上限和下限。

假设间隔在 72 英寸和 76 英寸之间。如果研究人员从整个高中篮球运动员群体中随机抽取 100 个样本,其中 95 个样本的平均值应该在 72 到 76 英寸之间。

如果研究人员想要更大的置信度,他们可以将区间扩大到 99% 置信度。这样做总是会创建更广泛的范围,因为它为更多的样本均值腾出了空间。如果他们将 99% 置信区间确定为介于 70 英寸和 78 英寸之间,他们可以预期 100 个样本中的 99 个被评估包含这些数字之间的平均值。

另一方面,90% 的置信水平意味着我们期望 90% 的区间估计包含总体参数,等等。

## 强调

  • 它们通常使用 95% 或 99% 的置信度来构建。

  • 置信区间显示参数落在平均值附近的一对值之间的概率。

  • 置信区间衡量抽样方法的不确定性或确定性程度。

## 常问问题

关于置信区间的常见误解是什么?

关于置信区间的最大误解是它们代表了来自给定样本的数据在上限和下限之间的百分比。换句话说,假设 99% 的置信区间意味着随机样本中 99% 的数据落在这些界限之间是不正确的。它实际上意味着可以 99% 确定该范围将包含总体均值。

什么是 T 检验?

置信区间是使用统计方法进行的,例如 t 检验。 t 检验是一种推断统计量,用于确定两组均值之间是否存在显着差异,这可能与某些特征有关。计算 t 检验需要三个关键数据值。它们包括每个数据集的平均值之间的差异(称为平均差异)、每组的标准差以及每组的数据值的数量。

置信区间揭示了什么?

置信区间是一系列值,在统计数据的平均值之上和之下,可能包含未知的总体参数。置信水平是指当您多次抽取随机样本时,置信区间将包含真实总体参数的概率或确定性百分比。

如何使用置信区间?

统计学家使用置信区间来衡量样本变量的不确定性。例如,研究人员从同一总体中随机选择不同的样本,并计算每个样本的置信区间,以查看它如何代表总体变量的真实值。结果数据集都是不同的,其中一些区间包含真实的总体参数,而另一些则不包含。