调整后的平均值
什么是调整后的平均值?
当必须校正统计平均值以补偿数据不平衡和较大的方差时,就会出现调整后的平均值。数据集中存在的异常值通常会被删除,以确定调整后的平均值,因为它们会对小群体的计算平均值产生很大影响。可以通过回归分析去除这些异常值来确定调整后的平均值。调整后的均值也称为最小二乘均值。
了解调整后的均值
当存在异常数据点对数据集的趋势线产生巨大影响时,调整后的平均值最常用于金融领域。分析师可能会选择完全删除异常值,但这通常仅在异常值背后的原因已知或适合对趋势进行粗略预测的情况下进行。
对于想要去除异常值的研究人员和专业人士,多元回归方程是首选方法。回归分析在研究结束时提供更准确的结果和更可靠的数据。除了回归分析之外,还有更基本的调整均值的方法。
调整平均值的一种方法是添加分类变量,以更精细地分离数据。例如,假设一项针对会计行业酒精消费的研究发现,今天的会计师饮酒量是 50 年前会计师的一半。虽然这似乎是积极的,但经过深入分析,发现该研究没有针对性别进行调整。如果考虑到性别,男性会计师的饮酒量比 50 年前的会计师略少,但主要变化是女性会计师总数的增长。平均而言,该研究表明,女性会计师的饮酒量与 50 年前的女性会计师大致相同。今天和 50 年前,女性会计师的饮酒量也比男性会计师少得多。但女性会计师比以往任何时候都多,有效地帮助降低了该行业的整体饮酒水平,尽管他们的男性同行在饮酒习惯上保持相对稳定。
在这种情况下,附加变量可以更准确地讲述数据的故事,并且可以通过添加反映每个抽样组中男性与女性比例的性别值来组合回整体平均值。这将显示该行业整体饮酒量的下降幅度较小。但是,对这些数据进行进一步分析可能表明,一个综合平均值并不是呈现这些数据的最佳方式。
在此示例中,参与者的性别将被视为协变量,这是一种研究人员无法控制但会影响实验结果的变量。使用调整后的平均值是一种补偿协变量的方法:如果性别之间没有差异,活动或行为的影响是什么?对年龄、种族、社会经济地位等其他人口统计数据进行了相同类型的调整。
调整均值示例
2009 年,财务会计准则委员会(FASB)明确了按市值计价的规则,以缓解压力并立即改善大型银行的资产负债表。如果分析师使用银行公布的指标来审查 2010 年过去十年的资产负债表实力趋势,平均平均值将是有问题且不准确的,因为它将包括到 2009 年的规则变化。
纠正这种情况的一种方法是,为大型银行的共同持有资产的子集,为资产负债表数据与当时市场价值之间的平均差异创建一个变异系数。然而,在实践中,银行业分析师在规则澄清后继续计算严格的按市值计算的数字,因此简单的解决方案是使用这些数据集。更重要的是,在按市值计价的规则下,银行一直有相当大的自由裁量权,因此在可能的情况下,应始终对持有资产的资产负债表数据持怀疑态度并进行独立验证。
## 强调
调整后的平均值用于校正统计平均值,其中包括由于数据集中的异常值而导致的明显不平衡。
对于大多数依赖统计数据的专业人士来说,计算调整均值的首选方法是使用多元回归。
计算调整均值的更简单方法是添加分类变量,以更精细地分离数据,例如性别。