同方差
什么是 Homoskedastic?
Homoskedastic(也拼写为“homoscedastic”)是指回归模型中残差或误差项的方差是恒定的条件。也就是说,误差项不会随着预测变量值的变化而变化很大。另一种说法是数据点的方差对于所有数据点大致相同。
这表明了一定程度的一致性,并使通过回归建模和处理数据变得更加容易;然而,缺乏同方差性可能表明回归模型可能需要包括额外的预测变量来解释因变量的表现。
同方差性如何工作
Homoskedasticity 是li近似回归模型的一个假设,这种类型的数据适用于最小二乘法。如果回归线周围的误差方差变化很大,则回归模型可能定义不明确。
同方差的反面是异方差,正如“同质”的反面是“异质”一样。异方差(也称为“异方差”)是指回归方程中误差项的方差不恒定的情况。
特别注意事项
一个简单的回归模型或方程由四个项组成。左侧是因变量。它代表了模型试图“解释”的现象。右侧是一个常数、一个预测变量和一个残差或误差项。误差项显示因变量中未由预测变量解释的变异量。
Homoskedastic 的例子
例如,假设您想用每个学生的学习时间来解释学生的考试成绩。在这种情况下,考试成绩是因变量,学习时间是预测变量。
误差项将显示测试分数的差异量,而这些差异量不能用学习时间量来解释。如果该方差是一致的或同方差的,那么这表明该模型可能是对测试性能的充分解释——用学习时间来解释它。
但方差可能是异方差的。误差项数据图可能显示大量的学习时间与高测试分数非常接近,但低学习时间测试分数差异很大,甚至包括一些非常高的分数。
因此,分数的差异并不能仅仅通过一个预测变量——学习时间量来很好地解释。在这种情况下,可能有其他一些因素在起作用,并且可能需要增强模型以识别它或它们。
当考虑方差是给定情况的预测结果和实际结果之间的测量差异时,确定同方差有助于确定需要调整哪些因素以提高准确性。
进一步的调查可能会发现一些学生提前看到了考试的答案,或者他们以前参加过类似的考试,因此不需要为这个特定的考试学习。就此而言,结果可能只是学生有不同水平的考试通过能力,与他们的学习时间和他们在以前的考试中的表现无关,而与科目无关。
为了改进回归模型,研究人员必须尝试其他可以更准确地拟合数据的解释变量。例如,如果一些学生提前看到了答案,那么回归模型将有两个解释变量:学习时间,以及学生是否事先知道答案。
使用这两个变量,可以解释更多的测试分数方差,然后误差项的方差可能是同方差的,这表明该模型是明确定义的。
## 强调
如果误差项的方差是同方差的,则模型定义良好。如果方差太大,模型可能无法很好地定义。
当回归模型中误差项的方差为常数时,就会出现同方差。
相反,当误差项的方差不恒定时,就会出现异方差。
添加额外的预测变量有助于解释因变量的表现。
## 常问问题
为什么同方差很重要?
同方差性很重要,因为它可以识别人群中的差异。总体或样本中的任何方差都不会产生偏差或有偏差的结果,从而使分析不正确或毫无价值。
异方差是什么意思?
统计中的异方差是误差方差。这是在具有最少一个自变量的样本中发生的散射依赖性。这意味着可预测变量的标准偏差是非常量的。
你如何判断一个回归是否是同方差的?
您可以通过查看最大方差和最小方差之间的比率来判断回归是否是同方差的。如果比率为 1.5 或更小,则回归是同方差的。