Investor's wiki

卡方 (χ2) 统计量

卡方 (χ2) 统计量

什么是卡方统计量?

卡方 (χ2) ^^统计量是衡量模型与实际观察数据的比较情况的测试。用于计算卡方统计量的数据必须是随机的、原始的、互斥的、从自变量中提取的,并且是从足够大的样本中提取的。例如,投掷一枚公平硬币的结果符合这些标准。

卡方检验常用于假设检验。给定样本大小和关系中的变量数量,卡方统计量比较预期结果与实际结果之间的任何差异的大小。

对于这些测试,使用自由度来确定是否可以根据实验中变量和样本的总数拒绝某个零假设。与任何统计数据一样,样本量越大,结果越可靠。

卡方的公式是

χc2 =(O i-Ei)2Ei</ mfrac></ mtd>其中: <mstyle scriptlevel=" 0" 显示样式="t rue">c=自由度O=观察值E=预期值\begin&\chi^2_c = \sum \frac{(O_i - E_i )^2} \&\textbf{其中:}\&c=\text{自由度}\&O=\text{观察值}\&E =\text{预期值}\end{对齐}

卡方统计告诉你什么?

卡方检验有两种主要类型:独立性检验,它提出一个关系问题,例如“学生性别和课程选择之间是否存在关系?”;以及拟合优度测试,它会询问“我手中的硬币与理论上公平的硬币的匹配程度如何?”

卡方分析适用于分类变量,当这些变量是名义变量时特别有用(其中顺序无关紧要,如婚姻状况或性别)。

独立

在考虑学生性别和课程选择时,可以使用 χ2 独立性测试。为了进行这个测试,研究人员将收集关于两个选定变量(性别和所选择的课程)的数据,然后使用上面给出的公式和 χ^ 比较男女学生在提供的课程中选择的频率2^统计表。

如果性别和课程选择之间没有关系(也就是说,如果他们是独立的),那么男性和女性学生选择每门课程的实际频率应该大致相等,或者相反,男性和女性的比例应该是大致相等的。任何选定课程的女学生应约等于样本中男女学生的比例。

χ2 独立性检验可以告诉我们随机机会可以解释数据中实际频率与这些理论预期之间的任何观察到的差异的可能性有多大。

拟合优度

χ2 提供了一种方法来测试数据样本与样本打算代表的较大总体的(已知或假设的)特征的匹配程度。这被称为拟合优度。如果样本数据不符合我们感兴趣的总体的预期属性,那么我们就不想使用这个样本来得出关于更大总体的结论。

## 例子

例如,考虑一个假想的硬币,正面或反面的概率正好是 50/50,而真正的硬币要抛 100 次。如果这枚硬币是公平的,那么它也有相同的概率落在两边,而掷硬币 100 次的预期结果是正面朝上 50 次,反面朝上 50 次。

在这种情况下,χ2 可以告诉我们 100 次硬币翻转的实际结果与公平硬币将给出 50/50 结果的理论模型相比有多好。实际的折腾可能会达到 50/50,或 60/40,甚至 90/10。 100 次抛掷的实际结果离 50/50 越远,这组抛掷对 50/50 的理论预期的拟合越差,我们就越有可能得出结论,这枚硬币实际上不是公平的硬币。

何时使用卡方检验

卡方检验用于帮助确定观察到的结果是否与预期结果一致,并排除观察结果是偶然的。当所分析的数据来自随机样本并且所讨论的变量是分类变量时,卡方检验适用于此。分类变量是由诸如汽车类型、种族、教育程度、男性与女性、某人喜欢政治候选人的程度(从非常喜欢到非常少)等选择组成的变量。

这些类型的数据通常通过调查回复或问卷收集。因此,卡方分析通常在分析此类数据时最有用。

## 强调

  • χ2 取决于实际值和观察值之间的差异大小、自由度和样本大小。

  • 卡方 (χ2) ^^统计量是衡量一组事件或变量的结果的观察频率和预期频率之间的差异。

  • 卡方可用于分析分类变量中的此类差异,尤其是那些名义上的变量。

  • 它还可用于测试观察到的分布与频率的理论分布之间的拟合优度。

  • χ2 可用于测试两个变量是否相关或相互独立。

## 常问问题

当自变量为名义型或有序型时,是否使用卡方分析?

名义变量是质量不同的分类变量,但其数字顺序可能无关紧要。例如,询问某人他们最喜欢的颜色会产生一个名义变量。另一方面,询问某人的年龄会产生一组有序的数据。卡方最适用于名义数据。

谁使用卡方分析?

由于卡方适用于分类变量,因此它最常用于研究调查响应数据的研究人员。这种类型的研究可以从人口统计学到消费者和市场营销研究,再到政治学和经济学。

卡方检验用于什么?

卡方是一种统计检验,用于检查随机样本中分类变量之间的差异,以判断预期结果和观察结果之间的拟合优度。