T检验

什么是 T 检验？

t 检验是一种推断统计量，用于确定两组均值之间是否存在显着差异，这可能与某些特征相关。它主要用于数据集（例如作为抛硬币 100 次结果记录的数据集）遵循正态分布并且可能具有未知方差的情况。 t 检验用作假设检验工具，它允许检验适用于总体的假设。

t 检验查看 t 统计量、 t 分布值和自由度以确定统计显着性。要使用三种或更多手段进行测试，必须使用方差分析。

解释 T 检验

本质上，t 检验允许我们比较两个数据集的平均值，并确定它们是否来自同一人群。在上面的例子中，如果我们从 A 班抽取一个学生样本，从 B 班抽取另一个学生样本，我们不会期望他们有完全相同的均值和标准差。同样，从安慰剂喂养的对照组和从药物处方组采集的样本应该具有略微不同的平均值和标准偏差。

在数学上，t 检验从两组中的每一个中抽取一个样本，并通过假设两个均值相等的原假设来建立问题陈述。根据适用的公式，计算某些值并与标准值进行比较，并相应地接受或拒绝假设的零假设。

如果零假设有资格被拒绝，则表明数据读数很强，可能不是偶然的。

t 检验只是用于此目的的众多检验之一。统计学家必须额外使用 t 检验以外的检验来检查更多变量和更大样本量的检验。对于大样本量，统计学家使用z 检验。其他测试选项包括卡方检验和 f 检验。

存在三种类型的 t 检验，它们分为依赖和独立 t 检验。

模棱两可的测试结果

假设制药商想要测试一种新发明的药物。它遵循标准程序，在一组患者身上尝试药物，然后给另一组（称为对照组）服用安慰剂。给予对照组的安慰剂是一种没有预期治疗价值的物质，并作为衡量给予实际药物的另一组如何反应的基准。

在药物试验之后，安慰剂喂养对照组的成员报告平均预期寿命增加了三年，而服用新药的组成员报告平均预期寿命增加了四年。即时观察可能表明该药物确实有效，因为使用该药物的组的结果更好。然而，观察结果也有可能是偶然发生的，尤其是意外的运气。 t 检验有助于得出结果是否实际正确并适用于整个人群的结论。

在一所学校，A 班 100 名学生的平均得分为 85%，标准差为 3%。另外 100 名属于 B 类的学生平均得分为 87%，标准差为 4%。虽然 B 班的平均成绩比 A 班的好，但直接断定 B 班学生的整体表现优于 A 班的学生未必是正确的。这是因为存在自然变异性在两个班级的考试成绩中，因此差异可能仅是由于偶然性。 t 检验可以帮助确定一个班级是否比另一个班级表现更好。

T 检验假设

关于 t 检验的第一个假设涉及测量规模。 t 检验的假设是应用于收集的数据的测量尺度遵循连续或有序尺度，例如 IQ 测试的分数。
第二个假设是一个简单的随机样本，即数据是从总人口中随机选择的代表性部分收集的。
第三个假设是数据在绘制时会产生正态分布的钟形分布曲线。
最后的假设是方差的同质性。当样本的标准偏差大致相等时，存在同质或相等的方差。

计算 T 检验

计算 t 检验需要三个关键数据值。它们包括每个数据集的平均值之间的差异（称为平均差异）、每组的标准差以及每组的数据值的数量。

t 检验的结果产生 t 值。然后将该计算的 t 值与从临界值表（称为 T 分布表）中获得的值进行比较。这种比较有助于确定仅机会对差异的影响，以及差异是否超出该机会范围。 t 检验质疑组之间的差异是否代表研究中的真实差异，或者它是否可能是无意义的随机差异。

T 分布表

T 分布表有单尾和双尾两种格式。前者用于评估具有固定值或范围且方向明确（正面或负面）的案例。例如，掷一对骰子时，输出值保持在 -3 以下或超过 7 的概率是多少？后者用于范围界限分析，例如询问坐标是否在 -2 和 +2 之间。

可以使用支持必要统计功能的标准软件程序执行计算，例如 MS Excel 中的那些。

T 值和自由度

t 检验产生两个值作为其输出：t 值和自由度。 t 值是两个样本集的平均值之差与样本集中存在的变异的比率。虽然分子值（两个样本集的平均值之间的差异）很容易计算，但分母（样本集中存在的变化）可能会变得有点复杂，具体取决于所涉及的数据值的类型。比率的分母是离散度或可变性的度量。较高的 t 值（也称为 t 分数）表明两个样本集之间存在较大差异。 t 值越小，两个样本集之间的相似度越高。

大的 t 分数表明组是不同的。
小 t 分数表示组相似。

自由度是指研究中可以自由变化的值，对于评估零假设的重要性和有效性至关重要。这些值的计算通常取决于样本集中可用数据记录的数量。

等方差（或合并）T 检验

当每组的样本数相同，或者两个数据集的方差相似时，使用等方差 t 检验。以下公式用于计算等方差 t 检验的 t 值和自由度：

$\begin&\text = \frac{ mean1 - mean2 }{\frac {(n1 - 1) \times var1$

l0 -0

c4,-6.7,10,-10,18,-10 H400000v40

H1013.1s-83.4,268,-264.1,840c-180.7,572,-277,876.3,-289,913c-4.7,4.7,-12.7,7,-24,7

s-12,0,-12,0c-1.3,-3.3,-3.7,-11.7,-7,-25c-35.3,-125.3,-106.7,-373.3,-214,-744

c-10,12,-21,25,-33,39s-32,39,-32,39c-6,-5.3,-15,-14,-27,-26s25,-30,25,-30

c26.7,-32.7,52,-63,76,-91s52,-60,52,-60s208,722,208,722

c56,-175.3,126.3,-397.3,211,-666c84.7,-268.7,153.8,-488.2,207.5,-658.5

c53.7,-170.3,84.5,-266.8,92.5,-289.5z

M1001 80h400000v40h-400000z'/> mean1−mean2哪里：mean1 和 mean2=每个的平均值样本集var 1 和var2= 每个样本集的方差n1 和 n2= 每个样本集中的记录数</跨度>

和，

$\begin &\text{自由度} = n1 + n2 - 2 \ &\textbf\ &n1 \text n2 = \text{每个样本集中的记录数} \ \end$

不等方差 T 检验

不等方差t检验用于每组样本数不同时，两个数据集的方差也不同。该检验也称为 Welch 的 t 检验。以下公式用于计算不等方差 t 检验的 t 值和自由度：

$\begin&\text {T 值}=\frac{\sqrt{\bigg(\frac{+\frac\bigg)}}}\&\textbf \&mean1 \text mean2 = \text{每个样本的平均值} \&\text{样本集} \&var1 \text var2 = \text {每个样本集的方差} \&n1 \text n2 = \text{每个样本集中的记录数} \end$

c339.3,-1799.3,509.3,-2700,510,-2702 l0 -0

c3.3,-7.3,9.3,-11,18,-11 H400000v40H1017.7

s-90.5,478,-276.2,1466c-185.7,988,-279.5,1483,-281.5,1485c-2,6,-10,9,-24,9

c-8,0,-12,-0.7,-12,-2c0,-1.3,-5.3,-32,-16,-92c-50.7,-293.3,-119.7,-693.3,-207,-1200

c0,-1.3,-5.3,8.7,-16,30c-10.7,21.3,-21.3,42.7,-32,64s-16,33,-16,33s-26,-26,-26,-26

s76,-153,76,-153s77,-151,77,-151c0.7,0.7,35.7,202,105,604c67.3,400.7,102,602.7,104,

606zM1001 80h400000v40H1017.7z'/> mean1−mean2哪里： mea n1和mean2=每个的平均值样本集var1 和 v ar2=每个样本集的方差n1 和 n2=每个样本集中的记录数

和，

$\begin &\text{自由度} = \frac{ \left ( \frac{ var1$

确定要使用的正确 T 检验

以下流程图可用于根据样本集的特征确定应使用哪个 t 检验。需要考虑的关键项目包括样本记录是否相似、每个样本集中的数据记录数以及每个样本集的方差。

不等方差 T 检验示例

假设我们正在对艺术画廊收到的画作进行对角线测量。一组样本包括 10 幅画作，而另一组样本包括 20 幅画作。具有相应均值和方差值的数据集如下：

TTT

虽然第 2 组的均值高于第 1 组，但我们不能断定第 2 组对应的总体比第 1 组对应的总体具有更高的均值。从 19.4 到 21.6 的差异仅仅是由于偶然性，还是因为画廊收到的所有画作的总体人群中真的存在差异吗？我们通过假设两个样本集的均值相同的零假设来确定问题，并进行 t 检验以检验该假设是否合理。

由于数据记录的数量不同（n1 = 10 和 n2 = 20）并且方差也不同，因此使用不等方差 T 检验中提到的公式计算上述数据集的 t 值和自由度部分。

t 值为 -2.24787。由于在比较两个 t 值时可以忽略减号，因此计算值为 2.24787。

自由度值为 24.38 并减少到 24，这是由于公式定义要求将该值向下舍入到可能的最小整数值。

可以指定一个概率水平（阿尔法水平、显着性水平、p）作为接受标准。在大多数情况下，可以假设 5% 的值。

使用自由度值为 24 和 5% 的显着性水平，查看 t 值分布表得出的值为 2.064。将此值与计算值 2.247 进行比较表明计算的 t 值大于表中的值，显着性水平为 5%。因此，拒绝均值之间没有差异的原假设是安全的。人口集具有内在差异，它们并非偶然。

＃＃强调

t 检验是一种推断统计量，用于确定两组均值之间是否存在显着差异，这可能与某些特征相关。
t 检验是用于统计假设检验的众多检验之一。
根据所需的数据和分析类型，可以执行几种不同类型的 t 检验。
计算 t 检验需要三个关键数据值。它们包括每个数据集的平均值之间的差异（称为平均差异）、每组的标准差以及每组的数据值的数量。

T检验