Investor's wiki

拟合优度

拟合优度

什么是拟合优度?

拟合优度一词是指一种统计检验,用于确定样本数据与具有正态分布的总体的分布的拟合程度。简而言之,它假设样本是否存在偏差或代表您希望在实际总体中找到的数据。

拟合优度确定了观察值与正态分布情况下模型的预期值之间的差异。有多种方法可以确定拟合优度,包括卡方。

了解拟合优度

拟合优度检验是对观察值进行推断的统计方法。例如,您可以确定一个样本组是否真正代表了整个人口。因此,它们确定实际值如何与模型中的预测值相关。当用于决策制定时,拟合优度测试可以更轻松地预测未来的趋势和模式。

如上所述,有几种类型的拟合优度检验。它们包括最常见的卡方检验,以及 Kolmogorov-Smirnov 检验和 Shipiro-Wilk 检验。测试通常使用计算机软件进行。但是统计学家可以使用针对特定测试类型量身定制的公式进行这些测试。

要进行测试,您需要一个特定的变量,以及它如何分布的假设。您还需要具有明确和明确值的数据集,例如:

  • 观察值,源自实际数据集

  • 预期值,取自所做的假设

  • 集合中的类别总数

拟合优度检验通常用于检验残差的正态性或确定两个样本是否来自相同的分布。

特别注意事项

为了解释拟合优度检验,统计学家必须建立一个 alpha 水平,例如卡方检验的p 值。 p 值是指得到接近观察结果极端值的结果的概率。这假设原假设是正确的。原假设断言变量之间不存在关系,备择假设假设存在关系。

取而代之的是,测量观察值的频率,然后将其与预期值和自由度一起使用以计算卡方。如果结果低于 alpha,则原假设无效,表明变量之间存在关系。

拟合优度测试的类型

卡方检验

< mi>χ2=i< mo>=1k( Oi-Ei)2/E i\chi2=\sum\limitsk_(O_i-E_i)^ 2/E_i

方检验,也称为独立性卡方检验,是一种推断统计方法,用于测试基于随机样本的总体声明的有效性。

专门用于分类(箱)的数据,它需要足够的样本量才能产生准确的结果。但这并不表明关系的类型或强度。例如,它不能断定关系是积极的还是消极的。

要计算卡方拟合优度,请设置所需的 alpha 显着性水平。因此,如果您的置信水平为 95%(或 0.95),则 alpha 为 0.05。接下来,确定要测试的分类变量,然后定义关于它们之间关系的假设陈述。

变量必须互斥才能符合卡方独立性检验的条件。并且 chi 拟合优度检验不应用于连续数据。

Kolmogorov-Smirnov 检验

D =max1< mo>≤iN(</ mo>F(Yi)-i-1N,iN< mo>-F(Yi))D=\max\limits_{ 1\leq i\leq N}\bigg(F(Y_i)-\frac,\frac-F(Y_i)\bigg)(F(Y i</ span>)-< span class="vlist" style="height:0.855664em;">< span class="sizing reset-size6 size3 mtight">Ni1 ,< span style="top:-2.6550000000000002em;">NiF( Yi< /span>))

以俄罗斯数学家 Andrey Kolmogorov 和 Nikolai Smirnov 命名的 Kolmogorov-Smirnov 检验(也称为 KS 检验)是一种统计方法,用于确定样本是否来自人群中的特定分布。

样本(例如,超过 2000 个)的该测试是非参数的。这意味着它不依赖于任何分发是有效的。目标是证明零假设,即正态分布的样本。

与卡方一样,它使用零假设和备择假设以及 alpha 显着性水平。 Null 表示数据遵循总体内的特定分布,alternative 表示数据未遵循总体内的特定分布。 alpha 用于确定测试中使用的临界值。但与卡方检验不同,Kolmogorov-Smirnov 检验适用于连续分布。

计算出的检验统计量通常表示为 D。它决定了原假设是被接受还是被拒绝。如果 D 大于alpha处的临界值,则拒绝原假设。如果 D 小于临界值,则接受原假设。

Shipiro-Wilk 测试

W =(i< /mi>=1nai (x(i))2i=1 n(xi</ msub>-xˉ) 2,W=\frac{\big(\sum^n_a_i(x_{(i)}\big)2}{\sumn_(x_i-\bar)^2},=< span class="mord">i=1n< /span>( span>x< /span>i - xˉ) 2 ( i =1n a< span class="vlist" style="height:0.3280857142857143em;"><span class="pstrut" 风格="height:2.5em;">i< /span>< span>(< span class="mord mathnormal mtight">x(i ) )2,

Shipiro-Wilk 检验确定样本是否服从正态分布。该检验仅在使用具有一个连续数据变量的样本时检查正态性,建议用于不超过 2000 的小样本。

Shipiro-Wilk 检验使用称为 QQ 图的概率图,它在 y 轴上显示从最小到最大排列的两组分位数。如果每个分位数都来自相同的分布,则该系列图是线性的。

QQ 图用于估计方差。使用 QQ 图方差和总体的估计方差,可以确定样本是否属于正态分布。如果两个方差的商等于或接近 1,则可以接受原假设。如果大大低于1,则可以拒绝。

就像上面提到的测试一样,这个使用 alpha 并形成两个假设:null 和 Alternative。原假设表明样本来自正态分布,而备择假设表明样本不来自正态分布。

拟合优度示例

这是一个假设性示例,展示了拟合优度检验的工作原理。

假设一个小型社区健身房在以下假设下运营:周一、周二和周六的上座率最高,周三和周四的平均上座率以及周五和周日的上座率最低。基于这些假设,健身房每天雇佣一定数量的工作人员来检查会员、清洁设施、提供培训服务和教授课程。

但健身房的财务状况不佳,业主想知道这些出勤率假设和人员配备水平是否正确。业主决定统计六周内每天参加健身房的人数。然后,他们可以使用卡方拟合优度检验将健身房的假设出勤率与观察到的出勤率进行比较。

现在他们有了新数据,他们可以确定如何最好地管理健身房并提高盈利能力。

底线

拟合优度检验确定样本数据与总体预期的匹配程度。从样本数据中,收集观察值并使用差异度量将其与计算的预期值进行比较。根据您寻求的结果,可以使用不同的拟合优度假设检验。

选择正确的拟合优度检验很大程度上取决于您想了解样本的内容以及样本的大小。例如,如果想知道分类数据的观察值是否与分类数据的预期值匹配,请使用卡方。如果想知道小样本是否服从正态分布,Shipiro-Wilk 检验可能是有利的。有许多测试可用于确定拟合优度。

## 强调

  • 拟合优度是一种统计测试,试图确定一组观察值是否与适用模型下的预期值相匹配。

  • 他们可以向您展示您的样本数据是否符合正态分布人群的预期数据集。

  • 卡方检验确定分类数据之间是否存在关系。

  • 有多种类型的拟合优度检验,但最常见的是卡方检验。

  • Kolmogorov-Smirnov 检验确定样本是否来自人口的特定分布。

## 常问问题

卡方检验中的拟合优度是什么?

卡方检验分类变量之间是否存在关系以及样本是否代表整体。它估计观察到的数据与预期数据的相似程度,或者它们的拟合程度。

拟合优度是什么意思?

拟合优度是一种统计假设检验,用于查看观察到的数据与预期数据的密切程度。拟合优度检验有助于确定样本是否服从正态分布、分类变量是否相关,或者随机样本是否来自同一分布。

您如何进行拟合优度测试?

拟合优度测试由不同的测试方法组成。测试的目标将有助于确定使用哪种方法。例如,如果目标是在相对较小的样本上检验正态性,则 Shipiro-Wilk 检验可能是合适的。如果要确定样本是否来自总体中的特定分布,将使用 Kolmogorov-Smirnov 检验。每个测试都使用自己独特的公式。但是,它们具有共性,例如零假设和显着性水平。

为什么拟合优度很重要?

拟合优度测试有助于确定观察到的数据是否与预期一致。可以根据进行的假设检验的结果做出决定。例如,零售商想知道什么样的产品对年轻人有吸引力。零售商对老年人和年轻人的随机样本进行调查,以确定哪种产品更受欢迎。使用卡方,他们以 95% 的置信度确定产品 A 与年轻人之间存在关系。根据这些结果,可以确定该样本代表了年轻人群。零售营销人员可以使用它来改革他们的活动。