Investor's wiki

P值

P值

什么是 P 值?

假设原假设正确的情况下,获得至少与统计假设检验的观察结果一样极端的结果的概率。 p 值用作拒绝点的替代方法,以提供将拒绝原假设的最小显着性水平。较小的 p 值意味着有更强有力的证据支持备择假设。

P 值通常用于提高政府机构研究或报告的可信度。例如,美国人口普查局规定任何 p 值大于 0.10 的分析都必须附有声明,即差异在统计上与零没有差异。人口普查局还制定了标准,规定哪些 p 值可以接受各种出版物。

P 值如何计算?

P 值通常使用 p 值表或电子表格/统计软件找到。这些计算基于测试的特定统计数据的假设或已知概率分布。在给定统计量的概率分布的情况下,根据观察值与所选参考值之间的偏差计算 P 值,两个值之间的较大差异对应于较低的 p 值。

在数学上,p 值是使用积分计算从概率分布曲线下的面积计算的,所有统计值至少与观察值一样远离参考值,相对于概率分布曲线下的总面积. p 值的计算因执行的测试类型而异。三种检验类型描述了概率分布曲线上的位置:下尾检验、上尾检验或双边检验。

简而言之,两个观察值之间的差异越大,差异由简单随机机会引起的可能性就越小,这反映在较低的 p 值上。

假设检验的 P 值方法

假设检验的 p 值方法使用计算的概率来确定是否有证据拒绝原假设。零假设,也称为“猜想”,是关于总体(或数据生成过程)的初始主张。备择假设说明总体参数是否与猜想中所述的总体参数值不同。

在实践中,显着性水平是预先说明的,以确定 p 值必须有多小才能拒绝原假设。因为不同的研究人员在检查一个问题时使用不同的显着性水平,所以读者有时可能难以比较两个不同测试的结果。 P 值提供了解决此问题的方法。

例如,假设一项比较两种特定资产收益的研究由使用相同数据但显着性水平不同的不同研究人员进行。对于资产是否不同,研究人员可能会得出相反的结论。如果一位研究人员使用 90% 的置信水平,而另一位研究人员需要 95% 的置信水平来拒绝零假设,并且观察到的两个回报之间差异的 p 值为 0.08(对应于 92% 的置信水平) ,那么第一个研究人员会发现两种资产的差异在统计上显着,而第二个研究人员会发现收益之间没有统计上的显着差异。

为了避免这个问题,研究人员可以报告假设检验的 p 值,并让读者自己解释统计显着性。这被称为假设检验的 p 值方法。独立观察者可以注意到 p 值并自行决定这是否代表统计学上的显着差异。

P 值示例

一位投资者声称其投资组合的表现与标准普尔 (S&P) 500 指数的表现相当。为了确定这一点,投资者进行了双尾测试。原假设表明投资组合的回报与标准普尔 500 指数在特定时期的回报相当,而备择假设表明投资组合的回报与标准普尔 500 的回报不等价——如果投资者进行了单尾检验,替代假设假设将表明投资组合的回报低于或高于标准普尔 500 指数的回报。

p 值假设检验不一定使用预先选择的置信水平,在该置信水平上,投资者应重新设置收益相等的零假设。相反,它提供了一个衡量有多少证据可以拒绝零假设。 p 值越小,反对原假设的证据就越大。因此,如果投资者发现 p 值为 0.001,则有强有力的证据反对原假设,投资者可以自信地得出投资组合的回报与标准普尔 500 指数的回报不相等的结论。

尽管这并没有提供投资者何时应该接受或拒绝原假设的确切阈值,但它确实具有另一个非常实际的优势。 P 值假设检验提供了一种直接的方法来比较投资者在选择多种不同类型的投资或投资组合时相对于标准普尔 500 指数等基准的相对信心。

例如,对于两个投资组合 A 和 B,其表现与标准普尔 500 指数的 p 值分别为 0.10 和 0.01 不同,投资者可以更加确信具有较低 p 值的投资组合 B 实际上会显示始终不同的结果。

更正 - 2022 年 4 月 2 日: 以前的版本错误地将 p 值描述为随机机会产生结果的概率。

## 强调

  • p 值是一种统计测量,用于根据观察到的数据验证假设。

  • p 值越低,观察到的差异的统计显着性越大。

  • P 值可以作为假设检验的预选置信水平的替代或补充。

  • 0.05 或更低的 p 值通常被认为具有统计学意义。

  • 假设原假设为真,p 值衡量获得观察结果的概率。

## 常问问题

0.05 P 值是否显着?

小于 0.05 的 p 值通常被认为具有统计显着性,在这种情况下应拒绝原假设。 p 值大于 0.05 意味着与原假设的偏差在统计上不显着,并且原假设未被拒绝。

P 值 0.001 是什么意思?

p 值为 0.001 表示如果检验的原假设确实为真,那么将有千分之一的机会观察到至少同样极端的结果。这导致观察者拒绝原假设,因为观察到了非常罕见的数据结果,或者原假设不正确。

如何使用 P 值比较假设检验的两个不同结果?

如果您有两种不同的结果,一种的 p 值为 0.04,另一种的 p 值为 0.06,则 0.04 将被视为具有统计显着性,而 0.06 则不会。除了这个简化的示例之外,您还可以将 0.04 p 值与 0.001 p 值进行比较。两者都具有统计显着性,但 0.001 比 0.04 提供了更强有力的针对零假设的案例。