Investor's wiki

非参数统计

非参数统计

什么是非参数统计?

非参数统计是指不假定数据来自由少数参数确定的规定模型的统计方法;此类模型的示例包括正态分布模型和线性回归模型。非参数统计有时使用有序数据,这意味着它不依赖于数字,而是依赖于排序或排序。例如,传达从喜欢到不喜欢的消费者偏好的调查将被视为序数数据。

非参数统计包括非参数描述统计、统计模型、推理和统计检验。非参数模型的模型结构不是先验指定的,而是根据数据确定的。 非参数一词并不意味着此类模型完全没有参数,而是参数的数量和性质是灵活的,而不是预先固定的。直方图是概率分布的非参数估计的一个例子。

理解非参数统计

在统计学中,参数统计包括均值、标准差、皮尔逊相关、方差等参数。这种形式的统计使用观察到的数据来估计分布的参数。在参数统计下,通常假设数据来自具有未知参数 μ(总体均值)和 σ2(总体方差)的正态分布,然后使用样本均值和样本方差进行估计。

非参数统计不假设样本量或观察到的数据是否是定量的。

非参数统计不假设数据来自正态分布。相反,分布的形状是在这种统计测量形式下估计的。虽然可以假设正态分布的情况有很多,但也有一些情况下,真实的数据生成过程远非正态分布。

非参数统计示例

在第一个示例中,考虑一位希望估计投资的风险价值 (VaR) 的金融分析师。分析师从类似时间范围内的 100 项类似投资中收集收益数据。他们没有假设收益服从正态分布,而是使用直方图以非参数方式估计分布。然后,该直方图的第 5 个百分位为分析师提供了 VaR 的非参数估计值。

第二个例子,考虑一位不同的研究人员,他想知道平均睡眠时间是否与一个人生病的频率有关。因为许多人很少生病,如果有的话,而且偶尔有人生病的频率比大多数人高得多,所以疾病频率的分布显然是非正态的,是右偏和易出现异常值的。因此,研究人员决定使用非参数方法,例如分位数回归分析,而不是像在经典回归分析中那样使用假设疾病频率正态分布的方法。

特别注意事项

非参数统计因其易于使用而受到赞赏。随着对参数的需求减少,数据变得更适用于更多种类的测试。当这些信息都不可用时,可以在没有平均值、样本量、标准偏差或任何其他相关参数的估计的情况下使用这种类型的统计数据。

由于非参数统计对样本数据的假设较少,因此其应用范围比参数统计更广泛。在参数测试更合适的情况下,非参数方法的效率会降低。这是因为与参数统计不同,非参数统计丢弃了数据中可用的一些信息。

## 强调

  • 这种类型的分析通常最适合考虑事物的顺序,即使数值数据发生变化,结果也可能保持不变。

  • 非参数统计易于使用,但不提供其他统计模型的精确度。