偏度f
##什么是偏度?
偏度是指一组数据中偏离对称钟形曲线或正态分布的失真或不对称。如果曲线向左或向右移动,则称为倾斜。偏度可以量化为给定分布与正态分布不同程度的表示。正态分布的偏斜为零,而对数正态分布例如会表现出某种程度的右偏。
了解偏度
有几种不同类型的分布和偏斜。远离中位数的“尾部”或数据点串会受到正偏斜和负偏斜的影响。负偏斜是指分布左侧较长或较粗的尾部,而正偏斜是指右侧较长或较粗的尾部。这两个偏斜指的是分布的方向或权重。
此外,分布可以具有零偏斜。当数据图是对称的时会发生零偏斜。不管分布尾部有多长或多粗,零偏斜表示数据的正态分布。如果数据不能提供有关其分布的足够信息,数据集也可能具有未定义的偏度。
的平均值将大于中位数。在负偏态分布中,情况正好相反:负偏态数据的平均值将小于中位数。如果数据对称绘制,则分布的偏度为零,无论尾部有多长或多粗。
下面描述的三个概率分布呈正偏(或右偏)的程度越来越大。负偏态分布也称为左偏态分布。
偏度与峰度一起使用,以更好地判断事件落在概率分布尾部的可能性。
测量偏度
有几种方法可以测量偏度。 Pearson 的第一和第二偏度系数是两种常用方法。 Pearson 的第一个偏度系数,或 Pearson 模式偏度,从平均值中减去众数,然后将差值除以标准差。 Pearson 的第二个偏度系数或 Pearson 中值偏度,从平均值中减去中值,将差值乘以 3,然后将乘积除以标准差。
皮尔逊偏度公式
如果数据表现出强模式,则 Pearson 的第一个偏度系数很有用。如果数据具有弱模式或多个模式,则 Pearson 的第二个系数可能更可取,因为它不依赖模式作为集中趋势的度量。
偏度告诉您异常值出现的位置,尽管它不会告诉您出现了多少异常值。
偏度告诉你什么?
投资者在判断回报分布时会注意到偏度,因为它与峰度一样,会考虑数据集的极端情况,而不是仅仅关注平均值。短期和中期投资者尤其需要关注极端情况,因为他们不太可能持有足够长的头寸以确信平均值会自行发挥作用。
投资者通常使用标准差来预测未来收益,但标准差假设为正态分布。由于很少有回报分布接近正态分布,因此偏度是基于性能预测的更好衡量标准。这是由于偏度风险。
偏斜风险是在偏斜分布中出现高偏斜数据点的风险增加。许多试图预测资产未来表现的金融模型假设一个正态分布,其中集中趋势的度量是相等的。如果数据有偏斜,这种模型总是会低估其预测中的偏斜风险。数据偏差越大,这个财务模型就越不准确。
偏态分布示例
1990 年代后期的互联网泡沫开始,在过去 20 年中更频繁地观察到偏离“正常”回报的情况。事实上,资产回报往往越来越右倾。这种波动发生在一些值得注意的事件中,例如 9 月 11 日的恐怖袭击、房地产泡沫破灭和随后的金融危机,以及量化宽松(QE)年代。
广泛的股票市场通常被认为具有负偏态分布。这个概念是,市场更经常地回报小的正回报,更经常地回报大的负损失。然而,研究表明,单个公司的股权可能倾向于左偏。
偏度的一个常见例子是美国家庭收入的分布,因为个人不太可能获得非常高的年收入。例如,考虑 2020 年的家庭收入统计数据。收入最低的五分之一从 0 美元到 27,026 美元不等,而收入最高的五分之一从 85,077 美元到 141,110 美元不等。由于最高的五分之一比最低的五分之一大两倍多,因此收入较高的数据点更加分散,并导致正偏态分布。
## 强调
偏度经常出现在股票市场回报以及平均个人收入的分布中。
分布可以不同程度地表现出右(正)偏度或左(负)偏度。正态分布(钟形曲线)表现出零偏度。
在统计学中,偏度是在概率分布中观察到的不对称程度。
投资者在判断回报分布时会注意到右偏,因为它与过度峰态一样,能更好地代表数据集的极端,而不是仅仅关注平均值。
偏度告诉用户异常值的方向,尽管它不会告诉用户异常值的数量。
## 常问问题
偏度告诉我们什么?
偏度告诉我们异常值的方向。在正偏斜中,分布曲线的尾部在右侧较长。这意味着分布曲线的异常值更靠近右侧,更靠近左侧的均值。偏度不告知异常值的数量;它只传达异常值的方向。
偏度正常吗?
分析数据集时通常会发现偏度,因为在某些情况下,偏度只是被分析数据集的一个组成部分。例如,考虑人类的平均寿命。由于大多数人往往在年老后死亡,因此在年轻时死亡的人相对较少。在这种情况下,偏斜是预期的并且是正常的。
高偏度是什么意思?
高偏度意味着分布曲线的一端具有较短的尾,分布曲线的另一端具有长尾。数据集遵循正态分布曲线;但是,较高的偏斜数据意味着数据分布不均。由于基础数据的性质,数据点倾向于分布的一侧。
什么导致偏斜?
偏度只是一个数据集的反映,其中活动在一个范围内高度浓缩,而在另一个范围内浓缩程度较低。想象一下在奥运会跳远比赛中测量的分数。许多跳投者可能会降落更远的距离,而更少的人可能会降落很短的距离。这通常会产生右偏分布。因此,数据点之间的关系以及它们发生的频率会导致偏度。