Investor's wiki

偏度f

偏度f

##什么是偏度?

偏度是指一组数据中偏离对称钟形曲线或正态分布的失真或不对称。如果曲线向左或向右移动,则称为倾斜。偏度可以量化为给定分布与正态分布不同程度的表示。正态分布的偏斜为零,而对数正态分布例如会表现出某种程度的右偏。

了解偏度

有几种不同类型的分布和偏斜。远离中位数的“尾部”或数据点串会受到正偏斜和负偏斜的影响。负偏斜是指分布左侧较长或较粗的尾部,而正偏斜是指右侧较长或较粗的尾部。这两个偏斜指的是分布的方向或权重。

此外,分布可以具有零偏斜。当数据图是对称的时会发生零偏斜。不管分布尾部有多长或多粗,零偏斜表示数据的正态分布。如果数据不能提供有关其分布的足够信息,数据集也可能具有未定义的偏度。

平均值将大于中位数。在负偏态分布中,情况正好相反:负偏态数据的平均值将小于中位数。如果数据对称绘制,则分布的偏度为零,无论尾部有多长或多粗。

下面描述的三个概率分布呈正偏(或右偏)的程度越来越大。负偏态分布也称为左偏态分布。

偏度与峰度一起使用,以更好地判断事件落在概率分布尾部的可能性。

测量偏度

有几种方法可以测量偏度。 Pearson 的第一和第二偏度系数是两种常用方法。 Pearson 的第一个偏度系数,或 Pearson 模式偏度,从平均值中减去众数,然后将差值除以标准差。 Pearson 的第二个偏度系数或 Pearson 中值偏度,从平均值中减去中值,将差值乘以 3,然后将乘积除以标准差。

皮尔逊偏度公式

Sk1=< /mo>XˉM< /mi>os< mstyle scriptlevel="0" displaystyle="true"> < mtd>Sk2< mo>=3Xˉ< mo>-Mds其中:< /mrow>< mtd>Sk1</ mn>=皮尔逊第一偏度系数和Sk2 < mrow>< mtext> 第二个 s= 样本的标准差 Xˉ=是平均值</ mtr>Mo=模态(模式)值< /mrow>Md=是中值\begin &\begin Sk _1 = \frac {\bar - Mo} \ \underline{\qquad\qquad\qquad\qquad\qquad\qquad\qquad \qquad\qquad\qquad\qquad\quad} \ Sk _2 = \frac {3\bar - Md} \end\ &\textbf\ & Sk_1=\text{Pearson 的第一个偏度系数和}Sk_2\ &\qquad\ \ \ \text{ 第二个}\ &s=\text{样本的标准差}\ &\bar=\text{是平均值}\ &Mo=\text{模态(众数)值}\ &Md=\text{是中值} \end{对齐}



如果数据表现出强模式,则 Pearson 的第一个偏度系数很有用。如果数据具有弱模式或多个模式,则 Pearson 的第二个系数可能更可取,因为它不依赖模式作为集中趋势的度量。

偏度告诉您异常值出现的位置,尽管它不会告诉您出现了多少异常值。

偏度告诉你什么?

投资者在判断回报分布时会注意到偏度,因为它与峰度一样,会考虑数据集的极端情况,而不是仅仅关注平均值。短期和中期投资者尤其需要关注极端情况,因为他们不太可能持有足够长的头寸以确信平均值会自行发挥作用。

投资者通常使用标准差来预测未来收益,但标准差假设为正态分布。由于很少有回报分布接近正态分布,因此偏度是基于性能预测的更好衡量标准。这是由于偏度风险。

偏斜风险是在偏斜分布中出现高偏斜数据点的风险增加。许多试图预测资产未来表现的金融模型假设一个正态分布,其中集中趋势的度量是相等的。如果数据有偏斜,这种模型总是会低估其预测中的偏斜风险。数据偏差越大,这个财务模型就越不准确。

偏态分布示例

1990 年代后期的互联网泡沫开始,在过去 20 年中更频繁地观察到偏离“正常”回报的情况。事实上,资产回报往往越来越右倾。这种波动发生在一些值得注意的事件中,例如 9 月 11 日的恐怖袭击、房地产泡沫破灭和随后的金融危机,以及量化宽松(QE)年代。

广泛的股票市场通常被认为具有负偏态分布。这个概念是,市场更经常地回报小的正回报,更经常地回报大的负损失。然而,研究表明,单个公司的股权可能倾向于左偏。

偏度的一个常见例子是美国家庭收入的分布,因为个人不太可能获得非常高的年收入。例如,考虑 2020 年的家庭收入统计数据。收入最低的五分之一从 0 美元到 27,026 美元不等,而收入最高的五分之一从 85,077 美元到 141,110 美元不等。由于最高的五分之一比最低的五分之一大两倍多,因此收入较高的数据点更加分散,并导致正偏态分布。

## 强调

  • 偏度经常出现在股票市场回报以及平均个人收入的分布中。

  • 分布可以不同程度地表现出右(正)偏度或左(负)偏度。正态分布(钟形曲线)表现出零偏度。

  • 在统计学中,偏度是在概率分布中观察到的不对称程度。

  • 投资者在判断回报分布时会注意到右偏,因为它与过度峰态一样,能更好地代表数据集的极端,而不是仅仅关注平均值。

  • 偏度告诉用户异常值的方向,尽管它不会告诉用户异常值的数量。

## 常问问题

偏度告诉我们什么?

偏度告诉我们异常值的方向。在正偏斜中,分布曲线的尾部在右侧较长。这意味着分布曲线的异常值更靠近右侧,更靠近左侧的均值。偏度不告知异常值的数量;它只传达异常值的方向。

偏度正常吗?

分析数据集时通常会发现偏度,因为在某些情况下,偏度只是被分析数据集的一个组成部分。例如,考虑人类的平均寿命。由于大多数人往往在年老后死亡,因此在年轻时死亡的人相对较少。在这种情况下,偏斜是预期的并且是正常的。

高偏度是什么意思?

高偏度意味着分布曲线的一端具有较短的尾,分布曲线的另一端具有长尾。数据集遵循正态分布曲线;但是,较高的偏斜数据意味着数据分布不均。由于基础数据的性质,数据点倾向于分布的一侧。

什么导致偏斜?

偏度只是一个数据集的反映,其中活动在一个范围内高度浓缩,而在另一个范围内浓缩程度较低。想象一下在奥运会跳远比赛中测量的分数。许多跳投者可能会降落更远的距离,而更少的人可能会降落很短的距离。这通常会产生右偏分布。因此,数据点之间的关系以及它们发生的频率会导致偏度。