Investor's wiki

平方和

平方和

##平方和是多少?

平方和是一种用于回归分析的统计技术,用于确定数据点的分散性。在回归分析中,目标是确定数据系列与可能有助于解释数据系列如何生成的函数的拟合程度。平方和用作从数据中找到最适合(变化最小)的函数的数学方法。

##平方和的公式是

对于一组X< mi>n 个项目:平方和</ mtext>=i=0</ mrow>n(Xi</ mi>-X)2<mstyle scriptlevel="0" 显示样式="true">哪里:</ mrow>X i=it h 集合中的项 X=所有项目的平均值集合</ mstyle>(X我< /mi>-X)=每一项与均值的偏差 \begin &\text X \text n \text\ &amp ;\text{平方和}=\sum_^\left(X_i-\overline\right)2\ &\textbf\ &X_i =\text{集合中的 } i \text{ 项}\ &\overline=\text{集合中所有项的均值}\ &\left(X_i- \overline\right) = \text{每个项目与平均值的偏差}\ \end

平方和也称为变异。

##平方和告诉你什么?

平方和是与平均值的偏差的度量。在统计学中,均值是一组数字的平均值,是最常用的集中趋势度量。算术平均值是简单地通过将数据集中的值相加并除以值的数量来计算的。

假设微软 (MSFT) 在过去五天的收盘价分别为 74.01、74.77、73.94、73.61 和 73.40 美元。总价格之和为 369.73 美元,因此教科书的平均价格为 369.73 美元 / 5 = 73.95 美元。

但是知道测量集的平均值并不总是足够的。有时,了解一组测量值有多少变化会很有帮助。单个值与均值的距离可以让我们深入了解观察值或值与所创建的回归模型的拟合程度。

例如,如果分析师想知道 MSFT 的股价是否与苹果 (AAPL) 的价格同步,他们可以列出在一定时期内两只股票的过程的一组观察值,比如 1、2 ,或 10 年,并创建一个线性模型,记录每个观察或测量。如果两个变量之间的关系(即 AAPL 的价格和 MSFT 的价格)不是一条直线,那么需要仔细检查数据集的变化。

用统计学术语来说,如果创建的线性模型中的线没有通过所有价值测量,那么在股价中观察到的一些可变性是无法解释的。平方和用于计算两个变量之间是否存在线性关系,任何无法解释的变异性称为残差平方和

平方和是变异的平方和,其中变异定义为每个单独值与平均值之间的分布。为了确定平方和,将每个数据点与最佳拟合线之间的距离平方,然后求和。最佳拟合线将最小化该值。

如何计算平方和

现在您可以了解为什么将测量称为偏差平方和,或简称为平方和。使用我们上面的 MSFT 示例,平方和可以计算为:

  • SS = (74.01 - 73.95)2 + (74.77 - 73.95)2 + (73.94 - 73.95)2 + (73.61 - 73.95)2 + (73.40 - 73.95)2

  • SS = (0.06) 2 + (0.82)2 + (-0.01)2 + (-0.34)2 + (-0.55)2

  • SS = 1.0942

单独添加偏差的总和而不进行平方将导致等于或接近于零的数字,因为负偏差将几乎完美地抵消正偏差。为了得到一个更现实的数字,偏差的总和必须是平方的。平方和总是正数,因为任何数的平方,无论是正数还是负数,总是正数。

如何使用平方和的示例

根据 MSFT 计算的结果,平方和越高表明大多数值离均值较远,因此数据的可变性很大。平方和低是指观察集的可变性低。

在上面的示例中,1.0942 表明 MSFT 过去五天的股价波动性非常低,希望投资具有价格稳定和低波动性股票的投资者可能会选择 MSFT。

使用平方和的限制

就购买什么股票做出投资决定需要比这里列出的更多的观察。分析师可能必须使用多年的数据才能更确定地了解资产的可变性有多高或多低。随着更多数据点添加到集合中,平方和变得更大,因为值将更加分散。

最广泛使用的变异量度是标准差方差。但是,要计算这两个指标中的任何一个,必须首先计算平方和。方差是平方和的平均值(即平方和除以观察次数)。标准差是方差的平方根。

有两种使用平方和的回归分析方法:线性最小二乘法和非线性最小二乘法。最小二乘法是指回归函数将实际数据点的方差平方和最小化。通过这种方式,可以绘制一个统计上为数据提供最佳拟合的函数。请注意,回归函数可以是线性的(直线)或非线性的(曲线)。

## 强调

  • 平方和测量数据点与平均值的偏差。

  • 较高的平方和结果表明数据集中存在较大程度的可变性,而较低的结果表明数据与平均值的差异不大。