Investor's wiki

非线性回归

非线性回归

非线性回归是一种回归分析形式,其中数据适合模型,然后表示为数学函数。简单线性回归将两个变量(X 和 Y)与一条直线(y = mx + b)相关联,而非线性回归将这两个变量以非线性(曲线)关系联系起来。

该模型的目标是使平方和尽可能小。平方和是跟踪 Y 观测值与用于预测 Y 的非线性(曲线)函数的差异程度的度量。

它是通过首先找到拟合的非线性函数与集合中每个 Y 数据点之间的差异来计算的。然后,将这些差异中的每一个平方。最后,将所有平方数相加。这些平方数字的总和越小,函数就越适合集合中的数据点。非线性回归使用对数函数、三角函数、指数函数、幂函数、洛伦兹曲线、高斯函数和其他拟合方法。

非线性回归建模与线性回归建模相似,两者都寻求以图形方式跟踪来自一组变量的特定响应。非线性模型的开发比线性模型更复杂,因为该函数是通过一系列可能源于反复试验的近似值(迭代)创建的。数学家使用几种成熟的方法,例如高斯-牛顿法和列文伯格-马夸特法。

通常,乍一看似乎是非线性的回归模型实际上是线性的。曲线估计过程可用于识别数据中起作用的函数关系的性质,因此您可以选择正确的回归模型,无论是线性的还是非线性的。线性回归模型虽然通常形成一条直线,但也可以形成曲线,具体取决于线性回归方程的形式。同样,可以使用代数来变换非线性方程,使其模仿线性方程——这样的非线性方程被称为“本征线性”。

线性回归将两个变量与一条直线联系起来;非线性回归使用曲线关联变量。

非线性回归示例

如何使用非线性回归的一个例子是预测人口随时间的增长。随时间变化的人口数据散点图显示,时间和人口增长之间似乎存在关系,但这是一种非线性关系,需要使用非线性回归模型。逻辑人口增长模型可以提供未测量时期的人口估计,以及未来人口增长的预测。

非线性回归中使用的自变量和因变量应该是定量的。分类变量,如居住地区或宗教,应编码为二元变量或其他类型的定量变量。

为了从非线性回归模型中获得准确的结果,您应该确保您指定的函数准确地描述了自变量和因变量之间的关系。良好的起始值也是必要的。即使您为模型指定了正确的函数形式,较差的起始值也可能导致模型无法收敛,或者仅在局部而不是全局最优的解决方案。

## 强调

  • 非线性回归可以显示随时间推移的人口增长预测。

  • 非线性回归是用于预测 Y 变量的 X 变量(或变量)的曲线函数

  • 线性和非线性回归都预测来自 X 变量(或变量)的 Y 响应。