線性回歸

在统计学中，线性回归（英語：linear regression）是利用称为线性回归方程的最小平方函數对一个或多个自变量和因变量之间关系进行建模的一种回归分析。这种函数是一个或多个称为回归系数的模型参数的线性组合。只有一个自变量的情况称为简单回归，大于一个自变量情况的叫做多元回归（multivariable linear regression）。^[1]

在线性迴归中，数据使用线性预测函数来建模，并且未知的模型参数也是通过数据来估计。这些模型被叫做线性模型。^[2]最常用的线性迴归建模是给定X值的y的条件均值是X的仿射函数。不太一般的情况，线性迴归模型可以是一个中位数或一些其他的给定X的条件下y的条件分布的分位数作为X的线性函数表示。像所有形式的迴归分析一样，线性迴归也把焦点放在给定X值的y的条件概率分布，而不是X和y的联合概率分布（多元分析领域）。

线性迴归是迴归分析中第一种经过严格研究并在实际应用中广泛使用的类型。^[3]这是因为线性依赖于其未知参数的模型比非线性依赖于其未知参数的模型更容易拟合，而且产生的估计的统计特性也更容易确定。

线性迴归有很多实际用途。分为以下两大类：

如果目标是预测或者映射，线性迴归可以用来对观测数据集的和X的值拟合出一个预测模型。当完成这样一个模型以后，对于一个新增的X值，在没有给定与它相配对的y的情况下，可以用这个拟合过的模型预测出一个y值。
给定一个变量y和一些变量 $X_{1}$ ,..., $X_{p}$ ，这些变量有可能与y相关，线性迴归分析可以用来量化y与Xj之间相关性的强度，评估出与y不相关的 $X_{j}$ ，并识别出哪些 $X_{j}$ 的子集包含了关于y的冗余信息。

线性迴归模型经常用最小二乘逼近来拟合，但他们也可能用别的方法来拟合，比如用最小化“拟合缺陷”在一些其他规范里（比如最小绝对误差迴归），或者在桥迴归中最小化最小二乘损失函数的惩罚。相反，最小二乘逼近可以用来拟合那些非线性的模型。因此，尽管“最小二乘法”和“线性模型”是紧密相连的，但他们是不能划等号的。

線性迴歸的「迴歸」指的是迴歸到平均值（英语：regression toward the mean）。

[1]

[2]

[3]

線性回歸

簡介

理論模型

數據和估計

古典假設

最小二乘法分析

最小二乘法估計

迴歸推論

單變量線性迴歸

方差分析

其他方法

廣義最小二乘法

總體最小二乘法

廣義線性模式

穩健回歸

線性回歸的應用

趨勢線

流行病学

金融

经济学

参考文献

延伸阅读

参见

外部連結

Wikiwand - on