曲線擬合
来自维基百科,自由的百科全书
曲線擬合(英語:curve fitting),簡稱擬合,俗稱拉曲線,是一種構建一個函数曲線,使之最佳地吻合現有數據點的過程[1],該過程可能附加若干條件限制。[2][3]通俗地說,科学和工程问题通过诸如采样、实验等方法获得了若干离散的数据点。根据这些数据,我们往往希望得到一个连续的函数(也就是曲线)或者更加密集的离散方程与已知数据相吻合,该过程就叫做“拟合”,而得到的曲线方程就称为“拟合函数”。曲线拟合又译为:曲線配適、曲線貼合、曲線適插法,均有助理解其选择曲线方程(解析函数)来“模拟吻合”观测数据的过程。

上:原始数据和模型
下:归一化误差平方和的演变
曲線擬合中可以使用插值[4][5](需要精確吻合某數據時)或平滑[6][7](構造一個平滑的函數曲線,近似符合數據點)。迴歸分析是與擬合密切相關的一個話題[8][9],它更關注的是統計推斷,例如一條擬合到有隨機誤差的一組觀測數據的曲線有多大的不確定性。擬合曲線可以用作數據視覺化的一種輔助手段,[10][11]以表示數據缺失的函數區間的取值,[12]也可概括兩個或多個變量之間的關係。[13]外推(extrapolation)指的是使用曲線來擬合觀察數據取值範圍以外的取值,[14]往往因採取的構建函數的方式不同而有較大的不确定性[15]
將函數擬合至數據點
最常見的是擬合成函數 y=f(x) 的形式。

一次多项式方程在笛卡尔平面上是一條直線,而這條直線的斜率是a。因為任何兩點可以決定一條直線,因此總能找到次數不多於1的多項式來串起任何兩個x值相異的點。
如果把多次式的次數增加到2:
那麼只要給定x值各異的3點,總會有次數不多於2的多項式可以把它們串起。
如果把多次式的次數再增加到3:
那麼只要給定x值各異的4點,總會有次數不多於3的多項式可以把它們串起。
更準確而言,這條多項式能夠符合任何4個限制。限制可以是一點(x, y)、角度或曲率(即密切圆半徑的倒數1/R)。角度和曲率的限制通常用在曲線的終端,此時稱為終端條件 。兩條不同多項式擬合曲線的轉換處通常會用到相同的終端條件,以確保樣條(spline)平滑交接。也可以增加如曲率变化率等高阶约束。例如,在高速公路立体交叉点苜蓿葉型的设计中,可以理解为汽车沿着苜蓿葉立交运动时作用在汽车上的力的变化率(加加速度),并依此设定合理的限速。
一次多项式也可以拟合一个单点和一个角度的限制;三次多项式也可以拟合两点、一个角度约束以及一个曲率约束。许多其它类型的约束组合也同样可以用低阶或者高阶多项式来拟合。
在有超过n+1个约束(n是多项式的阶次)的情况下,多项式拟合可能仍然能满足所有约束。满足所有约束的精确拟合不一定能够得到(但是有可能得到,例如一次多项式拟合中的三点共线)。通常,我们需要使用一些方法来评价拟合的好坏。最小平方法就是用来评价偏离的一种常用的方法。
虽然提高多项式的次数可能可以获得精确拟合,但有时我们仍会采用近似拟合,其原因有下:

其他類型的曲線在特定條件下也可使用,諸如三角函数(如正弦或餘弦函數)。
在光譜學中,數據可以使用高斯、柯西、福格特等相關函數來擬合。
在生物學、生態學、人口學、傳染病學等學科中,生物個體數增長、傳染病擴散等數據可以用逻辑斯谛函数(一种S型函數)來擬合。
在農業中,倒S型函數被用於描述作物產量和生長因子之間的關係。右方藍色的圖表是將農田中的測量數據進行S形回歸得出的。可以看出作物產量在土壤鹽度增加時先緩慢降低,之後降得更快,最終又趨於緩和。
代數擬合與幾何擬合
在数据的代数分析中,“拟合”通常意味着试图找到使点的垂直(y轴)方向偏移最小的曲线(例如普通最小二乘法)。然而,对于图形和图像应用,几何拟合可以提供最佳的视觉拟合;它通常试图使到曲线的正交距离最少(例如整体最小二乘法),或以其他方式将点和曲线之间两个轴的方向上的偏移都考虑在内。由于往往需要非线性和/或迭代运算,尽管几何拟合的结果有更美观和几何上更准确的优势,但实际上较少使用。[17][18][19]
將平面曲線擬合至數據點
软件
很多统计软件包,例如R语言,以及数值分析软件,例如gnuplot、GNU科学库、MLAB、Maple、MATLAB、TK Solver 6.0、Scilab、Mathematica、GNU Octave和SciPy,都可以用命令行进行不同情景下的曲线拟合。
参见
参考文献
外部連結
Wikiwand - on
Seamless Wikipedia browsing. On steroids.