吉洪諾夫正則化

吉洪諾夫正則化得名於安德烈·尼古拉耶維奇·吉洪諾夫，是在自變量高度相關的情景下估計多元回歸模型係數的方法。^[1]它已被用於許多領域，包括計量經濟學、化學和工程學。^[2]吉洪諾夫正則化為非適定性問題的正則化中最常見的方法。在統計學中，本方法被稱為脊迴歸或嶺回歸（ridge regression）；在機器學習領域則稱為權重衰減或權值衰減（weight decay）。因為有不同的數學家獨立發現此方法，此方法又稱做吉洪諾夫－米勒法（Tikhonov–Miller method）、菲利浦斯－圖米法（Phillips–Twomey method）、受限線性反演（constrained linear inversion method），或線性正規化（linear regularization）。此方法亦和用在非線性最小二乘法（英語：Non-linear_least_squares）的萊文貝格－馬夸特方法相關。它對於緩解線性回歸中的多重共線性問題特別有用，這常見於有大量參數的模型中。^[3]總的來說，這種方法提高了參數估計的效率，但也有可容忍的偏差（見偏差-方差權衡）。^[4]

該理論於1970年由Hoerl與Kennard發表在《技術計量學》上的文章《嶺回歸：非正交問題的偏估計》及《嶺回歸：非正交問題中的應用》中首次提出。^[5]^[6]^[1] This was the result of ten years of research into the field of ridge analysis.^[7]

嶺回歸是通過創建嶺回歸估計量（RR）實現的。當線性回歸模型具有多重共線（高度相關）的自變量時，嶺回歸對於最小二乘估計的不精確性是一種可能的解決方案。這提供了更精確的嶺參數估計，因為它的方差和均方估計量通常小於先前推導的最小二乘估計量。^[8]^[2]

當求解超定問題（即 $A_{m\times n}x=b,m>n$ ）時，矩陣 $A$ 的協方差矩陣 $A^{H}A$ 奇異或接近奇異時，利用最小二乘方法求出的結果 ${\hat {x}}_{LS}=(A^{H}A)^{-1}A^{H}b$ 會出現發散或對 $x$ 不合理的逼近。為了解決這一問題，吉洪諾夫於1963年提出了利用正則化項修改最小二乘的代價函數的方法，修改後的代價函數如下：

$J(x)={\frac {1}{2}}(\lVert Ax-b\rVert _{2}^{2}+\lambda \lVert x\rVert _{2}^{2})$

式中 $\lambda \geq 0$ 稱為正則化參數^[9]，這種方法被稱為吉洪諾夫正則化。

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]