過適

在統計學中，過適（英語：overfitting，或稱擬合過度）是指過於緊密或精確地匹配特定資料集，以致於無法良好地調適其他資料或預測未來的觀察結果的現象。^[1]過適模型指的是相較有限的資料而言，參數過多或者結構過於複雜的統計模型。^[2]發生過適時，模型的偏差小而方差大。過適的本質是訓練演算法從統計噪聲中不自覺取得了資訊並表達在了模型結構的參數當中。^[3]^:45相較用於訓練的資料總量來說，一個模型只要結構足夠複雜或參數足夠多，就總是可以完美地適應資料的。過適一般可以視為違反奧卡姆剃刀原則。

Thumb — 綠線代表過適模型，黑線代表正則化模型。雖然綠線完美的符合訓練數據，但調適得太過緊密或精確；並且與黑線相比，在新的測試資料上會有更高的錯誤率。

與過適相對應的概念是乏適（英語：underfitting，或稱：擬合不足）；它是指相較於資料而言，模型參數過少或者模型結構過於簡單，以至於無法捕捉到資料中的規律的現象。發生乏適時，模型的偏差大而方差小。

在機器學習或類神經網絡中，過適與乏適有時也被稱為「過訓練（英語：overtraining）」和「欠訓練（英語：undertraining）」。

之所以存在過適的可能，是因為選擇模型的標準和評價模型的標準是不一致的。舉例來說，選擇模型時往往是選取在訓練資料上表現最好的模型；但評價模型時則是觀察模型在訓練過程中不可見資料上的表現。當模型嘗試「記住」訓練資料而非從訓練資料中學習規律時，就可能發生過適。一般來說，當參數的自由度或模型結構的複雜度超過資料所包含資訊內容時，調適後的模型可能使用任意多的參數，這會降低或破壞模型一般化的能力。

在統計學習和機器學習中，為了避免或減輕過適現象，須要使用額外的技巧（如模型選擇、交叉驗證、提前停止、正則化、剪枝、貝葉斯資訊量準則、赤池資訊量準則或dropout）。在treatment learning中，使用最小最佳支援值（英語：minimum best support value）來避免過適。^{[來源請求]}這些方法大致可分為兩類：1. 對模型的複雜度進行懲罰，從而避免產生過於複雜的模型；2. 在驗證資料上測試模型的效果，從而模擬模型在實際工作環境的資料上的表現。

[1]

[2]

[3]

特性	過適	乏適（Underfitting）
模型複雜度	過高（參數過多/結構複雜）	過低（參數不足/結構簡單）
資料關係	學習噪聲+真實規律	未能捕捉主要規律
錯誤類型	高方差	高偏差
修改說明：表格化呈現關鍵差異，新增錯誤類型分類

過適

過適（Overfitting）技術精要

核心定義

與乏適對比

產生機制修正

關鍵技術補充

機器學習

後果

擴充閱讀

參考文獻

外部連結

Wikiwand - on