AI tools

資料增強

来自维基百科，自由的百科全书

資料增強（英語：Data augmentation）是一種統計技術，允許從不完整資料中進行最大似然估計^[1]^[2]。資料增強在貝葉斯推斷中有重要應用^[3]，並且在機器學習中廣泛使用，通過訓練模型使用已有資料的幾個略微修改的副本在訓練機器學習模型時減少過適^[4]。

圖像分類中的資料增強

在20世紀90年代中期，當卷積神經網路變得更加複雜時，資料量不足成為一個問題，特別是考慮到需要留出一部分資料用於後續測試。為了解決這個問題，有研究提議使用仿射變換擾動現有資料，以建立帶有相同標籤的新範例^[5]。隨後，2003年引入了所謂的彈性失真（英語：Elastic deformation）^[6]，到了2010年代，這些技術被廣泛採用^[7]。資料增強可以提升卷積神經網路的效能，並且作為對抗卷積神經網路分析攻擊的一種對策^[8]。

資料增強在圖像分類中已成為一種基礎工具，用來豐富訓練資料集的多樣性，以提升模型的泛化能力和效能。幾何變換、顏色空間調整和雜訊注入等是資料增強在圖像分類中的常用工具^[9]。

參見

資料分析中的過取樣和欠取樣（英語：Oversampling and undersampling in data analysis）
生成對抗網路
變分自編碼器
卷積神經網路
正則化 (數學)

參考來源

Loading content...

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.