長短期記憶
維基百科,自由的 encyclopedia
長短期記憶(英語:Long Short-Term Memory,LSTM)是一種時間循環神經網路(RNN)[1],論文首次發表於1997年。由於獨特的設計結構,LSTM適合於處理和預測時間序列中間隔和延遲非常長的重要事件。
此條目可參照外語維基百科相應條目來擴充。 |
LSTM的表現通常比時間循環神經網路及隱馬爾科夫模型(HMM)更好,比如用在不分段連續手寫辨識上[2]。2009年,用LSTM構建的人工神經網路模型贏得過ICDAR手寫辨識比賽冠軍。LSTM還普遍用於自主語音辨識,2013年運用TIMIT自然演講資料庫達成17.7%錯誤率的紀錄。作為非線性模型,LSTM可作為複雜的非線性單元用於構造更大型深度神經網路。
通常情況,一個LSTM單元由細胞單元(cell)、輸入門(input gate)、輸出門(output gate)[3]、遺忘門(forget gate)[4]組成。