受限玻爾茲曼機

受限玻爾茲曼機（英語：restricted Boltzmann machine, RBM）是一種可通過輸入數據集學習概率分佈的隨機生成神經網絡。RBM最初由發明者保羅·斯模稜斯基（英語：Paul Smolensky）於1986年命名為簧風琴（Harmonium）^[1]，但直到傑弗里·辛頓及其合作者在2000年代中葉發明快速學習算法後，受限玻茲曼機才變得知名。受限玻茲曼機在降維^[2]、分類^[3]、協同過濾^[4]、特徵學習^[5]和主題建模^[6]中得到了應用。根據任務的不同，受限玻茲曼機可以使用監督學習或無監督學習的方法進行訓練。

正如名字所提示的那樣，受限玻茲曼機是一種玻茲曼機的變體，但限定模型必須為二分圖。模型中包含對應輸入參數的輸入（可見）單元和對應訓練結果的隱單元，圖中的每條邊必須連接一個可見單元和一個隱單元。（與此相對，「無限制」玻茲曼機包含隱單元間的邊，使之成為循環神經網絡。）這一限定使得相比一般玻茲曼機更高效的訓練算法成為可能，特別是基於梯度的對比分歧（contrastive divergence）算法^[7]。

受限玻茲曼機也可被用於深度學習網絡。具體地，深度信念網絡可使用多個RBM堆疊而成，並可使用梯度下降法和反向傳播算法進行調優^[8]。

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

受限玻爾茲曼機

結構

與其他模型的關係

訓練算法

參見

參考資料

外部連結

Wikiwand - on