Remove ads
来自维基百科,自由的百科全书
聯結主義(英語:Connectionism)是認知科學領域的一種方法,期望能夠以人工神經網路(ANN)來解釋人腦、心理、精神及心靈等現象。[1]
此條目可參照英語維基百科相應條目來擴充。 |
聯結主義的中心原則是認為,心理及精神現象,可以通過簡單且經常一致的單元互相聯結的網路來描述。不同模型的聯結及單元形式可以有所不同。例如,網路的單元及聯結可以分別表示神經元及突觸,如同人腦那樣。
在大多數聯結主義模型中,網路會隨著時間而變化。聯結主義模型的一個密切且普遍的特徵是激活 。任何時候,網路中的單元都會有個激活,而該激活是表示該單元在某方面的數值。例如,如果模型中的單位是神經元,則激活可以表示神經元產生動作電位峰值的概率 。激活通常會傳遞到與其聯結的所有其他單元。擴散激活一直是神經網路模型的特徵,而該特徵在認知心理學家使用的聯結主義模型中也很常見。
迄今為止,神經網路是最常用的聯結主義模型。儘管神經網路模型種類繁多,但它們幾乎始終遵循關於思維的兩個基本原則:
大多數神經網路模型中的變化來自:
聯結主義者一致認為,與前饋神經網路(無循環的有向網路,稱為DAG)相比,循環神經網路(其中的網路聯結可以形成有向循環的有向網路)是更好的大腦模型。許多遞迴聯結主義模型也納入了動力學系統理論。許多研究者,例如聯結主義者保羅·斯莫林斯基,皆認為聯結主義模型將朝著完全地連續、高維度、非線性的動態系統方式發展。
一般而言,聯結主義者的工作不需要具有生物學上的現實意義,因此缺乏神經科學的合理性。[2][3][4][5][6][7][8]
神經網路中的權重根據某些學習規則或演算法(如赫布學習)進行調整。因此,聯結主義者為神經網路創建了許多複雜的學習過程。學習總是涉及修改聯結權重。通常,給定的數據集由神經單元的某個子集的激活向量組成時,這些公式會涉及到數學公式,以確定權重的變化。設計基於聯結主義的教學方法是近年來研究的熱點。[9]
藉由這種方式正規化學習,聯結主義者能夠使用許多工具。在聯結主義的學習方法中,有一種很常見的策略是在以權重矩陣所定義的空間中,於該空間的誤差表面與梯度下降合併。在聯結主義者模型中,所有梯度下降學習都涉及透過誤差表面對應於權重的偏導數來更改每個權重。反向傳播(BP)最早流行於1980年代,它可能是當今最普遍的聯結主義梯度下降算法。
聯結主義的思想可以追溯到一個世紀以前,在20世紀中後期之前,這些思想仍僅止於猜測。
當今流行的聯結主義方法,最初稱為分散式平行處理 (英語:Parallel distributed processing,PDP),是一種人工神經網路方法,強調了神經處理的並行性以及神經表徵的分散性,為研究人員提供了一個通用的數學框架。主要包括八個方面:
許多造成PDP發展的研究都是在1970年代完成,但是直到1980年代出版了《 分散式平行處理:認知微觀結構的探索》第一卷(基礎)及第二卷(心理和生物學模型),作者為詹姆斯·L·麥克萊蘭德 ,戴維·E·魯梅爾哈特和PDP研究小組,PDP才開始流行。 如今,這些書被認為是有著巨大影響的聯結主義著作,雖然書中未使用過「聯結主義」一詞,但仍普遍視PDP等同於聯結主義。
PDP的直接根源是研究人員的感知器理論,例如1950年代和1960年代的弗蘭克·羅森布拉特。但是,由馬文·閔斯基和西摩爾·派普特在1969年出版的《 感知器 》一書,使感知器模型變得非常不得人心。它詳述了單層(無隱藏層)感知器計算功能的局限性,甚至無法執行如異或問題 (exclusive disjunction,如判斷這是蘋果還是桔子,但不是二者皆是)這樣的簡單功能。 藉由證明多層次非線性神經網路更加強大,並可用於大量的函數陣列,PDP克服了這項難關。 [10]
許多早期的研究人員提倡聯結主義風格的模型,例如1940年代和1950年代的沃倫·麥卡洛克、沃爾特·皮茨 ( MP神經元 )、唐納德·赫布和卡爾·拉什利。麥卡洛克和皮茨展示了神經系統如何實現一階邏輯 :其經典論文《神經活動中內在思想的邏輯演算》(1943)深深影響了這方面的發展,而他們則是受到了尼古拉斯·拉舍夫斯基在1930年代的重要成果之影響。赫布對神經功能的推測做出了巨大貢獻,並提出了一種叫做赫布學習的學習原則 ,一直使用至今。拉什利(Lashley)主張採用分散式表示法,這是因為他在多年的病變實驗中,並未發現任何類似於局部印跡的東西。
雖然PDP是聯結主義的主要形式,但還有其他理論工作也應歸類為聯結主義。
許多聯結主義的原理可以追溯到心理學的早期工作,例如威廉·詹姆士。 [11]基於人腦知識的心理學理論在19世紀後期很流行。早在1869年,神經學家約翰·休格林·傑克遜就主張多層次分散式系統。在此基礎上,赫伯特·斯賓塞的《心理學原理 》第3版(1872年)和西格蒙德·弗洛伊德的《科學心理學計劃》(1895年)提出了聯結主義或原型聯結主義理論,而這些往往只是推測性的理論。到了20世紀初,愛德華·桑戴克進行了嘗試建立聯結型網路的實驗。
弗里德里希·哈耶克在1920年發表的一篇論文中,獨立構思了赫本突觸學習模型,將該模型發展成由赫本突觸網路所構成的「全球腦理論」,構成更大的地圖系統和記憶網路[來源請求]。弗蘭克·羅森布拉特在其感知器論文中引用了哈耶克的突破性成果。
聯結主義模型的另一種形式,是由語言學家雪梨·蘭姆在1960年代開發的關係網路框架。關係網路僅由語言學家使用,從未與PDP方法統一,因此,現今很少研究人員使用。
另外還有混合聯結主義模型,主要是將符號表徵與神經網路模型混合在一起。一些如孫融的研究人員提倡混合方法。
隨著聯結主義在1980年代後期變得越來越流行,一些研究人員(包括傑瑞·福多,史迪芬·平克等)對此表示反對。他們認為,隨著當時的發展,聯結主義威脅到經典的計算主義方法,並抹去認知科學和心理學領域正在取得的進步。計算主義是認知主義的一種特殊形式,認為心理活動是計算性的,也就是說,大腦透過對圖靈機之類的符號,執行純粹的形式運算來進行操作。一些研究人員認為,聯結主義的趨勢代表著聯想主義的回歸,以及對思想語言概念的放棄,而他們對此感到不以為然。相比之下,聯結主義的趨勢使得聯結主義對其它研究人員而言,變得更具吸引力。
聯結主義和計算主義不必然矛盾,但是在1980年代末和1990年代初的爭論,造成了兩種方法之間的對立。在整個爭論中,一些研究人員認為,儘管尚未就此問題完全達成共識,但是聯結主義和計算主義可完全兼容。兩種方法的差異包括:
儘管存在這些差異,一些理論家提出,聯結主義架構只是有機大腦碰巧實現符號操作系統的一種方式。這在邏輯上是可能的,因為眾所周知的事實,聯結主義模型可以實現計算主義模型中的符號操作系統,[來源請求]如果這個模型要解釋人類執行「符號操作任務」的能力,則確實必須做到這一點。但爭論的焦點在於這種符號操作是否構成了一般認知的基礎,所以這並不是對計算主義的潛在辯護。然而,舉例來說,計算性描述可能有助於對邏輯認知的高級描述。
爭論主要集中在邏輯論點上,即聯結主義網路是否能產生「這種在推理中觀察到的句法結構」。儘管聯結主義的處理過程在大腦中不太可能實現,[來源請求],但後來仍實現了這樣的句法結構,[來源請求]因此爭論仍在持續。截至2016年,神經生理學進展和一般神經網路的理解的進步,導致了很多此類的早期問題得以成功地建模,因此,關於基本認知的爭論在很大程度上取決於贊成聯結主義的神經科學家[來源請求]。然而,這些近期的發展尚未在心理學或心靈哲學等其他領域中達成共識。
近年來[何時?],動態系統流行於心靈哲學領域,為這一爭論提供了新的視角; 一些作者現在認為[哪個/哪些?],聯結主義和計算主義之間的任何分裂,更確切地說是計算主義和動態系統之間的分裂。
2014年, DeepMind的艾力克斯·格雷夫斯等人發表了一系列論文,描述了一種新型的深度神經網路結構,稱為神經圖靈機[12]。該結構能夠讀取磁帶上的符號,並將符號儲存在記憶體中。關係網路是DeepMind發行的另一個深度網路模塊,能夠創建類似客體的表徵形式,並操縱它們來回答複雜的問題。關係網路和神經圖靈機進一步證明了聯結主義和計算主義不必矛盾。
Seamless Wikipedia browsing. On steroids.
Every time you click a link to Wikipedia, Wiktionary or Wikiquote in your browser's search results, it will show the modern Wikiwand interface.
Wikiwand extension is a five stars, simple, with minimum permission required to keep your browsing private, safe and transparent.