一种从先验分布和经验数据更新模型后验概率的统计推断方法 来自维基百科,自由的百科全书
贝叶斯推断(英語:Bayesian inference)是推論統計的一种方法。这种方法使用贝叶斯定理,在有更多證據及信息時,更新特定假设的概率。贝叶斯推断是统计学(特別是数理统计学)中很重要的技巧之一。贝叶斯更新(Bayesian updating)在序列分析中格外的重要。贝叶斯推断應用在許多的領域中,包括科學、工程學、哲學、醫學、體育運動、法律等。在决策论的哲學中,贝叶斯推断和主觀概率有密切關係,常常稱為贝叶斯概率。
![]() | 此條目需要精通或熟悉相关主题的编者参与及协助编辑。 (2017年2月2日) |
贝叶斯定理是由統計學家托馬斯·貝葉斯(Thomas Bayes)根據許多特例推導而成,後來被許多研究者推廣為一普遍的定理[1]。
贝叶斯推断將后验概率(考慮相關證據或數據後,某一事件的條件機率)作为先验概率(考慮相關證據或數據前,某一事件不確定性的機率)和似然函数(由观测数据的统计模型(概率模型)推導而得)这两个前因导出的結果。贝叶斯推断根據贝叶斯定理計算后验概率:
其中
針對不同的數值,只有和(都在分子)會影響的數值。假說的后验概率和其先验概率(固有似然率)和新產生的似然率(假說和新得到證據的相容性)乘積成正比。
贝叶斯定理也可以寫成下式:
其中係數可以解釋成對機率的影響。
贝叶斯推断最關鍵的點是可以利用贝叶斯定理結合新的證據及以前的先驗機率,來得到新的機率(這和频率学派推断相反,頻率論推論只考慮證據,不考慮先驗機率)。
而且贝叶斯推断可以迭代使用:在觀察一些證據後得到的後設機率可以當作新的先驗機率,再根據新的證據得到新的後設機率。因此贝叶斯定理可以應用在許多不同的證據上,不論這些證據是一起出現或是不同時出現都可以,這個程序稱為贝叶斯更新(Bayesian updating)。
若用文字表示,即為「後驗和先驗及似然率的乘積成正比」,有時也會寫成「後驗 = 先驗 × 似然率,在有證據的情形下」。
贝叶斯推断有在人工智慧及專家系統上應用。自1950年代後期開始,贝叶斯推断技巧就是電腦模式识别技術中的基礎。現在也越來越多將贝叶斯推断和以模擬為基礎的蒙地卡羅方法合併使用的應用,因為一些模雜的模型無法用贝叶斯分析得到解析解,因圖模式結構可以配合一些快速的模擬方式(例如吉布斯抽樣或是其他Metropolis–Hastings演算法)[2]。因為上述理由,贝叶斯推断在系统发生学研究社群中來越受到重視,許多的應用可以用同時估測许多人口和进化参数。
「贝叶斯」是指托马斯·贝叶斯(1702–1761),他證明了一個特例(現在知道是贝叶斯定理的特例),不過皮埃尔-西蒙·拉普拉斯(1749–1827)推導了此定理的一般版本,應用在天體力學、醫療統計學、可靠度及法学上[3]。早期的贝叶斯推断是用拉普拉斯不充分理由原則所得的均勻先驗,稱為逆向機率(因為是由觀測值倒推參數的归纳推理,或是從結果倒推到原因[4])。在1920年代以後,逆向機率很大程度的被另一群稱為頻率論統計的方式取代[4]。
二十世紀時,拉普拉斯的概念往下分支為二派,開始出現主觀贝叶斯方法及客觀贝叶斯方法。客觀贝叶斯方法(或是不提供信息的贝叶斯方法)中,統計分析只依照假設的模型、分析的資料[5]以及給定先驗分布的方式(不同的客觀贝叶斯方法會有不同給定先驗分布的方式)。主觀贝叶斯方法(或是提供信息的贝叶斯方法)中,先驗的規格依信念(也是分析希望要呈現的主張)而定,信念可以由專家整理資訊後總結產生,也可以根據以往的研究等。
1980年代發現了马尔科夫蒙特卡洛方法,讓贝叶斯方法的研究及應用有大幅的發展,除去了許多運算上的問題,也有越來越多人願意參與非標準的複雜問題[6]。不過雖然贝叶斯方法的研究仍在成長,大部份大學本科的教學仍是以頻率論統計為基礎 [7]。不過贝叶斯方法也廣為許多領域接受及應用,例如在机器学习的領域中[8]。
Seamless Wikipedia browsing. On steroids.