核密度估計
来自维基百科,自由的百科全书
核密度估計(英語:Kernel density estimation,縮寫:KDE)是在概率論中用來估計未知的密度函數,屬於非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基於數據集密度函數聚類算法提出修訂的核密度估計方法。

![]() | 此條目需要精通或熟悉相關主題的編者參與及協助編輯。 (2015年12月14日) |
核密度估計在估計邊界區域的時候會出現邊界效應。
在單變量核密度估計的基礎上,可以建立風險價值的預測模型。通過對核密度估計變異係數的加權處理,可以建立不同的風險價值的預測模型。
一些比較常用的核函數是: 均勻核函數 , 加入帶寬後: 。
三角核函數 , 加入帶寬後: 。
伽馬核函數 。
定義
設為從單變量分布中抽取的獨立同分布樣本,給定點有未知的概率密度,我們對估計函數的形狀感興趣,其核密度估計器是
其中是非負的核函數,帶寬為平滑參數。帶下標h的核被稱為縮放核,定義為。直覺上講,在數據允許的範圍內應當選擇儘可能小的帶寬;然而,偏差和方差之間總有所權衡。
常用的核函數有:均勻核(Uniform)、三角核(Triangular)、雙權核(Biweight)、三權核(Triweight)、Epanechnikov核、正態核(Normal)等。從均方誤差的角度來看,Epanechnikov核是最佳的[1],儘管對於前面列出的核來說,效率的損失很小[2]。由於其數學特性良好,正態核經常被使用,即,其中是標準正態密度函數。
參考文獻
Wikiwand - on
Seamless Wikipedia browsing. On steroids.