核密度估計

来自维基百科,自由的百科全书

核密度估计

核密度估計(英語:Kernel density estimation縮寫KDE)是在概率論中用來估計未知的密度函數,屬於非參數檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基於數據集密度函數聚類算法提出修訂的核密度估計方法。

100個常態分佈亂數的核密度估計

核密度估計在估計邊界區域的時候會出現邊界效應

在單變量核密度估計的基礎上,可以建立風險價值的預測模型。通過對核密度估計變異係數的加權處理,可以建立不同的風險價值的預測模型。

一些比較常用的核函數是: 均勻核函數 , 加入帶寬後:

三角核函數 , 加入帶寬後:

伽馬核函數

定義

為從單變量分布中抽取的獨立同分布樣本,給定點有未知的概率密度,我們對估計函數的形狀感興趣,其核密度估計器是

其中是非負的核函數,帶寬為平滑參數。帶下標h的核被稱為縮放核,定義為。直覺上講,在數據允許的範圍內應當選擇儘可能小的帶寬;然而,偏差和方差之間總有所權衡。

常用的核函數有:均勻核(Uniform)、三角核(Triangular)、雙權核(Biweight)、三權核(Triweight)、Epanechnikov核、正態核(Normal)等。從均方誤差的角度來看,Epanechnikov核是最佳的[1],儘管對於前面列出的核來說,效率的損失很小[2]。由於其數學特性良好,正態核經常被使用,即,其中是標準正態密度函數。

參考文獻

Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.