版權(quán)歸原作者所有,如有侵權(quán),請聯(lián)系我們

[科普中國]-核密度估計

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識科普陣地
收藏

核密度估計(kernel density estimation)是在概率論中用來估計未知的密度函數(shù),屬于非參數(shù)檢驗方法之一,由Rosenblatt (1955)和Emanuel Parzen(1962)提出,又名Parzen窗(Parzen window)。Ruppert和Cline基于數(shù)據(jù)集密度函數(shù)聚類算法提出修訂的核密度估計方法。

簡介核密度估計在估計邊界區(qū)域的時候會出現(xiàn)邊界效應(yīng)。

在單變量核密度估計的基礎(chǔ)上,可以建立風(fēng)險價值的預(yù)測模型。通過對核密度估計變異系數(shù)的加權(quán)處理,可以建立不同的風(fēng)險價值的預(yù)測模型。

由給定樣本點集合求解隨機變量的分布密度函數(shù)問題是概率統(tǒng)計學(xué)的基本問題之一。解決這一問題的方法包括參數(shù)估計和非參數(shù)估計。參數(shù)估計又可分為參數(shù)回歸分析和參數(shù)判別分析。在參數(shù)回歸分析中,人們假定數(shù)據(jù)分布符合某種特定的性態(tài),如線性、可化線性或指數(shù)性態(tài)等,然后在目標函數(shù)族中尋找特定的解,即確定回歸模型中的未知參數(shù)。在參數(shù)判別分析中,人們需要假定作為判別依據(jù)的、隨機取值的數(shù)據(jù)樣本在各個可能的類別中都服從特定的分布。經(jīng)驗和理論說明,參數(shù)模型的這種基本假定與實際的物理模型之間常常存在較大的差距,這些方法并非總能取得令人滿意的結(jié)果。由于上述缺陷,Rosenblatt和Parzen提出了非參數(shù)估計方法,即核密度估計方法。

由于核密度估計方法不利用有關(guān)數(shù)據(jù)分布的先驗知識,對數(shù)據(jù)分布不附加任何假定,是一種從數(shù)據(jù)樣本本身出發(fā)研究數(shù)據(jù)分布特征的方法,因而,在統(tǒng)計學(xué)理論和應(yīng)用領(lǐng)域均受到高度的重視。

一些比較常用的核函數(shù)均勻核函數(shù) k(x)=1/2,-1≤x≤1 加入帶寬h后: kh(x)=1/(2h),-h≤x≤h

三角核函數(shù) k(x)=1-|x|,-1≤x≤1 加入帶寬h后: kh(x)=(h-|x|)/h2,-h≤x≤h

伽馬核函數(shù) kxi(x)=(xα-1e-xα/xi)/[(xi/α)α.Γ(α)]

高斯核函數(shù)K(x,xc)=exp[-||x-xc||2/(2*σ)2],其中xc為核函數(shù)中心,σ為函數(shù)的寬度參數(shù)。1

本詞條內(nèi)容貢獻者為:

孫和軍 - 副教授 - 南京理工大學(xué)