版權(quán)歸原作者所有,如有侵權(quán),請(qǐng)聯(lián)系我們

[科普中國(guó)]-等距特征映射

科學(xué)百科
原創(chuàng)
科學(xué)百科為用戶提供權(quán)威科普內(nèi)容,打造知識(shí)科普陣地
收藏

等距特征映射(Laplacian Eigenmaps)使用頻譜技術(shù)來(lái)執(zhí)行降維。該技術(shù)依賴于基本假設(shè),即數(shù)據(jù)位于高維空間中的低維流形中。該算法不能嵌入樣本點(diǎn),但是存在基于再生核Hilbert空間正則化的技術(shù)來(lái)增加這種能力。這些技術(shù)也可以應(yīng)用于其他非線性降維算法。

介紹主成分分析等傳統(tǒng)技術(shù)不考慮數(shù)據(jù)的內(nèi)在幾何。拉普拉斯算子特征映射根據(jù)數(shù)據(jù)集的鄰域信息構(gòu)建圖形。每個(gè)數(shù)據(jù)點(diǎn)用作圖上的節(jié)點(diǎn),并且節(jié)點(diǎn)之間的連接由相鄰點(diǎn)的接近度控制(使用例如k-最近鄰居算法)。由此生成的圖可以被認(rèn)為是高維空間中的低維流形的離散近似?;谠搱D最小化成本函數(shù)確保在歧管上彼此接近的點(diǎn)在低維空間中彼此靠近地映射,從而保持局部距離。拉普拉斯 - 貝爾特拉米算子在流形上的本征函數(shù)用作嵌入維數(shù),因?yàn)樵跍睾蜅l件下,該算子具有可計(jì)數(shù)的譜,該譜是流形上的平方可積函數(shù)的基礎(chǔ)(與單位圓流形上的傅里葉級(jí)數(shù)相比)。試圖將拉普拉斯特征映射置于堅(jiān)實(shí)的理論基礎(chǔ)上已經(jīng)取得了一些成功,因?yàn)樵谀承┓窍拗菩约僭O(shè)下,隨著點(diǎn)數(shù)變?yōu)闊o(wú)窮大,圖拉普拉斯矩陣已經(jīng)顯示收斂到拉普拉斯 - 貝爾特拉米算子。Laplacian Eigenmaps的Matlab代碼可以在算法中找到,Belkin的博士論文可以在俄亥俄州立大學(xué)找到。

應(yīng)用在分類應(yīng)用中,低維流形可用于建模數(shù)據(jù)類,這些數(shù)據(jù)類可以從觀察到的實(shí)例組中定義。每個(gè)觀察到的實(shí)例可以用兩個(gè)獨(dú)立因素來(lái)描述,稱為“內(nèi)容”和“風(fēng)格”,其中“內(nèi)容”是與類本質(zhì)相關(guān)的不變因子,“風(fēng)格”表示實(shí)例之間該類的變化。不幸的是,當(dāng)訓(xùn)練數(shù)據(jù)包括在風(fēng)格方面變化很大的實(shí)例時(shí),拉普拉斯特征圖可能無(wú)法產(chǎn)生感興趣類的連貫表示。在由多元序列表示的類的情況下,已經(jīng)提出結(jié)構(gòu)拉普拉斯特征映射來(lái)通過(guò)在拉普拉斯算子特征映射鄰域信息圖中添加附加約束來(lái)更好地反映該類的內(nèi)在結(jié)構(gòu)來(lái)克服該問(wèn)題1。更具體地,該圖用于編碼多變量序列的順序結(jié)構(gòu),并且如果其包含重復(fù),則用于最小化風(fēng)格變化,不同序列的數(shù)據(jù)點(diǎn)之間或甚至在序列內(nèi)的接近度。使用動(dòng)態(tài)時(shí)間扭曲,通過(guò)找到表現(xiàn)出高相似性的多變量序列的部分之間和之內(nèi)的對(duì)應(yīng)關(guān)系來(lái)檢測(cè)接近度。在基于視覺(jué)的活動(dòng)識(shí)別,面向?qū)ο蠓诸惡腿梭w3D姿勢(shì)恢復(fù)應(yīng)用上進(jìn)行的實(shí)驗(yàn)已經(jīng)證明了在處理多變量序列數(shù)據(jù)時(shí)結(jié)構(gòu)拉普拉斯特征圖的附加值。結(jié)構(gòu)拉普拉斯特征圖的擴(kuò)展,廣義拉普拉斯特征圖導(dǎo)致了流形的產(chǎn)生,其中一個(gè)維度特別代表風(fēng)格的變化。事實(shí)證明,這在跟蹤人體關(guān)節(jié)體和輪廓提取等應(yīng)用中尤為重要。

本詞條內(nèi)容貢獻(xiàn)者為:

王沛 - 副教授、副研究員 - 中國(guó)科學(xué)院工程熱物理研究所