版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
流形學習流行學習NonlinearMethodsIsomap,laplacianeigenmap(LE)locallinearembedding(LLE)LinearMethodsIsometricProjection,LPP,NPE,
UDP,2DLPP,tensorLPP,tensorNPE假定:數(shù)據(jù)的內在特征都嵌入在低維非線性流形面上幾種非線性流形學習算法
局部線性嵌入(LLE).S.T.RoweisandL.K.Saul.Nonlineardimensionalityreductionbylocallylinearembedding.Science,vol.290,pp.2323--2326,2000.
等距映射(Isomap).J.B.Tenenbaum,V.deSilva,andJ.C.Langford.Aglobalgeometricframeworkfornonlineardimensionalityreduction.Science,vol.290,pp.2319--2323,2000.
拉普拉斯特征映射(LaplacianEigenmap).M.Belkin,P.Niyogi,LaplacianEigenmapsforDimensionalityReductionandDataRepresentation.NeuralComputation,
Vol.15,Issue6,pp.1373–1396,2003.
LLE(locallylinearembedding)LLE算法的主要思想:對于一組具有嵌套流形的數(shù)據(jù)集,在嵌套空間與內在低維空間局部鄰域間的點的關系應該保持不變。即在嵌套空間每個采樣點可以用它的近鄰點線性表示,在低維空間中保持每個鄰域中的權值不變,重構原數(shù)據(jù)點,使重構誤差最小.LLE算法示意圖LLE(locallylinearembeddingLLE(locallylinearembedding)2.算法步驟:1)設D維空間中有N個數(shù)據(jù)屬于同一流形,記做:Xi=〔xi1,xi2,...,xiD〕,i=1~N。假設有足夠的數(shù)據(jù)點,并且認為空間中的每一個數(shù)據(jù)點可以用它的K個近鄰線性表示。求近鄰點,一般采用K近鄰或者鄰域.2)計算權值Wij,代價函數(shù)為:,(1)并且權值要滿足兩個約束條件:<1>每一個數(shù)據(jù)點Xi都只能由它的鄰近點來表示,若Xj不是近鄰點,則Wij=0;<2>權值矩陣的每一行的和為1,即:。這樣,求最優(yōu)權值就是對于公式(1)在兩個約束條件下求解最小二乘問題。權值體現(xiàn)了數(shù)據(jù)間內在的幾何關系。
LLE(locallylinearembedding)3)保持權值不變,在低維空間d(d<<D)中對原數(shù)據(jù)點重構。設低維空間的數(shù)據(jù)點為Yi,可以通過求最小的代價函數(shù)
最優(yōu)解需要滿足下面的約束條件:
條件1消除了Y向量平移不變的影響;條件2避免產生退化解。LLE
由Rayleittz-Riz定理,低維嵌入是M的最小的第2到第d+1個特征向量.去掉最小特征值0對應的特征向量。LLE算法的優(yōu)點LLE算法可以學習任意維數(shù)的低維流形.LLE算法中的待定參數(shù)很少,K和d.LLE算法中每個點的近鄰權值在平移,旋轉,伸縮變換下是保持不變的.LLE算法有解析的整體最優(yōu)解,不需迭代.LLE算法歸結為稀疏矩陣特征值計算,計算復雜度相對較小,容易執(zhí)行.LLE算法的缺點LLE算法要求所學習的流形只能是不閉合的且在局部是線性的.LLE算法要求樣本在流形上是稠密采樣的.LLE算法中的參數(shù)K,d有過多的選擇.LLE算法對樣本中的噪音很敏感.對于新樣本的映射需要重新計算。RReferencesS.T.RoweisandL.K.Saul.Nonlineardimensionalityreductionbylocallylinearembedding.Science,vol.290,pp.2323--2326,2000.OlgaKouropteva,OlegOkunandMattiPietikainen.Selectionoftheoptimalparametervalueforthelocallylinearembeddingalgorithm,PatternRecognitionLetetrs,2006,968-979-------多維尺度變換(MDS)MDS是一種非監(jiān)督的維數(shù)約簡方法.MDS的基本思想:約簡后低維空間中任意兩點間的距離應該與它們在原始空間中的距離相同.MDS的求解:通過適當定義準則函數(shù)來體現(xiàn)在低維空間中對高維距離的重建誤差,對準則函數(shù)用梯度下降法求解,對于某些特殊的距離可以推導出解析解法.ISOMAP建立在多維尺度變換(MDS)的基礎上,力求保持數(shù)據(jù)點的內在幾何性質,即保持兩點間的測地距離.等距映射(Isomap)的基本思想ISOMAP1高維數(shù)據(jù)所在的低維流形與歐氏空間的一個子集是整體等距的.2與數(shù)據(jù)所在的流形等距的歐氏空間的子集是一個凸集.Isomap的前提假設估計兩點間的測地距離:
1離得很近的點間的測地距離用歐氏距離代替.2離得較遠的點間的測地距離用最短路徑來逼近.Isomap算法的核心ISOMAP測地距離估計ISOMAPIsomap算法1計算每個點的近鄰點(用K近鄰或鄰域).2在樣本集上定義一個賦權無向圖如果和互為近鄰點,則邊的權值為3計算圖中兩點間的最短距離,記所得的距離矩陣為4用MDS求低維嵌入流形,???代價函數(shù):令低維嵌入是
的第2小到第d+1小的特征值所對應的特征向量.(推導)Isomap算法的特點Isomap是非線性的,適用于學習內部平坦的低維流形,不適于學習有較大內在曲率的流形.Isomap算法中有兩個待定參數(shù)K,d.Isomap算法計算圖上兩點間的最短距離,執(zhí)行起來比較慢.RISOMAP拉普拉斯特征映射(LaplacianEigenmap)
基本思想:在高維空間中離得很近的點投影到低維空間中的象也應該離得很近.通過使用兩點間的加權距離作為損失函數(shù),可求得相應的降維結果。待優(yōu)化的目標函數(shù):
s.t.(矩陣D提供了對圖的頂點的一種自然測度,Dii越大,說明這個頂點越重要。)求解方法:求解圖拉普拉斯算子的廣義特征值問題.示意圖LaplacianEigenmap算法1從樣本點構建一個近鄰圖,圖的頂點為樣本點,離得很近兩點用邊相連(K近鄰或鄰域).2給每條邊賦予權值如果第
個點和第j個點不相連,權值為0,否則(a);(b)LaplacianEigenmap算法3計算圖拉普拉斯算子的廣義特征向量,求得低維嵌入.優(yōu)化問題可化簡為:令D為對角矩陣L是近鄰圖上的拉普拉斯算子,求解y轉為求廣義特征值問題
最小特征值對應的特征向量。(由Rayleittz-Riz定理)
LaplacianEigenmap算法的特點
算法是局部的非線性方法.
算法與譜圖理論有很緊密的聯(lián)系.
算法中有兩個參數(shù)k,d.
算法通過求解稀疏矩陣的特征值問題解析地求出整體最優(yōu)解.
算法使原空間中離得很近的點在低維空間也離得很近,可以用于聚類.
LLE,Isomap,LaplacianEigenmap有效的原因1它們都是非參數(shù)的方法,不需要對流形的很多的參數(shù)假設.2它們是非線性的方法,都基于流形的內在幾何結構,更能體現(xiàn)現(xiàn)實中數(shù)據(jù)的本質.3它們的求解簡單,都轉化為求解特征值問題,而不需要用迭代算法.流形學習問題探討11對嵌入映射或者低維流形作出某種特定的假設,或者以保持高維數(shù)據(jù)的某種性質不變?yōu)槟繕?2將問題轉化為求解優(yōu)化問題.3提供有效的算法.
為流形學習提供更為堅實和易于接受的認知基礎.
如何確定低維目標空間的維數(shù).
當采樣數(shù)據(jù)很稀疏時,怎樣進行有效的學習.
將統(tǒng)計學習理論引入流形學習對其泛化性能進行研究.流形學習問題探討2流形學習問題探討3
流形學習作為一種非線性降維或數(shù)據(jù)可視化的方法已經在圖像處理如人臉圖像,手寫數(shù)字圖像,語言處理方面取得了較好的效果.
將其作為一種監(jiān)督的學習方法用于模式識別,雖然有研究者涉足,但是目前在這方面的工作還很有限.幾種線性流行學方法LPPX.He,S.Yan,Y.Hu,P.Niyogi,andH.Zhang.FaceRecognitionUsingLaplacianfaces.IEEETrans.PAMI,27(3):328-340,2005.NPEX.He,D.Cai,S.Yan,andH.Zhang.NeighborhoodPreservingEmbedding.ProceedingoftheTenthIEEEInternationalConferenceonComputerVision,2005IsomatricProjectionD.Cai,X.He,andJ.Han.IsometricProjection.AssociationfortheAdvancementofArtificialIntelligence,2007局部保持投影
LocalityPreservingProjection(LPP)局部保持投影目標函數(shù):
其中是一個權重矩陣,定義如下:通過簡單的推算得到:
局部保持投影
這里
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年宣威市復興街道辦事處公開招聘公益性崗位工作人員(3人)備考核心試題附答案解析
- 2025上海生物技術學院招聘生物技術學院課題組臨床前研究助理崗位1人考試重點試題及答案解析
- 2025江西省建科工程咨詢有限公司招聘1人考試重點題庫及答案解析
- 2025江西吉安市農業(yè)農村發(fā)展集團有限公司及下屬子公司第二批招聘9人備考考試試題及答案解析
- 2025北京大學物理學院招聘1名勞動合同制工作人員備考核心試題附答案解析
- 2025河北保定市博物館招聘講解員2名考試重點試題及答案解析
- 2026事業(yè)單位招聘參考考試試題及答案解析
- 2025四川自貢市第一人民醫(yī)院招聘醫(yī)療輔助崗人員11人參考筆試題庫附答案解析
- 2025四川九州電子科技股份有限公司招聘NPI崗1人備考筆試題庫及答案解析
- 2026天津河北區(qū)部分事業(yè)單位招聘25人備考核心試題附答案解析
- 中西醫(yī)結合糖尿病足分級治療策略
- 垃圾焚燒發(fā)電廠安全事故
- 【MOOC】微處理器與嵌入式系統(tǒng)設計-電子科技大學 中國大學慕課MOOC答案
- 汽車吊吊裝施工方案方案
- GB/T 4340.1-2024金屬材料維氏硬度試驗第1部分:試驗方法
- 速食食品行業(yè)相關投資計劃提議
- 安全操作規(guī)程管理制度(完整版合同模板)
- 賈玲春晚搞笑公司年會小品《真假老師》臺詞劇本完整版
- 涉詐風險賬戶審查表
- 測繪資質分級標準規(guī)定(2014版)
- 家譜序言經典范文(12篇)
評論
0/150
提交評論