下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
如果對你有幫助,請下載使用!如果對你有幫助,請下載使用!#有關k-均值聚類算法的理解1.K-均值聚類算法的歷史:聚類分析作為一種非監(jiān)督學習方法,是機器學習領域中的一個重要的研究方向,同時,聚類技術也是數(shù)據(jù)挖掘中進行數(shù)據(jù)處理的重要分析工具和方法。1967年MacQueen首次提出了K均值聚類算法(K-meanS算法)。到目前為止用于科學和工業(yè)應用的諸多聚類算法中一種極有影響的技術。它是聚類方法中一個基本的劃分方法,常常采用誤差平方和準則函數(shù)作為聚類準則函數(shù)迄今為止,很多聚類任務都選擇該經(jīng)典算法,K-meanS算法雖然有能對大型數(shù)據(jù)集進行高效分類的優(yōu)點,但K-means算法必須事先確定類的數(shù)目k,而實際應用過程中,k值是很難確定的,并且初始聚類中心選擇得不恰當會使算法迭代次數(shù)增加,并在獲得一個局部最優(yōu)值時終止,因此在實際應用中有一定的局限性。半監(jiān)督學習是近年來機器學習領域的一個研究熱點,已經(jīng)出現(xiàn)了很多半監(jiān)督學習算法,在很多實際應用中,獲取大量的無標號樣本非常容易,而獲取有標簽的樣本通常需要出較大的代價。因而,相對大量的無標簽樣本,有標簽的樣本通常會很少。傳統(tǒng)的監(jiān)督學習只能利用少量的有標簽樣本學習,而無監(jiān)督學習只利用無標簽樣本學習。半監(jiān)督學習的優(yōu)越性則體現(xiàn)在能同時利用有標簽樣本和無標簽樣本學習。針對這種情況,引入半監(jiān)督學習的思想,對部分已知分類樣本運用圖論知識迭代確定K-means算法的K值和初始聚類中心,然后在全體樣本集上進行K-均值聚類算法。2.K-算法在遙感多光譜分類中的應用基于K-均值聚類的多光譜分類算法近年來對高光譜與多光譜進行分類去混的研究方法很多, K-均值聚類算法與光譜相似度計算算法都屬于成熟的分類算法.這類算法的聚類原則是以數(shù)據(jù)的均值作為對象集的聚類中心。均值體現(xiàn)的是數(shù)據(jù)集的整體特征,而掩蓋了數(shù)據(jù)本身的特性。無論是對高光譜還是對多光譜進行分類的方法很多,K-均值算法屬于聚類方法中一種成熟的方法。使用ENV將多光譜圖像合成一幅偽彩色圖像見圖1,圖中可以看出它由標有數(shù)字1的背景與標有數(shù)字2和3的兩種不同的氣泡及標有數(shù)字4的兩個氣泡重疊處構成。圖1原始圖像用ENV進行K-means分類,分類結果如圖2,背景被分成標有數(shù)字1的紅色與標有數(shù)字2的綠色兩類;一種氣泡被分為兩類,一類歸為標有數(shù)字2的綠色的背景類,一類為標有數(shù)字4的藍色的氣泡類;另外一種氣泡被分為標有數(shù)字3的黃色與標有數(shù)字5的淺藍色兩類。通過ENVI用K-均值(K-mean9進行分類,K-meanS算法對于兩種氣泡的分類效果都很好。圖2K-均值分類后的圖像K-算法的步驟:第一步:選K個初始聚類中心,z1,z;‘zk,其中括號內的序號為尋找聚類中心的迭代運算的次序號。聚類中心的向量值可任意設定,例如可選開始的K個模式樣本的向量值作為初始聚類中心。第二步:逐個將需分類的模式樣本{X}按最小距離準則分配給K個聚類中心中的某一個z(1)。對所有的i工j,j=1,2,…,K,如果則,X^s:其中k為迭代運算的次序號,第一次迭代k=1,Sj表示第j個聚類,其聚類中心為Zj。第三步:計算各個聚類中心的新的向量值z(k1),j=1,2,…,K,求各聚類域中所包含樣本的均值向量:其中Nj為第j個聚類域Sj中所包含的樣本個數(shù)。以均值向量作為新的聚類中心,可使如下聚類準則函數(shù)J最?。涸谶@一步中要分別計算K個聚類中的樣本均值向量,所以稱之為K-均值算法。第四步:若Zj(kJz(k1),j=1,2,…,K,則返回第二步,將模式樣本逐個重新分類,重復迭代運算;若z(k'1^z(k1),j=1,2,…,K,則
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年共青團考試試題及答案
- 2026年寒假XX市第五中學-勞動實踐基地-建設方案:種植-養(yǎng)殖-手工勞動活動設計
- 醫(yī)院醫(yī)療廢物處置設施應急物資儲備制度
- 醫(yī)院醫(yī)療廢物處理制度制度
- 2026年會計師審計知識考題集與解答手冊
- 2026年高層次領導力能力考察測試題
- 2026年AI智慧城市建設管理技能測試
- 2026年環(huán)保工程師環(huán)境評價與治理試題庫及答案
- 2026年Web前端開發(fā)工程師考試全解題庫
- 2026年法律專業(yè)學生期末考試題庫
- 床上運動及轉移技術課件
- 子宮腺肌癥術后護理
- 獨資股東協(xié)議書范本
- 2024-2025蘇教版小學數(shù)學二年級上冊期末考試測試卷及答案(共3套)
- 光伏發(fā)電項目風險
- 風力發(fā)電項目分包合同施工合同
- GB/T 8607-2024專用小麥粉
- 新版外國人永久居住身份證考試試題
- 2024年中考數(shù)學復習:瓜豆原理講解練習
- 高一歷史期末試題中國近現(xiàn)代史
- (高清版)DZT 0210-2020 礦產(chǎn)地質勘查規(guī)范 硫鐵礦
評論
0/150
提交評論