《數(shù)據(jù)挖掘原理與應用 第2版 》課件 7.3聚類分析-K中心點算法_第1頁
《數(shù)據(jù)挖掘原理與應用 第2版 》課件 7.3聚類分析-K中心點算法_第2頁
《數(shù)據(jù)挖掘原理與應用 第2版 》課件 7.3聚類分析-K中心點算法_第3頁
《數(shù)據(jù)挖掘原理與應用 第2版 》課件 7.3聚類分析-K中心點算法_第4頁
《數(shù)據(jù)挖掘原理與應用 第2版 》課件 7.3聚類分析-K中心點算法_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第7章分類預測3.

K中心點算法背景K-means算法對噪聲數(shù)據(jù)點較為敏感,在前面的例子中的結果說明了這一點。包含離散點數(shù)據(jù)的質心有較大偏差,造成簇質心點的偏移,在下一輪迭代重新劃分樣本點的時候,會納入一定量不屬于該簇的樣本點,得到不準確的聚類結果。2算法K-medoids算法在計算新質心點時,并非如K-means算法中簡單地采用均值計算法,而是在每次迭代后,均從聚類的樣本點中選取質心點,而選取的標準就是當該樣本點成為新的質心點后能提高該簇的聚類質量,使得簇更加緊湊。該算法使用絕對誤差和來定義一個類簇的緊湊程度3數(shù)據(jù)分為k個簇,Ci為第i個簇,ci為簇Ci的質心選擇質心如果某樣本點成為質心點后,絕對誤差和小于原質心點的絕對誤差和,則認為該樣本點可取代原質心點,在迭代重新計算類簇質心點時,選擇絕對誤差和最小的那個樣本點成為新的質心點。4迭代處理與K-means算法一樣,K-medoids也采用歐幾里得距離來衡量樣本點到質心點的距離。終止條件是,當所有的簇的質心點都不再發(fā)生變化時,即認為聚類結束。5優(yōu)劣該算法改善了K-means算法對噪聲點敏感的問題,但由于新質心點計算規(guī)則改變,算法的時間復雜度也有所上升。6

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論