《大數(shù)據(jù)處理與智能決策》課件-11距離度量_第1頁
《大數(shù)據(jù)處理與智能決策》課件-11距離度量_第2頁
《大數(shù)據(jù)處理與智能決策》課件-11距離度量_第3頁
《大數(shù)據(jù)處理與智能決策》課件-11距離度量_第4頁
《大數(shù)據(jù)處理與智能決策》課件-11距離度量_第5頁
已閱讀5頁,還剩9頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

度量簡介度量常用于衡量個體之間差異性大小。距離度量(Distance)衡量個體在空間上存在的距離,距離越遠說明個體間的差異越大。相似度度量(Similarity)計算個體間的相似程度,相似度度量的值越小,說明個體間相似度越小,差異越大。廣泛應用于數(shù)據(jù)分析中的相關分析、數(shù)據(jù)挖掘中的聚類和分類算法等。1二維:以(21,32)和(42,51)為例三維:以(10,20,30)和(25,35,45)為例2歐幾里德距離歐幾里德距離(EuclideanDistance),歐氏距離是最常見的距離度量,衡量多維空間中各個點之間的絕對距離。公式如下:(1)計算基于各維度特征的絕對數(shù)值,所以歐氏度量需要保證各維度指標在相同的刻度級別.3標準化歐氏距離標準化歐氏距離

(StandardizedEuclideandistance)

標準化歐氏距離將各個分量進行標準化,標準化變量的數(shù)學期望為0,方差為1。那么,標準化歐氏距離的公式:(2)4明可夫斯基距離明可夫斯基距離(MinkowskiDistance),明氏距離是歐氏距離的推廣,是對多個距離度量公式的概括性的表述。公式如下:(3)這里的p值是一個變量,當p=2的時候就得到了上面的歐氏距離。5曼哈頓距離曼哈頓距離(ManhattanDistance)曼哈頓距離來源于城市區(qū)塊距離,是將多個維度上的距離進行求和后的結果,公式如下:(4)6切比雪夫距離切比雪夫距離(ChebyshevDistance)

切比雪夫距離起源于國際象棋中國王的走法。公式如下:(5)曼哈頓距離、歐氏距離和切比雪夫距離都是明可夫斯基距離在特殊條件下的應用。7馬哈拉諾比斯距離馬哈拉諾比斯距離(MahalanobisDistance)

印度統(tǒng)計學家馬哈拉諾比斯(P.C.Mahalanobis)提出的,表示數(shù)據(jù)的協(xié)方差距離。與歐式距離不同的是它考慮到各種特性之間的聯(lián)系。

例如:一條關于身高的信息會帶來一條關于體重的信息,因為兩者是有關聯(lián)的。8練習計算兩點(15,25)和(37,56)的各種距離。計算兩點(10,15,25)和(20,37,56)的各種距離。9Matlab實現(xiàn)10pdist函數(shù)調(diào)用格式:Y=pdist(X,’metric’)

說明:用‘metric’指定的方法計算X數(shù)據(jù)矩陣中對象之間的距離。

X:一個m×n的矩陣,它是由m個對象組成的數(shù)據(jù)集,每個對象的大小為n。

metric’取值如下:

‘euclidean’:歐氏距離(默認);‘seuclidean’:標準化歐氏距離;‘mahalanobis’:馬氏距離;

‘cityblock’:布洛克距離;‘minkowski’:明可夫斯基距離;

‘cosine’:夾角余弦‘correlation’:

相關距離‘spearman'

‘hamming’:漢明距離‘jaccard’:

杰卡德距離&杰卡德相似系數(shù)

‘chebychev’:Chebychev距離D=pdist2(X,Y)

D=pdist2(X,Y,distance)

D=pdist2(X,Y,'minkowski',P)

D=pdist2(X,Y,'mahalanobis',C)

D=pdist2(X,Y,distance,'Smallest',K)

D=pdist2(X,Y,distance,'Largest',K)

[D,I]=pdist2(X,Y,distance,'Smallest',K)

[D,I]=pdist2(X,Y,distance,'Largest',K)11clc;clear;

x=rand(4,3)

y=rand(1,3)

md1=pdist2(x,y,'Euclidean');md2=pdist2(x,y,'seuclidean');md3=pdist2(x,y,'mahalanobis');md4=pdist2(x,y,'cityblock');md5=pdist2(x,y,'minkowski',p);md6=pdist2(x,y,'chebychev');md7=pdist2(x,y,'cosine');md8=pdist2(x,y,'correlation');md9=pdist2(x,y,'hamming');md10=pdist2(x,y,'jaccard');

md11=pdist2(x,y,'spearman');D1=[d1,md1],D2=[d2,md2],D3=[d3,md3]D4=[d4,md4],D5=[d5,md5],D6=[d6,md6]D7=[d7,md7],D8=[d8,md8]md9,md10,md1112運行結果如下:

x=

0.5225

0.6382

0.6837

0.3972

0.5454

0.2888

0.8135

0.0440

0.0690

0.6608

0.5943

0.8384y=

0.5898

0.7848

0.4977D1=

0.2462

0.2462

0.3716

0.3716

0.8848

0.8848

0.3967

0.3967D2=

0.8355

0.8355

1.5003

1.5003

3.1915

3.1915

1.2483

1.2483D3=

439.5074

439.5074

437.5606

437.5606

438.3339

438.3339

437.2702

437.2702D4=

0.3999

0.3999

0.6410

0.6410

1.3934

1.3934

0.6021

0.6021D5=

0.2147

0.2147

0.3107

0.3107

0.7919

0.7919

0.3603

0.360313D6=

0.1860

0.1860

0.2395

0.2395

0.7409

0.7409

0.3406

0.3406D7=

0.0253

0.0253

0.0022

0.0022

0.3904

0.3904

0.0531

0.0531D8=

1.0731

1.0731

0.0066

0.0066

1.2308

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論