版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
度量簡介度量常用于衡量個體之間差異性大小。距離度量(Distance)衡量個體在空間上存在的距離,距離越遠說明個體間的差異越大。相似度度量(Similarity)計算個體間的相似程度,相似度度量的值越小,說明個體間相似度越小,差異越大。廣泛應用于數(shù)據(jù)分析中的相關分析、數(shù)據(jù)挖掘中的聚類和分類算法等。1二維:以(21,32)和(42,51)為例三維:以(10,20,30)和(25,35,45)為例2歐幾里德距離歐幾里德距離(EuclideanDistance),歐氏距離是最常見的距離度量,衡量多維空間中各個點之間的絕對距離。公式如下:(1)計算基于各維度特征的絕對數(shù)值,所以歐氏度量需要保證各維度指標在相同的刻度級別.3標準化歐氏距離標準化歐氏距離
(StandardizedEuclideandistance)
標準化歐氏距離將各個分量進行標準化,標準化變量的數(shù)學期望為0,方差為1。那么,標準化歐氏距離的公式:(2)4明可夫斯基距離明可夫斯基距離(MinkowskiDistance),明氏距離是歐氏距離的推廣,是對多個距離度量公式的概括性的表述。公式如下:(3)這里的p值是一個變量,當p=2的時候就得到了上面的歐氏距離。5曼哈頓距離曼哈頓距離(ManhattanDistance)曼哈頓距離來源于城市區(qū)塊距離,是將多個維度上的距離進行求和后的結果,公式如下:(4)6切比雪夫距離切比雪夫距離(ChebyshevDistance)
切比雪夫距離起源于國際象棋中國王的走法。公式如下:(5)曼哈頓距離、歐氏距離和切比雪夫距離都是明可夫斯基距離在特殊條件下的應用。7馬哈拉諾比斯距離馬哈拉諾比斯距離(MahalanobisDistance)
印度統(tǒng)計學家馬哈拉諾比斯(P.C.Mahalanobis)提出的,表示數(shù)據(jù)的協(xié)方差距離。與歐式距離不同的是它考慮到各種特性之間的聯(lián)系。
例如:一條關于身高的信息會帶來一條關于體重的信息,因為兩者是有關聯(lián)的。8練習計算兩點(15,25)和(37,56)的各種距離。計算兩點(10,15,25)和(20,37,56)的各種距離。9Matlab實現(xiàn)10pdist函數(shù)調(diào)用格式:Y=pdist(X,’metric’)
說明:用‘metric’指定的方法計算X數(shù)據(jù)矩陣中對象之間的距離。
X:一個m×n的矩陣,它是由m個對象組成的數(shù)據(jù)集,每個對象的大小為n。
metric’取值如下:
‘euclidean’:歐氏距離(默認);‘seuclidean’:標準化歐氏距離;‘mahalanobis’:馬氏距離;
‘cityblock’:布洛克距離;‘minkowski’:明可夫斯基距離;
‘cosine’:夾角余弦‘correlation’:
相關距離‘spearman'
‘hamming’:漢明距離‘jaccard’:
杰卡德距離&杰卡德相似系數(shù)
‘chebychev’:Chebychev距離D=pdist2(X,Y)
D=pdist2(X,Y,distance)
D=pdist2(X,Y,'minkowski',P)
D=pdist2(X,Y,'mahalanobis',C)
D=pdist2(X,Y,distance,'Smallest',K)
D=pdist2(X,Y,distance,'Largest',K)
[D,I]=pdist2(X,Y,distance,'Smallest',K)
[D,I]=pdist2(X,Y,distance,'Largest',K)11clc;clear;
x=rand(4,3)
y=rand(1,3)
md1=pdist2(x,y,'Euclidean');md2=pdist2(x,y,'seuclidean');md3=pdist2(x,y,'mahalanobis');md4=pdist2(x,y,'cityblock');md5=pdist2(x,y,'minkowski',p);md6=pdist2(x,y,'chebychev');md7=pdist2(x,y,'cosine');md8=pdist2(x,y,'correlation');md9=pdist2(x,y,'hamming');md10=pdist2(x,y,'jaccard');
md11=pdist2(x,y,'spearman');D1=[d1,md1],D2=[d2,md2],D3=[d3,md3]D4=[d4,md4],D5=[d5,md5],D6=[d6,md6]D7=[d7,md7],D8=[d8,md8]md9,md10,md1112運行結果如下:
x=
0.5225
0.6382
0.6837
0.3972
0.5454
0.2888
0.8135
0.0440
0.0690
0.6608
0.5943
0.8384y=
0.5898
0.7848
0.4977D1=
0.2462
0.2462
0.3716
0.3716
0.8848
0.8848
0.3967
0.3967D2=
0.8355
0.8355
1.5003
1.5003
3.1915
3.1915
1.2483
1.2483D3=
439.5074
439.5074
437.5606
437.5606
438.3339
438.3339
437.2702
437.2702D4=
0.3999
0.3999
0.6410
0.6410
1.3934
1.3934
0.6021
0.6021D5=
0.2147
0.2147
0.3107
0.3107
0.7919
0.7919
0.3603
0.360313D6=
0.1860
0.1860
0.2395
0.2395
0.7409
0.7409
0.3406
0.3406D7=
0.0253
0.0253
0.0022
0.0022
0.3904
0.3904
0.0531
0.0531D8=
1.0731
1.0731
0.0066
0.0066
1.2308
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 安全員A證考試高分題庫含完整答案詳解【奪冠】
- 手術室院感制度試題及答案
- GB/T 22184-2025谷物和豆類散存糧食溫度測定指南
- 2026福建廈門廈工重工有限公司校園招聘若干人參考考試題庫及答案解析
- 2025河北唐山市開平區(qū)公開招聘臨時公益性崗位人員備考考試試題及答案解析
- 2026山東東營河口區(qū)事業(yè)單位招聘備考考試題庫及答案解析
- 2026年臨沂蘭陵縣部分事業(yè)單位公開招聘綜合類崗位工作人員(34名)考試備考試題及答案解析
- 2026年西安交通職業(yè)學校教師招聘備考考試題庫及答案解析
- 2026年駐馬店上蔡縣事業(yè)單位引進高層次人才59名參考考試題庫及答案解析
- 2026年棗莊山亭區(qū)事業(yè)單位公開招聘初級綜合類崗位人員(55人)考試備考試題及答案解析
- 特種工安全崗前培訓課件
- 2026屆福建省三明市第一中學高三上學期12月月考歷史試題(含答案)
- (正式版)DB51∕T 3342-2025 《爐灶用合成液體燃料經(jīng)營管理規(guī)范》
- 2026北京海淀初三上學期期末語文試卷和答案
- 2025學年度人教PEP五年級英語上冊期末模擬考試試卷(含答案含聽力原文)
- 醫(yī)院醫(yī)院醫(yī)院后勤管理
- 2025年岐黃天使中醫(yī)課后試題及答案
- 肺癌術后呼吸功能鍛煉指導
- 保障供貨協(xié)議書
- 2025年中國糖尿病腎臟病基層管理指南(全文)
- 顱內(nèi)腫瘤切除術手術配合
評論
0/150
提交評論