版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、課程名稱數(shù)據(jù)分析方法課程編號(hào)實(shí)驗(yàn)地點(diǎn)系統(tǒng)建模與仿真實(shí)驗(yàn)室SL110實(shí)驗(yàn)時(shí)間校外指導(dǎo)教師無校內(nèi)指導(dǎo)教師實(shí)驗(yàn)名稱實(shí)驗(yàn)3 距離判別與貝葉斯判別分析評(píng)閱人簽字成績實(shí)驗(yàn)數(shù)據(jù)與內(nèi)容我國山區(qū)某大型化工廠, 在廠區(qū)及鄰近地區(qū)挑選有代表性的15個(gè)大氣取樣點(diǎn),每日4次同時(shí)抽取大氣樣品, 測定其中含有的6種氣體的濃度, 前后共4天, 每個(gè)取樣點(diǎn)每種氣體實(shí)測16次, 計(jì)算每個(gè)取樣點(diǎn)每種氣體的平均濃度, 數(shù)據(jù)見表4-8。氣體數(shù)據(jù)對(duì)應(yīng)的污染地區(qū)分類見表4-8中最后一列。 現(xiàn)有兩個(gè)取自該地區(qū)的4個(gè)氣體樣本,氣體指標(biāo)見表4-8中后4行,試解決以下問題:1 判別兩類總體的協(xié)方差矩陣是否相等,然后用馬氏距離差別這4個(gè)未知?dú)怏w樣本
2、的污染類別, 并計(jì)算回代誤判率與交叉誤判率;若兩類總體服從正態(tài)分布,第一類與第二類的先驗(yàn)概率分別為7/15、8/15, 利用貝葉斯判別樣本的污染分類。2先驗(yàn)概率為多少時(shí),距離判別與貝時(shí)斯判別相同?調(diào)整先驗(yàn)概率對(duì)判別結(jié)果的影響是什么?3對(duì)第一類與第二類的先驗(yàn)概率分別為7/15、8/15,計(jì)算誤判概率。一、實(shí)驗(yàn)?zāi)康?熟練掌握MATLAB軟件進(jìn)行距離判別與貝葉斯判別的方法與步驟。2掌握判別分析的回代誤判率與交叉誤判率的編程。3掌握貝葉斯判別的誤判率的計(jì)算。二、實(shí)驗(yàn)原理1)在MATLAB中,進(jìn)行數(shù)據(jù)的判別分析命令為classify,其調(diào)用格式為:class=classify(sample,traini
3、ng,grouptype)將sample數(shù)據(jù)的每一行指定到訓(xùn)練集training的一個(gè)類中。Sample和training必須具有相同的列數(shù)。group向量包含從1到組數(shù)的正整數(shù),它指明訓(xùn)練營集中的每一行屬于哪一類。group和training必須具有相同的行數(shù)。type是可選項(xiàng),選linear表示總體為多元正態(tài)總體,選quadratic與mahalanobis。該函數(shù)返回class,它是一個(gè)與sample具有相同行數(shù)的向量。Class的每一個(gè)元素指定sample中對(duì)應(yīng)元素的分類。通過計(jì)算sample和training中每一行的馬氏距離,classify函數(shù)決定sample中的每一行屬于哪一個(gè)
4、分類。2)貝葉斯判別方法步驟第1步,驗(yàn)證兩個(gè)總體服從二元正態(tài)分布;第2步,檢驗(yàn)兩個(gè)總體的協(xié)方差矩陣相等;估計(jì)兩個(gè)總體的先驗(yàn)概率p1、p2;利用MATLAB軟件計(jì)算。3)回代誤判率設(shè)G1,G2為兩個(gè)總體,x1,x2和y1,y2是分別來自G1,G2的訓(xùn)練樣本,以全體訓(xùn)練樣本作為m+n個(gè)新樣品,逐個(gè)代入已建立的判別準(zhǔn)則中判別其歸屬,這個(gè)過程稱為回判。回判結(jié)果中若屬于G1的樣品被誤判為屬于G2的個(gè)數(shù)為N1個(gè),屬于G2的樣品被誤判為屬于G1的個(gè)數(shù)為N2個(gè),則誤判估計(jì)為:P=(N1+N2)/(m+n)誤判率的回代估計(jì)易于計(jì)算。但是,p是由建立判別函數(shù)的數(shù)據(jù)反過來用作評(píng)估準(zhǔn)則的數(shù)據(jù)而得到的。所以有偏,往往比
5、真實(shí)誤判率小。當(dāng)訓(xùn)練樣本容量較大時(shí),p可以作為真實(shí)誤判率的一種估計(jì)。4)交叉誤判率估計(jì)是每次剔除一個(gè)樣品,利用m+n-1個(gè)訓(xùn)練樣本建立判別準(zhǔn)則,再利用建立的準(zhǔn)則對(duì)刪除的樣本進(jìn)行判別。對(duì)每個(gè)樣品做如上分析,以其誤判的比例作為誤判率,步驟;從總體G1的訓(xùn)練樣本開始,剔除其中一個(gè)樣品,剩余的m-1個(gè)樣品與G2中的全部樣品建立判別函數(shù);用建立的判別函數(shù)對(duì)剔除的樣品進(jìn)行判別;重復(fù)以上步驟,直到G1中的全部樣本依次被刪除又進(jìn)行判別,其誤判的樣品個(gè)數(shù)記為N1*;對(duì)G2的樣品重復(fù)以上步驟,直到G2中的全部樣本依次被刪除又進(jìn)行判別,其誤判的樣品個(gè)數(shù)記為N2*。于是交叉誤判率估計(jì)為:p*=(N1*+N2*)/(m
6、+n)5)貝葉斯判別的有效性可以通過平均誤判率來確定。判別準(zhǔn)則的誤判率在一定程度上依賴于所考慮的各總體間的差異程度。各總體間差異越大,就越有可能建立有效的判別準(zhǔn)則。如果各總體間差異很小,做判別分析的意義不大。三、實(shí)驗(yàn)步驟 輸入數(shù)據(jù),判別兩類總體的協(xié)方差陣是否相等,用馬氏距離判斷判別污染類別,計(jì)算回代誤判率與交叉誤判率,貝葉斯判別污染分類。四、實(shí)驗(yàn)過程原始記錄(數(shù)據(jù)、圖表、計(jì)算等)1、輸入矩陣,計(jì)算協(xié)方差矩陣是否相等 A=0.0560 0.0840 0.0310 0.0380 0.0081 0.0220 0.0400 0.0550 0.1000 0.1100 0.0220 0.0073 0.06
7、90 0.0870 0.0270 0.0500 0.0890 0.0210 0.0520 0.0840 0.0210 0.0370 0.0071 0.0220 x=0.052 0.084 0.021 0.037 0.0071 0.0220.0410 0.0550 0.1100 0.1100 0.0210 0.00730.0300 0.1120 0.0720 0.1600 0.0560 0.02100.0740 0.0830 0.1050 0.1900 0.0200 1.0000 G1=A(1:4 7:8 15,:); G2=A(5:6 9:4 15,:); n1=size(G1,1); n2=
8、size(G2,1); n=n1+n2; k=2; p=6; f=p*(p+1)*(k-1)/2; d=(2*p2+3*p-1)*(1/(n1-1)+1/(n2-1)-1/(n-k)/(6*(p+1)*(k-1); p1=n1/n;p2=n2/n; m1=mean(G1);m2=mean(G2); s1=cov(G1);s2=cov(G2); s=(n1-1)*s1+(n2-1)*s2)/(n-k); M=(n-k)*log(det(s)-(n1-1)*log(det(s1)+(n2-1)*log(det(s2); T=(1-d)*MT = -44.8237 + 0.9288i C=chi2i
9、nv(0.95,f)C = 32.6706 if T for i=1:4w(1)=m1*inv(s)*x(i,:)-1/2*m1*inv(s)*m1+log(p1);w(2)=m2*inv(s)*x(i,:)-1/2*m1*inv(s)*m2+log(p2);for j=1:2if w(j)=max(w)disp(待判樣品屬于第,num2str(j),類污染);endendend待判樣品屬于第2類污染待判樣品屬于第2類污染待判樣品屬于第2類污染待判樣品屬于第2類污染3、計(jì)算回代誤判率 n11=0;n22=0; for i=1:n1w1(i,1)=m1*inv(s)*G1(i,:)-1/2*m1
10、*inv(s)*m1+log(p1);w1(i,2)=m2*inv(s)*G1(i,:)-1/2*m2*inv(s)*m2+log(p2);for j=1:2if w1(i,j)=max(w1(i,:)&j=1n11=n11+1;endendend for i=1:n2w2(i,1)=m1*inv(s)*G2(i,:)-1/2*m1*inv(s)*m1+log(p1);w2(i,2)=m2*inv(s)*G2(i,:)-1/2*m2*inv(s)*m2+log(p2);for j=1:2if w2(i,j)=max(w2(i,:)&j=2n22=n22+1;endendend poo=(n11+n22)/(n1+n2)poo =0.10004、計(jì)算交叉誤判率 N11=0;N22=0; for k=1:n1A=G1(1:k-1,k+1:n1,:);N1=length(A(:,1);M1=mean(A,1);s11=cov(A);S1=(N1-1)*s11+(n2-1)*s2)/(N1+n2-k);po1=N1/(n-1);po2=n2/(n-1);for i=1:n1w1(i,1)=M1*inv(S1)*G1(i,:)-1/2*M1*inv(S1)*M1+log(po1);w1(i,2)=m2*inv(S1)*G1(i,:)-1/2
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學(xué)大二(植物營養(yǎng)學(xué))肥料施用期末測試試題及答案
- 2025年中職(倉儲(chǔ)實(shí)務(wù)綜合實(shí)訓(xùn))管理實(shí)操試題及答案
- 2025年大學(xué)漢語言文學(xué)(文學(xué)概論基礎(chǔ))試題及答案
- 2025年高職第一學(xué)年(工商管理)企業(yè)管理綜合試題及答案
- 2026年家電維修(洗衣機(jī)檢修)試題及答案
- 2025年高職健康管理(慢病管理)試題及答案
- 《潮流玩偶服飾設(shè)計(jì)》動(dòng)漫玩具設(shè)計(jì)專業(yè)全套教學(xué)課件
- 運(yùn)營中心管理制度新
- 中國銀行大學(xué)生培訓(xùn)課件
- 養(yǎng)老院老人疾病預(yù)防措施制度
- 急驚風(fēng)中醫(yī)護(hù)理查房
- 基于視頻圖像的大型戶外場景三維重建算法:挑戰(zhàn)、創(chuàng)新與實(shí)踐
- 2025年四川省高職單招模擬試題語數(shù)外全科及答案
- 2025年江蘇事業(yè)單位教師招聘體育學(xué)科專業(yè)知識(shí)考試試卷含答案
- 合肥市軌道交通集團(tuán)有限公司招聘筆試題庫及答案2025
- 《智慧水電廠建設(shè)技術(shù)規(guī)范》
- GB/T 46275-2025中餐評(píng)價(jià)規(guī)范
- 2025年6月大學(xué)英語四級(jí)閱讀試題及答案
- 信訪工作系列知識(shí)培訓(xùn)課件
- 壓力變送器拆校課件
- 2025年高考真題分類匯編必修二 《經(jīng)濟(jì)與社會(huì)》(全國)(原卷版)
評(píng)論
0/150
提交評(píng)論