第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第1頁(yè)
第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第2頁(yè)
第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第3頁(yè)
第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第4頁(yè)
第六章數(shù)據(jù)分析梅長(zhǎng)林習(xí)題答案_第5頁(yè)
已閱讀5頁(yè),還剩10頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

/第六章習(xí)題習(xí)題6.3解:用SAS的procfastclus將各個(gè)國(guó)家聚為三類,即如果如下:聚類散點(diǎn)圖如下:(2)聚為四類結(jié)果散點(diǎn)圖如下:習(xí)題6.4解:通過(guò)procfastclus聚為三類結(jié)果如下:tc"ClusterListing"\fC\l2ClusterListingObsyearsClusterDistancefromSeed119781474.3219791433.2319801362.1419811288.9519821260.0619831218.3719841141.781985160.4851919861169.31019871350.21119881730.51219891890.31319902985.01419912723.81519922249.21619932484.617199421475.118199531086.41919963394.5201997396.19752119983471.92219993958.6聚類結(jié)果散點(diǎn)圖:習(xí)題6.6解:(1)在proccluster過(guò)程中取選項(xiàng)“method=single”,用最短距離法得到的聚類結(jié)果如下所示:tc"Cluster"\fC\l1tc"ClusterHistory"\fC\l2ClusterHistoryNCLClustersJoinedFREQMin

DistT

i

e10NDa21T9FrI21T8CL9S317ECL10326CL8P435CL7G444CL5Du55T3CL4CL6952CL3H108T1CL2Fi118上述聚類過(guò)程為:首先在最短距離為1的時(shí)候,將挪威語(yǔ)和丹麥語(yǔ)聚為一類,得新類CL10={丹麥語(yǔ),挪威語(yǔ)},其中包含2個(gè)樣本,這是全部類被分為10類;其次,將法語(yǔ)和意大利語(yǔ)聚為一類,CL9={法語(yǔ),意大利語(yǔ)};其中包含兩個(gè)樣本,這是全部樣本被分為9類,接著在最短距離為2的時(shí)候,波蘭語(yǔ)被分到CL9當(dāng)中,也即CL8={CL9,波蘭語(yǔ)},然后英語(yǔ)被分到CL10中,的新類CL7={CL10,英語(yǔ)}={丹麥語(yǔ),挪威語(yǔ),英語(yǔ)},如此等等,最后在最短距離為8的時(shí)候,所有類并入CL2中,這樣全部樣品歸為一類,系統(tǒng)聚類結(jié)束。由譜系聚類法能夠細(xì)致的看出由小到大的聚類過(guò)程,由合并時(shí)的距離水平可以看出樣本之間的親疏程度。然后利用proctree過(guò)程可以畫(huà)出最短距離譜系圖如下所示:其中以E、N、Da、Du、G、Fr、S、I、P、H、Fi分別代表英語(yǔ)、挪威語(yǔ)、丹麥語(yǔ)、荷蘭語(yǔ)、德語(yǔ)、法語(yǔ)、西班牙語(yǔ)、意大利語(yǔ)、波蘭語(yǔ)、匈牙利語(yǔ)、芬蘭語(yǔ)等11中語(yǔ)言。(2)最長(zhǎng)距離法。在proccluster過(guò)程中選取”method=conplete”,得到最長(zhǎng)距離法聚類過(guò)程見(jiàn)下表:tc"Cluster"\fC\l1tc"ClusterHistory"\fC\l2ClusterHistoryNCLClustersJoinedFREQMax

DistT

i

e10NDa21T9FrI21T8ECL1032T7CL9S326DuG25T5CL7P454CL8CL657T3HFi282CL4CL3791CL2CL51110與最短距離法聚類過(guò)程相比,倒數(shù)第六步兩種方法合并次序和合并距離水平有所不同。(3)類平均距離法。在proccluster過(guò)程中選取”method=average”,得到最長(zhǎng)距離法聚類過(guò)程見(jiàn)下表:tc"Cluster"\fC\l1tc"ClusterHistory"\fC\l2ClusterHistoryNCLClustersJoinedFREQAver

DistT

i

e10NDa21T9FrI21T8CL9S31.57ECL10326CL8P445CL7G45T4CL5Du55.753CL4CL696.92HFi281CL3CL2119.0556與最短距離法聚類過(guò)程相比,倒數(shù)第二步兩種方法合并次序不同,在最長(zhǎng)距離聚類中時(shí)將匈牙利語(yǔ)和芬蘭語(yǔ)先合并為一類在和CL3聚為一類。最長(zhǎng)距離聚類法譜系圖如下所示:(4)重心法。在proccluster過(guò)程中選取”method=centroid”,得到最長(zhǎng)距離法聚類過(guò)程見(jiàn)下表:tc"Cluster"\fC\l1tc"ClusterHistory"\fC\l2ClusterHistoryNCLClustersJoinedFREQSquared

Cent

DistT

i

e10NDa21T9FrI21T8CL9S31.257ECL1031.756CL8P43.55565CL7G44.4444T4CL5CL684.06253CL4Du95.35942CL3Fi106.56791CL2H116.22重心法與前述幾種方法在類的合并以及距離水平都有所差異。其譜系聚類結(jié)果如下所示:2.習(xí)題6.7解:(1)最長(zhǎng)距離法。在proccluster過(guò)程中選取”method=complete”,得到最長(zhǎng)距離法聚類過(guò)程見(jiàn)下表:tc"ClusterHistory"\fC\l2ClusterHistoryNCLClustersJoinedFREQMax

Dist1519891990213.91419992000217.061319851986218.831219911992229.0221119961997231.48910CL131987347.6069CL15CL12453.2448CL111998368.771995CL8481.2536CL1019884118.565CL919935123.184CL7CL146144.0931994CL47199.952CL6CL59306.91CL2CL316672.8然后得到聚為三類的結(jié)果:第一類:1989、1990、1992、1991、1993第二類:1999、2000、1996、1997、1998、1995、1994第三類:1985、1992、1988tc"Print"\fC\l1tc"數(shù)據(jù)集WORK.C2"\fC\l2ObsyearsCLUSTERCLUSNAME119891CL5219901CL5319992CL3420002CL3519853CL6619863CL6719911CL5819921CL5919962CL31019972CL31119873CL61219982CL31319952CL31419883CL61519931CL51619942CL3譜系聚類結(jié)果圖:(2)類平均距離法。在proccluster過(guò)程中選取”method=average”,得到最長(zhǎng)距離法聚類過(guò)程見(jiàn)下表:、tc"ClusterHistory"\fC\l2ClusterHistoryNCLClustersJoinedFREQAver

DistT

i

e1519891990213.91419992000217.061319851986218.8312CL151991323.5081119961997231.48910CL131987338.3389CL121992442.1598CL111998356.31771995CL8473.32761988CL9589.9895CL7CL146110.94CL619936122.2631994CL57171.242CL10CL49185.581CL2CL316466.34譜系聚類結(jié)果圖如下所示:然后得到聚為三類的結(jié)果:第一類:1989、1990、1992、1988、1991、1993第二類:1999、2000、1996、1997、1998、1995、1994第三類:1986、1987、1985tc"Print"\fC\l1tc"數(shù)據(jù)集WORK.C3"\fC\l2ObsyearsCLUSTERCLUSNAME119891CL4219901CL4319992CL3420002CL3519853CL10619863CL10719911CL4819962CL3919972CL31019873CL101119921CL41219982CL31319952CL31419881CL41519931CL41619942CL3(3)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化之后,得到聚為三類的結(jié)果分別為:最長(zhǎng)距離法:聚為三類的結(jié)果為:第一類:1999、2000、1996、1997、1998、1994第二類結(jié)果:1989、1990、1991、1992、1993第三類結(jié)果為:1895、1986、1987、1988tc"Print"\fC\l1tc"數(shù)據(jù)集WORK.C33"\fC\l2ObsyearsCLUSTERCLUSNAME119991CL3220001CL3319892CL4419902CL4519853CL6619863CL6719961CL3819971CL3919912CL41019922CL41119873CL61219981CL31319951CL31419883CL61519932CL41619941CL3類平均距離法聚聚為三類的結(jié)果:第一類:1999、2000、1996、1997、1994、1995、1998、第二類:1989、1990、1991、1992、1993第三類:1985、1986、1987、1988tc"Print"\fC\l1tc"數(shù)據(jù)集WORK.C4"\fC\l2ObsyearsCLUSTERCLUSNAME119991CL3220001CL3319892CL4419902CL4519853CL5619863CL5719912CL4819961CL3919971CL31019873CL51119922CL41219981CL31319951CL31419883CL51519932CL41619941CL3觀察聚類結(jié)果發(fā)現(xiàn),在數(shù)據(jù)標(biāo)準(zhǔn)化之前不同聚類方法得到的結(jié)果不僅盡相同,而且在標(biāo)準(zhǔn)化前后聚類結(jié)果也是不要一樣的,但是在數(shù)據(jù)標(biāo)準(zhǔn)化之后,兩種不同的聚類方法聚類結(jié)果完全相同。3.習(xí)題6.8解:首先從相關(guān)系數(shù)矩陣出發(fā),通過(guò)變換得到距離矩陣。令,從出發(fā),得到變換之后的距離矩陣:(1)最短距離聚類法。在proccluster過(guò)程中取選項(xiàng)“method=single”,用最短距離法得到的聚類結(jié)果如下所示:tc"ClusterHistory"\fC\l2ClusterHistoryNCLClustersJoinedFREQMin

DistT

i

e4x2x320.58253x1CL430.62092x4x520.7081CL3CL250.8394譜系聚類結(jié)果圖:(2))最長(zhǎng)距離法。在proccluster過(guò)程中選取”method=conplete”,得到最長(zhǎng)距離法聚類過(guò)程見(jiàn)下表:tc"ClusterHistory"\fC\l2ClusterHistoryNCLClustersJoinedFREQMax

DistT

i

e4x2x320.58253x1CL430.69742x4x520.7081CL3CL251.03

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論