版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《統(tǒng)計(jì)分析與SPSS的應(yīng)用(第五版)》(薛薇)
課后練習(xí)答案
第10章SPSS的聚類分析
1、根據(jù)“高校科研研究裕儼數(shù)據(jù),利用層次聚類分析對(duì)各省市的高??蒲星闆r進(jìn)行層次聚
類分析。要求:
1)根據(jù)凝聚狀態(tài)表利用碎石圖對(duì)聚類類數(shù)進(jìn)行研究。
2)繪制聚類樹(shù)形圖,說(shuō)明哪些省市聚在一起。
3)繪制各類的科研指標(biāo)的均值對(duì)比圖。
4)利用方差分析方法分析各類在哪些科研指標(biāo)上存在顯著差異。
采用歐氏距離,組間平均鏈鎖法
利用凝聚狀態(tài)表中的組間距離和對(duì)應(yīng)的組數(shù),回歸散點(diǎn)圖,得到碎石圖。大約聚成4類。
步驟:分析)分類分系統(tǒng)聚類分按如下方式設(shè)置……
境系正聚菱分析色素蝮類分圻:娩計(jì)
亶量(V):statistics…]
e投入人年數(shù)[x2j
□正似值點(diǎn)還(E)
,投入高級(jí)職抬的人.
夕投入科研事業(yè)贊
方法(M).「聚類成員—
,課題總數(shù)[x5]
保存受
夕母哥致[6]◎無(wú)⑼
標(biāo)注個(gè)案(S):一單一方案?)
I8省市名稱口1]
照類。方案阻圍(R)
◎個(gè)案位)。變量(旦)最小蟹類數(shù)
輸出隈大思類數(shù)Q
qStatistics,圖&)
,確定,布n@O(RTJ,肺肖,幫助j[繼續(xù)"取消]幫助
結(jié)果:
凝聚計(jì)劃
組合的集群首次出現(xiàn)階段集群
階段集群1集群2系數(shù)集群1集群2一個(gè)階段
12630328.189002
2
2629638.29510
7
1053.42305
320250
121209.922015
440
5
82003
1505.0356
68161760.170509
724261831.9260210
87111929.8910011
9582302.0240622
1024312487.2097022
11272709.8870816
1222282897.1060019
136232916.5510017
1410193280.7520025
154213491.5854021
16234229.37511021
176134612.42313020
189185377.2530025
1914225622.41501224
206155933.51817023
21246827.276161526
225247930.76591024
236279475.49820026
2451414959.704221928
2591019623.050181427
262624042.669212328
2791732829.46625029
282548360.854262429
292991313.530282730
3012293834.5030290
1111x21323221228S21126214w17z
。
111」
7949064657S33:2山.
8??上2a
內(nèi)
斗
%寓
一
:
一
吞
一
一
一
一
一
一
一
一
一
一
1大
:一-rt
;北
湖
安
廣
款
廣
系
海
西
龍
新
-送
百
河
四
云
破
山
福
江
海
占
津
空
加
海
京
網(wǎng)
西
東■*
獻(xiàn)
由
川
西
網(wǎng)
百
東
建
KM?'南
江
.1(
11
-
25
使用平均聯(lián)接(組間)的譜系圖
西疆
寧夏
青海
貴州
新疆
廣西
云南
黑龍江
河南
內(nèi)蒙
申慶
II加
江西
ihK
安?
A海南
吉林
浙江
天津
河北
遼寧
四川
福在
山東
陜西
江蘇
廣東
上海
湖南
湖北
北京
將系數(shù)復(fù)制下來(lái)后,在EXCEL中建立工作表。
選中數(shù)據(jù)列,點(diǎn)擊“插入”菜單T拆線圖……
AB
文件|開(kāi)始播入陽(yáng)B橇公式S3R
11328.189
22638.29510浦屋鵲呼怎十
331053.423表格/片等貼百形欣SmartArt高
選椀表?▼▼
441209.922
二tt聽(tīng)線網(wǎng)
551505.035
A328.189
661760.17
BD
1831.9261匕I區(qū)
772弟乂.503
881929.891391313.53
48360.854
4
992302.02432329.466
5用zmu記的折鯨
10102487.209624042.669
19623.05受示角時(shí)間(明、年)
2709.887TE
Tin118149”.飛g序能別克化工洛丹
12122897.10699475.4?緣
9攸0.765
13132916.551
106a27.276卻累笊有幾個(gè)353瑟?
14143280.7525933.518則可使用瑞風(fēng)
15153491.5855622.415
5H7.253
16164229.375144612.423注意:降序
17174612.423154229.375
163491.585
18185377.25317刎.752
19195622.415182916.551
5933.518193W7.106
2020202TO.887
21216827.276212487.209
2302.024
22227930.76522
231929.89!
23239475.498241831.926
242414959.70425IM17
261505.035
252519623.0527的922
cz*ccvac
碎石圖:
3SOOOO
300000
250000
200000
1SOOOO
100000
50000
0
由圖可知,北京自成一類,江蘇、廣東、上海、湖南、湖北聚成一類。其他略。
接下來(lái),添加一個(gè)變晝CLU4」,其值為類別值。(1、2、3、4),再數(shù)據(jù)今匯總f設(shè)置
T確定。
均值對(duì)比,依據(jù)聚類解,利用分類匯總,計(jì)算各個(gè)聚類變量的均值
CLU4_1x2_meanx3_meanx4_meanx5_meanx6_meanx7_meanx8_mean
1679530373700339803003261002723.0012270.0023700
222091710514256046089236746258480008143.33
396015442467861.62372.31171.852117006408
44137.80199600122009802115009126086092027160
方差分析結(jié)果:分析^比較均值好單因素ANOVA今設(shè)置……玲確定
ANOVA
平方和df均方F顯著性
投入人年數(shù)組之間59778341.196319926113.73226.428.000
組內(nèi)20357294858
總計(jì)80135635.35533
投入高級(jí)職稱的人年數(shù)組之間16485966.82035495322.27334.553.000
組內(nèi)4294074783
總計(jì)20780040.96833
投入科研事業(yè)費(fèi)(百元)組之間132451401880.844150467293.
3324.318.000
84628
組內(nèi)136133442.47
3675602946.79427
■1
總計(jì)136127004827.6
33
77
課題總數(shù)組之間16470536.56435490178.85532.181.000
組內(nèi)4606273.43627170602.720
總計(jì)21076810.00033
專著數(shù)組之間7203690.38532401230.12861.327.000
組內(nèi)1057167.8092739154.363
總計(jì)8260858.)9433
論文數(shù)組之間219675698.219373225232.74017.693.000
組內(nèi)111743385.717274138643.915
總計(jì)331419083.9353)
獲獎(jiǎng)數(shù)組之間169882.049356627.3503.619.026
組內(nèi)422436.7902715645.807
總計(jì)592318.8393J
不同組在各個(gè)聚類變量上的均值均存在顯著差異。
2、試說(shuō)明當(dāng)變量存在數(shù)量級(jí)上的差異,進(jìn)行層次聚類分析時(shí)為什么要對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處
理?
因?yàn)閿?shù)量級(jí)將對(duì)距離產(chǎn)生較大影響,并影響最終聚類結(jié)果。
3、試說(shuō)明變量之間的高度相關(guān)性是否會(huì)對(duì)層次聚類分析結(jié)果造成影響?為什么?
會(huì)。如果所選變量之間存在較強(qiáng)的線性關(guān)系,能夠相互替代,在計(jì)算距離時(shí)同類變量招重復(fù)
“貢獻(xiàn)”,占有較高權(quán)重,而使最終的聚類結(jié)果偏向該類變量。
4、試說(shuō)明K-Mean聚類分析的基本步驟。
K-Means聚類分析步驟:
確定聚類數(shù)目K--確定K個(gè)初始類中心點(diǎn)-根據(jù)距離最近原則進(jìn)行分類-重新確定K個(gè)
類中心點(diǎn)-判斷是否已經(jīng)滿足終止條件。
是一個(gè)反復(fù)迭代的分類過(guò)程。在聚類過(guò)程中,樣本所屬的類會(huì)不斷調(diào)整,直至達(dá)到最終
穩(wěn)定為止。
5、收集到我國(guó)2007年各地區(qū)城鎮(zhèn)居民家庭平均每人全年消費(fèi)支出數(shù)據(jù),數(shù)據(jù)文件名為:“消
費(fèi)結(jié)構(gòu)"IV",變量包括:地區(qū)、消費(fèi)性支出總額、食品、衣著、居住、家庭設(shè)備用品及服
務(wù)、醫(yī)療保健、交通和通信、教育文化娛樂(lè)服務(wù)、醫(yī)療保健、雜項(xiàng)商品和服務(wù)支出。若采用
層次聚類法(個(gè)體間距離定義為平方歐氏距離,類間距離定義為組間平均鏈鎖距離),繪制
的碎石圖如下:
(1)依據(jù)上圖,數(shù)據(jù)聚成幾類較為恰當(dāng)?
(2)試采用K-MEANS聚類方法,從類內(nèi)相似性和類間差異性角度分析將數(shù)據(jù)聚成幾類較
為恰當(dāng)。
(1)聚成3類較為恰當(dāng)。
注:碎石圖可按第9章第1題方式繪制,也可按如下方式繪制。
步驟:分析玲降維T因子分析分導(dǎo)入全部變量到變量框中(地區(qū)變量除外)分抽
取:選中碎石圖)繼續(xù))確定。
十,」.」r,=F:
松也):訪位.............、
[分析
?相關(guān)住電庫(kù)R)未能H的因子解(£)
。協(xié)方差電庫(kù)包)?W5S(S)
油取
@基于特征值但)
tt?EfI^T(A):|1|
0日子的國(guó)士數(shù)量國(guó))
要提取雁子(D:
最大收繳性送弋次數(shù)兇:叵
[組一]她幫助
得到:(可以看出,分成3類恰當(dāng))
(2)用K-MEANS聚類方法進(jìn)行分類,比較分類數(shù)為2、3、4時(shí)的差別。
步驟:分析今分類TK-平均聚類T地區(qū)變量導(dǎo)入到標(biāo)注個(gè)案,其他變量全部導(dǎo)入
到變量框中玲聚類數(shù)填2今選項(xiàng):選中初始聚類中心和ANOVA分繼續(xù)1確定。
K平均值農(nóng)矣分析:_匕絲-
-Statistics---------------------
,世皓聚美”就
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026江西吉安市吉州區(qū)園投人力資源服務(wù)有限公司招募見(jiàn)習(xí)實(shí)習(xí)人員2人備考題庫(kù)帶答案詳解
- 2026河北地質(zhì)大學(xué)選聘30人備考題庫(kù)及參考答案詳解一套
- 2026中國(guó)科學(xué)院力學(xué)研究所微納流動(dòng)和空間兩相流團(tuán)隊(duì)招聘勞務(wù)派遣人員2人備考題庫(kù)(北京)及一套完整答案詳解
- 2026天津城建濱海路橋有限公司招聘?jìng)淇碱}庫(kù)及答案詳解參考
- 2026廣西北部灣大學(xué)招聘體育學(xué)院專任教師6人備考題庫(kù)及答案詳解1套
- 2026上海復(fù)旦大學(xué)附屬婦產(chǎn)科醫(yī)院招聘輸血科技術(shù)員1人備考題庫(kù)及答案詳解(奪冠系列)
- 2026中國(guó)人壽保險(xiǎn)股份有限公司錫林浩特市支公司招聘2人備考題庫(kù)及答案詳解(易錯(cuò)題)
- 2026年臨沂蘭山區(qū)部分事業(yè)單位公開(kāi)招聘綜合類崗位工作人員備考題庫(kù)(28名)(含答案詳解)
- 2025云南玉溪貓哆哩集團(tuán)食品有限責(zé)任公司第一期招募就業(yè)見(jiàn)習(xí)人員70人備考題庫(kù)含答案詳解
- 2026上半年貴州事業(yè)單位聯(lián)考貴州省紅十字會(huì)招聘1人備考題庫(kù)完整參考答案詳解
- 2025年證券市場(chǎng)交易操作與規(guī)范指南
- 2025-2026學(xué)年北京市西城區(qū)高三(上期)期末考試生物試卷(含答案)
- 2026廣西北部灣大學(xué)公開(kāi)招聘高層次人才76人筆試參考題庫(kù)及答案解析
- 2025年時(shí)事政治必考試題庫(kù)完整參考答案及參考答案詳解
- 2026年安徽糧食工程職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)考試題庫(kù)含答案詳解
- 混凝土施工作業(yè)環(huán)境管理方案
- 2025貴州黔西南州安龍縣選聘城市社區(qū)工作者工作61人備考題庫(kù)完整答案詳解
- T-CRHA 089-2024 成人床旁心電監(jiān)測(cè)護(hù)理規(guī)程
- 家長(zhǎng)要求學(xué)校換老師的申請(qǐng)書(shū)
- 闌尾腫瘤-課件
- 正式員工派遣單
評(píng)論
0/150
提交評(píng)論