多元統(tǒng)計(jì)分析案例分析_第1頁(yè)
多元統(tǒng)計(jì)分析案例分析_第2頁(yè)
多元統(tǒng)計(jì)分析案例分析_第3頁(yè)
多元統(tǒng)計(jì)分析案例分析_第4頁(yè)
多元統(tǒng)計(jì)分析案例分析_第5頁(yè)
已閱讀5頁(yè),還剩5頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

一、對(duì)我國(guó)30個(gè)省市自治區(qū)農(nóng)村居民生活水平作聚類分析

1、指標(biāo)選擇及數(shù)據(jù):為了全面分析我國(guó)農(nóng)村居民的生活狀況,主要考慮從收入、

消費(fèi)、就業(yè)等幾個(gè)方面對(duì)農(nóng)村居民的生活狀況進(jìn)行考察。因此選取以下指標(biāo):農(nóng)

村產(chǎn)品價(jià)格指數(shù)、農(nóng)村住宅投資、農(nóng)村居民消費(fèi)水平、農(nóng)村居民消費(fèi)支出、衣村

居民家庭人均純收入、耕地面積及農(nóng)村就業(yè)人數(shù)?,F(xiàn)從2010年的調(diào)查資料中

抽取30個(gè)樣木,指標(biāo)數(shù)據(jù)如下:

農(nóng)產(chǎn)品農(nóng)村居農(nóng)村居農(nóng)村私

農(nóng)村住農(nóng)村居耕地面

價(jià)格指民生活民家庭營(yíng)企業(yè)

宅投資民消費(fèi)積2008

地區(qū)數(shù)(.1-.消費(fèi)支人均純就業(yè)人

(億水平(萬(wàn)公

出合計(jì)收入數(shù)(萬(wàn)

元)(元)頃)

=100)(元)(元)人)

北京98.2793.04128869254.813262231.7153.9

天津103.0348.3178144936.710075441.18.0

河北99.70441.7538673844.959586317.380.9

山西100.43168.7145003663.947364055.851.7

內(nèi)蒙古99.8333.1744864460.855307147.218.4

遼寧102.90162.0557394489.569084085.399.5

吉林103.7771.6546634147.462375534.621.2

黑龍江98.07126.4545364391.2621111830.142.8

上海102.232.121360910210.513978244.0258.4

江蘇99.92284.5581966542.991184763.8569.8

浙江100.25513.7598788928.9113031920.9398.3

安徽99.08412.4844474013.352855730.2105.9

福建98.04176.3568795498.374271330.1113.1

江西96.81236.5343973911.657892827.1173.2

山東101.23566.9057334807.269907515.3273.6

河南99.07729.4740613682.255247926.4137.7

湖北96.30210.0647584090.858324664.166.4

湖南90.61298.4145134310.456223789.4104.5

廣東94.95337.4458805515.678902830.7124.4

廣西89.25248.8035613455.345434217.589.0

海南101.9126.2238463446.25275727.55.3

重慶88.9980.1236523624.652772235.936.7675

四川96.94456.1047483897.550875947.4140.3

貴州96.11137.2229262852.534724485.325.4

云南96.50158.9736033398.339526072.141.3

陜西95.83151.7936833793.841054050.31.7

甘肅100.2297.3329752942.034254658.822.0

青海94.6163.6336843863542.710.511.4

寧夏99.3929.51389446751107.143.616.7

新疆92.8779.3535903457.946434124.618.7

數(shù)據(jù)來(lái)源:《中國(guó)統(tǒng)計(jì)年鑒2010》.

2、將數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化變換:

農(nóng)村

農(nóng)村居農(nóng)村居耕地農(nóng)村私

農(nóng)產(chǎn)品住農(nóng)村居

民生活民家庭面積營(yíng)企業(yè)

價(jià)格指投民消費(fèi)

地區(qū)消費(fèi)支人均純2008就業(yè)人

數(shù)(上年1億水平

出合計(jì)(萬(wàn)數(shù)1萬(wàn)

=100),(元)

(元)(元)公頃)人)

北京0.09-0.672.822.532.37-1.360.37

天津1.33-0.910.920.151.30-1.29-0.78

河北0.471.24-0.56-0.46-0.070.84-0.21

山西0.65-0.25-0.33-0.56-0.480.02-0.44

內(nèi)蒙古0.50-0.99-0.33-0.12-0.211.15-0.70

遼寧1.30-0.290.14-0.100.250.03-0.06

吉林1.52-0.78-0.26-0.290.020.56-0.68

黑龍江0.04-0.48-0.31-0.150.012.84-0.51

上海1.12-1.163.093.062.60-1.361.20

江蘇0.520.38L061.040.980.283.66

浙江0.611.641.692.351.71-0.752.31

安徽0.301.08-0.35-0.36-0.300.63-0.01

福建0.04-0.210.570.460.42-0.970.05

江西-0.280.12-0.36-0.42-0.13-0.420.52

山東0.861.930.140.080.271.281.32

河’南0.302.82-0.49-0.55-0.221.430.24

湖北-0.42-0.03-0.23-0.32-0.110.24-0.32

湖南-1.890.46-0.32-0.20-0.18-0.07-0.02

廣東-0.770.670.190.470.57-0.420.14

廣西-2.240.19-0.68-0.67-0.540.08-0.14

海南1.04-1.03-0.57-0.68-0.30-1.18-0.81

重慶-2.31-0.74-0.64-0.58-0.30-0.64-0.56

四川-0.251.32-0.23-0.43-0.360.710.26

貴州-0.46-0.42-0.92-1.00-0.900.18-0.65

云南-0.36-0.31-0.66-0.70-0.740.75-0.52

陜西-0.54-0.34-0.63-0.48-0.690.02-0.83

甘肅0.60-0.64-0.90-0.96-0.920.24-0.67

青海-0.85-0.83-0.63-0.45-1.88-1.44-0.76

寧夏0.39-1.01-0.550.00-1.69-1.43-0.71

新疆-1.30-0.74-0.67-0.67-0.510.05-0.70

3、用K-均值聚類法對(duì)樣本進(jìn)行分類如下:

聚類成員

案例號(hào)地區(qū)聚類距離

1北京11069.19

2天津23060.35

3河北3920.65

4ill西41506.42

5內(nèi)蒙古3577.12

6遼寧22453.89

7吉林31487.95

8黑龍江35006.41

9上海12094.38

10江蘇22853.42

11浙江13015.14

12安徽31204.49

13福建21612.46

14江西41880.40

15U東32088.55

16河南31282.27

17湖北32230.15

18湖南42053.35

19r東21119.98

20廣西41412.14

21海南42541.05

22直慶41423.51

23四川31138.14

21貴州12025.41

25云南32196.63

26陜西41127.91

27甘肅42123.67

28青海44568.60

29字夏44247.12

30新疆41360.50

分四類的情況下,最終分類結(jié)果如下:

第一類:北京、上海、浙江。

第二類:天津、、遼寧、、福建、甘肅、江蘇、廣東。

第三類:浙江、河北、內(nèi)蒙古、吉林、黑龍江、安徽、山東、河南、湖北、四

川、云南。

第四類:山西、青海、寧夏、新疆、重慶、貴州、陜西、湖南、廣西、江西、。

從分類結(jié)果上看,根據(jù)2010年的調(diào)查數(shù)據(jù),第一類地區(qū)的農(nóng)民生活水平較高,

第二類屬于中等水平,第三類、第四類屬于較低水平。

二、判別分析

針對(duì)以上分類結(jié)果進(jìn)行判別分析。其中將新疆作作為待判樣本。判別結(jié)果如下:

案例數(shù)目實(shí)際組預(yù)測(cè)組P

1110.998

2220.575

3330.997

4440.361

5330.836

6220.234

7330.787

8330.097

9110.521

10220.439

11110.486

12330.992

13220.739

14440.415

15330.244

16330.406

17330.387

18440.421

19220.333

20440.95

21410.285

22440.453

23330.951

24440.337

2534**0.278

26440.632

27410.278

28440.222

29440.124

30440.981

**.錯(cuò)誤分類的案例

從上可知,只有一個(gè)地區(qū)判別組和原組不同,回弋率為96%。

下面對(duì)新疆進(jìn)行判別:

已知判別函數(shù)系數(shù)和組質(zhì)心處函數(shù)如下:

標(biāo)準(zhǔn)化的典型判別式函數(shù)系數(shù)

函數(shù)

123

農(nóng)產(chǎn)品價(jià)格指數(shù)0.180.3980.394

農(nóng)村住宅投資0.4930.687-0.197

農(nóng)村居民價(jià)格水

0.0870.3620.243

生活消費(fèi)支出1.0040.094-0.817

人均純收入0.381-0.2820.565

耕地面積-0.0411.019-0.235

就業(yè)人數(shù)-0.631-0.7420.802

組質(zhì)心處的函數(shù)

函數(shù)

組號(hào)123

110.678-0.369-0.628

21.747-0.7511.175

3-0.9621.899-0.032

4-2.595-1.177-0.306

判別函數(shù)分別為:Yl=0.18xl+0.493x2+0.087x3+1.004x4+0.381x5-0.041x6-0.631x7

丫2=0.398x1+0.687x2+0.362x3+0.094x4-0.282x5+1.019x6-0.742x7

丫3=0.394x1-0.197x2+0.243x3-0.817x4+0.565x5-0.235x6+0.802x7

將西藏的指標(biāo)數(shù)據(jù)代入函數(shù)得:Yl=-1.08671

Y2=-0.62213

丫3bo.84188

計(jì)算丫值與不同類別均值之間的距離分別為:01=138.5182756

02=12.11433124

D3=7.027544292

D4=2.869979346

經(jīng)過(guò)判別,D4最小,所以新疆應(yīng)歸于第四類,這與實(shí)際情況也比較相符。

三,因子分析:

分析數(shù)據(jù)在上表的基礎(chǔ)上去掉兩個(gè)耕地面積和農(nóng)村固定資產(chǎn)投資兩個(gè)指標(biāo)。

經(jīng)SPSS軟件分析結(jié)果如下:

(1)各指標(biāo)的相關(guān)系數(shù)陣:

CorrelationMatrix

農(nóng)產(chǎn)品價(jià)農(nóng)村居庭人均

格指數(shù)民消費(fèi)消費(fèi)支出純收入業(yè)就業(yè)人數(shù)

Correlation農(nóng)產(chǎn)品價(jià)格指數(shù)1.000.356.296.351.187

農(nóng)村居民消費(fèi).3561.000.968.922.584

消費(fèi)支出.296.9681.000.864.625

庭人均純收入.351.922.8641.000.578

業(yè)就業(yè)人數(shù).187.584.625.5781.000

從中可以看出,大部分指標(biāo)的相關(guān)系數(shù)都比較高,各變量之間的線性關(guān)系較明確,

能夠從中提取公共因子,適合因子分子。

(2)檢驗(yàn):

KMOandBartlett'sTest

Kaiser-Meyer-OlkinMeasureofSampling

Adequacy..701

BartlettsTestofApprox.Chi-Square145.585

Sphericitydf10

Sig..000

由上表可知:巴特利特球度檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值為145.585.相應(yīng)的概率p接近為

0.如果顯著性水平a為0.05,由于顯著性水平小于0.05,拒絕零假設(shè),認(rèn)為相關(guān)

系數(shù)矩陣與單位陣有顯著差異,同時(shí),K0M值為0.701,根據(jù)Kaiser給出的度量標(biāo)

準(zhǔn)可知原有變量適合進(jìn)行因子分析

(3)各指標(biāo)的貢獻(xiàn)率如下表:

Communalities

InitialE>:traction

農(nóng)產(chǎn)品價(jià)格指數(shù)1.000.979

農(nóng)村居民消費(fèi)1.000.938

消費(fèi)支出1.000.923

庭人均純收入1.000.878

業(yè)就業(yè)人數(shù)1.000.598

ExtractionMethod:PrincipalComponentAnalysis.

從中可以看出,各個(gè)指標(biāo)的貢獻(xiàn)率都在百分之五十之上比較高。

TotalVarianceExplained

hitialBoenviluesExtractionSumsofSquaredLoadingsRotationSumso<SquaredLoadings

%Of%Of%Of

ComponentTotalVarianceCumulative%TotalVarianceCumulatee%TotalVarianceCumulath/e%

13.44968.97368.9733.44968.97368.9733.20063.99763997

2.86717.34086.313.86717.34086.3131.11622.31586313

3.52610.51796.830

4.1402.79699.626

5.019.374100.000

ExtractionMethod:PrineoalConponentAnaf/sis.

從上表中可以看出,第一個(gè)因子的特征根為3.449.解釋原有五個(gè)變量總方差的

68%,累積方差貢獻(xiàn)率為68.973虬第二個(gè)因子的特征根為0.863,解釋原有變量

總方差17.34%,累計(jì)方差貢獻(xiàn)率為86.313%。

(4)碎石圖:

ScreePlot

(5)因子載荷陣如下:

ComponentMatri火

Component

12

農(nóng)產(chǎn)品價(jià)格指數(shù).446.883

農(nóng)村居民消費(fèi).967-.052

消費(fèi)支出.952-.125

家庭人均純收入.936-.039

就業(yè)人數(shù).729-.258

ExtractionMethod:PrineipalComponentAnalysis,

a.2componentsextracted.

由上表可知,各指標(biāo)在第一個(gè)因子上的載荷比較高,說(shuō)明第一個(gè)因子很重要;

第二個(gè)因子與原有變量的相關(guān)性較小,它對(duì)原有變量的解釋作用不顯著。為便于

對(duì)各因子進(jìn)行命名,虎因子載荷陣實(shí)施正交旋轉(zhuǎn)。

旋轉(zhuǎn)之后的因子載荷陣:

RotatedComponentMatri文

Component

12

農(nóng)產(chǎn)品價(jià)格指數(shù).150.978

農(nóng)村居民消費(fèi).936.251

消費(fèi)支出.944.177

家庭人均純收入.902.253

就業(yè)人數(shù).773-.019

ExtractionMethod:PrineipalComponentAnalysis.

RotationMethod:VarimaxwithKaiserNormalization.

a.Rotationconvergedin3iterations.

(6)從上表可見(jiàn),每個(gè)因子只有幾個(gè)指標(biāo)的因子載荷較大,因此可根據(jù)上表進(jìn)

行分類。將五個(gè)指標(biāo)按高載荷分成兩類:

品載荷指標(biāo)意義

農(nóng)村居民消費(fèi)水平

1農(nóng)村生活消費(fèi)支出收支因子

農(nóng)村居民家庭人均收入

2農(nóng)產(chǎn)品價(jià)格指數(shù)價(jià)格因子

四,主成分分析:

(1)各指標(biāo)間的相關(guān)系數(shù)矩陣如下表所示:

CorrelationMatrix

農(nóng)產(chǎn)品價(jià)農(nóng)村居庭人均

格指數(shù)民消費(fèi)消費(fèi)支出純收入業(yè)就業(yè)人數(shù)

Correlation農(nóng)產(chǎn)品價(jià)格指數(shù)1.000.356.296.351.187

農(nóng)村居民消費(fèi).3561.0C0.968.922.584

消費(fèi)支出.296.9681.000.864.625

庭人均純收入.351.922.8641.000.578

業(yè)就業(yè)人數(shù).187.584.625.5781.000

可以看到有些指標(biāo)之間的相關(guān)性較強(qiáng),如果直接進(jìn)行綜合分析會(huì)造成信息重疊,

所以用主成分分析將多個(gè)指標(biāo)化成幾個(gè)不相關(guān)的綜合指標(biāo)。

(2)求相關(guān)矩陣的特征值和特征向量:

特征根方差貢獻(xiàn)率累計(jì)貢獻(xiàn)率

13.44968.97368.973

20.86717.3486.313

30.52610.51796.83

40.142.79699.626

50.0190.374100

從上表可知,前兩個(gè)特征值累計(jì)貢獻(xiàn)率已達(dá)86.3:3%。說(shuō)明前兩個(gè)主成分基本包

含了全部指標(biāo)具有的信息。因此,取前兩個(gè)特征值,并計(jì)算相應(yīng)的特征向量:

(3)由上述因子分子的因子載荷陣計(jì)算主:成分的特征向量陣為:

compoent

12

農(nóng)產(chǎn)品價(jià)格指數(shù)0.1351121.018454

農(nóng)村居民消費(fèi)水平0.280371-0.059977

消費(fèi)支出0.276022-0.144175

家庭人均年純收入0.271383-0.044983

就業(yè)人數(shù)0.211366-0.297578

所以,前兩個(gè)主成分為:

第一個(gè)主成分:F1=O.135112X1+0.280371X2+0.276022X3+0.271383X4+0.211366X5

第二個(gè)主成分:F2=l.018454X1-0.059977X2-0.144175X3-0.044983X4-0.297578X5

在第一主成分中第二、三、四個(gè)指標(biāo)的系數(shù)較大,這三個(gè)指標(biāo)起主要作用,刻劃了農(nóng)

居民的收入支出狀況的綜合指標(biāo)。

在第二主成分中,第一個(gè)指標(biāo)系數(shù)較大,是農(nóng)產(chǎn)品價(jià)格水平指標(biāo)。

(4)因子得分:

ComponentScoreCoefficientMatrix

Component

12

農(nóng)產(chǎn)品價(jià)格指數(shù)-.1931.009

農(nóng)村居民消費(fèi).285.031

消費(fèi)支出.307-.051

家庭人均純收入.272.041

就業(yè)人數(shù).293-.218

ExbactionMethod;PrincipalComponentAnalysis.

RotationMethod:VarimaxwithKaiserNormalization.

ComponentScores.

根據(jù)上表寫出以下因子得分函數(shù):

Fl=-0.193農(nóng)產(chǎn)品價(jià)格指數(shù)+0.285農(nóng)村居民消費(fèi)+0.307消費(fèi)支出+0.272家庭

人均純收入+0.293就業(yè)人數(shù)

F2=l.009農(nóng)產(chǎn)品價(jià)格指數(shù)+0.031農(nóng)村居民消費(fèi)-0.051消費(fèi)支出+0.041家庭人

均純收入-0.218就業(yè)人數(shù)

(5)綜合評(píng)價(jià):以兩個(gè)因子的方差貢獻(xiàn)率為權(quán)數(shù),綜合評(píng)價(jià)模型為:

Z=0.63997F1+0.22315F2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論