多元統(tǒng)計分析案例分析報告_第1頁
多元統(tǒng)計分析案例分析報告_第2頁
多元統(tǒng)計分析案例分析報告_第3頁
多元統(tǒng)計分析案例分析報告_第4頁
多元統(tǒng)計分析案例分析報告_第5頁
已閱讀5頁,還剩1頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

/一、對我國30個省市自治區(qū)農村居民生活水平作聚類分析1、指標選擇及數據:為了全面分析我國農村居民的生活狀況.主要考慮從收入、消費、就業(yè)等幾個方面對農村居民的生活狀況進行考察。因此選取以下指標:農村產品價格指數、農村住宅投資、農村居民消費水平、農村居民消費支出、農村居民家庭人均純收入、耕地面積及農村就業(yè)人數?,F從2010年的調查資料中抽?。常皞€樣本.指標數據如下:地區(qū)農產品價格指數〔上年=100農村住宅投資

〔億元農村居民消費水平〔元農村居民生活消費支出合計

〔元農村居民家庭人均純收入〔元耕地面積2008

〔萬公頃農村私營企業(yè)就業(yè)人數〔萬人北京98.2793.04128869254.813262231.7153.9天津103.0348.3178144936.710075441.18.0河北99.70441.7538673844.959586317.380.9山西100.43168.7145003663.947364055.851.7XX99.8333.1744864460.855307147.218.4遼寧102.90162.0557394489.569084085.399.5吉林103.7771.6546634147.462375534.621.2XX98.07126.4545364391.2621111830.142.8上海102.232.121360910210.513978244.0258.4江蘇99.92284.5581966542.991184763.8569.8浙江100.25513.7598788928.9113031920.9398.3安徽99.08412.4844474013.352855730.2105.9福建98.04176.3568795498.374271330.1113.1江西96.81236.5343973911.657892827.1173.2山東101.23566.9057334807.269907515.3273.6河南99.07729.4740613682.255247926.4137.7湖北96.30210.0647584090.858324664.166.4湖南90.61298.4145134310.456223789.4104.5廣東94.95337.4458805515.678902830.7124.4廣西89.25248.8035613455.345434217.589.0海南101.9126.2238463446.25275727.55.3重慶88.9980.1236523624.652772235.936.7675四川96.94456.1047483897.550875947.4140.3貴州96.11137.2229262852.534724485.325.4云南96.50158.9736033398.339526072.141.3陜西95.83151.7936833793.841054050.31.7甘肅100.2297.3329752942.034254658.822.0青海94.6163.6336843863542.710.511.4寧夏99.3929.51389446751107.143.616.7新疆92.8779.3535903457.946434124.618.7數據來源:《中國統(tǒng)計年鑒2010》.2、將數據進行標準化變換:地區(qū)農產品價格指數〔上年=100農村住宅投資

〔億元農村居民消費水平〔元農村居民生活消費支出合計

〔元農村居民家庭人均純收入〔元耕地面積2008

〔萬公頃農村私營企業(yè)就業(yè)人數〔萬人北京0.09-0.672.822.532.37-1.360.37天津1.33-0.910.920.151.30-1.29-0.78河北0.471.24-0.56-0.46-0.070.84-0.21山西0.65-0.25-0.33-0.56-0.480.02-0.44XX0.50-0.99-0.33-0.12-0.211.15-0.70遼寧1.30-0.290.14-0.100.250.03-0.06吉林1.52-0.78-0.26-0.290.020.56-0.68XX0.04-0.48-0.31-0.150.012.84-0.51上海1.12-1.163.093.062.60-1.361.20江蘇0.520.381.061.040.980.283.66浙江0.611.641.692.351.71-0.752.31安徽0.301.08-0.35-0.36-0.300.63-0.01福建0.04-0.210.570.460.42-0.970.05江西-0.280.12-0.36-0.42-0.13-0.420.52山東0.861.930.140.080.271.281.32河南0.302.82-0.49-0.55-0.221.430.24湖北-0.42-0.03-0.23-0.32-0.110.24-0.32湖南-1.890.46-0.32-0.20-0.18-0.07-0.02廣東-0.770.670.190.470.57-0.420.14廣西-2.240.19-0.68-0.67-0.540.08-0.14海南1.04-1.03-0.57-0.68-0.30-1.18-0.81重慶-2.31-0.74-0.64-0.58-0.30-0.64-0.56四川-0.251.32-0.23-0.43-0.360.710.26貴州-0.46-0.42-0.92-1.00-0.900.18-0.65云南-0.36-0.31-0.66-0.70-0.740.75-0.52陜西-0.54-0.34-0.63-0.48-0.690.02-0.83甘肅0.60-0.64-0.90-0.96-0.920.24-0.67青海-0.85-0.83-0.63-0.45-1.88-1.44-0.76寧夏0.39-1.01-0.550.00-1.69-1.43-0.71新疆-1.30-0.74-0.67-0.67-0.510.05-0.703、用K-均值聚類法對樣本進行分類如下:聚類成員案例號地區(qū)聚類距離1北京11069.192天津23060.353河北3920.654山西41506.425XX3577.126遼寧22453.897吉林31487.958XX35006.419上海12094.3810江蘇22853.4211浙江13015.1412安徽31204.4913福建21612.4614江西41880.4015山東32088.5516河南31282.2717湖北32230.1518湖南42053.3519廣東21119.9820廣西41412.1421海南42541.0522重慶41423.5123四川31138.1424貴州42025.4125云南32196.6326陜西41127.9127甘肅42123.6728青海44568.6029寧夏44247.1230新疆41360.50分四類的情況下.最終分類結果如下:第一類:北京、上海、XX。第二類:天津、、XX、、XX、XX、XX、XX。第三類:XX、XX、XX、XX、XX、XX、XX、XX、XX、XX、XX。第四類:XX、XX、XX、新疆、XX、XX、XX、XX、廣西、XX、。從分類結果上看.根據2010年的調查數據.第一類地區(qū)的農民生活水平較高.第二類屬于中等水平.第三類、第四類屬于較低水平。二、判別分析針對以上分類結果進行判別分析。其中將新疆作作為待判樣本。判別結果如下:案例數目實際組預測組p1110.9982220.5753330.9974440.3615330.8366220.2347330.7878330.0979110.52110220.43911110.48612330.99213220.73914440.41515330.24416330.40617330.38718440.42119220.33320440.9521440.28522440.45323330.95124440.3372534**0.27826440.63227440.27828440.22229440.12430440.981**.錯誤分類的案例從上可知.只有一個地區(qū)判別組和原組不同.回代率為96%。下面對新疆進行判別:已知判別函數系數和組質心處函數如下:標準化的典型判別式函數系數函數123農產品價格指數0.180.3980.394農村住宅投資0.4930.687-0.197農村居民價格水平0.0870.3620.243生活消費支出1.0040.094-0.817人均純收入0.381-0.2820.565耕地面積-0.0411.019-0.235就業(yè)人數-0.631-0.7420.802組質心處的函數函數組號123110.678-0.369-0.62821.747-0.7511.1753-0.9621.899-0.0324-2.595-1.177-0.306判別函數分別為:Y1=0.18x1+0.493x2+0.087x3+1.004x4+0.381x5-0.041x6-0.631x7Y2=0.398x1+0.687x2+0.362x3+0.094x4-0.282x5+1.019x6-0.742x7Y3=0.394x1-0.197x2+0.243x3-0.817x4+0.565x5-0.235x6+0.802x7將XX的指標數據代入函數得:Y1=-1.08671Y2=-0.62213Y3=-0.84188計算Y值與不同類別均值之間的距離分別為:D1=138.5182756D2=12.11433124D3=7.027544292D4=2.869979346經過判別.D4最小.所以新疆應歸于第四類.這與實際情況也比較相符。三.因子分析:分析數據在上表的基礎上去掉兩個耕地面積和農村固定資產投資兩個指標。經spss軟件分析結果如下:〔1各指標的相關系數陣:從中可以看出.大部分指標的相關系數都比較高.各變量之間的線性關系較明確.能夠從中提取公共因子.適合因子分子。〔2檢驗:由上表可知:巴特利特球度檢驗統(tǒng)計量的觀測值為145.585.相應的概率p接近為0.如果顯著性水平a為0.05.由于顯著性水平小于0.05.拒絕零假設.認為相關系數矩陣與單位陣有顯著差異.同時.KOM值為0.701.根據Kaiser給出的度量標準可知原有變量適合進行因子分析〔3各指標的貢獻率如下表:從中可以看出.各個指標的貢獻率都在百分之五十之上比較高。從上表中可以看出.第一個因子的特征根為3.449.解釋原有五個變量總方差的68%.累積方差貢獻率為68.973%。第二個因子的特征根為0.863.解釋原有變量總方差17.34%.累計方差貢獻率為86.313%?!?碎石圖:〔5因子載荷陣如下:由上表可知.各指標在第一個因子上的載荷比較高.說明第一個因子很重要;第二個因子與原有變量的相關性較小.它對原有變量的解釋作用不顯著。為便于對各因子進行命名.對因子載荷陣實施正交旋轉。旋轉之后的因子載荷陣:〔6從上表可見.每個因子只有幾個指標的因子載荷較大.因此可根據上表進行分類。將五個指標按高載荷分成兩類:四.主成分分析:〔1各指標間的相關系數矩陣如下表所示:可以看到有些指標之間的相關性較強.如果直接進行綜合分析會造成信息重疊.所以用主成分分析將多個指標化成幾個不相關的綜合指標。〔2求相關矩陣的特征值和特征向量:從上表可知.前兩個特征值累計貢獻率已達86.313%。說明前兩個主成分基本包含了全部指標具有的信息。因此.取前兩個特征值.并計算相應的特征向量:〔3由上述因子分子的因子載荷陣計算主成分的特征向量陣為:所以.前兩個主成分為:第一個主成分:F1=0.135112X1+0.280371X2+0.276022X3+0.271383X4+0.211366X5第二個主成分:F2=1.018454X1-0.059977X2-0.144175X3-0.044983X4-0.297578X5在第一主成分中第二、三、四個指標的系數較大.這三個指標起主要作用.刻劃了農居民的收入支出狀況的綜合指標。在第二主成分中.第一個指標系數較大.是農產品價格水平指標。〔4因子得分:根據上表寫出以下因子得分函數:F1=-

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論