已閱讀5頁,還剩15頁未讀, 繼續(xù)免費閱讀
版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
數(shù)理統(tǒng)計 課程論文 題目:運用 SAS 軟件對我國人均消費支出的統(tǒng)計分析1我國城鎮(zhèn)居民人均消費支出的回歸分析摘要:本文基于城鎮(zhèn)居民平均消費水平,做多元線性回歸模型。首先,做 的回歸模型,以及對齊進行回歸診斷。結果發(fā)現(xiàn)4321x,y關 于回歸方程顯著,但是截距, 不是顯著的,且 的系數(shù)與實際情42x, 4x況不符合,并且變量間存在共線性,且數(shù)據(jù)中存在異常點。接著,對刪除異常點的數(shù)據(jù)做回歸分析,接著對不同的自變量組合做回歸分析并做逐步回歸,確定最優(yōu)的自變量組合。最后用最優(yōu)的自變量組合結合去除異常點的數(shù)據(jù)做回歸分析,殘差分析,確定回歸模型。最后得到最優(yōu)的回歸方程為 ,決321062.8xxy定系數(shù) 等于 0.9996。2R關鍵詞:回歸分析、殘差分析、逐步回歸、回歸診斷、城鎮(zhèn)居民平均消費水平1、引言城鎮(zhèn)居民消費水平是指居民在物質(zhì)產(chǎn)品和勞務的消費過程中,對滿足人們生存、發(fā)展和享受需要方面所達到的程度。通過消費的物質(zhì)產(chǎn)品和勞務的數(shù)量和質(zhì)量反映出來。本問題要求通過收集整理數(shù)據(jù),掌握對城鎮(zhèn)人均消費支出的影響因素, 利用 SAS 軟件進行多元回歸分析,求出回歸方程,進行統(tǒng)計檢驗(包括回歸方程的顯著2性檢驗,回歸系數(shù)的顯著性檢驗)以及殘差的檢驗;然后進行估計和預測。2、數(shù)據(jù)來源、指標闡述、及相關信息本問題所涉及的指標變量有一下五項:1:城鎮(zhèn)居民平均消費水平(y)。2:城鎮(zhèn)居民平均可支配收入(x1)。居民可支配收入=城鎮(zhèn)居民家庭總收入-交納所得稅-個人交納的社會保 障支出3:城鎮(zhèn)居民人均國內(nèi) GDP(x2)。4:城鎮(zhèn)居民消費價格指數(shù)(x3)。5:城鎮(zhèn)居民家庭恩格爾系數(shù)(x4)。恩格爾系數(shù)是食品支出總額占個人消費支出總額的比重上述所有數(shù)據(jù)均來自于中國統(tǒng)計年鑒網(wǎng)(/kns55/index.aspx) 數(shù)據(jù)的時間范圍為(1978-2012) 。其中城鎮(zhèn)居民消費價格指數(shù),以 1978 年為基 100 計算。年份 城鎮(zhèn)居民平均消費水平 人均可支配收 入 人均國內(nèi)生產(chǎn)總 值 城鎮(zhèn)居民消費價格指數(shù) 城鎮(zhèn)居民家庭恩 格爾系數(shù)%1978 405.0 343.4 381.2 100.0 57.5 1979 425.0 405.0 419.3 101.9 57.2 1980 489.0 477.6 463.3 109.5 56.9 1981 521.0 500.4 492.2 112.3 56.7 1982 536.0 535.3 527.8 114.5 58.6 1983 558.0 564.6 582.7 116.8 59.2 1984 618.0 652.1 695.2 120.0 58.0 1985 765.0 739.1 857.8 134.2 53.3 1986 872.0 900.9 963.2 143.6 52.4 1987 998.0 1002.1 1112.4 156.3 53.5 1988 1311.0 1180.2 1365.5 188.6 51.4 1989 1466.0 1373.9 1519.0 219.4 54.5 1990 1596.0 1510.2 1644.0 222.2 54.2 1991 1840.0 1700.6 1892.8 233.6 53.8 1992 2262.0 2026.6 2311.1 253.7 53.0 1993 2924.0 2577.4 2998.4 294.5 50.3 1994 3852.0 3496.2 4044.0 368.1 50.0 1995 4931.0 4283.0 5045.7 430.0 50.1 1996 5532.0 4838.9 5845.9 467.8 48.8 1997 5823.0 5160.3 6420.2 482.3 46.6 1998 6109.0 5425.1 6796.0 479.4 44.7 1999 6405.0 5854.0 7158.5 473.2 42.1 2000 6850.0 6280.0 7857.7 477.0 39.4 2001 7161.0 6859.6 8621.7 480.3 38.2 32002 7486.0 7702.8 9398.1 475.5 37.7 2003 8060.0 8472.2 10542.0 479.8 37.1 2004 8912.0 9421.6 12335.6 495.6 37.7 2005 9593.0 10493.0 14185.4 503.5 36.7 2006 10618.0 11759.5 16499.7 511.1 35.8 2007 12130.0 13785.8 20169.5 534.1 36.3 2008 13653.0 15780.8 23707.7 564.0 37.9 2009 14904.0 17174.7 25607.5 558.9 36.5 2010 16546.0 19109.4 30015.0 576.8 35.7 2011 18750.0 21809.8 35197.8 607.4 36.3 2012 21119.7 24564.7 38420.4 623.8 36.2 三、多元線性回歸理論基礎3.1 多元線性回歸的概念設自變量 的觀測值 及因變量 對應的觀測值 滿px,,21 ipix,21 yiy足關系式 niyipjiji ,10 式中, 是相互獨立且都服從正態(tài)分布,21n 的 隨 機 變 量 。2,0N根據(jù)最小二乘法,由 n 個觀測值 確定參數(shù)ipiyx,21后,得到公式的估計值, 210210 pp bb 及的 估 計 值及 稱為多元線性回歸方程。建立多元線性回歸方程的過程以及對jjxb10y回歸方程與回歸數(shù)所做的顯著性檢驗,稱為多元線性回歸分析或多元線性回歸。,則pjjipi xbx 1021 y, , 記帶 入 多 元 線 性 回 歸 方 程如 果 將 iyi與之間的偏差平方和 ni pjjiniiiyQ2102b由 正 規(guī) 方 程 組 。可 得 到 多 元 線 性 回 歸 的pjbj ,10通過解正規(guī)方程組,即可以算出 求出回歸方程。,210pbb及3.2 回歸方程的顯著性檢驗4與一元線性回歸方程相類似,多元線性回歸方程的總平方和 SST 也可以分解為剩余平方和 SSE 和回歸平方和 SSR,即SST=SSR+SSE式中,pjjyniiyii lbSRlT112而 ,2,1 因 此pjyxlinijijjy SRlEy如果 SSR 的數(shù)值較大, SSE 的數(shù)值便比較小,說明回歸的效果好。如果 SSR 的數(shù)值較小,SSE 的數(shù)值便比較大,說明回歸的效果差。理論上已經(jīng)證明:當原假設 成 立 時 , 并 且,為 02100HHp,1,222 pnSESRnST且 SSR 與 SSE 相互獨立, ,1/pFSEF的 無 偏 估 計 量 。為 221pnMSE因此,給出顯著性水平 ,即可進行回歸方程的顯著性檢驗。3.3 回歸系數(shù)的顯著性檢驗一個多元線性回歸方程顯著,并不表示方程中的每一個自變量對因變量 的影響都是重要的。因此為了對 的重要程度作出pjx,21y jx比較與檢驗,有必要找出一個與 有關的統(tǒng)計量。jb由于 各 都服從正態(tài)分布,所以的 線 性 函 數(shù) ,是 隨 機 變 量 nj yb,21 jy也 服 從 正 態(tài) 分 布 , 且j 1,0, 22NcbbDbEjjjjjjj 式中, 列 的 元 素 。行 第陣 的 逆 矩 陣 中 第是 正 規(guī) 方 程 組 的 系 數(shù) 矩 jcj5還可以證明, 相 互 獨 立與 SEbj當原假設 分 布 , 推 出服 從成 立 時 , 由并 且為 102200 pnSEHj 11/ ,/2pntpnSEcbt FFjjj jjj ,因此,給出顯著性水平 ,即可進行回歸常數(shù) 的顯pjbb,20與 回 歸 系 數(shù)著性檢驗,得到各個 是否顯著的結論。jb3.4 多元線性回歸的估計與預測與一元線性回歸方程類似,多元線性回歸方程的應用也包括點預測和區(qū)間預測等內(nèi)容。當 時jpp xbyxx 01j0000201 , 且統(tǒng)計量 - N(0, (1+ +00,bEjEj 0y2n1( )( )) ),式中, 為正規(guī)方程組的逆矩陣中第 k 行pkjkc1kx0jjx0kjc第 j 列的元素,因此,當 n 比較大, 與 , . 與 比較接近時,01x2p0x的方差比較小,用 預測 的效果比較好。0y0y作區(qū)間預測時,統(tǒng)計量1)(1(100 pntxxcnMSEtpkj jjkk式中,MSE= ,由置信水平 1- 求出 P =1- 中的臨界值pn )1(tpn)1(t后,若記 )(1()(t 100pkj jjkkxxcnMSEpn則 P =1-,0y6( )便是 的預測區(qū)間,而 為區(qū)間0y, opyxx時00201,.,x的半徑。當 n 比較大, 比較接近時,p與與與 02010.,.MSEnt)1(四、模型的計算與求解4.1 根據(jù)數(shù)據(jù),首先通過 SAS 作圖分別觀察 的線性關系。4321,xy與data keche.kchg;set keche.kecheshuju;symbol i=rl v=star;proc gplot; plot y*x1;/*觀察y 與x1的線性關系*/proc gplot; plot y*x2;/*觀察y 與x2的線性關系*/proc gplot; plot y*x3;/*觀察y 與x3的線性關系*/proc gplot; plot y*x4;/*觀察y 與x4的線性關系*/run;(圖一: 的線性關系)4321,xy分 別 于通過作圖觀察發(fā)現(xiàn), 21x和與 有 很 好 的 線 性 關 系 ,7。的 線 性 關 系 卻 不 是 很 好與但 43x4.2做 的回歸分析與回歸診斷,4321xy關 于4.2.1做 的多元線性回歸關 于data keche.kchg;set keche.kecheshuju;symbol i=rl v=star;proc reg;model y=x1 x2 x3 x4/tol vif collin r;*建立y與x1-x4的多元回歸;run;a)(表一)通過上表可以知道回歸方程式是顯著的( )01.P并且 的 解 釋 效 果好 。 達 到說 明 此 模 型 擬 合 情 況 很決 定 系 數(shù) %94.94.02R8(表二)由上表可得回歸方程 4321 80.296.500 xxy 但是根據(jù)實際情況人均消費水平應該與城鎮(zhèn)居民家庭恩格爾系數(shù)成反比,但是此處的系數(shù) 為正數(shù),所以此回歸方程不符合實際,不采用。4但是通過上表關于各個參數(shù)的顯著性檢驗發(fā)現(xiàn),在 的 水 平 下1.0不是顯著的。, 420在上述情況下,求得的回歸方程不夠精簡,存在不顯著的變量。b)(表三)上表對回歸方程做回歸診斷,檢驗各個變量之間的共線性問題。假設k為條件指數(shù),若10,則認為沒有多重共線性;1030,則認為存在中等程度或較強的多重共線性;30,則認為存在嚴重的多重共線性。從上表的第三、四可以發(fā)現(xiàn)條件指數(shù)比較大,說明變量間存在嚴重的共線性,并且從偏差比例可以猜測 之間存在共線性。此時需要調(diào)整變量使降低其共線性。421,xc)9。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。(表四)上表依據(jù)殘差表對回歸方程做回歸診斷,檢驗各個觀測值中是否存在異常點。其中學生殘差和COOK D統(tǒng)計量用來觀察每
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026廣西崇左憑祥市退役軍人服務中心見習人員招聘1人備考題庫及答案詳解(新)
- 2026上半年貴州事業(yè)單位聯(lián)考貴州省國有資產(chǎn)監(jiān)督管理研究和服務中心招聘2人備考題庫及1套完整答案詳解
- 事業(yè)單位考試題庫《職業(yè)能力傾向測驗》試題及答案-綜合應用能力
- 物業(yè)安全月活動總結
- 2026廣東東莞市橫瀝鎮(zhèn)中心幼兒園教職工招聘2人備考題庫附參考答案詳解(奪分金卷)
- 2026廣西北海市第二中學(北京八中北海分校)臨聘教師招聘2人備考題庫附答案詳解(黃金題型)
- 2026年機器人控制系統(tǒng)設計師綜合能力考試題目及答案
- 城市綠化苗木枯死率高問題排查整改報告
- 2026上半年貴州事業(yè)單位聯(lián)考貴陽學院招聘5人備考題庫含答案詳解(滿分必刷)
- 2026廣東云浮新興縣南藝僑中春季學期臨聘教師2人備考題庫及完整答案詳解1套
- 赤峰出租車資格證考試500題
- 信訪工作知識講座
- 更年期女性心腦血管疾病的預防和保健指南
- 2023年河北省中考英語真題卷(含答案與解析)
- 普通外科患者靜脈血栓栓塞癥風險評估與預防護理
- PVC地膠施工合同
- 聲樂教學與藝術指導的有效結合淺析
- 對標學習華為EMT機制
- 建筑物拆除工程施工組織設計
- GB/T 6730.62-2005鐵礦石鈣、硅、鎂、鈦、磷、錳、鋁和鋇含量的測定波長色散X射線熒光光譜法
- GB/T 40761-2021城市和社區(qū)可持續(xù)發(fā)展改變我們的城市GB/T 40759本地實施指南
評論
0/150
提交評論