已閱讀5頁(yè),還剩15頁(yè)未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
數(shù)理統(tǒng)計(jì) 課程論文 題目:運(yùn)用 SAS 軟件對(duì)我國(guó)人均消費(fèi)支出的統(tǒng)計(jì)分析1我國(guó)城鎮(zhèn)居民人均消費(fèi)支出的回歸分析摘要:本文基于城鎮(zhèn)居民平均消費(fèi)水平,做多元線性回歸模型。首先,做 的回歸模型,以及對(duì)齊進(jìn)行回歸診斷。結(jié)果發(fā)現(xiàn)4321x,y關(guān) 于回歸方程顯著,但是截距, 不是顯著的,且 的系數(shù)與實(shí)際情42x, 4x況不符合,并且變量間存在共線性,且數(shù)據(jù)中存在異常點(diǎn)。接著,對(duì)刪除異常點(diǎn)的數(shù)據(jù)做回歸分析,接著對(duì)不同的自變量組合做回歸分析并做逐步回歸,確定最優(yōu)的自變量組合。最后用最優(yōu)的自變量組合結(jié)合去除異常點(diǎn)的數(shù)據(jù)做回歸分析,殘差分析,確定回歸模型。最后得到最優(yōu)的回歸方程為 ,決321062.8xxy定系數(shù) 等于 0.9996。2R關(guān)鍵詞:回歸分析、殘差分析、逐步回歸、回歸診斷、城鎮(zhèn)居民平均消費(fèi)水平1、引言城鎮(zhèn)居民消費(fèi)水平是指居民在物質(zhì)產(chǎn)品和勞務(wù)的消費(fèi)過(guò)程中,對(duì)滿足人們生存、發(fā)展和享受需要方面所達(dá)到的程度。通過(guò)消費(fèi)的物質(zhì)產(chǎn)品和勞務(wù)的數(shù)量和質(zhì)量反映出來(lái)。本問(wèn)題要求通過(guò)收集整理數(shù)據(jù),掌握對(duì)城鎮(zhèn)人均消費(fèi)支出的影響因素, 利用 SAS 軟件進(jìn)行多元回歸分析,求出回歸方程,進(jìn)行統(tǒng)計(jì)檢驗(yàn)(包括回歸方程的顯著2性檢驗(yàn),回歸系數(shù)的顯著性檢驗(yàn))以及殘差的檢驗(yàn);然后進(jìn)行估計(jì)和預(yù)測(cè)。2、數(shù)據(jù)來(lái)源、指標(biāo)闡述、及相關(guān)信息本問(wèn)題所涉及的指標(biāo)變量有一下五項(xiàng):1:城鎮(zhèn)居民平均消費(fèi)水平(y)。2:城鎮(zhèn)居民平均可支配收入(x1)。居民可支配收入=城鎮(zhèn)居民家庭總收入-交納所得稅-個(gè)人交納的社會(huì)保 障支出3:城鎮(zhèn)居民人均國(guó)內(nèi) GDP(x2)。4:城鎮(zhèn)居民消費(fèi)價(jià)格指數(shù)(x3)。5:城鎮(zhèn)居民家庭恩格爾系數(shù)(x4)。恩格爾系數(shù)是食品支出總額占個(gè)人消費(fèi)支出總額的比重上述所有數(shù)據(jù)均來(lái)自于中國(guó)統(tǒng)計(jì)年鑒網(wǎng)(/kns55/index.aspx) 數(shù)據(jù)的時(shí)間范圍為(1978-2012) 。其中城鎮(zhèn)居民消費(fèi)價(jià)格指數(shù),以 1978 年為基 100 計(jì)算。年份 城鎮(zhèn)居民平均消費(fèi)水平 人均可支配收 入 人均國(guó)內(nèi)生產(chǎn)總 值 城鎮(zhèn)居民消費(fèi)價(jià)格指數(shù) 城鎮(zhèn)居民家庭恩 格爾系數(shù)%1978 405.0 343.4 381.2 100.0 57.5 1979 425.0 405.0 419.3 101.9 57.2 1980 489.0 477.6 463.3 109.5 56.9 1981 521.0 500.4 492.2 112.3 56.7 1982 536.0 535.3 527.8 114.5 58.6 1983 558.0 564.6 582.7 116.8 59.2 1984 618.0 652.1 695.2 120.0 58.0 1985 765.0 739.1 857.8 134.2 53.3 1986 872.0 900.9 963.2 143.6 52.4 1987 998.0 1002.1 1112.4 156.3 53.5 1988 1311.0 1180.2 1365.5 188.6 51.4 1989 1466.0 1373.9 1519.0 219.4 54.5 1990 1596.0 1510.2 1644.0 222.2 54.2 1991 1840.0 1700.6 1892.8 233.6 53.8 1992 2262.0 2026.6 2311.1 253.7 53.0 1993 2924.0 2577.4 2998.4 294.5 50.3 1994 3852.0 3496.2 4044.0 368.1 50.0 1995 4931.0 4283.0 5045.7 430.0 50.1 1996 5532.0 4838.9 5845.9 467.8 48.8 1997 5823.0 5160.3 6420.2 482.3 46.6 1998 6109.0 5425.1 6796.0 479.4 44.7 1999 6405.0 5854.0 7158.5 473.2 42.1 2000 6850.0 6280.0 7857.7 477.0 39.4 2001 7161.0 6859.6 8621.7 480.3 38.2 32002 7486.0 7702.8 9398.1 475.5 37.7 2003 8060.0 8472.2 10542.0 479.8 37.1 2004 8912.0 9421.6 12335.6 495.6 37.7 2005 9593.0 10493.0 14185.4 503.5 36.7 2006 10618.0 11759.5 16499.7 511.1 35.8 2007 12130.0 13785.8 20169.5 534.1 36.3 2008 13653.0 15780.8 23707.7 564.0 37.9 2009 14904.0 17174.7 25607.5 558.9 36.5 2010 16546.0 19109.4 30015.0 576.8 35.7 2011 18750.0 21809.8 35197.8 607.4 36.3 2012 21119.7 24564.7 38420.4 623.8 36.2 三、多元線性回歸理論基礎(chǔ)3.1 多元線性回歸的概念設(shè)自變量 的觀測(cè)值 及因變量 對(duì)應(yīng)的觀測(cè)值 滿px,,21 ipix,21 yiy足關(guān)系式 niyipjiji ,10 式中, 是相互獨(dú)立且都服從正態(tài)分布,21n 的 隨 機(jī) 變 量 。2,0N根據(jù)最小二乘法,由 n 個(gè)觀測(cè)值 確定參數(shù)ipiyx,21后,得到公式的估計(jì)值, 210210 pp bb 及的 估 計(jì) 值及 稱(chēng)為多元線性回歸方程。建立多元線性回歸方程的過(guò)程以及對(duì)jjxb10y回歸方程與回歸數(shù)所做的顯著性檢驗(yàn),稱(chēng)為多元線性回歸分析或多元線性回歸。,則pjjipi xbx 1021 y, , 記帶 入 多 元 線 性 回 歸 方 程如 果 將 iyi與之間的偏差平方和 ni pjjiniiiyQ2102b由 正 規(guī) 方 程 組 ???得 到 多 元 線 性 回 歸 的pjbj ,10通過(guò)解正規(guī)方程組,即可以算出 求出回歸方程。,210pbb及3.2 回歸方程的顯著性檢驗(yàn)4與一元線性回歸方程相類(lèi)似,多元線性回歸方程的總平方和 SST 也可以分解為剩余平方和 SSE 和回歸平方和 SSR,即SST=SSR+SSE式中,pjjyniiyii lbSRlT112而 ,2,1 因 此pjyxlinijijjy SRlEy如果 SSR 的數(shù)值較大, SSE 的數(shù)值便比較小,說(shuō)明回歸的效果好。如果 SSR 的數(shù)值較小,SSE 的數(shù)值便比較大,說(shuō)明回歸的效果差。理論上已經(jīng)證明:當(dāng)原假設(shè) 成 立 時(shí) , 并 且,為 02100HHp,1,222 pnSESRnST且 SSR 與 SSE 相互獨(dú)立, ,1/pFSEF的 無(wú) 偏 估 計(jì) 量 。為 221pnMSE因此,給出顯著性水平 ,即可進(jìn)行回歸方程的顯著性檢驗(yàn)。3.3 回歸系數(shù)的顯著性檢驗(yàn)一個(gè)多元線性回歸方程顯著,并不表示方程中的每一個(gè)自變量對(duì)因變量 的影響都是重要的。因此為了對(duì) 的重要程度作出pjx,21y jx比較與檢驗(yàn),有必要找出一個(gè)與 有關(guān)的統(tǒng)計(jì)量。jb由于 各 都服從正態(tài)分布,所以的 線 性 函 數(shù) ,是 隨 機(jī) 變 量 nj yb,21 jy也 服 從 正 態(tài) 分 布 , 且j 1,0, 22NcbbDbEjjjjjjj 式中, 列 的 元 素 。行 第陣 的 逆 矩 陣 中 第是 正 規(guī) 方 程 組 的 系 數(shù) 矩 jcj5還可以證明, 相 互 獨(dú) 立與 SEbj當(dāng)原假設(shè) 分 布 , 推 出服 從成 立 時(shí) , 由并 且為 102200 pnSEHj 11/ ,/2pntpnSEcbt FFjjj jjj ,因此,給出顯著性水平 ,即可進(jìn)行回歸常數(shù) 的顯pjbb,20與 回 歸 系 數(shù)著性檢驗(yàn),得到各個(gè) 是否顯著的結(jié)論。jb3.4 多元線性回歸的估計(jì)與預(yù)測(cè)與一元線性回歸方程類(lèi)似,多元線性回歸方程的應(yīng)用也包括點(diǎn)預(yù)測(cè)和區(qū)間預(yù)測(cè)等內(nèi)容。當(dāng) 時(shí)jpp xbyxx 01j0000201 , 且統(tǒng)計(jì)量 - N(0, (1+ +00,bEjEj 0y2n1( )( )) ),式中, 為正規(guī)方程組的逆矩陣中第 k 行pkjkc1kx0jjx0kjc第 j 列的元素,因此,當(dāng) n 比較大, 與 , . 與 比較接近時(shí),01x2p0x的方差比較小,用 預(yù)測(cè) 的效果比較好。0y0y作區(qū)間預(yù)測(cè)時(shí),統(tǒng)計(jì)量1)(1(100 pntxxcnMSEtpkj jjkk式中,MSE= ,由置信水平 1- 求出 P =1- 中的臨界值pn )1(tpn)1(t后,若記 )(1()(t 100pkj jjkkxxcnMSEpn則 P =1-,0y6( )便是 的預(yù)測(cè)區(qū)間,而 為區(qū)間0y, opyxx時(shí)00201,.,x的半徑。當(dāng) n 比較大, 比較接近時(shí),p與與與 02010.,.MSEnt)1(四、模型的計(jì)算與求解4.1 根據(jù)數(shù)據(jù),首先通過(guò) SAS 作圖分別觀察 的線性關(guān)系。4321,xy與data keche.kchg;set keche.kecheshuju;symbol i=rl v=star;proc gplot; plot y*x1;/*觀察y 與x1的線性關(guān)系*/proc gplot; plot y*x2;/*觀察y 與x2的線性關(guān)系*/proc gplot; plot y*x3;/*觀察y 與x3的線性關(guān)系*/proc gplot; plot y*x4;/*觀察y 與x4的線性關(guān)系*/run;(圖一: 的線性關(guān)系)4321,xy分 別 于通過(guò)作圖觀察發(fā)現(xiàn), 21x和與 有 很 好 的 線 性 關(guān) 系 ,7。的 線 性 關(guān) 系 卻 不 是 很 好與但 43x4.2做 的回歸分析與回歸診斷,4321xy關(guān) 于4.2.1做 的多元線性回歸關(guān) 于data keche.kchg;set keche.kecheshuju;symbol i=rl v=star;proc reg;model y=x1 x2 x3 x4/tol vif collin r;*建立y與x1-x4的多元回歸;run;a)(表一)通過(guò)上表可以知道回歸方程式是顯著的( )01.P并且 的 解 釋 效 果好 。 達(dá) 到說(shuō) 明 此 模 型 擬 合 情 況 很決 定 系 數(shù) %94.94.02R8(表二)由上表可得回歸方程 4321 80.296.500 xxy 但是根據(jù)實(shí)際情況人均消費(fèi)水平應(yīng)該與城鎮(zhèn)居民家庭恩格爾系數(shù)成反比,但是此處的系數(shù) 為正數(shù),所以此回歸方程不符合實(shí)際,不采用。4但是通過(guò)上表關(guān)于各個(gè)參數(shù)的顯著性檢驗(yàn)發(fā)現(xiàn),在 的 水 平 下1.0不是顯著的。, 420在上述情況下,求得的回歸方程不夠精簡(jiǎn),存在不顯著的變量。b)(表三)上表對(duì)回歸方程做回歸診斷,檢驗(yàn)各個(gè)變量之間的共線性問(wèn)題。假設(shè)k為條件指數(shù),若10,則認(rèn)為沒(méi)有多重共線性;1030,則認(rèn)為存在中等程度或較強(qiáng)的多重共線性;30,則認(rèn)為存在嚴(yán)重的多重共線性。從上表的第三、四可以發(fā)現(xiàn)條件指數(shù)比較大,說(shuō)明變量間存在嚴(yán)重的共線性,并且從偏差比例可以猜測(cè) 之間存在共線性。此時(shí)需要調(diào)整變量使降低其共線性。421,xc)9。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。 。(表四)上表依據(jù)殘差表對(duì)回歸方程做回歸診斷,檢驗(yàn)各個(gè)觀測(cè)值中是否存在異常點(diǎn)。其中學(xué)生殘差和COOK D統(tǒng)計(jì)量用來(lái)觀察每
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 《GB-T 39003.1-2020工業(yè)自動(dòng)化系統(tǒng)工程用工程數(shù)據(jù)交換格式 自動(dòng)化標(biāo)識(shí)語(yǔ)言 第1部分:架構(gòu)和通 用要求》專(zhuān)題研究報(bào)告
- 《GB-T 11322.1-2013射頻電纜 第0部分:詳細(xì)規(guī)范設(shè)計(jì)指南 第1篇 同軸電纜》專(zhuān)題研究報(bào)告
- 《GB-T 31181-2014假肢 踝足裝置和足部組件 要求和試驗(yàn)方法》專(zhuān)題研究報(bào)告
- 《GB-T 38842-2020實(shí) 用超導(dǎo)線的分類(lèi)和檢測(cè)方法 一般特性和指南》專(zhuān)題研究報(bào)告
- 《GBT 34475-2017 尿素級(jí)奧氏體不銹鋼棒》專(zhuān)題研究報(bào)告
- 《GB-T 7268-2015電力系統(tǒng)保護(hù)及其自動(dòng)化裝置用插箱及插件面板基本尺寸系列》專(zhuān)題研究報(bào)告
- Tiamo-basical-method-1參考資料說(shuō)明
- 《幼兒文學(xué)》課件-6.2幼兒圖畫(huà)故事特點(diǎn)
- 種子行業(yè)種子銷(xiāo)售經(jīng)理崗位招聘考試試卷及答案
- 2026年消防安全工作計(jì)劃(2篇)
- 贛南師范大學(xué)《中國(guó)地理》2022-2023學(xué)年第一學(xué)期期末試卷
- 興業(yè)銀行還款合同模板
- 基于機(jī)器學(xué)習(xí)的房性心動(dòng)過(guò)速射頻消融預(yù)測(cè)模型
- GB/T 44239-2024增材制造用鋁合金粉
- 溫泉洗浴中心管理手冊(cè)樣本
- 內(nèi)分泌科醫(yī)生進(jìn)修匯報(bào)
- 工業(yè)固廢運(yùn)輸處置投標(biāo)方案(技術(shù)標(biāo))
- 泰文租房合同
- 《機(jī)械制圖》期末考試題庫(kù)388題(含答案)
- 培訓(xùn)費(fèi)收款收據(jù)模板
- 鋼結(jié)構(gòu)施工技術(shù)指導(dǎo)手冊(cè)
評(píng)論
0/150
提交評(píng)論