【原創(chuàng)】R軟件R語言城鎮(zhèn)居民、農(nóng)村居民現(xiàn)價消費水平建模分析報告_第1頁
【原創(chuàng)】R軟件R語言城鎮(zhèn)居民、農(nóng)村居民現(xiàn)價消費水平建模分析報告_第2頁
【原創(chuàng)】R軟件R語言城鎮(zhèn)居民、農(nóng)村居民現(xiàn)價消費水平建模分析報告_第3頁
【原創(chuàng)】R軟件R語言城鎮(zhèn)居民、農(nóng)村居民現(xiàn)價消費水平建模分析報告_第4頁
【原創(chuàng)】R軟件R語言城鎮(zhèn)居民、農(nóng)村居民現(xiàn)價消費水平建模分析報告_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、【原創(chuàng)】定制代寫 r/python/spss/matlab/WEKA/sas/sql/C+/stata/eviews 數(shù)據(jù)挖掘和統(tǒng)計分析可視化調(diào)研報告等服務(wù)(附代碼數(shù)據(jù)),咨詢郵箱:3025393450有問題請聯(lián)系官網(wǎng)客服:/teradat 有問題到淘寶找“大數(shù)據(jù)部落”就可以了城鎮(zhèn)居民、農(nóng)村居民現(xiàn)價消費水平 R 軟件建模摘要近年來我國的城鎮(zhèn)居民、農(nóng)村居民想消費水平不斷提升,購買力也不斷增強,國民經(jīng)濟也在不斷增長。而我截取了 2003 年到 2012 年間的消費水平數(shù)據(jù),來觀察各個數(shù)據(jù)間的關(guān)系與聯(lián)系,是否是正相關(guān)或者負相關(guān)。我通過多個方法去建模,來驗證我自己的結(jié)

2、論與預(yù)測。而我挖掘的數(shù)據(jù)項目分別是居民消費水平,農(nóng)村居民消費水平,城鎮(zhèn)居民消費水平。通過以下數(shù)據(jù)來進行我的建模分析。關(guān)鍵詞:居民消費水平,城鎮(zhèn)居民消費水平,農(nóng)村居民消費水平城鎮(zhèn)居民、農(nóng)村居民現(xiàn)價消費水平統(tǒng)計數(shù)據(jù)年份居民消費水平農(nóng)場居民消費水平城鎮(zhèn)居民水平20032004503223198912200555962657959320066299295010618200773103347121302008843039101365320099283461314904201010522470016546201112272563318750201213946647520864447521308060(1)

3、多元線性回歸方程設(shè)變量 y 與變量 x1,x2,x3,xp 間有線性關(guān)系y=0+1x1+2x2+.+pxp+&,其中,&N(0,2),0,1,.,p 和 2 是未知參數(shù),p=2,稱上述模型為多元線性回歸模型。多元線性回歸模型與簡單線性回歸模型不同,簡單線性回歸模型中除了一個解釋變量以外,其他影響因素均被歸入為隨機擾動項。多元線性回歸模型把多個解釋變量納入模型,即將原本歸入隨機項的因素納入了模型,這對于經(jīng)濟計量分析是有十分重要的意義。多元線性回歸模型中有對個解釋變量,可以同時估計和檢驗多個因素對被解釋變量的影響,從而避免重要解釋變量被遺漏而導(dǎo)致設(shè)定誤差。blood lm.sol summary(

4、lm.sol)Call:lm(formula = y x1 + x2, data = blood)Residuals:Min1QMedian3QMax-144.626-69.507-0.99638.070268.728Coefficients:Estimate Std. Error t value Pr(|t|)(Intercept) -37.99442131.88814-0.2880.7816x12.250180.0393857.145 1.32e-10 *x2-0.021150.01029-2.0560.0788 .-Signif. codes:0 * 0.001 * 0.01 * 0.0

5、5 . 0.1 1Residual standard error: 136.4 on 7 degrees of freedom Multiple R-squared:0.9986,Adjusted R-squared:0.9982F-statistic:2447 on 2 and 7 DF,p-value: 1.102e-10從回歸結(jié)果看,回歸系數(shù)與回歸方程都是顯著的,因此回歸方程為 y=-37.99+2.25x1- 0.02x2.接下來我做的是多元回歸的預(yù)測區(qū)間。多元線性回歸方程經(jīng)過檢驗是顯著的,且其中每一個系數(shù)均顯著時,可用此方程作為預(yù)測。給定 x=x0=(x01,x02,x03,.,x0

6、p)T,將其帶入回歸方程,得到 y0=0+1x01+.+px0p.對于 x=x0,y=y0 的置信度為 1- 的預(yù)測區(qū)間為(y0-l,y0+l),其中 l=t/2(n-p-1) &*(1+x0T*(xTx)(-1)*x0)(-1).多元線性回歸模型用于經(jīng)濟預(yù)測,是指對各個解釋變量給定樣本意外的數(shù)值 xf=(1,x2f,x3f,.xkf)d 條件下,對預(yù)測期被解釋變量 y 的平均值 E(Yf)及個別值 Yf 進行估計,這種預(yù)測也分為點預(yù)測和區(qū)間預(yù)測。new lm.pred lm.predfitlwrupr 1 5270.199 4887.563 5652.836由軟件求得,y0=15270.19

7、9,相應(yīng)的 y 的概率為 0.95 的預(yù)測區(qū)間為4887.563,5652.823.(2)箱線圖能直觀簡潔的展現(xiàn)數(shù)據(jù)分布的特征。在箱線圖中,上(Q3)下(Q1)四分位數(shù)分別確定出中間箱體的頂部和底部。箱體中間的粗線是中位數(shù)(me)所在的位置。由箱體向上下伸出的垂直部分稱為觸須,表示數(shù)據(jù)的分布范圍,最遠的點位 1.5 倍四分位數(shù)間距,超出此范圍的點稱為異常值點,異常值點用“o”號表示。x1 x2 y boxplot(x1,x2,y,notch=T,names=c(x1,x2,y),vcol=c(1,2,3)從圖中我們可以看出三組的均值不等,第二組明顯高于第三,第一組值。(3)t 檢驗多元線性回歸

8、分析的目的,不僅是獲得比較高的擬合優(yōu)度的模型,也不僅是尋求方程整體的顯著性,而是要對各個總體回歸參數(shù)作出有意義的估計。因為方程的整體線性關(guān)系顯著并不一定表示美國解釋變量對被解釋變量的影響都是顯著的。因此,還必須分別對美國解釋變量進行顯著性檢驗。多元回歸分析中對各個回歸系數(shù)的顯著性檢驗,目的在與分別檢驗當其他解釋變量不變時,該回歸系數(shù)對應(yīng)的解釋變量是否對唄解釋變量有顯著影響。一般來說,多元線性回歸模型在經(jīng)過參數(shù)估計和模型檢驗后,應(yīng)對回歸分析結(jié)果做出分析判斷。倘若某些解釋變量對被解釋變量的影響不顯著,則應(yīng)重新建立多元線性回歸方程模型,對于新模型參數(shù)進行估計和假設(shè)檢驗,直到獲得滿意的結(jié)果為止。 co

9、r.test(x1+x2,data=blood)Pearsons product-moment correlation data:x1 and x2t = 2.1242, df = 8, p-value = 0.06639alternative hypothesis: true correlation is not equal to 095 percent confidence interval:-0.046800980.89263760sample estimates: cor0.6005209 cor.test(y+x1,data=blood)Pearsons product-moment

10、 correlation data:y and x1t = 59.024, df = 8, p-value = 7.54e-12alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval:0.9949667 0.9997394sample estimates: cor0.9988538 cor.test(y+x2,data=blood)Pearsons product-moment correlation data:y and x2t = 1.9948, df = 8, p-

11、value = 0.08117alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval:-0.083624090.88486947sample estimates:cor 0.576348從上述計算結(jié)果可以看出,x1,x2,y 兩兩均相關(guān)。我們在圖中可以看出,每個 t 檢驗的 p值都小于 0.1,因此拒絕原假設(shè),選擇備擇假設(shè)。因此認為兩兩相關(guān)。(4)應(yīng)用多元分析用 princomp()作主成分分析,由前面的分析,選擇相關(guān)矩陣作主成分分析更合理,因此這里選擇的參數(shù)是 cor=

12、TRUE.最后用 summary()列出主成分分析的值,這里選擇loadings=TRUE。 blood blood.pr summary(blood.pr,loadings=TRUE) Importance of components:Comp.1Comp.2 Standard deviation1.4129826 0.058992994Proportion of Variance 0.9982599 0.001740087Cumulative Proportion0.9982599 1.000000000Loadings:Comp.1 Comp.2 x10.707 -0.707x20.70

13、70.707 y*1=0.707x*1+0.707x*2, y*2=-0.707x*1+0.7077.在上述程序中,語句 blood.pr-princomp(blood,cor=TRUE)可以改成 blood.pr predict(blood.pr)Comp.1Comp.2 1, -1.790159130.0090049212, -1.56317739 -0.0248839293, -1.258443090.0157013334, -0.944145760.0007490665, -0.50459654 -0.0332029166,0.04527512 -0.0078825307,0.6041

14、38030.1514783808,0.93872247 -0.0942220329,1.82513045 -0.02742542510,2.647255830.010683132 screeplot(blood.pr,type=lines) pre blood$z1-pre,1;blood$z2 lm.sol summary(lm.sol) Call:lm(formula = y z1 + z2, data = blood)Residuals:Min1QMedian3QMax-204.67-92.18-23.09102.50160.91Coefficients:Estimate Std. Er

15、ror t value Pr(|t|)(Intercept) 13403.0044.66 300.123 1.20e-15 *z12906.5731.6191.963 4.74e-12 *z2-2691.79757.01-3.5560.00927 *-Signif. codes:0 * 0.001 * 0.01 * 0.05 . 0.1 1Residual standard error: 141.2 on 7 degrees of freedom Multiple R-squared:0.9992,Adjusted R-squared:0.9989F-statistic:4235 on 2 a

16、nd 7 DF,p-value: 1.618e-11回歸系數(shù)和回歸方程均通過檢驗,而且效果顯著,即得到回歸方程為y=13403+2906.57z*1-2691.79. beta-coef(lm.sol);A x.bar-blood.pr$center;x.sd coef coef beta0 c(beta0,coef)(Intercept)x1x2 1932.12261500.23492112.4570548在程序中,coef 函數(shù)是提取回歸系數(shù);loadings 是提取主要成分對應(yīng)的特征向量; blood.pr$center 是數(shù)據(jù)的中心,也就是數(shù)據(jù) x 的均值;blood.p$scale

17、是數(shù)據(jù)的標準差,即 s 的開方,優(yōu)化以后的回歸方程為Y=1932.1226150+0.2349211x1+2.4570548x2.此時,x1,x2 對應(yīng)的系數(shù)均為正數(shù),比原回歸方程更合理??偨Y(jié):在畫水箱圖的時候,我忘記了給后面的顏色賦值,把 vcol=c 寫成了 vcol=后面直接加上顏色的代號,而忘記賦值著一個步驟。說實話,畫圖這個部分,我不是掌握的很好,雖然能夠畫出圖,但是需要看書才能去完成,自己的獨立性不高,還有對很多圖的代碼不明白,畫其他的圖容易出現(xiàn)錯誤。再次做的 t 檢驗,也就是檢查各個項數(shù)之間的關(guān)系,但是我開始時對其中的 data 賦值比較模糊,習(xí)慣性的會按照書上的來,也導(dǎo)致后面的程序之間運行不了。沒有看到先前代碼的賦值,會遺忘原先代碼的賦值,到后來,我翻書才把那些錯誤糾正過來。所以我對書的一來性還是很強的,自己獨自完成的量確實很小。嚴重發(fā)現(xiàn)自己的短板與不足,接下來要好好努力去學(xué)習(xí)這門很實用的課程,把以前沒有搞懂的知識點都好好復(fù)習(xí),鞏固。更加熟悉的運用這個軟件。我在做這篇報告的時候,其實是真的比較擔心的,一直擔心報告的內(nèi)容出錯,有問題, 對各種問題的把握不熟悉,以及對 R 的理解程度不夠。作為一門軟件,R 是一款功能強大的統(tǒng)計軟件包,R 是屬于 GNU 系統(tǒng)的一個自由、免費、源代碼開放的軟件,全世界的 R 愛好者不斷的開發(fā),使 R 軟件的發(fā)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論