Excel 回歸分析結(jié)果詳解_第1頁(yè)
Excel 回歸分析結(jié)果詳解_第2頁(yè)
Excel 回歸分析結(jié)果詳解_第3頁(yè)
Excel 回歸分析結(jié)果詳解_第4頁(yè)
Excel 回歸分析結(jié)果詳解_第5頁(yè)
已閱讀5頁(yè),還剩4頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、 Excel回歸分析結(jié)果詳解利用Excel的數(shù)據(jù)分析進(jìn)行回歸,可以得到一系列的統(tǒng)計(jì)參量。下面以連續(xù)10年積雪深度和灌溉面積序列(圖1)為例給予詳細(xì)的說(shuō)明。AIBBC1年份最大積雪洙度規(guī)米灌溉面積y(千田2197115.228.63197210.419.34197321.240.5519741S.635.66197526.448.97197&23.4458197713.529.29197316.734.11019792446.71119S019.137.4圖1連續(xù)10年的最大積雪深度與灌溉面積(19711980)回歸結(jié)果摘要(SummaryOutput)如下(圖2):ABCDEFGIHIISUM

2、MARYOUTPUT回歸統(tǒng)i-MultipleRSquareAdJLie標(biāo)卷誤差觀測(cè)值0.9894160.3789440.9763121.41892410方差分析df汩NSF?nifi:anceF回歸分析殘差總計(jì)1748.8542748.8542371.94535.425-03s16.106762.0133459764.961Coefficien-杯港誤差tStat?-valueLower9E%Upper95%F限95.0!上艱95.0cIritcrccpi2.3563S最天積Si1.8129211.8278761.289167(i.233363-1.858656.5T1E3-1.SES6E6

3、.571E30.09400219.285885.42E-C81.5961512.0296911.5961512.029691RESIDUALOUTPUTPROBABILITYOUTPUT觀測(cè)值體溉面積y孫差師世殘差弓分山推筑面積譏T田)1234529.91284-1.31284-0.981363A.321.21082-1.910B2-1.428361528.640.79036-0.29036-0.217052529.236.07677-0.47677-0.356393S34.150.21755-1.31755-0.984894535.6圖2利用數(shù)據(jù)分析工具得到的回歸結(jié)果第一部分回歸統(tǒng)計(jì)表這一部

4、分給出了相關(guān)系數(shù)、測(cè)定系數(shù)、校正測(cè)定系數(shù)、標(biāo)準(zhǔn)誤差和樣本數(shù)目如下(表1)表1回歸統(tǒng)計(jì)表回歸統(tǒng)計(jì)Multipie0.989416RSquare0.978944Adjustud0.976312標(biāo)淮誤差1.413924觀泌值10逐行說(shuō)明如下:Multiple對(duì)應(yīng)的數(shù)據(jù)是相關(guān)系數(shù)(correlationcoefficient),即R=0.989416。RSquare對(duì)應(yīng)的數(shù)值為測(cè)定系數(shù)(determinationcoefficient),或稱擬合優(yōu)度(goodnessoffit),它是相關(guān)系數(shù)的平方,即有R2=0.9894162=0.978944。Adjusted對(duì)應(yīng)的是校正測(cè)定系數(shù)(adjusted

5、determinationcoefficient),計(jì)算公式為R=1-(n一1)(1一R2)an一m1R二1-(1一1)(1一.978944)二0.976312a式中n為樣本數(shù),m為變量數(shù),R2為測(cè)定系數(shù)。對(duì)于本例,n=10,m=1,R2=0.978944,代入上式得10一1一1標(biāo)準(zhǔn)誤差(standarderror)對(duì)應(yīng)的即所謂標(biāo)準(zhǔn)誤差,計(jì)算公式為SSen一m一1這里SSe為剩余平方和,可以從下面的方差分析表中讀出,即有SSe=16.10676,代入上式可得16.1067611仆s二二1.41892410-1-1最后一行的觀測(cè)值對(duì)應(yīng)的是樣本數(shù)目,即有n=10。第二部分方差分析表方差分析部分包括

6、自由度、誤差平方和、均方差、F值、P值等(表2)。表2方差分析表(ANOVA)方差分析dfSSMSFgificance回歸分析1748.8542748.8542371.9453542E-08殘差316.106762.013345總計(jì)9764.961逐列、分行說(shuō)明如下:第一列df對(duì)應(yīng)的是自由度(degreeoffreedom),第一行是回歸自由度dfr,等于變量數(shù)目,即dfr=m;第二行為殘差自由度dfe,等于樣本數(shù)目減去變量數(shù)目再減1,即有dfe=n-m-1;第三行為總自由度dft,等于樣本數(shù)目減1,即有dft=n-l。對(duì)于本例,m=1,n=10,因此,dfr=1,dfe=n-m-1=8,df

7、t=n-1=9。第二列SS對(duì)應(yīng)的是誤差平方和,或稱變差。第一行為回歸平方和或稱回歸變差SSr,即有SSr二工(y-y)2二748.8542ii它表征的是因變量的預(yù)測(cè)值對(duì)其平均值的總偏差。第二行為剩余平方和(也稱殘差平方和)或稱剩余變差SSe,即有SSe二工(y-y)2二16.10676ii它表征的是因變量對(duì)其預(yù)測(cè)值的總偏差,這個(gè)數(shù)值越大,意味著擬合的效果越差。上述的y的標(biāo)準(zhǔn)誤差即由SSe給出。第三行為總平方和或稱總變差SSt,即有SSt二工(y-y)2二764.961ii它表示的是因變量對(duì)其平均值的總偏差。容易驗(yàn)證748.8542+16.10676=764.961,即有SSr+SSe=SSt而

8、測(cè)定系數(shù)就是回歸平方和在總平方和中所占的比重,即有SSrSSt748.8542764.961二0.978944顯然這個(gè)數(shù)值越大,擬合的效果也就越好。第四列MS對(duì)應(yīng)的是均方差,它是誤差平方和除以相應(yīng)的自由度得到的商。第一行為回第二行為剩余均方差MSe,即有愛(ài)二161坯二2.013345MSe二dfe8顯然這個(gè)數(shù)值越小,擬合的效果也就越好。第四列對(duì)應(yīng)的是F值,用于線性關(guān)系的判定。FR2(1-R2)n-m-1對(duì)于一元線性回歸,F(xiàn)值的計(jì)算公式為_(kāi)dfeR21-R2歸均方差MSr,即有MSr_SSr_748.8542_748.8542dfr1式中R2=0.978944,dfe=10-1-1=8,因此8*

9、0.978944F_8_371.94531-0.978944第五列SignificanceF對(duì)應(yīng)的是在顯著性水平下的Fa臨界值,其實(shí)等于P值,即棄真概率。所謂“棄真概率”即模型為假的概率,顯然1-P便是模型為真的概率??梢?jiàn),P值越小越好。對(duì)于本例,P=0.0000000542v0.0001,故置信度達(dá)到99.99%以上。第三部分回歸參數(shù)表回歸參數(shù)表包括回歸模型的截距、斜率及其有關(guān)的檢驗(yàn)參數(shù)(表3)。表3回歸參數(shù)表Cmeff讓iEirlis標(biāo)準(zhǔn)誤差tStatLi怔ru印t2.35643旳羽1戲五比1.哲916可最大積雪深度工(米)1.8129210650.0勺400引19.撫5茨Fmlue山舊孔

10、95%Upw:r95%下限95.0%上限勺5.側(cè)R2爍制-1.亦65譏715301-i那&5465Y15同|b42E731.5觥1氐末2969131.59&150320296913第一列Coefficients對(duì)應(yīng)的模型的回歸系數(shù),包括截距a=2.356437929和斜率b=1.812921065,由此可以建立回歸模型y二2.3564+1.8129xii或y二2.3564+1.8129x+iii第二列為回歸系數(shù)的標(biāo)準(zhǔn)誤差(用s或s表示),誤差值越小,表明參數(shù)的精確度越高。ab這個(gè)參數(shù)較少使用,只是在一些特別的場(chǎng)合出現(xiàn)。例如L.Benguigui等人在Whenandwhereisacityfra

11、ctal?一文中將斜率對(duì)應(yīng)的標(biāo)準(zhǔn)誤差值作為分形演化的標(biāo)準(zhǔn),建議采用0.04作為分維判定的統(tǒng)計(jì)指標(biāo)(參見(jiàn)EPB2000)。不常使用標(biāo)準(zhǔn)誤差的原因在于:其統(tǒng)計(jì)信息已經(jīng)包含在后述的t檢驗(yàn)中。第三列tStat對(duì)應(yīng)的是統(tǒng)計(jì)量t值,用于對(duì)模型參數(shù)的檢驗(yàn),需要查表才能決定t值是回歸系數(shù)與其標(biāo)準(zhǔn)誤差的比值,即有根據(jù)表3中的數(shù)據(jù)容易算出:2.3564381.827876二1.289167,1.8129210.094002二19.28588對(duì)于一元線性回歸,t值可用相關(guān)系數(shù)或測(cè)定系數(shù)計(jì)算,公式如下Rt=:1-R2n-m-1將R=0.989416、n=10、m=1代入上式得到二19.285880.989416t=:

12、1-0.989416210-1-1對(duì)于一元線性回歸,F(xiàn)值與t值都與相關(guān)系數(shù)R等價(jià),因此,相關(guān)系數(shù)檢驗(yàn)就已包含了這部分信息。但是,對(duì)于多元線性回歸,t檢驗(yàn)就不可缺省了。第四列Pvalue對(duì)應(yīng)的是參數(shù)的P值(雙側(cè))。當(dāng)PV0.05時(shí),可以認(rèn)為模型在*0.05的水平上顯著,或者置信度達(dá)到95%;當(dāng)PV0.01時(shí),可以認(rèn)為模型在=0.01的水平上顯著,或者置信度達(dá)到99%;當(dāng)PV0.001時(shí),可以認(rèn)為模型在=0.001的水平上顯著,或者置信度達(dá)到99.9%。對(duì)于本例,P=0.0000000542v0.0001,故可認(rèn)為在=0.0001的水平上顯著,或者置信度達(dá)到99.99%。P值檢驗(yàn)與t值檢驗(yàn)是等價(jià)的

13、,但P值不用查表,顯然要方便得多。最后幾列給出的回歸系數(shù)以95%為置信區(qū)間的上限和下限??梢钥闯?,在o=0.05的顯著水平上,截距的變化上限和下限為-1.85865和6.57153,即有-1.85865a6.57153斜率的變化極限則為1.59615和2.02969,即有1.59615b2.02969第四部分殘差輸出結(jié)果這一部分為選擇輸出內(nèi)容,如果在“回歸”分析選項(xiàng)框中沒(méi)有選中有關(guān)內(nèi)容,則輸出結(jié)果不會(huì)給出這部分結(jié)果。殘差輸出中包括觀測(cè)值序號(hào)(第一列,用i表示),因變量的預(yù)測(cè)值(第二列,用y表i示),殘差(residuals,第二列,用e表示)以及標(biāo)準(zhǔn)殘差(表4)。i表4殘差輸出結(jié)果觀值預(yù)測(cè)灌溉

14、面積y(千田)殘差標(biāo)準(zhǔn)殘差129.912S3S11-1.31284-0.98136221.210317-1.91082-1.42836340.7903645-0.29036-0.21705436.07676973-0.47677-0.35639550.21755404-1.31755-0.9S4S9&44.778790840.2212090.165356T26.S3087232.3691281.770947832.632219711.467781.097181945.8665434S0.8334570.6230171036.983230270.416770.31154預(yù)測(cè)值是用回歸模型y二2.

15、3564+1.8129xii計(jì)算的結(jié)果,式中x.即原始數(shù)據(jù)的中的自變量。從圖1可見(jiàn),x,=15.2,代入上式,得i1y二2.3564+1.8129x=2.3564+1.8129*15.2=29.9128411其余依此類推。殘差e.的計(jì)算公式為ie二yy.從圖1可見(jiàn),y1=28.6,代入上式,得到e二y-y二28.6-29.91284=-1.31284111其余依此類推。標(biāo)準(zhǔn)殘差即殘差的數(shù)據(jù)標(biāo)準(zhǔn)化結(jié)果,借助均值命令average和標(biāo)準(zhǔn)差命令stdev容易驗(yàn)證,殘差的算術(shù)平均值為0,標(biāo)準(zhǔn)差為1.337774。利用求平均值命令standardize(殘差的單元格范圍,均值,標(biāo)準(zhǔn)差)立即算出表4中的結(jié)

16、果。當(dāng)然,也可以利用數(shù)據(jù)標(biāo)準(zhǔn)化公式z*.zziJvar(z/逐一計(jì)算。將殘差平方再求和,便得到殘差平方和即剩余平方和,即有SSe=Xe2=工(y一y)2=16.10676iiii=1i=1利用Excel的求平方和命令sumsq容易驗(yàn)證上述結(jié)果。以最大積雪深度x.為自變量,以殘差e.為因變量,作散點(diǎn)圖,可得殘差圖(圖3)。殘ii差點(diǎn)列的分布越是沒(méi)有趨勢(shì)(沒(méi)有規(guī)則,即越是隨機(jī)),回歸的結(jié)果就越是可靠。用最大積雪深度x.為自變量,用灌溉面積y.及其預(yù)測(cè)值y.為因變量,作散點(diǎn)圖,可得.線性擬合圖(圖4)。最大積雪深度x(米)ResidualPlot1差0殘0-110152025-2-3最大積雪深度x(

17、米)圖3殘差圖最大積雪深度x(米)LineFitPlot-_OooooooO654321千面溉灌灌溉面積y(千畝)-預(yù)測(cè)灌溉面積y(千畝)102030最大積雪深度x(米)圖4線性擬合圖第五部分概率輸出結(jié)果在選項(xiàng)輸出中,還有一個(gè)概率輸出(ProbabilityOutput)表(表5)。第一列是按等差數(shù)列設(shè)計(jì)的百分比排位,第二列則是原始數(shù)據(jù)因變量的自下而上排序(即從小到大)選中圖1中的第三列(C列)數(shù)據(jù),用鼠標(biāo)點(diǎn)擊自下而上排序按鈕丨,立即得到表5中的第二AI列數(shù)值。當(dāng)然,也可以沿著主菜單的數(shù)據(jù)(D)-排序(S)”路徑,打開(kāi)數(shù)據(jù)排序選項(xiàng)框,進(jìn)行數(shù)據(jù)排序。6050畝千40積只30面溉20灌10NormalProbabilityPlot用表5中的數(shù)據(jù)作散點(diǎn)圖,可以得到Excel所謂的正態(tài)概率圖(圖5)。表5概率輸出表百分比排位灌溉面積y(千田)519.31528.62529.23534.14535

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論