多元線性回歸分析_第1頁
多元線性回歸分析_第2頁
多元線性回歸分析_第3頁
多元線性回歸分析_第4頁
多元線性回歸分析_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

多元線性回歸Multiplelinearregression1表127名糖尿病人的血糖及有關(guān)變量的測量結(jié)果

2人的體重與身高、胸圍有關(guān)人的心率與年齡、體重、肺活量有關(guān)人的血壓值與年齡、性別、勞動強度、飲食習(xí)慣、吸煙狀況、家族史等有關(guān)射頻治療儀定向治療腦腫瘤過程中,腦皮質(zhì)的毀損半徑與輻射的溫度、照射的時間有關(guān)

…3多元線性回歸:簡稱為多元回歸,分析一個應(yīng)變量與多個自變量間的線性關(guān)系。4表2多元回歸分析數(shù)據(jù)格式例號X1X2

XmY1X11X12

X1mY12X21X22

X2mY2

nXn1Xn2

XnmYn5一、多元線性回歸模型一般形式為:

Y=β0+β1X1+β2X2+…+βmXm

+εβ0

:常數(shù)項,又稱為截距β1,β2,…,βm:偏回歸系數(shù)(Partialregressioncoefficient)簡稱回歸系數(shù),在其它自變量保持不變時Xi(i=1,2,…,m)每改變一個單位時,應(yīng)變量Y的平均變化量ε:去除m個自變量對Y的影響后的隨機誤差,又稱殘差6多元線性回歸模型的應(yīng)用條件:1.線性趨勢:Y與Xi間具有線性關(guān)系2.獨立性:應(yīng)變量Y的取值相互獨立3.正態(tài)性:對任意一組自變量取值,因變量Y服從正態(tài)分布4.方差齊性:對任意一組自變量取值,因變量y的方差相同

后兩個條件等價于:殘差ε服從均數(shù)為0、方差為σ2的正態(tài)分布7多元線性回歸的分析步驟:1.根據(jù)樣本數(shù)據(jù)求得模型參數(shù)的估計值,得到應(yīng)變量與自變量數(shù)量關(guān)系的表達式:2.對回歸方程及各自變量作假設(shè)檢驗,并對方程的擬和效果及各自變量的作用大小作出評價此公式稱為多元線性回歸方程8多元線性回歸方程的建立:利用最小二乘法原理估計模型的參數(shù):(使殘差平方和最小)9方程的求解過程復(fù)雜,可借助于SPSS、SAS等統(tǒng)計軟件來完成SPSS:Analyze→Regression→Linearregression→dependent:yindependent:x1-x5SAS程序:PROCREGDATA=mr15-1;

MODELy=x1-x5;

RUN;10例15.1:P210

SPSS的分析結(jié)果11二、多元回歸方程的假設(shè)檢驗回歸方程是否成立?各偏回歸系數(shù)是否等于0?121.多元線性回歸方程的假設(shè)檢驗:方差分析法:SS總=SS回+SS殘13142.偏回歸系數(shù)的假設(shè)檢驗方差分析法、t檢驗法方差分析法:SS(Xi)為第i個自變量的偏回歸平方和15偏回歸平方和:SS(Xi),表示模型中含有其它m-1個自變量的條件下該自變量對Y的回歸貢獻,相當(dāng)于從回歸方程中剔除該自變量后回歸平方和的減少量,或者在m-1個自變量的基礎(chǔ)上增加一個自變量后回歸平方和的增加量。注意:m-1個自變量對y的回歸平方和由m-1個自變量對y重新建立回歸方程后計算得到,而不能簡單的在整個方程的基礎(chǔ)上把biliy去掉后得到。16各偏回歸平方和SS(Xi)及殘差的計算回歸方程中包含的自變量SS回SS(Xi)X1X2X3X4X5SS總-X2X3X4X5SS-1SS總-

SS-1X1X3X4X5SS-2SS總-

SS-2X1X2X4X5SS-3SS總-

SS3X1X2X3X5SS-4SS總-

SS4X1X2X3X4SS-5SS總-

SS5172.偏回歸系數(shù)的假設(shè)檢驗t檢驗法:18SPSS的結(jié)果193.標(biāo)準(zhǔn)化偏回歸系數(shù)對各數(shù)據(jù)進行標(biāo)準(zhǔn)化后求得的回歸方程即標(biāo)準(zhǔn)化回歸方程,其相應(yīng)的偏回歸系數(shù)即標(biāo)準(zhǔn)化偏回歸系數(shù)。標(biāo)準(zhǔn)化偏回歸系數(shù)和偏回歸系數(shù)的關(guān)系:在有統(tǒng)計學(xué)意義的前提下,標(biāo)準(zhǔn)化偏回歸系數(shù)絕對值的大小可直接進行比較,以衡量自變量對應(yīng)變量的作用大小例:見P213204.復(fù)相關(guān)系數(shù)復(fù)相關(guān)系數(shù):multiplecorrelationcoefficient衡量因變量y與回歸方程內(nèi)所有自變量線性組合間相關(guān)關(guān)系的密切程度,也即Y與之間的相關(guān)系數(shù)。R

其值在0與1之間如果只有一個自變量,此時21

R2稱為決定系數(shù)表明回歸平方和在總平方和中所占的比重。R2越接近于1,說明引入方程的自變量與因變量的相關(guān)程度越高,Xi與y的回歸效果越好。

R2受自變量個數(shù)的影響,由此又提出校正決定系數(shù),既反映模型的擬和優(yōu)度,又同時考慮了模型中的自變量個數(shù)。2223三、選擇最優(yōu)回歸方程的方法1.最優(yōu)回歸方程

:1)對y的作用有統(tǒng)計學(xué)意義的自變量,全部選入回歸方程

2)對y的作用沒有統(tǒng)計學(xué)意義的自變量,一個也不引入回歸方程

242.方法:1)最優(yōu)子集回歸法:又稱全局擇優(yōu)法,求出所有可能的回歸模型(共有2m-1個)選取最優(yōu)者2)向后剔除法(backwardselection)3)向前引入法(forwardselection)4)逐步回歸法(stepwiseregression)25逐步回歸法自變量回歸平方和最大的Xi首先進入方程,在Xi進入方程的基礎(chǔ)上計算其余m-1個自變量分別進入回歸方程時的偏回歸平方和,其中最大者記為SSj,對Xj進行檢驗,若有意義則進入方程,并重新對Xi進行檢驗。若Xi退化為無意義,則剔除Xi,同時再對Xj進行檢驗。若Xj依然有意義則繼續(xù)選擇下一個偏回歸平方和最大者并進行檢驗。重復(fù)此過程。26逐步回歸法每引入或剔除一個自變量后都要重新對已進入方程中的自變量進行檢驗,直到方程外沒有有意義的自變量可引入、方程內(nèi)也沒有無意義的自變量可剔除為止。27逐步回歸法雙向篩選;引入一個有意義變量(前進法)的同時,剔除無意義的變量(后退法)

“先剔除后選入”原則

α入和α出可等可不等

注意,引入變量的檢驗水準(zhǔn)要小于或等于剔除變量的檢驗水準(zhǔn)。2829303132四、多元線性回歸的應(yīng)用1.影響因素分析:年齡(X1)飲食習(xí)慣(X2)吸煙狀況(X3)工作緊張度(X4)家族史(X5)

高血壓(Y)332.估計與預(yù)測:心臟表面積(Y)=b0+b1心臟橫徑(X1)+b2心臟縱徑(X2)+b3心臟寬徑(X3)新生兒體重(Y)=b0+b1胎兒孕齡(X1)+b2胎兒頭徑(X2)+b3胎兒胸徑(X3)+b4胎兒腹徑(X4)343.統(tǒng)計控制:利用回歸方程進行逆估計,確定Y后控制X。采用射頻治療儀治療腦腫瘤:腦皮質(zhì)毀損半徑(Y)=b0+b1射頻溫度(X1)+b2照射時間(X2)35五、多元線性回歸應(yīng)用的注意事項1.指標(biāo)的數(shù)量化應(yīng)變量Y為連續(xù)變量自變量X可為連續(xù)、有序分類或無序分類變量

(1)連續(xù)變量:X(2)有序分類變量:

1輕

X=2中

3重36(3)無序分類變量自變量為二分類變量:自變量為多分類變量:假定有n類,則用n-1個取值為0或1的啞變量(dummyvariables)來表示這些類別。X=0男1女372.樣本含量:

n至少是X個數(shù)m的5~10倍3.關(guān)于逐步回歸:不要盲目信任,結(jié)合專業(yè)知識。4.多重共線性:指自變量之間存在較強的線性關(guān)系

使偏回歸系數(shù)方差加大,系數(shù)估計不穩(wěn),難以有合乎專業(yè)知識的解釋。38提示可能存在多重共線性的情況:整個模型的檢驗結(jié)果為P<α,但各自變量的偏回歸系數(shù)的檢驗結(jié)果P>α。專業(yè)上認(rèn)為應(yīng)該有統(tǒng)計學(xué)意義的自變量檢驗結(jié)果卻無統(tǒng)計學(xué)意義。自變量的偏回歸系數(shù)取值大小甚至符號明顯與實際情況相違背,難以解釋。增加或刪除一個自變量或一條記錄,自變量回歸系數(shù)發(fā)生較大變化。39容忍度:若某變量的容忍度≤0.1時,說明該變量與其它變量存在嚴(yán)重的多重共線性。方差膨脹因子(VIF):為容忍度的倒數(shù)。VIF≥10時,存在嚴(yán)重的多重共線性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論