版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
逐步回歸分析字體[大][中][?。葜鸩交貧w是多元回歸中用以選擇自變量的一種常用方法。本條目重點(diǎn)介紹的是一種''向前法〃。此法的基本思想是:將自變量逐個(gè)地引入方程,引入的條件是該自變量的偏回歸平方和在未選入的自變量(未選量)中是最大的,并經(jīng)F檢驗(yàn)是有顯著性的。另一方面,每引入一個(gè)新變量,要對先前已選入方程的變量(已選量)逐個(gè)進(jìn)行F檢驗(yàn),將偏回歸平方和最小且無顯著性的變量剔除出方程,直至方程外的自變量不能再引入,方程中的自變量不能再剔除為止。另一種是''向后法〃,它的基本思想是:首先建立包括全部自變量的回歸方程,然后逐步地剔除變量,先對每一自變量作F(或t)檢驗(yàn),剔除無顯著性的變量中偏回歸平方和最小的自變量,重新建立方程。接著對方程外的自變量逐個(gè)進(jìn)行F檢驗(yàn),將偏回歸平方和最大且有顯著性的變量引入方程。重復(fù)上述過程,直至方程中的所有自變量都有顯著性而方程外的自變量都沒有顯著性為止(例見條目''多元線性回歸〃例1、2)。此法在自變量不多,特別是無顯著性的自變量不多時(shí)可以使用。與一般多元回歸相比,用逐步回歸法求得的回歸方程有如下優(yōu)點(diǎn):它所含的自變量個(gè)數(shù)較少,便于應(yīng)用;它的剩余標(biāo)準(zhǔn)差也較小,方程的穩(wěn)定性較好;由于每步都作檢驗(yàn),因而保證了方程中的所有自變量都是有顯著性的。逐步回歸分析的主要用途是:(1)建立一個(gè)自變量個(gè)數(shù)較少的多元線性回歸方程。它和一般多元回歸方程的用途一
樣,可用于描述某些因素與某一醫(yī)學(xué)現(xiàn)象間的數(shù)量關(guān)系,疾病的預(yù)測預(yù)報(bào),輔助診斷等等。(2)因素分析。它有助于從大量因素中把對某一醫(yī)學(xué)現(xiàn)象作用顯著的因素或因素組找出來,因此在病因分析、療效分析中有著廣泛的應(yīng)用。但通常還須兼用''向前法〃、“向后法〃,并適當(dāng)多采用幾個(gè)F檢驗(yàn)的界值水準(zhǔn),結(jié)合專業(yè)分析,從中選定比較正確的結(jié)果。求回歸方程的方法步驟如下:設(shè)有含量為n的樣本,對每個(gè)觀察單位觀察了m個(gè)自變量Xj(j=1,2,...m)和一個(gè)應(yīng)變量Y(可記為Xm+1),得原始數(shù)據(jù)如表1。表1原始數(shù)據(jù)格式觀察單位編號變量X1X2XmY=Xm+11X11X12X1mX1,m+12X21X22X2mX2,m+1nXn1Xn2XnmXn,m+11.先規(guī)定一個(gè)F*值,作為引入或剔除自變量時(shí)進(jìn)行F檢驗(yàn)的界值。對于給定的顯著性水準(zhǔn)a來說,每一步作檢驗(yàn)時(shí)的Fa(1-m’-J值是不同的,f但由于樣本含量n比引入自(1,n1變量的個(gè)數(shù)m‘大得多(一般在10倍以上),所以各步的m‘雖然不同,但Fa(1,n-m‘-1)
值都近似相等。故為方便起見,可取一個(gè)定數(shù)F*作為F檢驗(yàn)的標(biāo)準(zhǔn)。2.計(jì)算每個(gè)變量的均數(shù)j、離均差平方和仏、ljj),每兩個(gè)變量的離均差積和j以及相關(guān)系數(shù)j并以求得的rij為元素列出原始相關(guān)矩陣R(0)(陣中甲并以求得的rij為元素列出原始相關(guān)矩陣R(0)(陣中甲0)=「詁:41.(0)、l?w-H27m+l”0m2訊+1啟1mmm+l7mjMi以后每引入或剔除一個(gè)變量都計(jì)為一步運(yùn)算。設(shè)R(0)經(jīng)L步所得的R(L)為廠⑴1mm"⑴iH步,對于每一步,R(L)均同樣按式(2)變換成R(L+1)。設(shè)引入或剔除的變量為Xg(g為該變量的下標(biāo)),按式(2)作變換Lg,則R(l)成R(L+1)時(shí),兩矩陣中的各元素rij,iH步,嚴(yán)1)心嚴(yán)1)心1)心1)Uv=吩(1H刃,選自變量。(1)引入未選量。按式(3)計(jì)算各未選量的偏回歸平方和Vj(L+1)(1)引入未選量。找出其中最大者,記作Va(L+1),就它所對應(yīng)的自變量Xa按式(4)作F檢驗(yàn):昭切⑵-冰-2);M+1
式中m‘為已引入變量的個(gè)數(shù)。當(dāng)F1>F*時(shí)引入變量Xa,并對R(L)按式(2)作變換La,得R(L+1);當(dāng)F]<F*時(shí)挑選變量工作就此結(jié)束。(2)剔除已選量。引入新變量后,對原先引入的已選量分別計(jì)算其偏回歸平方和Vj(L):(5)(6)找出Vj(L)中最小者,記作Vb(L)。就Vb(L)所對應(yīng)的自變量Xb按式(6)作F檢驗(yàn)。w_皆冷—吸—1)(6)當(dāng)F2<F*時(shí),剔除Xb,并對R(L)按式(2)作變換Lb得R(L+1);下一步對其余已選量再按式(5)、(6)求Vj并作F檢驗(yàn),直到已選量中沒有可剔除時(shí)為止;當(dāng)F2>F*時(shí),已選量都不能被剔除,于是再考慮從未選量中能否引入新變量。如此反復(fù)進(jìn)行到第L步,若已選量都不能被剔除,未選量都不能引入時(shí),逐步運(yùn)算結(jié)束。求回歸方程。由相關(guān)矩陣R(L)求得的回歸方程苑曲+b;%+…+瓦蓉稱為標(biāo)準(zhǔn)回歸方程,式中bj是標(biāo)準(zhǔn)偏回歸系數(shù),按式(7)求得。b'j=rj.m+1(L)。(7)實(shí)用中多元線性回歸方程常用變量Xj的原單位,因此須再按式(8)求化成原單位后務(wù)的偏回歸系數(shù)q.m+tm+1式中l(wèi)m+1,m+1=lYY,即丫的離均差平方和,jj為務(wù)的離均差平方和?;貧w方程的常數(shù)項(xiàng)按式⑼計(jì)算,-4—Yb0二-工bjj,⑼式中j為已選量的下標(biāo)。于是得多元回歸方程為Y=b0+》bjXj°(10)回歸方程的線性假設(shè)檢驗(yàn)。按式(11)作方差分析。(11)(11)£2總=Lyy,V^=n~1,斛=Epp?lyY=lyy盤]嚴(yán)+1,卩劉=£2回=SS.fe-SS^3v回=朋:”_陰回/卅_陰詁(充井'-1)?;貧w的剩余標(biāo)準(zhǔn)差s按式(12)計(jì)算。(12)SS剩(12)n-mf-L°其意義及用途見條目''多元線性回歸〃。多元相關(guān)系數(shù)R按式(13)計(jì)算,R的意義、用途及假設(shè)檢驗(yàn)見條目''多元線性相關(guān)〃。R二J1_心忍+1口(⑶求得多元線性回歸方程后,就可利用它來進(jìn)行預(yù)測,參見條目''多元線性回歸〃。例某單位為了研究正常少年兒童的心象面積與性別、月齡、身高、體重、胸圍的關(guān)系,調(diào)查了521名2.5?15歲的正常少兒,資料見表2,試用逐步回歸法求預(yù)測心象面積的回歸方程。表2521名正常兒童各項(xiàng)指標(biāo)的部分記錄編號性別*月齡身高體重胸圍實(shí)測心象面積X1(月)(cm)(kg)(cm)(cm2)X2X3X4X5Y=X6113295.514.053.549.64213392.013.052.041.61313589.012.553.535.815200176156.055.083.094.605210178163.051.079.087.42*男記作1,女記作0規(guī)定F*值。本例n=521,估計(jì)可能選入4個(gè)自變量。對于給定的a=0.05,F0-05(p516)丄3.86,故取F*=3.86。計(jì)算各變量的均數(shù)j與離均差平方和I》得:j123456j0.4875102.37124.4724.7660.2361.75Ijj130.171016518.26218849.1048820.5429980.76127402.29以及離均差積和Ijj(略)。計(jì)算相關(guān)系數(shù)「jj,并以rij為元素列矩陣R(0)(rij(0)=rij),(1-0.039603-0.041057-0.0344470.0479920.037969-0.0396031f).9657990.9216310.90S2980.S55474-0.0410570.96579910.9382340.9153320.883857-0.0344470.9216310.93S23410.9668650.S634410.0479920.90S29S0.9153320.96686510.85031Si0.0379690.8554740.8S3S570.S634410.85031S1(3)選自變量。第一步:選第一個(gè)自變量。對全部自變量按式(3)計(jì)算Vi(1)得(嚴(yán)y袴)=f=(0.037969)2/1=0.001442,■Yi'代y券=(0.855474)2/1=0.731836,%同理,V3(1)=0.781203,V4(1)=0.745530,V5(1)=0.723041。其中V3(1)最大即Va,按式(4)作F檢驗(yàn)。(0.781203)(521-0-2)1-0.781203=1853.06>F(0.781203)(521-0-2)1-0.781203=1853.06>F*,故引入變量X3。對R(0)按式(2)作變換-,此時(shí)g=3,L=O?!?1/屢)=1/1=1,盤'=即/即=-0.041057/1=-0.041057,嗤=-盤仃燉=-0.965799/1=-0.965799,_(0.96579^-Q04105K00000491余類推,得疋\0.0040730.0855780.0742570.0040730.0855780.074257\0.015W0.0242700.0018440.9382340.9153320.8838570.1197150.10S0680.0341740.10S0680.1621660.0412940.0341740.0412940.218795丿(0.9983140.000049-0.0410570.0040730.0S5573、、0.0742570.0000490.0672300.9657990.0154S40.00242700.0018440.041057-0.9657991-0.9382340.915332-0.883857第二步:選第二個(gè)自變量。計(jì)算各未選量的吟2):VJ2)=0.005523,V2(2)=0.000050,V(2)4=0.009755,V(2)5=0.010515,其中V5(2)最大,經(jīng)F檢驗(yàn)有顯著性,故引入變量X5,對R(1)仍按式(2)作變換L5,這時(shí)g=5,L=1,得R(2)(略)。第三步:由于新變量X5的引入方程,對原有變量X3應(yīng)重新檢驗(yàn),為此計(jì)算VP、。按式(5)得即6.166502再按式(6)作F檢驗(yàn):口^2\521-2-1)(0.068678X521-2-1)0.208279=一0.2082791=170.81故X3不能剔除。于是考慮引入第三個(gè)自變量,計(jì)算各未選量的Vj(3):V1(3)=0.002888,V2(3)=0.000295,V4(3)=0.000928,其中V1(3)最大,經(jīng)F檢驗(yàn)有顯著性,故引入X1,對R(2)作變換L1,這時(shí)g=1,L=2,得R(3)(略)。第四步:由于X1的引入,對已選量X3、X5重作檢驗(yàn)。計(jì)算得V3(3)=0.071558,V5(3)=0.007880,對其最小者作F檢驗(yàn),得l用一袒一1)(0.007880)(521-3-1)0.205391傀=一k~0.205391<5+U+l=19.83故原有已選量不能剔除??紤]引入第四個(gè)自變量,計(jì)算各未選量的Vj(4):V2(4)=0.000208,V/4)=0.002046,其中V4⑷最大,經(jīng)F檢驗(yàn)有顯著性,引入X4,對R(3)作變換L4,這時(shí)g=4,L=3,得R(4)(略)。第五步:由于X4的引入,應(yīng)對原有的X1、X2、X5重作檢驗(yàn),計(jì)算得£(4)=0.004005,V3W=0.044834,V5(4)=0.000341,其中V5(4)最小。按式(6)作F檢驗(yàn),砂引(521—4—1)(山叩241)(521-4一1)20-203345=0.87<F*n故剔除XS。對R(4)仍按式(2)作變換L5,此時(shí)g=5,L=4,得R(5)(略)。第六步:上步剔除了X5后,應(yīng)考慮其余已選量%、X3、X4還須剔除否。為此計(jì)算得V1(5)=0.005352,V3(5)=0.046192,V4(5)=0.009584,其中V1(5)最小。作F檢驗(yàn),得F2=13.59>F*。故已選量都不能剔除。再考慮未選量X2、X5能否選入。由于X5剛被剔除,可不考慮,為此計(jì)算V2(6)=0.000099,作F檢驗(yàn),得F1=0.25<F*。故不能引入X2。至此,方程外的變量不能進(jìn)入,方程內(nèi)的變量不能剔除,逐步運(yùn)算到此結(jié)束。共選進(jìn)了三個(gè)自變量:X1、X3、X4。茲節(jié)錄R(5)中的最后一列:r(5)16=0.073228,r(5)26=0.002541,r(5)36=0.621366,r(5)46=0.282975,r(5)56=0.004447,r(5)66=0.203686。據(jù)式(7)及R(5)可得標(biāo)準(zhǔn)偏回歸系數(shù)為b'1=r(5)16=0.0732,b'3=r(5)36=0.6214,b'4=r⑸46=0.2830。再按式(8)換算成按原單位的偏回歸系數(shù),得=(0.0732)(127402.29=(0.0732)130.17仿此,b3=0.474,b4=0.460。按式(9),■Yb=_b口-b口-b口0b113344=61.75-2.291x0.4875-0.474x124.47-0.460x24.76=-9.755。按式(10),得回歸方程為Y=-9.755+2.291X+0.474X+0.460X,134'即心象面積(cm)2=-9.755+2.291性別(男為1,女為0)+0.474身高(cm)+0.460體重(kg)。對此方程作線性假設(shè)檢驗(yàn)。列方差分析表(表3)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025北京市海淀區(qū)成志幼兒園招聘3人考試核心試題及答案解析
- 2025年雄安人才服務(wù)有限公司人力資源、綜合文字崗位招聘備考題庫及參考答案詳解
- 陜西郵政2026年度校園招聘200人備考題庫及答案詳解參考
- 2025年江蘇能達(dá)私募基金管理有限公司公開招聘工作人員備考題庫及答案詳解1套
- 中煤湖北地質(zhì)局集團(tuán)有限公司2026年度應(yīng)屆高校畢業(yè)生招聘19人備考題庫及1套參考答案詳解
- 2025年南山實(shí)驗(yàn)教育集團(tuán)白石洲學(xué)校面向全國選聘初中物理、歷史教師備考題庫及參考答案詳解1套
- 2025年湘潭市九華中學(xué)(長沙市一中九華中學(xué))代課教師招聘備考題庫參考答案詳解
- 2025湖北隨州市中心醫(yī)院衛(wèi)生專業(yè)技術(shù)人員專項(xiàng)招聘21人考試核心試題及答案解析
- 2025年甘肅省人民醫(yī)院護(hù)理員及人體器官捐獻(xiàn)協(xié)調(diào)員招聘備考題庫參考答案詳解
- 綿陽職業(yè)技術(shù)學(xué)院2025年下半年公開考核招聘高層次人才(53人)參考筆試題庫附答案解析
- 學(xué)困生轉(zhuǎn)換課件
- 食堂干貨調(diào)料配送方案(3篇)
- 腫瘤病人免疫治療及護(hù)理
- 醫(yī)院住院部2024工作總結(jié)及2025工作計(jì)劃
- 門診護(hù)理工作流程
- 委托加工方案模板(3篇)
- 臨床科研團(tuán)隊(duì)管理辦法
- (高清版)DB31∕T 1571-2025 城鎮(zhèn)供水廠生產(chǎn)廢水回用要求
- 鴻翔角鋼檢測報(bào)告
- 水泵房衛(wèi)生管理制度
- 高校資產(chǎn)管理十五五規(guī)劃方案
評論
0/150
提交評論