版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、第十章:多元線性回歸與曲線擬合Regression菜單詳解(上)(醫(yī)學(xué)統(tǒng)計之星:張文彤)回歸分析是處理兩個及兩個以上變量間線性依存關(guān)系的統(tǒng)計方法。在醫(yī)學(xué)領(lǐng)域中,此類問題很普遍,如人頭發(fā)中某種金屬元素的含量與血液中該元素的含量有關(guān)系,人的體表面積與身高、體重有關(guān)系;等等。回歸分析就是用于說明這種依存變化的數(shù)學(xué)關(guān)系。§10.1Linear過程10.1.1 簡單操作入門調(diào)用此過程可完成二元或多元的線性回歸分析。在多元線性回歸分析中,用戶還可根據(jù)需要,選用不同篩選自變量的方法(如:逐步法、向前法、向后法,等)。例10.1:請分析在數(shù)據(jù)集Fat surfactant.sav中變量fat對變量s
2、povl的大小有無影響?顯然,在這里spovl是連續(xù)性變量,而fat是分類變量,我們可用用單因素方差分析來解決這個問題。但此處我們要采用和方差分析等價的分析方法-回歸分析來解決它?;貧w分析和方差分析都可以被歸入廣義線性模型中,因此他們在模型的定義、計算方法等許多方面都非常近似,下面大家很快就會看到。這里spovl是模型中的因變量,根據(jù)回歸模型的要求,它必須是正態(tài)分布的變量才可以,我們可以用直方圖來大致看一下,可以看到基本服從正態(tài),因此不再檢驗其正態(tài)性,繼續(xù)往下做。10.1.1.1 界面詳解在菜單中選擇Regression=>liner,系統(tǒng)彈出線性回歸對話框如下:除了大家熟悉的內(nèi)容以外,
3、里面還出現(xiàn)了一些特色菜,讓我們來一一品嘗?!綝ependent框】用于選入回歸分析的應(yīng)變量?!綛lock按鈕組】由Previous和Next兩個按鈕組成,用于將下面Independent框中選入的自變量分組。由于多元回歸分析中自變量的選入方式有前進(jìn)、后退、逐步等方法,如果對不同的自變量選入的方法不同,則用該按鈕組將自變量分組選入即可。下面的例子會講解其用法?!綢ndependent框】用于選入回歸分析的自變量?!綧ethod下拉列表】用于選擇對自變量的選入方法,有Enter(強(qiáng)行進(jìn)入法)、Stepwise(逐步法)、Remove(強(qiáng)制剔除法)、Backward(向后法)、Forward(向前法
4、)五種。該選項對當(dāng)前Independent框中的所有變量均有效。【Selection Variable框】選入一個篩選變量,并利用右側(cè)的Rules鈕建立一個選擇條件,這樣,只有滿足該條件的記錄才會進(jìn)入回歸分析。【Case Labels框】選擇一個變量,他的取值將作為每條記錄的標(biāo)簽。最典型的情況是使用記錄ID號的變量?!網(wǎng)LS>>鈕】可利用該按鈕進(jìn)行權(quán)重最小二乘法的回歸分析。單擊該按鈕會擴(kuò)展當(dāng)前對話框,出現(xiàn)WLS Weight框,在該框內(nèi)選入權(quán)重變量即可?!維tatistics鈕】彈出Statistics對話框,用于選擇所需要的描述統(tǒng)計量。有如下選項: o Regression Co
5、efficients復(fù)選框組:定義回歸系數(shù)的輸出情況,選中Estimates可輸出回歸系數(shù)B及其標(biāo)準(zhǔn)誤,t值和p值,還有標(biāo)準(zhǔn)化的回歸系數(shù)beta;選中Confidence intervals則輸出每個回歸系數(shù)的95%可信區(qū)間;選中covariance matrix則會輸出各個自變量的相關(guān)矩陣和方差、協(xié)方差矩陣。以上選項默認(rèn)只選中Estimates。 o Residuals復(fù)選框組:用于選擇輸出殘差診斷的信息,可選的有Durbin-Watson殘差序列相關(guān)性檢驗、超出規(guī)定的n倍標(biāo)準(zhǔn)誤的殘差列表。 o Model fit復(fù)選框:模型擬合過程中進(jìn)入、退出的變量的列表,以及一些有關(guān)擬合優(yōu)度的檢驗:,R
6、,R2和調(diào)整的R2, 標(biāo)準(zhǔn)誤及方差分析表。 o R squared change復(fù)選框:顯示模型擬合過程中R2、F值和p值的改變情況。 o Descriptives復(fù)選框:提供一些變量描述,如有效例數(shù)、均數(shù)、標(biāo)準(zhǔn)差等,同時還給出一個自變量間的相關(guān)矩陣。 o Part and partial correlations復(fù)選框:顯示自變量間的相關(guān)、部分相關(guān)和偏相關(guān)系數(shù)。 o Collinearity diagnostics復(fù)選框:給出一些用于共線性診斷的統(tǒng)計量,如特征根(Eigenvalues)、方差膨脹因子(VIF)等。以上各項在默認(rèn)情況下只有Estimates和Model fit復(fù)選框被選中。【
7、Plot鈕】彈出Plot對話框,用于選擇需要繪制的回歸分析診斷或預(yù)測圖??衫L制的有標(biāo)準(zhǔn)化殘差的直方圖和正態(tài)分布圖,應(yīng)變量、預(yù)測值和各自變量殘差間兩兩的散點(diǎn)圖等?!維ave鈕】許多時候我們需要將回歸分析的結(jié)果存儲起來,然后用得到的殘差、預(yù)測值等做進(jìn)一步的分析,Save鈕就是用來存儲中間結(jié)果的??梢源鎯Φ挠校侯A(yù)測值系列、殘差系列、距離(Distances)系列、預(yù)測值可信區(qū)間系列、波動統(tǒng)計量系列。下方的按鈕可以讓我們選擇將這些新變量存儲到一個新的SPSS數(shù)據(jù)文件或XML中?!綩ptions鈕】設(shè)置回歸分析的一些選項,有: o Stepping Method Criteria單選鈕組:設(shè)置納入和排除
8、標(biāo)準(zhǔn),可按P值或F值來設(shè)置。o Include constant in equation復(fù)選框:用于決定是否在模型中包括常數(shù)項,默認(rèn)選中。o Missing Values單選鈕組:用于選擇對缺失值的處理方式,可以是不分析任一選入的變量有缺失值的記錄(Exclude cases listwise)而無論該缺失變量最終是否進(jìn)入模型;不分析具體進(jìn)入某變量時有缺失值的記錄(Exclude cases pairwise);將缺失值用該變量的均數(shù)代替(Replace with mean)。10.1.1.2 輸出結(jié)果解釋根據(jù)題目的要求,我們只需要在Dependent框中選入spovl,Independent
9、框中選入fat即可,其他的選項一律不管。單擊OK后,系統(tǒng)很快給出如下結(jié)果:Regression這里的表格是擬合過程中變量進(jìn)入/退出模型的情況記錄,由于我們只引入了一個自變量,所以只出現(xiàn)了一個模型1(在多元回歸中就會依次出現(xiàn)多個回歸模型),該模型中fat為進(jìn)入的變量,沒有移出的變量,具體的進(jìn)入/退出方法為enter。上表為所擬合模型的情況簡報,顯示在模型1中相關(guān)系數(shù)R為0.578,而決定系數(shù)R2為0.334,校正的決定系數(shù)為0.307。這是所用模型的檢驗結(jié)果,可以看到這就是一個標(biāo)準(zhǔn)的方差分析表!有興趣的讀者可以自己用方差分析模型做一下,就會發(fā)現(xiàn)出了最左側(cè)的一列名字不太一樣外,其他的各個參數(shù)值都是
10、相同的。從上表可見所用的回歸模型F值為12.059,P值為0.002,因此我們用的這個回歸模型是有統(tǒng)計學(xué)意義的,可以繼續(xù)看下面系數(shù)分別檢驗的結(jié)果。由于這里我們所用的回歸模型只有一個自變量,因此模型的檢驗就等價與系數(shù)的檢驗,在多元回歸中這兩者是不同的。上表給出了包括常數(shù)項在內(nèi)的所有系數(shù)的檢驗結(jié)果,用的是t檢驗,同時還會給出標(biāo)化/未標(biāo)化系數(shù)??梢姵?shù)項和fat都是有統(tǒng)計學(xué)意義的,上表的內(nèi)容如果翻譯成中文則如下所示:未標(biāo)準(zhǔn)化系數(shù)標(biāo)準(zhǔn)化系數(shù)模型系數(shù)b系數(shù)標(biāo)準(zhǔn)誤系數(shù)t值P值1常數(shù)5.0970.42711.9230.000fat0.7000.2020.5783.4730.00210.1.2 復(fù)雜實(shí)例操作1
11、0.1.2.1 分析實(shí)例例10.2:請分析在數(shù)據(jù)集plastic.sav中變量extrusn、additive、gloss和opacity對變量tear_res的大小有無影響?已知extrusn對tear_res的大小有影響。顯然,這里是一個多元回歸,由于除了extrusn確有影響以外,我們不知道另三個變量有無影響,因此這里我們將extrusn放在第一個block,進(jìn)入方法為enter(我們有把握extrusn一定有統(tǒng)計學(xué)意義);另三個變量放在第二個block,進(jìn)入方法為stepwise(讓軟件自動選擇判斷),操作如下:1. Analyze=>Regression=>Liner2.
12、 Dependent框:選入tear_res3. Independent框:選入extrusn;單擊next鈕4. Independent框:選入additive、gloss和opacity;Method列表框:選擇stepwise5. 單擊OK鈕10.1.2.2 結(jié)果解釋最終的結(jié)果如下:Regression上面的表格依次列出了模型的篩選過程,模型1用進(jìn)入法引入了extrusn,然后模型2用stepwise法引入了additive,另兩個變量因沒有達(dá)到進(jìn)入標(biāo)準(zhǔn),最終沒有進(jìn)入。上面的表格翻譯出來如下:模型進(jìn)入的變量移出的變量變量篩選方法1extrusn進(jìn)入法2additivestepwise法(
13、標(biāo)準(zhǔn):進(jìn)入概率小于0.05,移出概率大于0.1)上表是兩個模型變異系數(shù)的改變情況,從調(diào)整的R2可見,從上到下隨著新變量的引入,模型可解釋的變異占總變異的比例越來越大。上表是所用兩個模型的檢驗結(jié)果,用的方法是方差分析,可見二個模型都有統(tǒng)計學(xué)意義。上表仍然為三個模型中各個系數(shù)的檢驗結(jié)果,用的是t檢驗,可見在模型2中所有的系數(shù)都有統(tǒng)計學(xué)意義,上表的內(nèi)容翻譯如下: 未標(biāo)化的系數(shù)標(biāo)化的系數(shù) 模型 B標(biāo)準(zhǔn)誤Betat值P值1(常數(shù))5.900.265 22.278.000 extrusion.590.167.6393.5
14、22.0002(常數(shù))5.315.314 16.926.000 extrusion.590.144.6394.905.000 additive.390.144.4222.707.000這是新出現(xiàn)的一個表格,反映的是沒有進(jìn)入模型的各個變量的檢驗結(jié)果,可見在模型1中,未引入模型的候選變量additive還有統(tǒng)計學(xué)意義,可能需要引入,而模型2中沒有引入的兩個變量其P值均大于0.05,無需再進(jìn)行分析了。10.2 Curve Estimation過程Curve Estimation過程可以用與擬合各種各樣的曲線,原則上只要兩個變量間存在某種可以被它所描述的數(shù)量關(guān)系,就可以用
15、該過程來分析。但這里我們要指出,由于曲線擬合非常的復(fù)雜,而該模塊的功能十分有限,因此最好采用將曲線相關(guān)關(guān)系通過變量變換的方式轉(zhuǎn)化為直線回歸的形式來分析,或者采用其他專用的模塊分析。10.2.1 界面詳解Curve Estimation過程中有特色的對話框界面內(nèi)容如下:下面我們分別解釋一下它們的具體功能?!綝ependent框】用于選入曲線擬和中的應(yīng)變量,可選入多個,如果這樣,則對各個應(yīng)變量分別擬合模型?!綢ndependent單選框組】用于選入曲線擬和中的自變量,有兩種選擇,可以選入普通的自變量,也可以選擇時間作為自變量,如果這樣做,則所用的數(shù)據(jù)應(yīng)為時間序列數(shù)據(jù)格式。【Models復(fù)選框組】是
16、該對話框的重點(diǎn),用于選擇所用的曲線模型,可用的有:· Linear:擬合直線方程,實(shí)際上與Linear過程的二元直線回歸相同;· Quadratic:擬合二次方程Y = b0+b1X+b2X2;· Compound:擬合復(fù)合曲線模型Y = b0×b1X;· Growth:擬合等比級數(shù)曲線模型Y = e(b0+b1X);· Logarithmic:擬合對數(shù)方程Y = b0+b1lnX;· Cubic:擬合三次方程Y = b0+b1X+b2X2+b3X3;· S:擬合S形曲線Y = e(b0+b1/X);·
17、Exponential:擬合指數(shù)方程Y = b0 eb1X;· Inverse:數(shù)據(jù)按Y = b0+b1/X進(jìn)行變換;· Power:擬合乘冪曲線模型Y = b0X b1;· Logistic:擬合Logistic曲線模型Y = 1/(1/u + b0×b1X),如選擇該線型則要求輸入上界。上面的幾種線型和其他的模塊有重復(fù),如Logistic、Liner等,由于本模塊的功能有限,在重復(fù)的情況下建議用其它專用模塊來分析?!綢nclude constant in equation復(fù)選框】確定是否在方程中包含常數(shù)項。【Plot models復(fù)選框】要求對模型做
18、圖,包括原始數(shù)值的連線圖和擬合模型的曲線圖?!緎ave鈕】彈出SAVE對話框,用于定義想要存儲的中間結(jié)果,如預(yù)測值、預(yù)測值可信區(qū)間、殘差等?!綝isplay ANOVA table復(fù)選框】要求顯示模型檢驗的方差分析表。10.2.2 實(shí)例操作例10.3:錫克試驗陰性率(%)隨著年齡的增長而增高,某地查得兒童年齡(歲)X與錫克試驗陰性率Y的資料如下,試擬合曲線。年齡(歲)1234567錫克試驗陰性率(%)57.176.090.993.096.795.696.2首先對年齡和陰性率作散點(diǎn)圖,發(fā)現(xiàn)兩者有斜率逐漸放緩的曲線趨勢,因此選擇二次曲線模型、三次曲線模型和對數(shù)曲線模型,最終取其中結(jié)果最優(yōu)者,做法如下:1. Analyze=>Regression=>Curve estimation2. Dependant框:選入陰性率3. Independant框:選入年齡4. Models復(fù)選框組:選擇Quadratic、Curbe、Logarithmatic,取消對Liner的選擇。5. 單擊OK結(jié)果如下:Curve FitMODEL:
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 施工方案注意問題(3篇)
- 罕見腫瘤的代謝重編程與靶向干預(yù)
- 2026年濟(jì)寧市屬事業(yè)單位公開招聘初級綜合類崗位人員備考題庫(33人)及一套完整答案詳解
- 2026四川成都市雙流區(qū)實(shí)驗第四幼兒園招聘3人備考題庫含答案詳解
- 2026對外經(jīng)濟(jì)貿(mào)易大學(xué)事業(yè)編專職輔導(dǎo)員、其他專技人員招聘備考題庫完整答案詳解
- 2026江西職業(yè)技術(shù)大學(xué)高層次人才招聘備考題庫及完整答案詳解
- 陜西高考預(yù)考制度
- 罕見腫瘤的個體化治療治療策略優(yōu)化經(jīng)驗與個體化醫(yī)療-1
- 2025年建筑施工企業(yè)施工日志管理制度
- 山東省公路系統(tǒng)財務(wù)制度
- 2025年中考?xì)v史開卷考查范圍重大考點(diǎn)全突破(完整版)
- 學(xué)術(shù)誠信與學(xué)術(shù)規(guī)范研究-深度研究
- 《ETF相關(guān)知識培訓(xùn)》課件
- (一模)烏魯木齊地區(qū)2025年高三年級第一次質(zhì)量英語試卷(含答案)
- 2025年云南省普洱市事業(yè)單位招聘考試(833人)高頻重點(diǎn)提升(共500題)附帶答案詳解
- DB15-T 3677-2024 大興安嶺林區(qū)白樺樹汁采集技術(shù)規(guī)程
- 2024年《13464電腦動畫》自考復(fù)習(xí)題庫(含答案)
- 義務(wù)教育階段學(xué)生語文核心素養(yǎng)培養(yǎng)的思考與實(shí)踐
- 綜合利用1噸APT渣項目研究報告樣本
- JT-T 1495-2024 公路水運(yùn)危險性較大工程專項施工方案編制審查規(guī)程
- 圓錐曲線壓軸題30題2023
評論
0/150
提交評論