版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
1、李曉松主編李曉松主編. . 醫(yī)學統(tǒng)計學醫(yī)學統(tǒng)計學( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.第十四章第十四章陳衛(wèi)中陳衛(wèi)中 副教授副教授公共衛(wèi)生系流行病與衛(wèi)生統(tǒng)計學教研室公共衛(wèi)生系流行病與衛(wèi)生統(tǒng)計學教研室20222022年年6 6月月2626日星期日日星期日l例例14.1 探討男性腰圍探討男性腰圍(WC)與腹腔與腹腔內(nèi)脂肪內(nèi)脂肪面面積積(VAT)的關系的關系-利用腰圍預測腹腔內(nèi)脂肪面積利用腰圍預測腹腔內(nèi)脂肪面積l隨機抽取了隨機抽取了20名男性名男性志愿受試者志愿受試者l測量測量其腰圍其腰圍(cm),并采用磁共振成像法測量其腹腔內(nèi),并采用
2、磁共振成像法測量其腹腔內(nèi)脂肪面積脂肪面積(cm2)引例引例內(nèi)容提要內(nèi)容提要概念和用途概念和用途分析步驟分析步驟模型中參數(shù)的估計模型中參數(shù)的估計l研究變量間數(shù)量依存關系,并研究變量間數(shù)量依存關系,并以函數(shù)的形式以函數(shù)的形式表達這種表達這種關系的統(tǒng)計學關系的統(tǒng)計學方法方法回歸分析回歸分析數(shù)量依存關系的專業(yè)解釋數(shù)量依存關系的專業(yè)解釋l從專業(yè)上來看,存在數(shù)量依存關系的變量間從專業(yè)上來看,存在數(shù)量依存關系的變量間的關系的關系-因果關系因果關系l影響因素作用于研究對象必然事物的發(fā)生或所處狀態(tài)影響因素作用于研究對象必然事物的發(fā)生或所處狀態(tài)產(chǎn)生影響產(chǎn)生影響(效應效應) l影響因素不同水平產(chǎn)生的效應不同影響因素
3、不同水平產(chǎn)生的效應不同-伴隨關系伴隨關系l ZXYl根據(jù)被預測變量根據(jù)被預測變量(Y)的類型及函數(shù)形式不同的類型及函數(shù)形式不同-簡單線性回歸簡單線性回歸(Simple linear regression)-多元線性回歸多元線性回歸(Multivariate linear regression)-logistic回歸回歸(Logistic regression)-Cox回歸回歸(Cox regression)-非線性回歸非線性回歸(Curve regression)常見的回歸形式常見的回歸形式l是是一種研究兩變量間數(shù)量依存關系,并尋找最能一種研究兩變量間數(shù)量依存關系,并尋找最能代表這種關系的直線
4、的統(tǒng)計方法代表這種關系的直線的統(tǒng)計方法-回歸:數(shù)量依存關系回歸:數(shù)量依存關系-簡單:兩變量簡單:兩變量lY:被預測的變量,稱為被預測的變量,稱為因變量因變量(dependent variable)或反應變量或反應變量(response variable)必須是定量變量必須是定量變量lX:Y所依存的變量所依存的變量,稱為自變量稱為自變量(independent variable)或解釋或解釋變量變量(explanatory variable)可用可用數(shù)字進行表達數(shù)字進行表達-線性:直線函數(shù)線性:直線函數(shù)簡單線性回歸簡單線性回歸內(nèi)容提要內(nèi)容提要概念概念和用途和用途分析步驟分析步驟回歸分析的應用回歸
5、分析的應用1. 明確明確X、Y,并定量化,并定量化2. 確定確定回歸回歸模型模型:繪制散點圖繪制散點圖3. 估計模型中的參數(shù)估計模型中的參數(shù),形成,形成回歸方程回歸方程4. 繪制回歸繪制回歸函數(shù)圖形函數(shù)圖形5. 回歸分析的統(tǒng)計推斷回歸分析的統(tǒng)計推斷6. 回歸模型診斷回歸模型診斷7. 回歸方程回歸方程預測效果預測效果的評價的評價回歸分析回歸分析的基本步驟的基本步驟l確定因變量確定因變量 (結局變量,結局變量,Y)與自變量與自變量 (X)-因果因果關系:醫(yī)學關系:醫(yī)學常識、專業(yè)常識、專業(yè)意義確定意義確定-伴隨關系:伴隨關系:研究目的研究目的確定確定X、Y1. 明確明確X、Y,并定量化,并定量化2.
6、 確定確定回歸回歸模型模型:繪制散點圖繪制散點圖3. 估計模型中的參數(shù)估計模型中的參數(shù),形成,形成回歸方程回歸方程4. 繪制回歸繪制回歸函數(shù)圖形函數(shù)圖形5. 回歸分析的統(tǒng)計推斷回歸分析的統(tǒng)計推斷6. 回歸模型診斷回歸模型診斷7. 回歸方程回歸方程預測效果預測效果的評價的評價回歸分析回歸分析的基本步驟的基本步驟l根據(jù)資料,繪制根據(jù)資料,繪制散點圖散點圖-建立坐標系建立坐標系-每個每個點表示一個觀測對象點表示一個觀測對象-點的密集程度和趨勢來表示兩個變量間的數(shù)量點的密集程度和趨勢來表示兩個變量間的數(shù)量關系關系確定回歸模型,散點圖確定回歸模型,散點圖的繪制的繪制表表14.1 2014.1 20名男性
7、志愿受試者腰圍和腹腔內(nèi)脂肪面積的測量值名男性志愿受試者腰圍和腹腔內(nèi)脂肪面積的測量值編號編號腰圍腰圍(cm)腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)編號編號腰圍腰圍(cm)腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)181.369.81193.5108.2285.661.212103.8129.0385.980.31397.5110.4487.875.51498.3123.3579.075.71599.7105.5682.585.41687.283.1795.2102.51784.172.0896.199.61888.0100.0994.497.819101.0105.01090.6100.92088.
8、3127.7506580951101251407580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)散點圖的繪制散點圖的繪制20名男性志愿受試者腰圍和腹腔內(nèi)脂肪面積的測量值散點圖名男性志愿受試者腰圍和腹腔內(nèi)脂肪面積的測量值散點圖81.3,69.8506580951101251407580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)繪制散點圖的意義繪制散點圖的意義l是否存在線性趨勢是否存在線性趨勢-散點完全在一條直線散點完全在一條直線上上lY變量的變異完全由變量的變異完全由X變量的變化來解釋變量的變化來解釋確定性關系確
9、定性關系-散散點未完全落在一條直線,只存在線性點未完全落在一條直線,只存在線性趨勢趨勢lY變量的變量的變異不完全變異不完全由由X變量的變化來解釋變量的變化來解釋非非確定性關系確定性關系-不存在回歸關系不存在回歸關系-不存在線性關系不存在線性關系l有無異常點有無異常點l有無混雜因素影響有無混雜因素影響同質(zhì)性同質(zhì)性506580951101251407580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm) y= + x (98.3, 123.3) + 98.3iiixy確定回歸模型確定回歸模型l說明說明1個因變量和個因變量和1個自變量間數(shù)量依存關系,個自變量間數(shù)量
10、依存關系,并用并用線性函數(shù)表達線性函數(shù)表達-非確定性關系非確定性關系直線回歸模型的表達直線回歸模型的表達常數(shù)常數(shù)項項截距截距回歸系數(shù)回歸系數(shù)斜率斜率殘差殘差回歸部分回歸部分y xxiiiyx隨機部分隨機部分20,Nl y|x= + x:X確定時其值不再變化,確定時其值不再變化,故故又稱又稱為固定部分為固定部分-統(tǒng)計學意義:統(tǒng)計學意義:X為某一定值時為某一定值時Y的總體均數(shù),又的總體均數(shù),又稱為條件均數(shù)稱為條件均數(shù)-專業(yè)意義:專業(yè)意義:X為某一定值時為某一定值時Y的預測值的預測值l截距截距(intercept), 或或 0表示表示-回歸直線在回歸直線在Y軸上的截距,即軸上的截距,即x=0時時Y的
11、條件均數(shù)的條件均數(shù)回歸部分回歸部分81.3cm2|81.396.392.1196.392.11 81.375.19cmy xy xxix - -00y xl亦亦稱回歸系數(shù)稱回歸系數(shù)(regression coefficient), 表示表示-X每每變化變化1個單位時個單位時,Y平均平均變化變化 個個單位單位l =0,X與與Y之間之間無數(shù)量依存無數(shù)量依存關系關系l 0,X與與Y之間存在數(shù)量之間存在數(shù)量依存依存關系關系協(xié)同變化的方向協(xié)同變化的方向l 0,X、Y同同向變化向變化l 0,X、Y反向變化反向變化斜率斜率(slope)11(1)y xy xy xy xxx -殘差殘差(residual)l
12、 =Y-( + X),實測實測值與條件均數(shù)之間的差異值與條件均數(shù)之間的差異-為隨機誤差,無方向性為隨機誤差,無方向性-假定其假定其服從正態(tài)分布服從正態(tài)分布l總體均數(shù)為總體均數(shù)為0l方差方差 2,且不隨,且不隨x的變化而變化的變化而變化與與X無關無關-殘差間相互獨立殘差間相互獨立20,NCov,0ij 1. 明確明確X、Y,并,并定量化定量化2. 確定確定回歸回歸模型模型:繪制散點圖繪制散點圖3. 估計模型中的參數(shù)估計模型中的參數(shù),形成,形成回歸方程回歸方程4. 繪制回歸繪制回歸函數(shù)圖形函數(shù)圖形直線直線5. 回歸分析的統(tǒng)計推斷回歸分析的統(tǒng)計推斷6. 回歸模型診斷回歸模型診斷7. 回歸方程回歸方程
13、預測效果預測效果的評價的評價簡單線性回歸分析簡單線性回歸分析的基本步驟的基本步驟22()(),iiiiyaxbyyQ a b-iiieyabx-2iiyy- yabx506580951101251407580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)iiyy-l最小二乘法最小二乘法(least square estimate, LSE)-使實際使實際數(shù)據(jù)數(shù)據(jù)中中y的實測值與模型預測值的實測值與模型預測值 之之差的差的平方和達到平方和達到最小最小-建立建立關于關于a、b的的一階偏導數(shù),整理得到正規(guī)方一階偏導數(shù),整理得到正規(guī)方程組,最終獲得程組,最終獲得回
14、歸方程系數(shù)回歸方程系數(shù)的估計值的估計值系數(shù)估計方法系數(shù)估計方法2()()()xyxxlxxyyblxx-aybx-22,()iiiiQ a byaxbyy-2020iiiiiQyabxxaQyabxb - - y yabx例題回歸方程例題回歸方程22006.6492.11cmcm950.778xyxxlbl296.39cmaybx- -96.392.11yx -yabxeyey xyx數(shù)學數(shù)學模型模型回歸方程回歸方程-截距截距a=-96.39cm2,表示腰圍為,表示腰圍為0cm時,腹腔內(nèi)時,腹腔內(nèi)脂肪面積的平均估計值為脂肪面積的平均估計值為-96.39cm2-回歸系數(shù)回歸系數(shù)b=2.11cm2
15、/cm,說明腰圍每增加,說明腰圍每增加1cm,腹腔內(nèi)脂肪面積平均增加腹腔內(nèi)脂肪面積平均增加2.11cm2-當腰圍當腰圍x=81.3cm時時l與實測值與實測值69.8cm2之間的差距為殘差之間的差距為殘差296.392.11 81.375.19cmy -,腹腔,腹腔內(nèi)脂肪面積內(nèi)脂肪面積平均估計值平均估計值2169.875.195.39cme - -96.392.11yx -1. 明確明確X、Y,并,并定量化定量化2. 確定確定回歸回歸模型模型:繪制散點圖繪制散點圖3. 估計模型中的參數(shù)估計模型中的參數(shù),形成,形成回歸方程回歸方程4. 繪制回歸直線繪制回歸直線5. 回歸分析的統(tǒng)計推斷回歸分析的統(tǒng)計
16、推斷6. 回歸模型診斷回歸模型診斷7. 回歸方程回歸方程預測效果預測效果的評價的評價簡單線性回歸分析簡單線性回歸分析的基本步驟的基本步驟20名男性志愿受試者腰圍和腹腔內(nèi)脂肪面積的測量值散點圖及回歸線名男性志愿受試者腰圍和腹腔內(nèi)脂肪面積的測量值散點圖及回歸線506580951101251407580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)1. 明確明確X、Y,并,并定量化定量化2. 確定確定回歸回歸模型模型:繪制散點圖繪制散點圖3. 估計模型中的參數(shù)估計模型中的參數(shù),形成,形成回歸方程回歸方程4. 繪制回歸直線繪制回歸直線5. 回歸分析的統(tǒng)計推斷回歸分
17、析的統(tǒng)計推斷6. 回歸模型診斷回歸模型診斷7. 回歸方程回歸方程預測效果預測效果的評價的評價簡單線性回歸分析簡單線性回歸分析的基本步驟的基本步驟回歸分析的統(tǒng)計推斷回歸分析的統(tǒng)計推斷yabxeyey xyx數(shù)學數(shù)學模型模型回歸方程回歸方程表達兩變量間的數(shù)表達兩變量間的數(shù)量依存關系量依存關系用用X的變化解釋的變化解釋Y的變異的變異回歸模型的假設檢驗回歸模型的假設檢驗l目的:排除抽樣誤差的影響,確定回歸關系目的:排除抽樣誤差的影響,確定回歸關系確實存在確實存在1.建立檢驗假設,確定檢驗水準建立檢驗假設,確定檢驗水準H0:無直線回歸關系,即:無直線回歸關系,即 =0H1:存在直線回歸關系,即:存在直線
18、回歸關系,即 0 =0.052.選定檢驗方法,計算檢驗統(tǒng)計量選定檢驗方法,計算檢驗統(tǒng)計量方差分析法:對方差分析法:對整個回歸模型進行整個回歸模型進行檢驗檢驗t檢驗檢驗法:對回歸系數(shù)法:對回歸系數(shù)(及截距及截距)進行檢驗進行檢驗506580951101251407580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)222yyyyyy-95.65y SSSSSS回總剩yyyyyy-x0P(x0, y) yyy-y 2222yyyyyyyyyy-22yyyyyy- 20yyyy-1vn-總1v回2vn-?;乜偸?yy-方差分析法方差分析法-SS總總 :未:未考慮
19、考慮x與與y的的回歸關系回歸關系時時y的的總總變異變異-SS回回 :y的的總變異總變異中能用中能用x的變化解釋的的變化解釋的y的變異的變異-SS剩剩 :y的的總變異中無法總變異中無法用用x解釋解釋的部分的部分SSSSSS回總?;乜偸?.確定確定P值,做出統(tǒng)計推斷值,做出統(tǒng)計推斷F=26.9241, 1=1, 2=18,查查F界值表,得界值表,得P0.001,故拒,故拒絕絕H0( =0),接受,接受H1 ( 0)方差分析法方差分析法方差分析結果方差分析結果SS MSFP回歸分析回歸分析4235.10 14235.10 24.92 0.001殘差殘差3058.55 18169.92 總變異總變異7
20、293.65 19回歸系數(shù)的抽樣分布回歸系數(shù)的抽樣分布l回歸系數(shù)回歸系數(shù)b是根據(jù)樣本信息獲得的,為樣本是根據(jù)樣本信息獲得的,為樣本統(tǒng)計量統(tǒng)計量-分布:分布:-標準誤:標準誤:2,bbN b2bbbtt nS- -未知222bxy xy xSSSSyySSSMSnn-剩剩t 檢驗法檢驗法3.確定確定P值,做出統(tǒng)計推斷值,做出統(tǒng)計推斷t=4.9924, =18查查t界值表,得界值表,得P0.001,故拒絕,故拒絕H0( =0),接受接受H1 ( 0)t檢驗結果檢驗結果系數(shù)估計值系數(shù)估計值標準誤標準誤tPIntercept-96.39 38.58 -2.50 0.0224 腰圍腰圍2.11 0.42
21、 4.99 0.0001 回歸分析的統(tǒng)計推斷回歸分析的統(tǒng)計推斷yabxeyey xyx數(shù)學數(shù)學模型模型回歸方程回歸方程表達兩變量間的數(shù)表達兩變量間的數(shù)量依存關系量依存關系用用X的變化解釋的變化解釋Y的變異的變異l點估計:點估計:b l區(qū)間估計:區(qū)間估計:回歸系數(shù)回歸系數(shù) 的估計的估計2bbtt nS-2,22,22,22,22,22,2111nnnnbbbnnP btttbP bttSP btSbtS- - - -系數(shù)區(qū)間估計結果系數(shù)區(qū)間估計結果系數(shù)估計值系數(shù)估計值標準誤標準誤Lower CI95%Upper CI95%Intercept-96.39 38.58 -177.44 -15.35
22、腰圍腰圍2.11 0.42 1.22 3.00 總體條件均數(shù)總體條件均數(shù) y|x的的估計估計l通過通過20人樣本信息獲得的腰圍和腹腔內(nèi)脂肪人樣本信息獲得的腰圍和腹腔內(nèi)脂肪面積間的回歸方程為面積間的回歸方程為-當腰圍當腰圍x=90cm時時-腰圍為腰圍為90cm個體個體的腹腔內(nèi)脂肪的腹腔內(nèi)脂肪面積的總體均數(shù)面積的總體均數(shù)如何估計?如何估計?96.392.11yx -296.392.11 9093.51cmy -總體總體條件均數(shù)條件均數(shù) y|x的的估計估計l點估計:點估計:l區(qū)間估計區(qū)間估計-在在x為定值為定值xp時,時, 亦為樣本統(tǒng)計量亦為樣本統(tǒng)計量-分布:分布:px xpyab x2,pppx
23、xy x xy x xyN2py x xpppx xy x xy x xytt nS- -未知1ppy xy x xxxxSSnSS-|ppx xy x xy總體條件均數(shù)總體條件均數(shù) y|x的的估計估計l區(qū)間估計區(qū)間估計-當置信當置信度度1- 為為95%,腰圍腰圍x=90cm:-回歸回歸直線直線的的1- 置信置信帶帶(confidence band)l將將x取不同值時取不同值時y的條件均數(shù)的條件均數(shù)置信區(qū)間置信區(qū)間的上下限分別連的上下限分別連起來形成的兩條弧形線間的起來形成的兩條弧形線間的區(qū)域區(qū)域2,22,21pppppx xx xnny x xy xy x xP ytSytS- -93.51
24、2.101 5.0276= 82.95, 104.075070901101307580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)條件均數(shù)條件均數(shù) x|y的的95%置信帶置信帶5070901101307580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)1. 明確明確X、Y,并,并定量化定量化2. 確定確定回歸回歸模型模型:繪制散點圖繪制散點圖3. 估計模型中的參數(shù)估計模型中的參數(shù),形成,形成回歸方程回歸方程4. 繪制回歸直線繪制回歸直線5. 回歸分析的統(tǒng)計推斷回歸分析的統(tǒng)計推斷6. 回歸模型診斷回歸模型診斷7. 回
25、歸方程回歸方程預測效果預測效果的評價的評價簡單線性回歸分析簡單線性回歸分析的基本步驟的基本步驟殘差殘差(residual)l =Y-( + X),實測實測值與條件均數(shù)之間的差異值與條件均數(shù)之間的差異-為隨機誤差,無方向性為隨機誤差,無方向性-假定其假定其服從正態(tài)分布服從正態(tài)分布l總體均數(shù)為總體均數(shù)為0l方差方差 2,且不隨,且不隨x的變化而變化的變化而變化與與X無關無關-殘差間相互獨立殘差間相互獨立20,NCov,0ij 殘差圖殘差圖-40-30-20-1001020304060708090100110120130殘差殘差腹腔內(nèi)脂肪面積預測值腹腔內(nèi)脂肪面積預測值(cm2)20名男性志愿受試者腰
26、圍與腹腔內(nèi)脂肪面積殘差圖名男性志愿受試者腰圍與腹腔內(nèi)脂肪面積殘差圖殘差圖殘差圖l用途用途-殘差是否服從正態(tài)分布殘差是否服從正態(tài)分布 的診斷的診斷-離群值離群值識別識別-線性診斷線性診斷-殘差方差齊性的診斷殘差方差齊性的診斷-獨立性獨立性診斷診斷l(xiāng)自變量與殘差的獨立性診斷自變量與殘差的獨立性診斷l(xiāng)殘差之間的殘差之間的獨立性獨立性診斷診斷 ye ye ye ye ye1. 明確明確X、Y,并,并定量化定量化2. 確定確定回歸回歸模型模型:繪制散點圖繪制散點圖3. 估計模型中的參數(shù)估計模型中的參數(shù),形成,形成回歸方程回歸方程4. 繪制回歸直線繪制回歸直線5. 回歸分析的統(tǒng)計推斷回歸分析的統(tǒng)計推斷6.
27、 回歸模型診斷回歸模型診斷7. 回歸方程回歸方程預測效果預測效果的評價的評價簡單線性回歸分析簡單線性回歸分析的基本步驟的基本步驟預測或擬合效果預測或擬合效果評價評價l決定系數(shù):決定系數(shù):-反映反映回歸擬合效果,回歸貢獻的相對程度,即回歸擬合效果,回歸貢獻的相對程度,即在應變量在應變量y的總變異中,用的總變異中,用y與與x回歸關系所能解回歸關系所能解釋的釋的比例比例l本本例例R2=0.5812SSRSS回總方差分析結果方差分析結果SS MSFP回歸分析回歸分析4235.10 14235.10 24.92 ,尚不能認為,尚不能認為X對對Y有有影響影響作用作用個體個體y值的預測區(qū)間值的預測區(qū)間l通過
28、通過20人樣本信息獲得的腰圍和腹腔內(nèi)脂肪人樣本信息獲得的腰圍和腹腔內(nèi)脂肪面積間的回歸方程為面積間的回歸方程為-當腰圍當腰圍x=90cm時時-腰圍為腰圍為90cm大多數(shù)個體的腹腔內(nèi)脂肪面積的波大多數(shù)個體的腹腔內(nèi)脂肪面積的波動范圍?動范圍?96.392.11yx -296.392.11 9093.51cmy -個體個體y值的預測區(qū)間值的預測區(qū)間l當當x為某一定值為某一定值xp時時,個體,個體y值值的的波動范圍波動范圍-1- 為為95%,腰圍腰圍x=90cm腹腔內(nèi)脂肪面積的腹腔內(nèi)脂肪面積的95%參考值范圍為:參考值范圍為:2,22,21pppppx xx xx xnny x xy x xP ytSy
29、ytS- -11ppy xy x xxxxxSSnl-93.512.101 13.9713= 64.16, 122.86條件條件均數(shù)均數(shù) x|y的的95%置信區(qū)間和個體置信區(qū)間和個體y值值95%預測區(qū)間預測區(qū)間 204060801001201401607580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)204060801001201401607580859095100105110腹腔內(nèi)脂肪面積腹腔內(nèi)脂肪面積(cm2)腰圍腰圍(cm)直線回歸分析其它注意事項直線回歸分析其它注意事項 l分析分析要要有實際有實際意義意義l回歸關系不一定回歸關系不一定是因果是因
30、果關系關系l為提高分析的準確性,為提高分析的準確性,觀察對象數(shù)觀察對象數(shù)n 5l自變量自變量X為定量變量時,為定量變量時,取值范圍盡可能取值范圍盡可能大大l對自變量對自變量X的分布的分布無特殊無特殊要求要求-只需嚴密只需嚴密控制或精確測量的控制或精確測量的數(shù)據(jù),可以用數(shù)值數(shù)據(jù),可以用數(shù)值加以表達即可加以表達即可自變量自變量的量化的量化l自變量自變量X既可以是定量變量,也可以是定性既可以是定量變量,也可以是定性變量變量-定量變量定量變量l如如自變量自變量和因變量存在線性關系和因變量存在線性關系,則直接以原,則直接以原變量取變量取值引入模型值引入模型l如自變量與應變量是非線性關系,則需作如自變量與
31、應變量是非線性關系,則需作適當變換適當變換,如如x2、logx等等,直到變換后與應變量成,直到變換后與應變量成線性關系線性關系l轉(zhuǎn)化為有序多分類轉(zhuǎn)化為有序多分類/二分類數(shù)據(jù)二分類數(shù)據(jù)-定性變量:需定量化后方可引入定性變量:需定量化后方可引入模型模型可直線化的曲線回歸可直線化的曲線回歸類型類型函數(shù)形式函數(shù)形式變量變換變量變換直線化結果直線化結果(+ )對數(shù)曲線指數(shù)曲線冪函數(shù)雙曲線S型曲線lglg+yabxyabx K10bxbxyaeyabyax1bayx1a bxKyLelglg+xxxx K lnlgyyyy ln ,lnxx yy1,1xx yylnKyLyyL- -yabxlnlgyab
32、xyabx lnlgyabxyabx yabxyabx 定性變量的量化定性變量的量化l二分類定性變量:常用二分類定性變量:常用0,1指示。如性別:指示。如性別:l無序多分類定性變量無序多分類定性變量-以啞以啞變量變量(dummy variables)形式形式納入納入l有序多分類定性變量有序多分類定性變量(等級變量等級變量)-以以0、1、2、c-1來來表示表示c個類別直接納入個類別直接納入-以啞變量形式引入以啞變量形式引入模型模型10X男性女性(非男性)啞啞變量變量(dummy variable)l亦亦稱指示變量稱指示變量(indicator variable)-適用于適用于l無序定性自變量無序
33、定性自變量l有序定性自變量,但與有序定性自變量,但與因變量因變量不不呈呈線性關系線性關系-有有c個類別個類別的定性變量用的定性變量用c-1個啞變量進行表達個啞變量進行表達l確定啞變量所表明的類別確定啞變量所表明的類別l1代表個體代表個體屬于該啞變量屬于該啞變量所表明的所表明的類別,類別,0代表個體不代表個體不屬于屬于所表明的所表明的類別類別l為減少冗余,用為減少冗余,用c-1個啞個啞變量表達變量表達c個類別個類別年齡年齡賦值賦值(X)啞變量啞變量D0(0)D1(10)D2(18)D3(65)001000101010018200106530001啞變量生成示例啞變量生成示例啞變量的生成啞變量的生
34、成李曉松主編李曉松主編. . 醫(yī)學統(tǒng)計學醫(yī)學統(tǒng)計學( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.表表9.1 喂養(yǎng)不同喂養(yǎng)不同飼料的大鼠紅細胞數(shù)飼料的大鼠紅細胞數(shù)(1012/L)普通飼料普通飼料10%大豆飼料大豆飼料yij4.784.654.656.923.984.444.046.163.445.993.776.673.655.294.914.704.795.055.316.014.055.675.164.684.385.52nstP(2-tailed) 普通飼料普通飼料124.38 0.63 -3.77 0.001 10%大豆飼料大豆飼
35、料125.52 0.84 喂養(yǎng)不同喂養(yǎng)不同飼料的大鼠紅細胞數(shù)飼料的大鼠紅細胞數(shù)(1012/L)t檢驗結果檢驗結果t檢驗檢驗回歸分析結果回歸分析結果l以紅細胞數(shù)為以紅細胞數(shù)為y,組別,組別(g)為自變量為自變量0110%g普通飼料大豆飼料系數(shù)系數(shù)標準誤標準誤tP截距截距4.38 0.214 20.4650.001 組別組別1.14 0.303 3.7740.001 喂養(yǎng)喂養(yǎng)2種種不同飼料的大鼠紅細胞數(shù)不同飼料的大鼠紅細胞數(shù)(1012/L)回歸分析結果回歸分析結果4.38 1.14yg014.384.38 1.14 15.52ggyy 表表9.1 喂養(yǎng)不同喂養(yǎng)不同飼料的大鼠紅細胞數(shù)飼料的大鼠紅細胞
36、數(shù)(1012/L)普通飼料普通飼料10%大豆飼料大豆飼料15%大豆飼料大豆飼料yij4.784.656.804.656.925.913.984.447.284.046.167.513.445.997.513.776.677.743.655.298.194.914.707.154.795.058.185.316.015.534.055.677.795.164.688.034.385.527.30方差分析方差分析例例9.1資料的資料的方差分析方差分析結果結果變異來源變異來源SS MSFP組間變異組間變異52.13 226.0642.920.001組內(nèi)變異組內(nèi)變異20.0433 0.60總變異總變異
37、72.16352.06l以紅細胞數(shù)為以紅細胞數(shù)為y,組,組別定量化納入別定量化納入回歸分析回歸分析組別組別定量化定量化普通飼料普通飼料010%大豆飼料大豆飼料115%大豆飼料大豆飼料20123456789-10123RBC(1012/L)組別組別例例9.1喂養(yǎng)喂養(yǎng)不同飼料的大鼠紅細胞數(shù)不同飼料的大鼠紅細胞數(shù)(1012/L)散點圖散點圖回歸分析回歸分析l以紅細胞數(shù)為以紅細胞數(shù)為y,組別以啞變量納入,組別以啞變量納入010%10110%g非大豆飼料大豆飼料015%15115%g非大豆飼料大豆飼料組別組別groupg10g15普通飼料普通飼料00010%大豆飼料大豆飼料11015%大豆飼料大豆飼料2
38、01表表9.1 喂養(yǎng)三種不同飼料的大鼠紅細胞數(shù)喂養(yǎng)三種不同飼料的大鼠紅細胞數(shù)(1012/L)回歸分析結果回歸分析結果例例9.1資料資料的回歸模型方差分析的回歸模型方差分析結果結果變異來源變異來源SS MSFP回歸回歸52.13 226.0642.920.001剩余剩余20.0433 0.60總變異總變異72.16352.06回歸分析結果回歸分析結果系數(shù)系數(shù)標準誤標準誤tP截距截距4.38 0.22 19.46 0.001 g101.14 0.32 3.59 0.001 g152.92 0.32 9.19 0.001不同不同飼料的大鼠紅細胞數(shù)飼料的大鼠紅細胞數(shù)(1012/L)回歸分析結果回歸分析
39、結果4.38 1.14102.9215ygg10 0, 15 010 1, 15 010 0, 15 14.384.38 1.145.524.382.927.30ggggggyyy李曉松主編李曉松主編. . 醫(yī)學統(tǒng)計學醫(yī)學統(tǒng)計學( (第第3 3版版). ). 北京北京: : 高等教育出版社高等教育出版社, , 2014.2014.例例11.9(P146) l抽樣調(diào)查抽樣調(diào)查了了891名名中學生中學生的吸煙的吸煙狀況狀況-該該市中學生吸煙率是否有隨年級增加而增高的市中學生吸煙率是否有隨年級增加而增高的趨勢趨勢年級年級調(diào)查調(diào)查人數(shù)人數(shù)吸煙吸煙人數(shù)人數(shù)吸煙率吸煙率(%)初一初一1441711.81初
40、二初二1481912.84初三初三1352518.52高一高一1574126.11高二高二1685532.74高三高三1397251.80合計合計89122925.70表表11.13 某市不同年級中學生吸煙某市不同年級中學生吸煙率率(%)趨勢線圖趨勢線圖01020304050607080初一初一初二初二初三初三高一高一高二高二高三高三吸煙率吸煙率(%)某某市不同年級中學生吸煙市不同年級中學生吸煙率率(%)率的線性趨勢率的線性趨勢分析分析l分析目的:某事物的發(fā)生率是否隨著某因素分析目的:某事物的發(fā)生率是否隨著某因素分層等級呈線性變化趨勢分層等級呈線性變化趨勢l研究方法:調(diào)查研究研究方法:調(diào)查研究
41、l變量類型變量類型-自變量:年級,有序多分類定性變量自變量:年級,有序多分類定性變量/等級變量等級變量-應變量:是否吸煙,二分類定性變量應變量:是否吸煙,二分類定性變量l已知:樣本數(shù)據(jù),已知:樣本數(shù)據(jù),R 2列聯(lián)表列聯(lián)表R 2列聯(lián)表列聯(lián)表形式形式x未未發(fā)生數(shù)發(fā)生數(shù)發(fā)生數(shù)發(fā)生數(shù)合計合計發(fā)生發(fā)生率率(%)1n10n11n1.p112n20n21n2.p21ini0ni1ni.pi1RnR0nR1nR.pR1合計合計n.0n.1n.p.1R 2列聯(lián)表形式列聯(lián)表形式分析過程分析過程l分析事物發(fā)生率分析事物發(fā)生率(Y)與某等級變量與某等級變量(X)間的線間的線性數(shù)量依存關系性數(shù)量依存關系-定性變量的定量化:定性變量轉(zhuǎn)換為數(shù)值定性變量的定量化:定性變量轉(zhuǎn)換為數(shù)值lx年級年級:1, 2, 3, , Rls吸煙吸煙:吸煙:吸煙=1,不吸煙,不吸煙=0-線性模型:線性模型:-模型系數(shù)的估計模型系數(shù)的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 衛(wèi)生院員工體檢管理制度
- 衛(wèi)生室財務管理制度規(guī)定
- 衛(wèi)生室控煙工作制度
- 施工現(xiàn)場衛(wèi)生制度
- 衛(wèi)生院普法學法制度
- 休息室打掃衛(wèi)生制度
- 衛(wèi)生分區(qū)域管理制度
- 衛(wèi)生院三級管理制度
- 汽修廠衛(wèi)生責任管理制度
- 機房衛(wèi)生員管理制度
- 鄉(xiāng)鎮(zhèn)醫(yī)院器械管理辦法
- 關節(jié)脫位院前急救
- 2024年山東省濟南市中考化學試卷( 含答案)
- 建筑結構改造設計和加固技術綜合分析的開題報告
- 管理會計學 第10版 課件 第1、2章 管理會計概論、成本性態(tài)與變動成本法
- 喪葬費用補助申請的社保授權委托書
- 2024年度初會《經(jīng)濟法基礎》高頻真題匯編(含答案)
- 課例研究報告
- 啤酒營銷促銷實戰(zhàn)技巧之經(jīng)銷商管理技巧知識培訓
- 建筑工程各部門職能及各崗位職責201702
- 機柜端口對應表
評論
0/150
提交評論