衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第1頁
衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第2頁
衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第3頁
衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第4頁
衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第1頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室2在上一節(jié)中咱們經(jīng)過直線相關(guān)分析知道了待產(chǎn)婦尿中雌三醇含量和新生兒體重之間成正相關(guān)關(guān)系。那么,假如咱們知道了一位待產(chǎn)婦尿雌三醇含量,能推斷出這個新生兒體重嗎?或者這個新生兒體重可能在什么范圍內(nèi)呢?對此相關(guān)分析不能給咱們答案,這些問題需要使用直線回歸方法來處理。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第2頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室3第二節(jié)線性回歸當咱們知道了兩個變量之間有直線相關(guān)關(guān)系,而且一個變量改變會引發(fā)另一個變量改變,這時,假如它們之間存在準確、嚴格關(guān)系,那么它們改變可用函數(shù)方程來表示。在實際生活當中,因為其它原因干擾,許多雙變量之間關(guān)系并不是嚴格函數(shù)關(guān)系,不能用函數(shù)方程來反應(yīng)。不過,咱們需要利用數(shù)學(xué)函數(shù)理論去研究兩變量之間數(shù)量依存關(guān)系,為了區(qū)分于數(shù)學(xué)上確定函數(shù)方程,咱們稱這種關(guān)系式為直線回歸方程,這種關(guān)系為直線回歸。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第3頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室4直線回歸統(tǒng)計模型1.yi是xi線性函數(shù)個別加上誤差項εi;2.α:截距(intercept),是x=0時y本底水平;3.回歸個別βx:y改變中隨x改變而改變個別;β稱為回歸系數(shù)(regressioncoefficient):自變量x每改變一個度量單位,應(yīng)變量y改變量平均預(yù)計值;4.隨機誤差εi

:又稱殘差(residual);是不能由變量x所解釋變異個別;反應(yīng)了除變量x之外隨機原因?qū)影響。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第4頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室5建立直線回歸方程利用樣本數(shù)據(jù)計算參數(shù)α和β預(yù)計值a和b,建立模型預(yù)計方程,即尋找一條與全部散點都最為靠近(實測點到直線縱向距離)直線,使得總預(yù)測誤差最小。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第5頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室6尋找總預(yù)測誤差最小直線X觀察值預(yù)測值預(yù)測誤差(殘差)Y衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第6頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室7最小二乘法(leastsquaremethod)怎樣最好代表了全部y,需要有個標準。經(jīng)典標準是最小二乘(leastsquares)標準:每個觀察點距離回歸線縱向距離平方和最小,即殘差平方和最?。阂驗橹本€一定經(jīng)過“樣本均數(shù)”點衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第7頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室8計算例1資料預(yù)計值a和b衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第8頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室9將預(yù)計值a和b代入方程回歸參數(shù)a、b解釋1.斜率(b):當x每增加1個單位時,y平均改變b個單位;本例b=0.0608,表明待產(chǎn)婦尿中雌三醇含量每增加1mg/24h,新生兒體重平均增加0.0608kg。2.截距(a):當x=0時y本底水平平均預(yù)計值;本例a=2.1523,表示待產(chǎn)婦尿中雌三醇含量為0時,新生兒體重本底值為2.1523kg(注意這種解釋有時候并無實際意義,如x是否可取0)。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第9頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室10問題:直線回歸方程建立是否一定能說明雌三醇含量與新生兒體重之間存在回歸關(guān)系?與直線相關(guān)一樣,直線回歸方程也是從樣本資料計算而得,一樣也存在著抽樣誤差問題。所以,需要對樣本回歸系數(shù)b進行假設(shè)檢驗,以判斷b是否從回歸系數(shù)為零總體中抽得(即檢驗總體回歸系數(shù)β是否為0)。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第10頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室11(一)回歸系數(shù)假設(shè)檢驗(t檢驗):1.建立檢驗假設(shè):H0:β=0H1:β≠0α=0.052.計算統(tǒng)計量t:回歸方程假設(shè)檢驗衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第11頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室12Sb:回歸系數(shù)標準誤;Sy.x

:殘差標準差(又稱剩下標準差),即去除x對y影響后y變異。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第12頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室13例1資料回歸系數(shù)t檢驗查t界值表t0.05(29)=2.045<t,在α=0.05水準拒絕H0,認為總體回歸系數(shù)不為零,雌三醇含量與新生兒出生體重之間存在線性回歸關(guān)系。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第13頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室14(二)回歸模型假設(shè)檢驗(方差分析,ANOVA):1.建立檢驗假設(shè):H0:回歸模型不成立H1:回歸模型成立α=0.052.計算統(tǒng)計量F:方差分析基礎(chǔ)思想:將應(yīng)變量y總變異分解成兩個個別,一個是處理原因(自變量x)帶來回歸變異,另一個是隨機誤差帶來殘差變異。回歸變異:又稱回歸均方(方差),即y變異中因為x對y線性回歸關(guān)系而帶來變異;殘差變異:又稱殘差均方(方差),是除了自變量x之外其它隨機原因?qū)帶來變異;衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第14頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室15F檢驗就是將兩個別變異進行比較:假如F值靠近1,說明回歸變異和殘差變異沒有多大差異,二者都是隨機誤差,處理原因(自變量x)對應(yīng)變量y沒有線性回歸關(guān)系,回歸模型不成立;假如F值遠大于1,說明回歸變異遠大于殘差變異,處理原因(自變量x)帶來變異不能簡單解釋為隨機誤差,即處理原因(自變量x)對應(yīng)變量y存在回歸關(guān)系,回歸模型成立。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第15頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室16衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第16頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室17從上圖能夠看出:上式兩端平方,數(shù)學(xué)上能夠證實:y總離均差平方和等于回歸離均差平方和加上殘差離均差平方和,y自由度等于回歸自由度加上殘差自由度。即:SS總=SS回+SS殘,v總=v回+v殘衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第17頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室18例1資料方差分析表變異起源離均差平方和(SS)自由度(v)均方(MS)F值回歸2.5057412.5057417.16殘差4.23426290.14601總變異6.7400030查F界值表F0.05(1,29)=4.18<F,在α=0.05水準拒絕H0,認為處理原因(自變量x)對應(yīng)變量y存在回歸關(guān)系,回歸模型成立。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第18頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室19相關(guān)系數(shù)與回歸系數(shù)假設(shè)檢驗關(guān)系從上述計算結(jié)果能夠看到:相關(guān)系數(shù)和回歸系數(shù)t檢驗結(jié)果完全等價,而且與各自方差分析結(jié)果完全等價(分子自由度為1,即兩變量分析)衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第19頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室20直線回歸分析應(yīng)用

1.建立統(tǒng)計模型解釋應(yīng)變量對自變量數(shù)量依存關(guān)系2.自變量預(yù)測應(yīng)變量:利用已知、輕易測量或能夠測量變量去預(yù)測未知、不易測量或不可測量變量由父親身高預(yù)測兒子成人后身高;3.應(yīng)變量控制自變量:利用應(yīng)變量反向控制自變量已知鉛作業(yè)時間(x)與血鉛濃度(y)回歸關(guān)系,當制訂人體血鉛正常值上限標準后,控制工人鉛作業(yè)時間;已知汽車流量(x)與空氣氮氧化物污染濃度(y)回歸關(guān)系,當制訂空氣氮氧化物限制標準后,控制汽車流量。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第20頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室211.β置信區(qū)間:

意義:預(yù)計總體回歸系數(shù)取值范圍大小例1資料:回歸系數(shù)為0.0608,計算置信區(qū)間是(0.0308,0.0908)區(qū)間范圍不包含0,即總體回歸系數(shù)不為0,說明尿雌三醇含量對新生兒體重存在回歸關(guān)系。利用回歸方程進行預(yù)計和預(yù)測

衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第21頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室222.總體置信區(qū)間:意義:當自變量x取值為某一定值xi時,回歸方程對應(yīng)預(yù)計值yi總體條件均數(shù)取值范圍。例1資料:假如某位待產(chǎn)婦尿中雌三醇含量為16mg/24h,預(yù)計其新生兒體重均數(shù)是3.1251kg,總體均數(shù)95%置信區(qū)間是2.98~3.27kg。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第22頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室23總體95%置信區(qū)間衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第23頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室243.個體y值預(yù)測區(qū)間:意義:當自變量x取值為某一定值xi時,預(yù)測應(yīng)變量預(yù)計值yi取值參考值范圍。例1資料:假如某位待產(chǎn)婦尿中雌三醇含量為16mg/24h,預(yù)計其新生兒體重均數(shù)是3.1251kg,95%參考值范圍是2.33~3.92kg。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第24頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室25個體y值95%預(yù)測區(qū)間衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第25頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室2695%置信區(qū)間和參考值范圍衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第26頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室27線性回歸類型與條件

(一)線性回歸類型:Ⅰ型回歸:y是來自正態(tài)分布總體隨機變量,x是準確測量或可控制變量。(溶液濃度與光密度)Ⅱ型回歸:y是來自正態(tài)分布總體隨機變量,x也是來自正態(tài)分布總體隨機變量。(父高與子高)(二)線性回歸條件:1.線性(linearity):y與x之間存在直線關(guān)系;2.獨立性(independence):各觀察值間彼此獨立;3.正態(tài)性(normality):對于任何給定自變量x,應(yīng)變量y都有一個服從正態(tài)分布取值范圍對應(yīng);4.等方差(equalvariance):對于任何給定自變量x,應(yīng)變量y每一個取值范圍方差相等。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第27頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室28給定x,y是正態(tài)分布、方差相等示意圖衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第28頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室29給定x,y是正態(tài)分布、方差不等示意圖衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第29頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室30相關(guān)與回歸區(qū)分(一)資料要求不一樣:1.相關(guān)分析:對稱地對待兩個變量,對自變量和應(yīng)變量不加以區(qū)分。要求:x與y均為隨機變量(有概率分布),且x和y都來自正態(tài)分布總體(雙變量正態(tài)分布)。2.回歸分析:應(yīng)變量和自變量處理不對稱。自變量x:被看做是(在重復(fù)抽樣中)可準確測量或嚴格控制變量。應(yīng)變量y:是隨機變量,而且對于任何一個選定x,應(yīng)變量y都有一個正態(tài)分布總體與之對應(yīng),且這些總體方差都相等。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第30頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室31(二)應(yīng)用方向不一樣:1.相關(guān)分析:研究兩個變量之間相互關(guān)系,即在兩個變量中,任何一個改變都會引發(fā)另一個改變,是一個雙向改變關(guān)系。經(jīng)過相關(guān)分析能夠知道兩個變量是否相關(guān)系,關(guān)系是否親密,性質(zhì)是屬于正相關(guān)還是負相關(guān)。2.回歸分析:研究兩個變量在數(shù)量百分比上依存關(guān)系,一個變量改變會引發(fā)另一個變量改變,是一個單向關(guān)系?;貧w是對兩個變量做定量描述,研究變量間數(shù)量依存關(guān)系,已知一個變量值能夠預(yù)測或控制另一個變量值,而且得到定量結(jié)果。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第31頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室32(三)參數(shù)性質(zhì)不一樣:1.相關(guān)系數(shù)r:說明含有直線關(guān)系兩個變量間相關(guān)方向和親密程度統(tǒng)計指標。沒有單位,取值范圍【-1,1】;絕對值意義:絕對值越大,散點越趨向于一條直線,表明兩變量關(guān)系越親密,相關(guān)程度越高。2.回歸系數(shù)b:表示x每增大(或減?。┮粋€單位,y平均增大(或減?。゜個單位。有單位(y單位/x單位),取值范圍無限;絕對值意義:絕對值越大,回歸直線越陡,說明當x改變一個單位時,y平均改變就越大。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第32頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室33相關(guān)與回歸聯(lián)絡(luò)(一)相關(guān)系數(shù)和回歸系數(shù)聯(lián)絡(luò):對于同一組樣本資料,假如知道變量x和y標準差sx、sy,相關(guān)系數(shù)和回歸系數(shù)能夠相互推算。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第33頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室34(二)方向一致且假設(shè)檢驗等價1.對于同一組樣本資料,r與b符號一致。r為正時,b也為正,表示兩變量是正相關(guān),是同向改變(x變大y也變大)。r為負時,b也為負,表示兩變量是負相關(guān),是反向改變(x變大y會變?。?。2.對于同一組樣本資料,r與b假設(shè)檢驗結(jié)果等價,可用r顯著檢驗代替b顯著性檢驗。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第34頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室35(三)相關(guān)回歸能夠相互解釋確定系數(shù)(coefficientofdetermination):相關(guān)系數(shù)平方,反應(yīng)x對y回歸貢獻程度大小。計算公式:在應(yīng)變量y總離均差平方和中自變量x回歸離均差平方和所占百分比,即自變量x回歸貢獻對應(yīng)變量y總變異能解釋百分比。取值范圍:【0,1】,越靠近1,說明實際觀察點離回歸直線越近,回歸模型擬合度越高。

例1:r=0.6097,R2=0.3717,即待產(chǎn)婦尿中雌三醇含量大約可解釋新生兒體重變異性37.17%。衛(wèi)生統(tǒng)計學(xué)線性相關(guān)與回歸第35頁中醫(yī)科研設(shè)計與統(tǒng)計湖北中醫(yī)學(xué)院衛(wèi)生教研室36相關(guān)回歸分析注意事項1.實際意義:進行相關(guān)回歸分析

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論