Logistic-回歸模型-課件_第1頁
Logistic-回歸模型-課件_第2頁
Logistic-回歸模型-課件_第3頁
Logistic-回歸模型-課件_第4頁
Logistic-回歸模型-課件_第5頁
已閱讀5頁,還剩157頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

Logistic回歸模型趙耐青復(fù)旦大學(xué)公共衛(wèi)生學(xué)院1ppt課件Logistic回歸模型趙耐青1ppt課件數(shù)據(jù)分析的背景計(jì)量資料單因素統(tǒng)計(jì)分析對于兩組計(jì)量資料的比較,一般采用t檢驗(yàn)或秩和檢驗(yàn)。對于兩個(gè)變量的相關(guān)分析采用Pearson相關(guān)分析或Spearman相關(guān)分析考慮多因素的影響,對于應(yīng)變量(反應(yīng)變量)為計(jì)量資料,一般可以考慮應(yīng)用多重線性回歸模型進(jìn)行多因素分析。2ppt課件數(shù)據(jù)分析的背景計(jì)量資料單因素統(tǒng)計(jì)分析2ppt課件數(shù)據(jù)分析的背景單因素的分類資料統(tǒng)計(jì)分析,一般采用Pearson2進(jìn)行統(tǒng)計(jì)檢驗(yàn),用OddsRatio及其95%可信區(qū)間評(píng)價(jià)關(guān)聯(lián)程度??紤]多因素的影響,對于反應(yīng)變量為分類變量時(shí),用線性回歸模型P=a+bx就不合適了,應(yīng)選用Logistic回歸模型進(jìn)行統(tǒng)計(jì)分析。3ppt課件數(shù)據(jù)分析的背景單因素的分類資料統(tǒng)計(jì)分析,一般采用PearsoLogistic回歸模型按研究設(shè)計(jì)分類非配對設(shè)計(jì):非條件Logistic回歸模型配對的病例對照:條件Logistic回歸模型按反應(yīng)變量分類二分類Logistic回歸模型(常用)多分類無序Logistic回歸模型多分類有序Logistic回歸模型4ppt課件Logistic回歸模型按研究設(shè)計(jì)分類4ppt課件基礎(chǔ)知識(shí)通過下例引入和復(fù)習(xí)相關(guān)概念例如:研究患某疾病與飲酒的關(guān)聯(lián)性患病率P1=a/m1P2=b/m25ppt課件基礎(chǔ)知識(shí)通過下例引入和復(fù)習(xí)相關(guān)概念5ppt課件基礎(chǔ)知識(shí)Odds(優(yōu)勢)P越大,則Odds越大;P越小,則Odds越小并且0<Odds<+6ppt課件基礎(chǔ)知識(shí)Odds(優(yōu)勢)P越大,則Odds越大;P越小,則O基礎(chǔ)知識(shí)P與Odds一一對應(yīng)對于兩個(gè)Odds的比較,一般用它們的Ratio,并稱為OddsRatio(OR),其定義如下:其樣本估計(jì)統(tǒng)計(jì)量為7ppt課件基礎(chǔ)知識(shí)基礎(chǔ)知識(shí)

故比較兩個(gè)率<==>比較OR=1?OR>1?OR<1?8ppt課件基礎(chǔ)知識(shí)8ppt課件(二分類)Logistic回歸模型因?yàn)?<Odds<+所以-<ln(Odds)<+對ln(Odds)引入類似多重線性回歸的表達(dá)式9ppt課件(二分類)Logistic回歸模型因?yàn)?<Odds<+9pLogistic回歸模型記:故可以寫為也可以寫為10ppt課件Logistic回歸模型記:10ppt課件回歸系數(shù)的意義以x1的回歸系數(shù)1為例固定其它自變量,比較x1與x1+1的ln(Odds)變化。對于x1,對于x1+1,反對數(shù)變換得到11ppt課件回歸系數(shù)的意義以x1的回歸系數(shù)1為例11ppt課件研究急性心肌梗塞(AMI)患病與飲酒的關(guān)系,采用橫斷面調(diào)查。實(shí)例112ppt課件研究急性心肌梗塞(AMI)患病與飲酒的關(guān)系,采用橫斷面調(diào)查實(shí)例1飲酒的患病率和Odds分別為不飲酒的患病率和Odds分別為13ppt課件實(shí)例1飲酒的患病率和Odds分別為不飲酒的患病率和Odds分實(shí)例1的Logistic回歸模型患病(Y=1)的概率為x=1表示飲酒,x=0表示不飲酒回歸系數(shù)0,1是未知參數(shù),通常用最大似然估計(jì)的方法。14ppt課件實(shí)例1的Logistic回歸模型患病(Y=1)的概率為14p實(shí)例1:患病與未患病的概率飲酒(x=1),患病概率和未患病概率分別為不飲酒(x=0),患病概率和未患病概率分別為15ppt課件實(shí)例1:患病與未患病的概率飲酒(x=1),患病概率和未患病概實(shí)例1:最大似然估計(jì)本例的似然函數(shù)選擇0和1使似然函數(shù)L達(dá)到最大,即最大似然估計(jì)。16ppt課件實(shí)例1:最大似然估計(jì)本例的似然函數(shù)16ppt課件實(shí)例1:用Logistic模型進(jìn)行統(tǒng)計(jì)分析以上述實(shí)例資料用Stata統(tǒng)計(jì)軟件對回歸系數(shù)進(jìn)行最大似然估計(jì),得到回歸系數(shù)估計(jì)為即:17ppt課件實(shí)例1:用Logistic模型進(jìn)行統(tǒng)計(jì)分析以上述實(shí)例資料用SLogistic模型的單個(gè)回歸系數(shù)檢驗(yàn)關(guān)鍵是如果=0,意味自變量X與Y無關(guān)聯(lián)性。由于的估計(jì)存在抽樣誤差,即使=0,其估計(jì)值b一般不為0,故需檢驗(yàn)=0?H0:=0H1:0=0.05檢驗(yàn)統(tǒng)計(jì)量可以證明:H0:=0為真時(shí),z近似服從標(biāo)準(zhǔn)正態(tài)分布,即:|z|>1.96,P<0.05,拒絕H018ppt課件Logistic模型的單個(gè)回歸系數(shù)檢驗(yàn)關(guān)鍵是如果=0,意味實(shí)例1:用Logistic模型進(jìn)行統(tǒng)計(jì)分析實(shí)例1的回歸系數(shù)估計(jì)為se(b)=0.1780719,z=b/se=2.31,P=0.021<0.05拒絕H0,差異有統(tǒng)計(jì)學(xué)意義,可認(rèn)為0。飲酒與患AMI的關(guān)聯(lián)性為OR的95%可信區(qū)間為(1.06,2.14)19ppt課件實(shí)例1:用Logistic模型進(jìn)行統(tǒng)計(jì)分析實(shí)例1的回歸系數(shù)估應(yīng)用Logistic模型校正混雜作用實(shí)例2:上例沒有考慮吸煙情況,故將吸煙作為分層加入,資料如下:20ppt課件應(yīng)用Logistic模型校正混雜作用實(shí)例2:上例沒有考慮吸煙實(shí)例2:應(yīng)用Logistic模型

校正混雜作用從分層的資料表述可知:由于吸煙的混雜作用以致飲酒與AMI患病伴隨有關(guān)聯(lián)。用x1=1和0分別表示飲酒和不飲酒,用x2=1和0分別表示吸煙和不吸煙,Logistic模型表示如下21ppt課件實(shí)例2:應(yīng)用Logistic模型

校正混雜作用從分層的資料表Logistic模型的似然比檢驗(yàn)在多個(gè)自變量回歸模型中,回歸系數(shù)檢驗(yàn)分為單個(gè)回歸系數(shù)檢驗(yàn)和多個(gè)回歸系數(shù)檢驗(yàn)。單個(gè)回歸系數(shù)檢驗(yàn)表示其它變量均在模型中的情況下,檢驗(yàn)?zāi)硞€(gè)回歸系數(shù)i=0,一般用Wald檢驗(yàn)(如實(shí)例1)。多個(gè)回歸系數(shù)檢驗(yàn)要用似然比方法(likelihoodratiotest)22ppt課件Logistic模型的似然比檢驗(yàn)在多個(gè)自變量回歸模型中,回歸Logistic模型的似然比檢驗(yàn)多個(gè)回歸系數(shù)的檢驗(yàn)(以實(shí)例2為例)H0:1=2=0H1:1,2不全為0=0.05H0為真時(shí),模型為用最大似然法進(jìn)行估計(jì),其對數(shù)最大似然函數(shù)值(似然函數(shù)的最大值取對數(shù))記為ln(L0)23ppt課件Logistic模型的似然比檢驗(yàn)多個(gè)回歸系數(shù)的檢驗(yàn)(以實(shí)例2Logistic模型的似然比檢驗(yàn)H1為真時(shí),實(shí)例2的模型為用最大似然法進(jìn)行估計(jì),其對數(shù)最大似然函數(shù)值記為ln(L1)記似然比檢驗(yàn)統(tǒng)計(jì)量為2ln(L)=2(ln(L1)-ln(L0))24ppt課件Logistic模型的似然比檢驗(yàn)H1為真時(shí),實(shí)例2的模型為2Logistic模型的似然比檢驗(yàn)可以證明:H0為真時(shí),2ln(L)近似服從2分布,自由度為需檢驗(yàn)的自變量個(gè)數(shù),如在實(shí)例2中,自由度為2。如果似然比檢驗(yàn)統(tǒng)計(jì)量2ln(L)>則拒絕H0。如果對模型中所有的自變量進(jìn)行檢驗(yàn),則稱為模型檢驗(yàn)。如實(shí)例2,對兩個(gè)自變量進(jìn)行檢驗(yàn),故這是模型檢驗(yàn)。25ppt課件Logistic模型的似然比檢驗(yàn)可以證明:H0為真時(shí),2l實(shí)例2應(yīng)用Logistic模型

校正混雜作用應(yīng)用Stata軟件進(jìn)行最大似然估計(jì),得到模型擬合的主要結(jié)果如下似然函數(shù)比為2ln(L)=76.32,df=2,P<0.001,因此拒絕H0:1=2=0,可以認(rèn)為1和2不全為0。26ppt課件實(shí)例2應(yīng)用Logistic模型

校正混雜作用應(yīng)用Stata軟實(shí)例2應(yīng)用Logistic模型

校正混雜作用應(yīng)用Stata軟件進(jìn)行最大似然估計(jì),得到回歸系數(shù)估計(jì)的主要結(jié)果如下飲酒:27ppt課件實(shí)例2應(yīng)用Logistic模型

校正混雜作用應(yīng)用Stata軟多自變量Logistic模型的OR解釋在本例中,對于同為吸煙或不吸煙的對象而言(x2相對固定不變),飲酒(x1=1)的對數(shù)Odds為不飲酒(x1=0)的對數(shù)Odds為28ppt課件多自變量Logistic模型的OR解釋在本例中,對于同為吸煙多自變量Logistic模型的OR解釋則飲酒的對數(shù)OddsRatio為即:飲酒的意義:對于同為吸煙的對象或者同為不吸煙的對象,其飲酒的故稱校正吸煙后OR,而前者未考慮吸煙的單因素OR稱為crudeOR29ppt課件多自變量Logistic模型的OR解釋則飲酒的對數(shù)Odds實(shí)例2應(yīng)用Logistic模型

校正混雜作用飲酒:P=1校正了吸煙因素的情況下,沒有足夠的證據(jù)推斷飲酒與AMI患病有關(guān)聯(lián)性。吸煙:P<0.001,校正了飲酒的情況下,可以認(rèn)為吸煙與患AMI的關(guān)聯(lián)性有統(tǒng)計(jì)學(xué)意義,并且可以認(rèn)為吸煙者患AMI的風(fēng)險(xiǎn)更大。30ppt課件實(shí)例2應(yīng)用Logistic模型

校正混雜作用飲酒:30pptLogistic模型中的交互作用實(shí)例3:采用病例對照設(shè)計(jì)研究吸煙和家屬史與患肺癌的關(guān)聯(lián)性。用x1=1,0分別表示吸煙和不吸煙;x2=1,0分別表示有無家屬史;用y=1,0分別表示患肺癌和未患肺癌。31ppt課件Logistic模型中的交互作用實(shí)例3:采用病例對照設(shè)計(jì)研究實(shí)例3:Logistic模型的交互作用一般而言,吸煙和家屬史均是肺癌的重要相關(guān)因素,很有可能這兩個(gè)因素對患肺癌有交互作用,因此采用下列含有交互作用項(xiàng)的Logistic模型。其中x1和x2的乘積項(xiàng)x1x2稱為交互作用項(xiàng)32ppt課件實(shí)例3:Logistic模型的交互作用一般而言,吸煙和家屬史應(yīng)用Logistic模型分析實(shí)例3用Stata軟件對實(shí)例3的資料擬合上述模型,得到下列結(jié)果:3=0.955825,P=0.04,差別有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為吸煙和家屬史對患肺癌有交互作用。33ppt課件應(yīng)用Logistic模型分析實(shí)例3用Stata軟件對實(shí)例3的實(shí)例3:Logistic模型的交互作用由于本例模型為對于無家屬史,x2=0代入模型,得到由回歸系數(shù)與OR的關(guān)系,得到吸煙的:P<0.00134ppt課件實(shí)例3:Logistic模型的交互作用由于本例模型為P<0.實(shí)例3:Logistic模型的交互作用由于本例模型為對于有家屬史,x2=1代入模型,得到有家屬史的吸煙OR為35ppt課件實(shí)例3:Logistic模型的交互作用由于本例模型為35pp實(shí)例3:Logistic模型的交互作用H0:1+3=0H1:1+30=0.05(應(yīng)用Stata軟件可進(jìn)行下列計(jì)算)

當(dāng)H0為真時(shí),檢驗(yàn)統(tǒng)計(jì)量2服從自由度為1的2分布,由于本例檢驗(yàn)統(tǒng)計(jì)量2=40.58>=3.84,故拒絕H0,可以認(rèn)為1+30,差別有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為吸煙者患肺癌的風(fēng)險(xiǎn)更大。36ppt課件實(shí)例3:Logistic模型的交互作用H0:1+3=0實(shí)例3:Logistic模型的交互作用同理,為了評(píng)價(jià)家屬史與肺癌的關(guān)聯(lián)性,根據(jù)下列Logistic模型對于不吸煙x1=0,則上述Logistic模型為家屬史的P=0.認(rèn)為026<0.05,差別有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為有家屬史的患者患肺癌的風(fēng)險(xiǎn)更大。37ppt課件實(shí)例3:Logistic模型的交互作用同理,為了評(píng)價(jià)家屬史與實(shí)例3:Logistic模型的交互作用同理,為了評(píng)價(jià)家屬史與肺癌的關(guān)聯(lián)性,根據(jù)下列Logistic模型對于吸煙x1=1,則上述Logistic模型為同理可用Stata軟件得到相應(yīng)P=0.007738ppt課件實(shí)例3:Logistic模型的交互作用同理,為了評(píng)價(jià)家屬史與Logistic模型中的交互作用實(shí)例3小結(jié):吸煙與肺癌患病有關(guān)聯(lián)性,并且對于有家屬史的情況下,吸煙與肺癌患病的關(guān)聯(lián)性被進(jìn)一步加強(qiáng),且差異有統(tǒng)計(jì)學(xué)意義。家屬史與患肺癌有關(guān)聯(lián)性,并且吸煙會(huì)導(dǎo)致家屬史與肺癌之間的關(guān)聯(lián)性進(jìn)一步加強(qiáng),且差異有統(tǒng)計(jì)學(xué)意義。39ppt課件Logistic模型中的交互作用實(shí)例3小結(jié):39ppt課件病例對照研究與Logistic模型在病例對照研究中,由于分組采樣是按病例和對照分別采樣的,病例組的人數(shù)和對照組的人數(shù)均是研究者自己決定的,病例數(shù)人與對照人數(shù)之比不是人群的比,故不能估計(jì)患病率,但可以估計(jì)OR。對于病例對照研究的資料,可以用Logistic模型評(píng)估各個(gè)因素對應(yīng)變量的OR,但不能估計(jì)和預(yù)測相應(yīng)的患病概率。40ppt課件病例對照研究與Logistic模型在病例對照研究中,由于分組Logistic模型中的交互作用例4評(píng)價(jià)兩個(gè)藥治療某疾病的療效,資料如下:定義y=1,0分別為有效和無效,x1=1,0分別為A藥和B藥,x2=1,0分別為病情重和輕。41ppt課件Logistic模型中的交互作用例4評(píng)價(jià)兩個(gè)藥治療某疾病的Logistic模型中的交互作用由于研究設(shè)計(jì)中考慮了病情重和病情輕的情況,所以應(yīng)考慮病情輕重和不同藥物治療對療效的交互作用。用Stata統(tǒng)計(jì)軟件進(jìn)行回歸模型的擬合,得到下列結(jié)果(見下一張幻燈)。42ppt課件Logistic模型中的交互作用由于研究設(shè)計(jì)中考慮了病情重和Logistic模型中的交互作用對于病情輕x2=0代入模型,得到

43ppt課件Logistic模型中的交互作用43ppt課件Logistic模型中的交互作用藥物因素變量x1的回歸系數(shù)為,P=0.652>0.05,兩個(gè)藥的療效差異無統(tǒng)計(jì)學(xué)意義。模型病情重x2=1代入模型,得到44ppt課件Logistic模型中的交互作用藥物因素變量x1的回歸系數(shù)為Logistic模型中的交互作用即:病情重時(shí)的藥物變量x1的回歸系數(shù)為對于在病情重的情況下,兩個(gè)藥的療效是否有差異需檢驗(yàn)1+3=0,用Stata軟件計(jì)算得:檢驗(yàn)統(tǒng)計(jì)量2=42.16,df=1,P<0.001,說明A藥組(x1=1)的療效大于B藥組(x1=0),差異有統(tǒng)計(jì)學(xué)意義。45ppt課件Logistic模型中的交互作用即:病情重時(shí)的藥物變量x1的實(shí)例4小結(jié)在病情輕的情況下,兩個(gè)藥的療效差異無統(tǒng)計(jì)學(xué)意義。在病情重的情況下,可以認(rèn)為A藥的療效優(yōu)于B藥。即:不能簡單地稱A藥優(yōu)于B藥或兩個(gè)藥的療效差異無統(tǒng)計(jì)學(xué)意義。請注意:在有交互作用的模型中,其主效應(yīng)(本例x1)解釋應(yīng)謹(jǐn)慎。46ppt課件實(shí)例4小結(jié)在病情輕的情況下,兩個(gè)藥的療效差異無統(tǒng)計(jì)學(xué)意義。4交互作用的小結(jié)交互作用的意義就是不同層(某因素的不同水平)另一個(gè)研究因素與應(yīng)變量的之間的關(guān)聯(lián)程度是不同的。在回歸分析和方差分析中,經(jīng)統(tǒng)計(jì)檢驗(yàn)得到交互作用項(xiàng)有統(tǒng)計(jì)學(xué)意義只是統(tǒng)計(jì)分析的中間結(jié)果,不要簡單歸結(jié)為協(xié)同作用或拮抗作用,一般要做進(jìn)一步分析。47ppt課件交互作用的小結(jié)交互作用的意義就是不同層(某因素的不同水平)另交互作用的小結(jié)在有交互作用的Logistic模型中,對交互作用項(xiàng)要根據(jù)研究目的進(jìn)行解釋,一般應(yīng)進(jìn)行分層作簡單效應(yīng)檢驗(yàn),特別很可能某個(gè)層有統(tǒng)計(jì)學(xué)意義而另一個(gè)層沒有統(tǒng)計(jì)學(xué)意義。主效應(yīng)的解釋要特別注意,要結(jié)合回歸模型和變量定義進(jìn)行謹(jǐn)慎地解釋。應(yīng)用交互作用模型可以比較多個(gè)OR。48ppt課件交互作用的小結(jié)在有交互作用的Logistic模型中,對交互作多分類無序自變量的處理例5:用橫斷面調(diào)查設(shè)計(jì),分析職業(yè)與患糖尿病的關(guān)聯(lián)性。職業(yè):用x1=1,2,3分別表示農(nóng)民,工人和干部(含知識(shí)分子)。用x2表示年齡。由于x1是分類無序變量,必須用亞元變量表示。49ppt課件多分類無序自變量的處理例5:用橫斷面調(diào)查設(shè)計(jì),分析職業(yè)與患糖多分類無序自變量的處理職業(yè)變量x1直接引入Logistic模型是不合適的,因?yàn)槟P椭幸離1后,模型為若1>0,導(dǎo)致x1越大,患病概率相對越大;若1<0,則導(dǎo)致x1越大,患病概率相對越小。而x1屬于無序多分類變量,x1數(shù)值大小是沒有背景意義的,僅是指示作用,應(yīng)引入亞元變量處理。50ppt課件多分類無序自變量的處理職業(yè)變量x1直接引入Logistic模多分類無序自變量的處理亞元變量x12和x13的定義如下:相應(yīng)的Logistic模型為51ppt課件多分類無序自變量的處理亞元變量x12和x13的定義如下:51多分類無序自變量的處理借助Stata軟件用最大似然法估計(jì)回歸系數(shù)得到下列結(jié)果:x12的回歸系數(shù)的P=0.401>0.05,即:對于職業(yè)為工人與農(nóng)民而言,其與患病之間的關(guān)聯(lián)性無統(tǒng)計(jì)學(xué)意義。52ppt課件多分類無序自變量的處理借助Stata軟件用最大似然法估計(jì)回歸多分類無序自變量的處理x13的回歸系數(shù)P=0.003<0.05,說明干部與農(nóng)民的職業(yè)與患糖尿病有關(guān)聯(lián),其干部與工人比較,用Stata軟件檢驗(yàn)12=13,P=0.023<0.05,差異有統(tǒng)計(jì)學(xué)意義。X2的回歸系數(shù)P<0.001,說明年齡與患病也有關(guān)聯(lián),其OR=1.04。53ppt課件多分類無序自變量的處理x13的回歸系數(shù)P=0.003<0.0引用亞元變量應(yīng)注意的問題在Logistic模型中,二分類變量是不區(qū)分有序和無序的,因?yàn)榛貧w系數(shù)的正負(fù)號(hào)能處理兩分類變量所對應(yīng)的概率大小問題。在Logistic模型中,用亞元處理多分類自變量時(shí),對同一個(gè)因素的一組亞元而言,必須同時(shí)引入模型或同時(shí)不引入模型,不能若干個(gè)亞元在模型中,其它亞元不在模型中,這樣會(huì)導(dǎo)致模型的參數(shù)意義發(fā)生改變以致錯(cuò)誤解釋參數(shù)意義。54ppt課件引用亞元變量應(yīng)注意的問題在Logistic模型中,二分類變量多分類有序自變量的處理例6:用橫斷面調(diào)查設(shè)計(jì),分析肥胖與患糖尿病的關(guān)聯(lián)性。職業(yè):用x1=0,1,2分別表示體重正常,超重和肥胖。用x2表示年齡。x1是有序的分類變量(等級(jí)變量)Y=1表示患糖尿病,Y=0表示未患糖尿病。55ppt課件多分類有序自變量的處理例6:用橫斷面調(diào)查設(shè)計(jì),分析肥胖與患糖多分類有序自變量的處理有序分類變量可以直接引入Logistic模型,也可以按無序分類變量方式采用亞元變量引入模型,一般視資料而決定。有序分類變量直接引入模型:體重正常x1=0,體重超重x1=1,體重超重與正常的對數(shù)OR為56ppt課件多分類有序自變量的處理有序分類變量可以直接引入Logisti多分類有序自變量的處理由體重正常x1=0體重超重x1=1,體重超重與正常的對數(shù)OR為作對數(shù)反變換,得到體重超重與正常的57ppt課件多分類有序自變量的處理由57ppt課件多分類有序自變量的處理由體重超重x1=1,體重肥胖x1=2,體重肥胖與超重的對數(shù)OR為作對數(shù)反變換,得到體重肥胖與超重的58ppt課件多分類有序自變量的處理由58ppt課件多分類有序自變量的處理由此可見,如果直接將有序多分類變量引入模型,就是假定相鄰兩個(gè)等級(jí)的總體OR相同,并且不難驗(yàn)證:體重肥胖與體重正常的。綜合上述,若滿足相鄰兩個(gè)等級(jí)的總體OR相同的條件下可以直接將有序多分類變量引入模型,對于不滿足這個(gè)條件,則應(yīng)采用亞元變量引入模型。59ppt課件多分類有序自變量的處理由此可見,如果直接將有序多分類變量引入多分類有序自變量的處理對于多分類有序自變量,可以用似然比檢驗(yàn)的方法檢驗(yàn)相鄰兩個(gè)等級(jí)的總體OR是否相同。在模型1中引入亞元變量,其定義如下:體重正常體重超重體重肥胖x1012X11010x1200160ppt課件多分類有序自變量的處理對于多分類有序自變量,可以用似然比檢驗(yàn)多分類有序自變量的處理模型1用最大似然法得到的似然函數(shù)值為L1模型2:用最大似然法得到的似然函數(shù)值為L2顯然兩個(gè)模型等價(jià)意味1=11且21=12似然比檢驗(yàn)統(tǒng)計(jì)量為2ln(L)=2(ln(L1)-ln(L2))61ppt課件多分類有序自變量的處理模型161ppt課件多分類有序自變量的處理H0:模型1等價(jià)于模型2H1:模型1不等價(jià)模型2=0.05H0為真時(shí),2ln(L)近似服從自由度為1(自變量的分類數(shù)-2)的2分布,即:檢驗(yàn)統(tǒng)計(jì)量,則拒絕H0,選用引入亞元的模型1。62ppt課件多分類有序自變量的處理H0:模型1等價(jià)于模型262ppt逐步回歸分析在多因素統(tǒng)計(jì)分析中,多個(gè)自變量之間存在相關(guān)性,往往相互影響,研究者希望尋找主要影響應(yīng)變量Y的因素。理論上,只要把各種因素組合都試一遍,尋找變量個(gè)數(shù)最多,每個(gè)變量均有統(tǒng)計(jì)學(xué)意義,并且模型擬合程度最好的模型,這種模型稱為最佳預(yù)測模型,這種方法稱為尋找最優(yōu)子集,當(dāng)變量較多時(shí)很難實(shí)現(xiàn)。63ppt課件逐步回歸分析在多因素統(tǒng)計(jì)分析中,多個(gè)自變量之間存在相關(guān)性,往逐步回歸為了比較方便地找到最佳預(yù)測回歸模型,一般采用逐步回歸的分析策略建立擬最佳預(yù)測回歸模型。逐步回歸采用逐個(gè)增加最佳變量的方式或逐個(gè)減少最差的變量方式找到最佳或擬最佳回歸模型。64ppt課件逐步回歸為了比較方便地找到最佳預(yù)測回歸模型,一般采用逐步回歸逐步回歸逐步回歸有4種方式:前進(jìn)法:最開始時(shí),模型中無任何自變量,然后逐個(gè)引入變量進(jìn)入模型,每次在未進(jìn)入模型的所有變量中挑選一個(gè)變量,其P是最小且P值<,每引入一個(gè)變量,重新擬合一次模型,逐步引入變量直至沒有滿足上述條件的變量可以引入模型為止。65ppt課件逐步回歸逐步回歸有4種方式:65ppt課件逐步回歸后退法:最開始時(shí),把所有的變量引入模型,然后逐次把P值最大并且P<的變量剔除出模型,每次只剔除一個(gè)變量,每次剔除一個(gè)變量后重新擬合模型,按照上述剔除標(biāo)準(zhǔn)繼續(xù)剔除變量,直至模型中的所有變量的P<為止。66ppt課件逐步回歸后退法:最開始時(shí),把所有的變量引入模型,然后逐次把P逐步回歸前進(jìn)逐步回歸法最開始時(shí),模型中無任何自變量,然后逐個(gè)引入變量進(jìn)入模型,每次在未進(jìn)入模型的所有變量中挑選一個(gè)變量,其P是最小且P值<,每引入一個(gè)變量,考察模型中是否有P值>的變量,若有將其剔出模型,然后重新擬合一次模型,逐步引入變量直至沒有滿足上述條件的變量可以引入模型為止。67ppt課件逐步回歸前進(jìn)逐步回歸法67ppt課件逐步回歸后退逐步回歸法最開始時(shí),把所有的變量引入模型,然后逐次把P值最大并且P<的變量剔除出模型,每次只剔除一個(gè)變量,每次剔除一個(gè)變量后考察未在模型中的變量中是否存在P<的變量,若有重新引入模型,然后重新擬合模型,按照上述剔除標(biāo)準(zhǔn)繼續(xù)剔除變量,直至模型中的所有變量的P<為止。68ppt課件逐步回歸后退逐步回歸法68ppt課件實(shí)例6:逐步回歸例6:采用橫斷面調(diào)查。研究糖尿病與血壓、血脂等因素的關(guān)系。收集變量如下:69ppt課件實(shí)例6:逐步回歸例6:采用橫斷面調(diào)查。研究糖尿病與血壓、血脂實(shí)例6:逐步回歸X1=1,0分別表示男和女X2表示年齡,X3表示BMIX4=1,0分別表示有家屬史和無家屬史X5,X6,X7分別表示總膽固醇,甘油三酯和高密度脂蛋白Y=1,0分別表示患糖尿病和未患糖尿病。先根據(jù)逐步回歸的思路,人工進(jìn)行逐步回歸,然后用軟件進(jìn)行逐步回歸驗(yàn)證。70ppt課件實(shí)例6:逐步回歸X1=1,0分別表示男和女70ppt課件實(shí)例6:逐步回歸X1的P值最大并且P>0.05,故剔除X171ppt課件實(shí)例6:逐步回歸X1的P值最大并且P>0.05,故剔除X1實(shí)例6:逐步回歸X6的P值最大并且P>0.05,故剔除X672ppt課件實(shí)例6:逐步回歸X6的P值最大并且P>0.05,故剔除X6實(shí)例6:逐步回歸X3的P值最大并且P>0.05,故剔除X373ppt課件實(shí)例6:逐步回歸X3的P值最大并且P>0.05,故剔除X37實(shí)例6:逐步回歸X7的P值最大并且>0.05,故剔除X774ppt課件實(shí)例6:逐步回歸X7的P值最大并且>0.05,故剔除X774實(shí)例6:逐步回歸所有變量的P值均<0.05,故得到最終回歸模型75ppt課件實(shí)例6:逐步回歸所有變量的P值均<0.05,故得到最終回歸模實(shí)例6:逐步回歸用Stata進(jìn)行(后退法)逐步回歸,得到下列結(jié)果:beginwithfullmodelp=0.9049>=0.0510removingx1p=0.7183>=0.0510removingx6p=0.3873>=0.0510removingx3p=0.4013>=0.0510removingx776ppt課件實(shí)例6:逐步回歸用Stata進(jìn)行(后退法)逐步回歸,得到下列實(shí)例6:逐步回歸得到下列回歸系數(shù)的估計(jì)由上述結(jié)果可知與糖尿病患病的主要影響因素是年齡x2,家屬史x4和總膽固醇x5。77ppt課件實(shí)例6:逐步回歸得到下列回歸系數(shù)的估計(jì)77ppt課件逐步回歸小結(jié)逐步回歸是尋找主要影響因素的一種回歸策略,又稱建立最佳預(yù)測模型。進(jìn)入回歸模型的變量可以推斷這些變量與應(yīng)變量Y有關(guān)聯(lián),但是沒有進(jìn)入回歸模型的變量不能稱這些變量與應(yīng)變量Y沒有關(guān)聯(lián)性。一般設(shè)定變量進(jìn)入模型的=0.05,剔除變量的>0.05。78ppt課件逐步回歸小結(jié)逐步回歸是尋找主要影響因素的一種回歸策略,又稱建Logistic回歸模型小結(jié)對于應(yīng)變量為二分類,可以用Logistic回歸模型進(jìn)行統(tǒng)計(jì)分析。在Logistic模型中,自變量可以是二分類的,也可以是連續(xù)型變量和有序多分類變量,但無序多分類變量應(yīng)用一組亞元變量取代。逐步回歸是尋找主要影響因素的回歸策略,沒有進(jìn)入模型的變量不能作推斷。79ppt課件Logistic回歸模型小結(jié)對于應(yīng)變量為二分類,可以用LogLogistic回歸模型小結(jié)模型中出現(xiàn)有交互作用,不是統(tǒng)計(jì)分析的最終結(jié)果,只是中間結(jié)果,一般要根據(jù)研究目的進(jìn)行簡單效應(yīng)分析。條件Logistic模型只適用于配對病例對照研究,其回歸系數(shù)解釋與非條件的Logistic模型相同。80ppt課件Logistic回歸模型小結(jié)模型中出現(xiàn)有交互作用,不是統(tǒng)計(jì)分Logistic回歸模型小結(jié)病例對照研究的資料可以用Logistic回歸模型分析暴露因素與應(yīng)變量之間的關(guān)聯(lián)性,但不可以直接應(yīng)用Logistic模型進(jìn)行預(yù)測或估計(jì)患病率。Logistic回歸模型在擬合的過程中經(jīng)常會(huì)提到擬合優(yōu)度(goodnessoffiting)的問題,擬合優(yōu)度沒有統(tǒng)計(jì)學(xué)意義,只說明當(dāng)前在模型中的變量情況下,該模型與最優(yōu)模型無統(tǒng)計(jì)學(xué)差異,但不能說明模型中再增加變量的情況。81ppt課件Logistic回歸模型小結(jié)病例對照研究的資料可以用LogiLogistic回歸模型趙耐青復(fù)旦大學(xué)公共衛(wèi)生學(xué)院82ppt課件Logistic回歸模型趙耐青1ppt課件數(shù)據(jù)分析的背景計(jì)量資料單因素統(tǒng)計(jì)分析對于兩組計(jì)量資料的比較,一般采用t檢驗(yàn)或秩和檢驗(yàn)。對于兩個(gè)變量的相關(guān)分析采用Pearson相關(guān)分析或Spearman相關(guān)分析考慮多因素的影響,對于應(yīng)變量(反應(yīng)變量)為計(jì)量資料,一般可以考慮應(yīng)用多重線性回歸模型進(jìn)行多因素分析。83ppt課件數(shù)據(jù)分析的背景計(jì)量資料單因素統(tǒng)計(jì)分析2ppt課件數(shù)據(jù)分析的背景單因素的分類資料統(tǒng)計(jì)分析,一般采用Pearson2進(jìn)行統(tǒng)計(jì)檢驗(yàn),用OddsRatio及其95%可信區(qū)間評(píng)價(jià)關(guān)聯(lián)程度??紤]多因素的影響,對于反應(yīng)變量為分類變量時(shí),用線性回歸模型P=a+bx就不合適了,應(yīng)選用Logistic回歸模型進(jìn)行統(tǒng)計(jì)分析。84ppt課件數(shù)據(jù)分析的背景單因素的分類資料統(tǒng)計(jì)分析,一般采用PearsoLogistic回歸模型按研究設(shè)計(jì)分類非配對設(shè)計(jì):非條件Logistic回歸模型配對的病例對照:條件Logistic回歸模型按反應(yīng)變量分類二分類Logistic回歸模型(常用)多分類無序Logistic回歸模型多分類有序Logistic回歸模型85ppt課件Logistic回歸模型按研究設(shè)計(jì)分類4ppt課件基礎(chǔ)知識(shí)通過下例引入和復(fù)習(xí)相關(guān)概念例如:研究患某疾病與飲酒的關(guān)聯(lián)性患病率P1=a/m1P2=b/m286ppt課件基礎(chǔ)知識(shí)通過下例引入和復(fù)習(xí)相關(guān)概念5ppt課件基礎(chǔ)知識(shí)Odds(優(yōu)勢)P越大,則Odds越大;P越小,則Odds越小并且0<Odds<+87ppt課件基礎(chǔ)知識(shí)Odds(優(yōu)勢)P越大,則Odds越大;P越小,則O基礎(chǔ)知識(shí)P與Odds一一對應(yīng)對于兩個(gè)Odds的比較,一般用它們的Ratio,并稱為OddsRatio(OR),其定義如下:其樣本估計(jì)統(tǒng)計(jì)量為88ppt課件基礎(chǔ)知識(shí)基礎(chǔ)知識(shí)

故比較兩個(gè)率<==>比較OR=1?OR>1?OR<1?89ppt課件基礎(chǔ)知識(shí)8ppt課件(二分類)Logistic回歸模型因?yàn)?<Odds<+所以-<ln(Odds)<+對ln(Odds)引入類似多重線性回歸的表達(dá)式90ppt課件(二分類)Logistic回歸模型因?yàn)?<Odds<+9pLogistic回歸模型記:故可以寫為也可以寫為91ppt課件Logistic回歸模型記:10ppt課件回歸系數(shù)的意義以x1的回歸系數(shù)1為例固定其它自變量,比較x1與x1+1的ln(Odds)變化。對于x1,對于x1+1,反對數(shù)變換得到92ppt課件回歸系數(shù)的意義以x1的回歸系數(shù)1為例11ppt課件研究急性心肌梗塞(AMI)患病與飲酒的關(guān)系,采用橫斷面調(diào)查。實(shí)例193ppt課件研究急性心肌梗塞(AMI)患病與飲酒的關(guān)系,采用橫斷面調(diào)查實(shí)例1飲酒的患病率和Odds分別為不飲酒的患病率和Odds分別為94ppt課件實(shí)例1飲酒的患病率和Odds分別為不飲酒的患病率和Odds分實(shí)例1的Logistic回歸模型患病(Y=1)的概率為x=1表示飲酒,x=0表示不飲酒回歸系數(shù)0,1是未知參數(shù),通常用最大似然估計(jì)的方法。95ppt課件實(shí)例1的Logistic回歸模型患病(Y=1)的概率為14p實(shí)例1:患病與未患病的概率飲酒(x=1),患病概率和未患病概率分別為不飲酒(x=0),患病概率和未患病概率分別為96ppt課件實(shí)例1:患病與未患病的概率飲酒(x=1),患病概率和未患病概實(shí)例1:最大似然估計(jì)本例的似然函數(shù)選擇0和1使似然函數(shù)L達(dá)到最大,即最大似然估計(jì)。97ppt課件實(shí)例1:最大似然估計(jì)本例的似然函數(shù)16ppt課件實(shí)例1:用Logistic模型進(jìn)行統(tǒng)計(jì)分析以上述實(shí)例資料用Stata統(tǒng)計(jì)軟件對回歸系數(shù)進(jìn)行最大似然估計(jì),得到回歸系數(shù)估計(jì)為即:98ppt課件實(shí)例1:用Logistic模型進(jìn)行統(tǒng)計(jì)分析以上述實(shí)例資料用SLogistic模型的單個(gè)回歸系數(shù)檢驗(yàn)關(guān)鍵是如果=0,意味自變量X與Y無關(guān)聯(lián)性。由于的估計(jì)存在抽樣誤差,即使=0,其估計(jì)值b一般不為0,故需檢驗(yàn)=0?H0:=0H1:0=0.05檢驗(yàn)統(tǒng)計(jì)量可以證明:H0:=0為真時(shí),z近似服從標(biāo)準(zhǔn)正態(tài)分布,即:|z|>1.96,P<0.05,拒絕H099ppt課件Logistic模型的單個(gè)回歸系數(shù)檢驗(yàn)關(guān)鍵是如果=0,意味實(shí)例1:用Logistic模型進(jìn)行統(tǒng)計(jì)分析實(shí)例1的回歸系數(shù)估計(jì)為se(b)=0.1780719,z=b/se=2.31,P=0.021<0.05拒絕H0,差異有統(tǒng)計(jì)學(xué)意義,可認(rèn)為0。飲酒與患AMI的關(guān)聯(lián)性為OR的95%可信區(qū)間為(1.06,2.14)100ppt課件實(shí)例1:用Logistic模型進(jìn)行統(tǒng)計(jì)分析實(shí)例1的回歸系數(shù)估應(yīng)用Logistic模型校正混雜作用實(shí)例2:上例沒有考慮吸煙情況,故將吸煙作為分層加入,資料如下:101ppt課件應(yīng)用Logistic模型校正混雜作用實(shí)例2:上例沒有考慮吸煙實(shí)例2:應(yīng)用Logistic模型

校正混雜作用從分層的資料表述可知:由于吸煙的混雜作用以致飲酒與AMI患病伴隨有關(guān)聯(lián)。用x1=1和0分別表示飲酒和不飲酒,用x2=1和0分別表示吸煙和不吸煙,Logistic模型表示如下102ppt課件實(shí)例2:應(yīng)用Logistic模型

校正混雜作用從分層的資料表Logistic模型的似然比檢驗(yàn)在多個(gè)自變量回歸模型中,回歸系數(shù)檢驗(yàn)分為單個(gè)回歸系數(shù)檢驗(yàn)和多個(gè)回歸系數(shù)檢驗(yàn)。單個(gè)回歸系數(shù)檢驗(yàn)表示其它變量均在模型中的情況下,檢驗(yàn)?zāi)硞€(gè)回歸系數(shù)i=0,一般用Wald檢驗(yàn)(如實(shí)例1)。多個(gè)回歸系數(shù)檢驗(yàn)要用似然比方法(likelihoodratiotest)103ppt課件Logistic模型的似然比檢驗(yàn)在多個(gè)自變量回歸模型中,回歸Logistic模型的似然比檢驗(yàn)多個(gè)回歸系數(shù)的檢驗(yàn)(以實(shí)例2為例)H0:1=2=0H1:1,2不全為0=0.05H0為真時(shí),模型為用最大似然法進(jìn)行估計(jì),其對數(shù)最大似然函數(shù)值(似然函數(shù)的最大值取對數(shù))記為ln(L0)104ppt課件Logistic模型的似然比檢驗(yàn)多個(gè)回歸系數(shù)的檢驗(yàn)(以實(shí)例2Logistic模型的似然比檢驗(yàn)H1為真時(shí),實(shí)例2的模型為用最大似然法進(jìn)行估計(jì),其對數(shù)最大似然函數(shù)值記為ln(L1)記似然比檢驗(yàn)統(tǒng)計(jì)量為2ln(L)=2(ln(L1)-ln(L0))105ppt課件Logistic模型的似然比檢驗(yàn)H1為真時(shí),實(shí)例2的模型為2Logistic模型的似然比檢驗(yàn)可以證明:H0為真時(shí),2ln(L)近似服從2分布,自由度為需檢驗(yàn)的自變量個(gè)數(shù),如在實(shí)例2中,自由度為2。如果似然比檢驗(yàn)統(tǒng)計(jì)量2ln(L)>則拒絕H0。如果對模型中所有的自變量進(jìn)行檢驗(yàn),則稱為模型檢驗(yàn)。如實(shí)例2,對兩個(gè)自變量進(jìn)行檢驗(yàn),故這是模型檢驗(yàn)。106ppt課件Logistic模型的似然比檢驗(yàn)可以證明:H0為真時(shí),2l實(shí)例2應(yīng)用Logistic模型

校正混雜作用應(yīng)用Stata軟件進(jìn)行最大似然估計(jì),得到模型擬合的主要結(jié)果如下似然函數(shù)比為2ln(L)=76.32,df=2,P<0.001,因此拒絕H0:1=2=0,可以認(rèn)為1和2不全為0。107ppt課件實(shí)例2應(yīng)用Logistic模型

校正混雜作用應(yīng)用Stata軟實(shí)例2應(yīng)用Logistic模型

校正混雜作用應(yīng)用Stata軟件進(jìn)行最大似然估計(jì),得到回歸系數(shù)估計(jì)的主要結(jié)果如下飲酒:108ppt課件實(shí)例2應(yīng)用Logistic模型

校正混雜作用應(yīng)用Stata軟多自變量Logistic模型的OR解釋在本例中,對于同為吸煙或不吸煙的對象而言(x2相對固定不變),飲酒(x1=1)的對數(shù)Odds為不飲酒(x1=0)的對數(shù)Odds為109ppt課件多自變量Logistic模型的OR解釋在本例中,對于同為吸煙多自變量Logistic模型的OR解釋則飲酒的對數(shù)OddsRatio為即:飲酒的意義:對于同為吸煙的對象或者同為不吸煙的對象,其飲酒的故稱校正吸煙后OR,而前者未考慮吸煙的單因素OR稱為crudeOR110ppt課件多自變量Logistic模型的OR解釋則飲酒的對數(shù)Odds實(shí)例2應(yīng)用Logistic模型

校正混雜作用飲酒:P=1校正了吸煙因素的情況下,沒有足夠的證據(jù)推斷飲酒與AMI患病有關(guān)聯(lián)性。吸煙:P<0.001,校正了飲酒的情況下,可以認(rèn)為吸煙與患AMI的關(guān)聯(lián)性有統(tǒng)計(jì)學(xué)意義,并且可以認(rèn)為吸煙者患AMI的風(fēng)險(xiǎn)更大。111ppt課件實(shí)例2應(yīng)用Logistic模型

校正混雜作用飲酒:30pptLogistic模型中的交互作用實(shí)例3:采用病例對照設(shè)計(jì)研究吸煙和家屬史與患肺癌的關(guān)聯(lián)性。用x1=1,0分別表示吸煙和不吸煙;x2=1,0分別表示有無家屬史;用y=1,0分別表示患肺癌和未患肺癌。112ppt課件Logistic模型中的交互作用實(shí)例3:采用病例對照設(shè)計(jì)研究實(shí)例3:Logistic模型的交互作用一般而言,吸煙和家屬史均是肺癌的重要相關(guān)因素,很有可能這兩個(gè)因素對患肺癌有交互作用,因此采用下列含有交互作用項(xiàng)的Logistic模型。其中x1和x2的乘積項(xiàng)x1x2稱為交互作用項(xiàng)113ppt課件實(shí)例3:Logistic模型的交互作用一般而言,吸煙和家屬史應(yīng)用Logistic模型分析實(shí)例3用Stata軟件對實(shí)例3的資料擬合上述模型,得到下列結(jié)果:3=0.955825,P=0.04,差別有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為吸煙和家屬史對患肺癌有交互作用。114ppt課件應(yīng)用Logistic模型分析實(shí)例3用Stata軟件對實(shí)例3的實(shí)例3:Logistic模型的交互作用由于本例模型為對于無家屬史,x2=0代入模型,得到由回歸系數(shù)與OR的關(guān)系,得到吸煙的:P<0.001115ppt課件實(shí)例3:Logistic模型的交互作用由于本例模型為P<0.實(shí)例3:Logistic模型的交互作用由于本例模型為對于有家屬史,x2=1代入模型,得到有家屬史的吸煙OR為116ppt課件實(shí)例3:Logistic模型的交互作用由于本例模型為35pp實(shí)例3:Logistic模型的交互作用H0:1+3=0H1:1+30=0.05(應(yīng)用Stata軟件可進(jìn)行下列計(jì)算)

當(dāng)H0為真時(shí),檢驗(yàn)統(tǒng)計(jì)量2服從自由度為1的2分布,由于本例檢驗(yàn)統(tǒng)計(jì)量2=40.58>=3.84,故拒絕H0,可以認(rèn)為1+30,差別有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為吸煙者患肺癌的風(fēng)險(xiǎn)更大。117ppt課件實(shí)例3:Logistic模型的交互作用H0:1+3=0實(shí)例3:Logistic模型的交互作用同理,為了評(píng)價(jià)家屬史與肺癌的關(guān)聯(lián)性,根據(jù)下列Logistic模型對于不吸煙x1=0,則上述Logistic模型為家屬史的P=0.認(rèn)為026<0.05,差別有統(tǒng)計(jì)學(xué)意義,可以認(rèn)為有家屬史的患者患肺癌的風(fēng)險(xiǎn)更大。118ppt課件實(shí)例3:Logistic模型的交互作用同理,為了評(píng)價(jià)家屬史與實(shí)例3:Logistic模型的交互作用同理,為了評(píng)價(jià)家屬史與肺癌的關(guān)聯(lián)性,根據(jù)下列Logistic模型對于吸煙x1=1,則上述Logistic模型為同理可用Stata軟件得到相應(yīng)P=0.0077119ppt課件實(shí)例3:Logistic模型的交互作用同理,為了評(píng)價(jià)家屬史與Logistic模型中的交互作用實(shí)例3小結(jié):吸煙與肺癌患病有關(guān)聯(lián)性,并且對于有家屬史的情況下,吸煙與肺癌患病的關(guān)聯(lián)性被進(jìn)一步加強(qiáng),且差異有統(tǒng)計(jì)學(xué)意義。家屬史與患肺癌有關(guān)聯(lián)性,并且吸煙會(huì)導(dǎo)致家屬史與肺癌之間的關(guān)聯(lián)性進(jìn)一步加強(qiáng),且差異有統(tǒng)計(jì)學(xué)意義。120ppt課件Logistic模型中的交互作用實(shí)例3小結(jié):39ppt課件病例對照研究與Logistic模型在病例對照研究中,由于分組采樣是按病例和對照分別采樣的,病例組的人數(shù)和對照組的人數(shù)均是研究者自己決定的,病例數(shù)人與對照人數(shù)之比不是人群的比,故不能估計(jì)患病率,但可以估計(jì)OR。對于病例對照研究的資料,可以用Logistic模型評(píng)估各個(gè)因素對應(yīng)變量的OR,但不能估計(jì)和預(yù)測相應(yīng)的患病概率。121ppt課件病例對照研究與Logistic模型在病例對照研究中,由于分組Logistic模型中的交互作用例4評(píng)價(jià)兩個(gè)藥治療某疾病的療效,資料如下:定義y=1,0分別為有效和無效,x1=1,0分別為A藥和B藥,x2=1,0分別為病情重和輕。122ppt課件Logistic模型中的交互作用例4評(píng)價(jià)兩個(gè)藥治療某疾病的Logistic模型中的交互作用由于研究設(shè)計(jì)中考慮了病情重和病情輕的情況,所以應(yīng)考慮病情輕重和不同藥物治療對療效的交互作用。用Stata統(tǒng)計(jì)軟件進(jìn)行回歸模型的擬合,得到下列結(jié)果(見下一張幻燈)。123ppt課件Logistic模型中的交互作用由于研究設(shè)計(jì)中考慮了病情重和Logistic模型中的交互作用對于病情輕x2=0代入模型,得到

124ppt課件Logistic模型中的交互作用43ppt課件Logistic模型中的交互作用藥物因素變量x1的回歸系數(shù)為,P=0.652>0.05,兩個(gè)藥的療效差異無統(tǒng)計(jì)學(xué)意義。模型病情重x2=1代入模型,得到125ppt課件Logistic模型中的交互作用藥物因素變量x1的回歸系數(shù)為Logistic模型中的交互作用即:病情重時(shí)的藥物變量x1的回歸系數(shù)為對于在病情重的情況下,兩個(gè)藥的療效是否有差異需檢驗(yàn)1+3=0,用Stata軟件計(jì)算得:檢驗(yàn)統(tǒng)計(jì)量2=42.16,df=1,P<0.001,說明A藥組(x1=1)的療效大于B藥組(x1=0),差異有統(tǒng)計(jì)學(xué)意義。126ppt課件Logistic模型中的交互作用即:病情重時(shí)的藥物變量x1的實(shí)例4小結(jié)在病情輕的情況下,兩個(gè)藥的療效差異無統(tǒng)計(jì)學(xué)意義。在病情重的情況下,可以認(rèn)為A藥的療效優(yōu)于B藥。即:不能簡單地稱A藥優(yōu)于B藥或兩個(gè)藥的療效差異無統(tǒng)計(jì)學(xué)意義。請注意:在有交互作用的模型中,其主效應(yīng)(本例x1)解釋應(yīng)謹(jǐn)慎。127ppt課件實(shí)例4小結(jié)在病情輕的情況下,兩個(gè)藥的療效差異無統(tǒng)計(jì)學(xué)意義。4交互作用的小結(jié)交互作用的意義就是不同層(某因素的不同水平)另一個(gè)研究因素與應(yīng)變量的之間的關(guān)聯(lián)程度是不同的。在回歸分析和方差分析中,經(jīng)統(tǒng)計(jì)檢驗(yàn)得到交互作用項(xiàng)有統(tǒng)計(jì)學(xué)意義只是統(tǒng)計(jì)分析的中間結(jié)果,不要簡單歸結(jié)為協(xié)同作用或拮抗作用,一般要做進(jìn)一步分析。128ppt課件交互作用的小結(jié)交互作用的意義就是不同層(某因素的不同水平)另交互作用的小結(jié)在有交互作用的Logistic模型中,對交互作用項(xiàng)要根據(jù)研究目的進(jìn)行解釋,一般應(yīng)進(jìn)行分層作簡單效應(yīng)檢驗(yàn),特別很可能某個(gè)層有統(tǒng)計(jì)學(xué)意義而另一個(gè)層沒有統(tǒng)計(jì)學(xué)意義。主效應(yīng)的解釋要特別注意,要結(jié)合回歸模型和變量定義進(jìn)行謹(jǐn)慎地解釋。應(yīng)用交互作用模型可以比較多個(gè)OR。129ppt課件交互作用的小結(jié)在有交互作用的Logistic模型中,對交互作多分類無序自變量的處理例5:用橫斷面調(diào)查設(shè)計(jì),分析職業(yè)與患糖尿病的關(guān)聯(lián)性。職業(yè):用x1=1,2,3分別表示農(nóng)民,工人和干部(含知識(shí)分子)。用x2表示年齡。由于x1是分類無序變量,必須用亞元變量表示。130ppt課件多分類無序自變量的處理例5:用橫斷面調(diào)查設(shè)計(jì),分析職業(yè)與患糖多分類無序自變量的處理職業(yè)變量x1直接引入Logistic模型是不合適的,因?yàn)槟P椭幸離1后,模型為若1>0,導(dǎo)致x1越大,患病概率相對越大;若1<0,則導(dǎo)致x1越大,患病概率相對越小。而x1屬于無序多分類變量,x1數(shù)值大小是沒有背景意義的,僅是指示作用,應(yīng)引入亞元變量處理。131ppt課件多分類無序自變量的處理職業(yè)變量x1直接引入Logistic模多分類無序自變量的處理亞元變量x12和x13的定義如下:相應(yīng)的Logistic模型為132ppt課件多分類無序自變量的處理亞元變量x12和x13的定義如下:51多分類無序自變量的處理借助Stata軟件用最大似然法估計(jì)回歸系數(shù)得到下列結(jié)果:x12的回歸系數(shù)的P=0.401>0.05,即:對于職業(yè)為工人與農(nóng)民而言,其與患病之間的關(guān)聯(lián)性無統(tǒng)計(jì)學(xué)意義。133ppt課件多分類無序自變量的處理借助Stata軟件用最大似然法估計(jì)回歸多分類無序自變量的處理x13的回歸系數(shù)P=0.003<0.05,說明干部與農(nóng)民的職業(yè)與患糖尿病有關(guān)聯(lián),其干部與工人比較,用Stata軟件檢驗(yàn)12=13,P=0.023<0.05,差異有統(tǒng)計(jì)學(xué)意義。X2的回歸系數(shù)P<0.001,說明年齡與患病也有關(guān)聯(lián),其OR=1.04。134ppt課件多分類無序自變量的處理x13的回歸系數(shù)P=0.003<0.0引用亞元變量應(yīng)注意的問題在Logistic模型中,二分類變量是不區(qū)分有序和無序的,因?yàn)榛貧w系數(shù)的正負(fù)號(hào)能處理兩分類變量所對應(yīng)的概率大小問題。在Logistic模型中,用亞元處理多分類自變量時(shí),對同一個(gè)因素的一組亞元而言,必須同時(shí)引入模型或同時(shí)不引入模型,不能若干個(gè)亞元在模型中,其它亞元不在模型中,這樣會(huì)導(dǎo)致模型的參數(shù)意義發(fā)生改變以致錯(cuò)誤解釋參數(shù)意義。135ppt課件引用亞元變量應(yīng)注意的問題在Logistic模型中,二分類變量多分類有序自變量的處理例6:用橫斷面調(diào)查設(shè)計(jì),分析肥胖與患糖尿病的關(guān)聯(lián)性。職業(yè):用x1=0,1,2分別表示體重正常,超重和肥胖。用x2表示年齡。x1是有序的分類變量(等級(jí)變量)Y=1表示患糖尿病,Y=0表示未患糖尿病。136ppt課件多分類有序自變量的處理例6:用橫斷面調(diào)查設(shè)計(jì),分析肥胖與患糖多分類有序自變量的處理有序分類變量可以直接引入Logistic模型,也可以按無序分類變量方式采用亞元變量引入模型,一般視資料而決定。有序分類變量直接引入模型:體重正常x1=0,體重超重x1=1,體重超重與正常的對數(shù)OR為137ppt課件多分類有序自變量的處理有序分類變量可以直接引入Logisti多分類有序自變量的處理由體重正常x1=0體重超重x1=1,體重超重與正常的對數(shù)OR為作對數(shù)反變換,得到體重超重與正常的138ppt課件多分類有序自變量的處理由57ppt課件多分類有序自變量的處理由體重超重x1=1,體重肥胖x1=2,體重肥胖與超重的對數(shù)OR為作對數(shù)反變換,得到體重肥胖與超重的139ppt課件多分類有序自變量的處理由58ppt課件多分類有序自變量的處理由此可見,如果直接將有序多分類變量引入模型,就是假定相鄰兩個(gè)等級(jí)的總體OR相同,并且不難驗(yàn)證:體重肥胖與體重正常的。綜合上述,若滿足相鄰兩個(gè)等級(jí)的總體OR相同的條件下可以直接將有序多分類變量引入模型,對于不滿足這個(gè)條件,則應(yīng)采用亞元變量引入模型。140ppt課件多分類有序自變量的處理由此可見,如果直接將有序多分類變量引入多分類有序自變量的處理對于多分類有序自變量,可以用似然比檢驗(yàn)的方法檢驗(yàn)相鄰兩個(gè)等級(jí)的總體OR是否相同。在模型1中引入亞元變量,其定義如下:體重正常體重超重體重肥胖x1012X11010x12001141ppt課件多分類有序自變量的處理對于多分類有序自變量,可以用似然比檢驗(yàn)多分類有序自變量的處理模型1用最大似然法得到的似然函數(shù)值為L1模型2:用最大似然法得到的似然函數(shù)值為L2顯然兩個(gè)模型等價(jià)意味1=11且21=12似然比檢驗(yàn)統(tǒng)計(jì)量為2ln(L)=2(ln(L1)-ln(L2))142ppt課件多分類有序自變量的處理模型161ppt課件多分類有序自變量的處理H0:模型1等價(jià)于模型2H1:模型1不等價(jià)模型2=0.05H0為真時(shí),2ln(L)近似服從自由度為1(自變量的分類數(shù)-2)的2分布,即:檢驗(yàn)統(tǒng)計(jì)量,則拒絕H0,選用引入亞元的模型1。143ppt課件多分類有序自變量的處理H0:模型1等價(jià)于模型262ppt逐步回歸分析在多因素統(tǒng)計(jì)分析中,多個(gè)自變量之間存在相關(guān)性,往往相互影響,研究者希望尋找主要影響應(yīng)變量Y的因素。理論上,只要把各種因素組合都試一遍,尋找變量個(gè)數(shù)最多,每個(gè)變量均有統(tǒng)計(jì)學(xué)意義,并且模型擬合程度最好的模型,這種模型稱為最佳預(yù)測模型,這種方法稱為尋找最優(yōu)子集,當(dāng)變量較多時(shí)很難實(shí)現(xiàn)。144ppt課件逐步回歸分析在多因素統(tǒng)計(jì)分析中,多個(gè)自變量之間存在相關(guān)性,往逐步回歸為了比較方便地找到最佳預(yù)測回歸模型,一般采用逐步回歸的分析策略建立擬最佳預(yù)測回歸模型。逐步回歸采用逐個(gè)增加最佳變量的方式或逐個(gè)減少最差的變量方式找到最佳或擬最佳回歸模型。145ppt課件逐步回歸為了比較方便地找到最佳預(yù)測回歸模型,一般采用逐步回歸逐步回歸逐步回歸有4種方式:前進(jìn)法:最開始時(shí),模型中無任何自變量,然后逐個(gè)引入變量進(jìn)入模型,每次在未

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論