醫(yī)學(xué)統(tǒng)計學(xué) 定性資料的分析課件_第1頁
醫(yī)學(xué)統(tǒng)計學(xué) 定性資料的分析課件_第2頁
醫(yī)學(xué)統(tǒng)計學(xué) 定性資料的分析課件_第3頁
醫(yī)學(xué)統(tǒng)計學(xué) 定性資料的分析課件_第4頁
醫(yī)學(xué)統(tǒng)計學(xué) 定性資料的分析課件_第5頁
已閱讀5頁,還剩67頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第七章 定性資料的分析參數(shù)估計: 率的區(qū)間估計假設(shè)檢驗: 1一、率的可信區(qū)間 與均數(shù)一樣,率也存在抽樣誤差 ,率的標(biāo)準(zhǔn)差又稱率的標(biāo)準(zhǔn)誤為: 率的抽樣誤差2(一)率的分布 當(dāng)總體率0.5時為正偏態(tài),當(dāng)0.5時為負(fù)偏態(tài),當(dāng)=0.5時為對稱分布。只有當(dāng)n較大、率和(1-)都不太小時,例如n和n(1-)均大于5時,率的抽樣分布近似于正態(tài)分布。3(二)總體率的區(qū)間估計 正態(tài)近似法 查表法41.正態(tài)近似法條件: 樣本例數(shù)n足夠大,且樣本率 p 和 (1-p) 都不 太小時,即 np 和 n(1-p) 均大于5時,樣本率p 的抽樣分布近似正態(tài)分布 ??傮w率的可信區(qū)間: 52.查表法例4.5 有人調(diào)查29名非

2、吸毒婦女,出獄時有1名HIV(人免疫缺陷病毒)陽性,求陽性率95可信區(qū)間? 直接查附表6.2,在行n=29, 列x=1交叉處0.117.8即為陽性率95可信區(qū)間7二、定性資料的假設(shè)檢驗 樣本率與總體率的比較 兩樣本率的比較 多個率的比較 構(gòu)成比的比較 配對設(shè)計兩樣本率的比較 兩事件數(shù)的比較 定性資料假設(shè)檢驗的正確應(yīng)用8樣本率與總體率比較的正態(tài)近似檢驗?zāi)康模和茢鄻颖臼欠駚碜阅骋阎傮w 條件:正態(tài)近似檢驗:np5 同時 n(1-p)5 10檢驗假設(shè): H0:=0, 老年胃潰瘍病患者的胃出血率等于20;H1:0, 老年胃潰瘍病患者的胃出血率大于20。 單側(cè)=0.05。 P3.84的可能性只有0.05

3、,是一小概 率事件。32本例 2 =3.52 0.05。按 = 0.05水準(zhǔn)不拒絕H0,差別無統(tǒng)計學(xué)意義。故尚不能認(rèn)為單純手術(shù)療法與聯(lián)合療法對乳腺癌患者治療效果有差別。33基本思想概括若H0成立,則四個格子的實際頻數(shù)A與理論頻數(shù)T之差異純系抽樣誤差所致,故一般不會很大,2值也就不會很大;在一次隨機(jī)試驗中,出現(xiàn)大的 2 值的概率P 是很小的。34因此,若根據(jù)實際樣本資料求得一個很小的P,且P (檢驗水準(zhǔn)),根據(jù)小概率原理,就有理由懷疑H0的真實性,因而拒絕它;若P,則沒有理由拒絕H0 35四格表資料2檢驗專用公式 36 由于2分布是一種連續(xù)性分布,附表3中2界值是根據(jù)此連續(xù)性分布的理論公式計算出

4、來的,但兩個或多個率比較的原始數(shù)據(jù)卻屬定性資料,是不連續(xù)的,故式(7.5)只是一個近似計算公式。計算出來的2值往往偏大,相應(yīng)的P值偏小,從而人為地增加了范第一類錯誤的機(jī)會。為糾正這種偏性,可采用校正2,用C2表示。 四格表資料2檢驗的校正372檢驗不校正的條件: n 40 且所有T 5 2檢驗校正的條件: n40 但有l(wèi)T5 四格表資料2檢驗的應(yīng)用條件確切概率法: 當(dāng)n和T過小,如T1或n40時因近似程度太差,不宜用2檢驗,而應(yīng)改用確切概率法。38四格表資料2檢驗的校正公式39例7.3 比較單用甘磷酰芥(單純化療組)與復(fù)合使用爭光霉素、環(huán)磷酰胺等藥(復(fù)合化療組)對淋巴系統(tǒng)腫瘤的療效,問兩組患者

5、總體的完全緩解率有無差別 40H0:1=2;H1:12。0.05。 按 =1查附表3,2界值表,得P0.05,按 = 0.05水準(zhǔn)不拒絕H0,差異無統(tǒng)計學(xué)意義。故根據(jù)本資料尚不能認(rèn)為兩種療法的總體緩解率有差別。本例a 格的理論頻數(shù)最小,T11=1216/41=4.6840,故考慮用校正公式計算 2 值。41u檢驗與2檢驗的關(guān)系 兩樣本率比較時,如為雙側(cè)檢驗,則u檢驗和四格表2檢驗是等價的,即自由度為1的2=u2 ;校正u檢驗和四格表校正2檢驗也是等價的,應(yīng)用條件亦相同。若為單側(cè)檢驗,則用u檢驗較為方便。 42數(shù)據(jù)特點: 多(R)個率的比較,其基本數(shù)據(jù) 有R行2列,構(gòu)成R2表,用以表述R個率的基

6、本數(shù)據(jù)。目的: R2表的2檢驗用于推斷R個樣本率 各自所代表的總體率是否相等。 7.3 多個樣本率的比較 43 多個樣本率的比較的公式 式中,A為第R行第C列對應(yīng)的實際頻數(shù),nR為第R行的行合計, nC為第C列的列合計, n為總樣本含量。 44例7.4 某地調(diào)查了19951998四個年度中小學(xué)女生的貧血狀況,見表7.4,問各年度間學(xué)生貧血率有無差別? 45H0:四個年度學(xué)生的貧血檢出率相等;H1:四個年度學(xué)生的貧血檢出率不等或不全相等。 =0.05。 =(4-1)(2-1)=3。查附表3,2界值表,得P0.005。按 =0.05水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義。故可認(rèn)為該地四個年份中小

7、學(xué)女生貧血檢出率不相等 46多個率的多重比較 當(dāng)多個樣本率比較的2檢驗,結(jié)論為拒絕H0時,只能認(rèn)為各總體率之間總的說來有差別,但不能說明它們彼此間都有差別,或某兩者間有差別。若要進(jìn)一步比較哪些率之間有差別,應(yīng)進(jìn)行多重比較。 47Scheff可信區(qū)間法 原理: 通過計算兩率之差的可信區(qū)間來推斷比較組間有無差異。兩率之差的(1-)100%可信區(qū)間pA和pB分別為比較組的樣本率;nA和nB分別為比較組的樣本含量;k所有的組數(shù)。48例7.5 試對例7.4四個年度學(xué)生貧血檢出率的分析結(jié)果進(jìn)一步作兩兩比較 .2=281.6263,P0.005,該地四個年份中小學(xué)女生貧血檢出率總的說來有差別。 2檢驗的結(jié)果

8、:2=281.6263,P0.005,該地四個年份中小學(xué)女生貧血檢出率總的說來有差別。 2檢驗的結(jié)果:4998與97兩年間學(xué)生貧血檢出率差別的95%可信區(qū)間之計算如下98與97兩年間學(xué)生貧血檢出率差別的95%可信區(qū)間(-0.0122,0.0364). 50 四個年度學(xué)生貧血檢出率的兩兩比較 51構(gòu)成比的比較 構(gòu)成比(proportion) 又稱構(gòu)成指標(biāo),表示某一事物內(nèi)部各組成部分所占的比重或頻率,常以百分?jǐn)?shù)表示,計算公式為: 52構(gòu)成比有兩個特點:各部分構(gòu)成比的合計為1或100%事物內(nèi)部某一部分的構(gòu)成比發(fā)生變化時,其他部分也會相應(yīng)發(fā)生變化53多(R)個率的比較,構(gòu)成 R2表如有R個都分為C類的

9、構(gòu)成比(R2,C3),則其基本數(shù)據(jù)有R行C列,組成RC表,又稱行列表22表、R2表是行列表的特殊情形54目的:對多(R)個構(gòu)成比檢驗的目的是推斷各樣本分別代表的總體構(gòu)成比是否相同,用2檢驗?;舅枷耄菏紫燃僭O(shè)各樣本所代表的總體構(gòu)成比相同,均等于合計的構(gòu)成比,據(jù)此,可算得每個格子的理論頻數(shù)(見表7.6括號內(nèi)數(shù)據(jù))。如果檢驗假設(shè)是真實的,則每一格子的理論頻數(shù)與實際頻數(shù)一般均不會相差很大,即2值一般不會很大;若根據(jù)樣本信息算得一個很大的2值,則有理由懷疑H0的成立,進(jìn)而拒絕它。 55例7.6 某市對城、郊區(qū)小學(xué)三四年級學(xué)生營養(yǎng)狀況進(jìn)行了抽樣調(diào)查,資料如表7.6試考察該地城、郊兒童營養(yǎng)狀況的構(gòu)成比有無

10、差別? 56H0:城郊兒童營養(yǎng)狀況的構(gòu)成比相同; H1:城郊兒童營養(yǎng)狀況的構(gòu)成比不同。 =0.05。 按 =(3-1)(2-1)=2查附表3,2界值表,得P0.05,按=0.05水準(zhǔn)拒絕H0,接受H1,差異有統(tǒng)計學(xué)意義,可認(rèn)為該市城郊兩地兒童營養(yǎng)類型構(gòu)成比不同。 577.5 配對設(shè)計兩樣本率的比較 目的: 通過對單一樣本數(shù)據(jù)的分析,推斷兩種處理的結(jié)果有無差別 。配對設(shè)計: 是醫(yī)學(xué)研究中常用的設(shè)計方法之一,二分類結(jié)果資料的配對研究常用于比較兩種檢驗方法、兩種培養(yǎng)方法、兩種提取方法等的差別。 58配對設(shè)計的特點是對同一樣本的每一份檢品分別用甲、乙兩種方法處理,觀察其陽性與陰性例數(shù)。 59當(dāng)b+c4

11、0時: 直接計算2當(dāng)20b+c40時: 計算2C當(dāng)b+c20時:計算確切概率配對2檢驗的應(yīng)用條件60例7.8 用兩種檢驗方法對某食品作沙門氏菌檢驗,結(jié)果如表7.9,試比較兩種方法的陽性結(jié)果是否有差別。 61H0:兩種檢驗方法的結(jié)果相同,即總體B=C;H1:兩種檢驗方法的結(jié)果不同,即總體BC。=0.05。按 =1查2界值表,P0.005。在 =0.05水準(zhǔn)上拒絕H0 ,接受H1,差異有統(tǒng)計學(xué)意義??烧J(rèn)為兩法檢驗結(jié)果不同,熒光抗體法陽性結(jié)果高于常規(guī)培養(yǎng)法。 627.6 似然比檢驗(likelihood ratio test) 四格表資料和行列表資料除可使用 2 檢驗,還可使用似然比檢驗(likel

12、ihood ratio test)檢驗,計算統(tǒng)計量G。優(yōu)點:可以不考慮樣本含量的大小63年齡(歲)血紅蛋白含量(mg/ml)合計30609011063(2.10)4026138276(4.83)57834318982(4.07)527629159合計1114918585430 某市郊區(qū)430名68歲兒童血紅蛋白(mg/ml)構(gòu)成比較64 3(1/4)個格子T40,且4個理論頻數(shù)T均大于5,方可用2檢驗;當(dāng)n40但有一個理論頻數(shù) lT5時,需用校正2檢驗;若出現(xiàn)T1或n40時,則用確切概率法檢驗為妥 7.9 定性資料假設(shè)檢驗的正確應(yīng)用 67兩樣本率比較時,如為雙側(cè)檢驗,則u檢驗和四格表2檢驗是等價的,校正u檢驗和四格表校正2檢驗也是等價的,應(yīng)用條件亦相同。若為單側(cè)檢驗,則用u檢驗較為方便。 68當(dāng)多個樣本率(或構(gòu)成比)比較的假設(shè)檢驗結(jié)論為拒絕檢驗假設(shè),只能認(rèn)為各總體率(或總體構(gòu)成比)之間總的說來有差別,但不能說明它們彼此間都有差別,或某兩者間有差別。若要進(jìn)一步明確差別之所在,可進(jìn)行多重比較。 69RC表2檢驗的應(yīng)用注意事項 1. 對RC表,若較多格子(1/5)的理論頻數(shù)小于5或有一個格子的理論頻數(shù)小于1,則易犯第一類錯誤。出現(xiàn)某些格子中理論頻數(shù)過小時怎么辦? (1

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論