8_第八講_計(jì)數(shù)資料推斷2011.ppt_第1頁
8_第八講_計(jì)數(shù)資料推斷2011.ppt_第2頁
8_第八講_計(jì)數(shù)資料推斷2011.ppt_第3頁
8_第八講_計(jì)數(shù)資料推斷2011.ppt_第4頁
8_第八講_計(jì)數(shù)資料推斷2011.ppt_第5頁
已閱讀5頁,還剩67頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、計(jì)數(shù)資料的統(tǒng)計(jì)推斷,第八講,計(jì)數(shù)資料統(tǒng)計(jì)推斷內(nèi)容,率差或率比的區(qū)間估計(jì):u分布,二項(xiàng)分布 假設(shè)檢驗(yàn):u檢驗(yàn),2檢驗(yàn),一、計(jì)數(shù)資料假設(shè)檢驗(yàn)- 二項(xiàng)分布直接法及u檢驗(yàn)-,(一)單個(gè)樣本率與已知總體率比較 樣本率與總體率的假設(shè)檢驗(yàn)的目的是推斷樣本率所代表的未知總體率與已知總體率0(一般指理論值、標(biāo)準(zhǔn)值或經(jīng)大量觀察得到的穩(wěn)定值)是否相等,其u檢驗(yàn): p為樣本率,0為已知總體率,例1、由臨床經(jīng)驗(yàn)得知,一般潰瘍病患者的胃出血率為20%,現(xiàn)某醫(yī)師觀察65歲以上潰瘍病人250例,其中80例發(fā)生胃出血癥狀(32%),問老年人胃出血率與一般患者是否不同?,u檢驗(yàn)應(yīng)用條件:當(dāng)n較大,np和n(1-p)均大于5時(shí),中

2、心極限定理-樣本率p抽樣分布近似正態(tài)分布。,H0:=0 ,即老年人胃出血率與一般患者相同;H1:0 ,即老年人胃出血率與一般患者不同=0.05,第一步,本例 0=20%,n=250,x=80將數(shù)據(jù)代入上式:,第二步,P 0.001,按=0.05,拒絕H0,接受H1,可認(rèn)為老年患者胃出血率與一般患者不同,老年潰瘍病患者更容易出現(xiàn)胃出血。 老年潰瘍病患者出血率的95%可信區(qū)間:0.262 0.378 一般出血率:0.20,第三步,(二)兩樣本率比較u檢驗(yàn) 目的:是推斷兩樣本所來自兩總體率是否相等 u檢驗(yàn)應(yīng)用條件:當(dāng)n較大,np和n(1-p)均大于5時(shí),可利用樣本率p的抽樣分布近似正態(tài)分布.,其u檢

3、驗(yàn)公式為:,例2:為比較工人和農(nóng)民的高血壓患病率,分別調(diào)查了5059歲男性工人和5059歲男性農(nóng)民1281人和387人,其高血壓患者分別為386人(患病率30.1%)和65人(患病率16.8%)。問工人與農(nóng)民的高血壓患病率有無不同?,H0:1=2, 兩者高血壓患病率相同 H1:12 ,兩者高血壓患病率不同 =0.05,第一步,例 x1=386,n1=1281 ,p1=30.1%;x2=65,n2=387 ,p2=16.8%,第二步,P0.001,按=0.05,拒絕H0,接受H1,可認(rèn)為5059歲男性工人和 5059歲男性農(nóng)民高血壓患病率不同,工人患病率高于農(nóng)民. 率差95%可信區(qū)間:0.088

4、 - 0.178,平均率差為0.133.(0)對(duì)于小樣本的率,如何進(jìn)行假設(shè)檢驗(yàn)? 對(duì)于三組以上率或構(gòu)成比,如何進(jìn)行假設(shè)檢驗(yàn)?,第三步,二、計(jì)數(shù)資料的假設(shè)檢驗(yàn)- 卡方檢驗(yàn)-Pearson Chi-square test,KarlPearson,18571936,生卒于倫敦,公認(rèn)為統(tǒng)計(jì)學(xué)之父。 1879年畢業(yè)于劍橋大學(xué)數(shù)學(xué)系;曾參與激進(jìn)的政治活動(dòng),還出版幾本文學(xué)作品,并且作了三年的實(shí)習(xí)律師。1884年進(jìn)入倫敦大學(xué)學(xué)院 ,教授數(shù)學(xué)與力學(xué),從此在該校工作一直到1933年。 K Pearson 最重要的學(xué)術(shù)成就,是為現(xiàn)代統(tǒng)計(jì)學(xué)打下了堅(jiān)實(shí)基礎(chǔ)。KPearson 在1893-1912年間寫出18篇在進(jìn)化論上

5、的數(shù)學(xué)貢獻(xiàn)的文章,而這門“算術(shù)”,也就是今日的統(tǒng)計(jì)。許多統(tǒng)計(jì)名詞如標(biāo)準(zhǔn)差,成分分析,卡方檢驗(yàn)(1900)都是他提出。,2檢驗(yàn)的主要應(yīng)用,推斷兩個(gè)/兩個(gè)以上總體率或構(gòu)成比有無差別; 兩分類變量間有無相關(guān)的假設(shè)檢驗(yàn)(獨(dú)立性); 擬合優(yōu)度檢驗(yàn)(理論分布與實(shí)際分布的吻合情況檢驗(yàn))。,(一) 2 檢驗(yàn)主要類型,四格表資料的2檢驗(yàn) 22列聯(lián)表的2檢驗(yàn) RC表資料的2檢驗(yàn),卡方檢驗(yàn)基本思想:以四格表資料為例,例4、在二乙基亞硝胺誘發(fā)大白鼠鼻咽癌的實(shí)驗(yàn)中,一組單純用亞硝胺向鼻腔灌注,另一組在鼻注的基礎(chǔ)上加肌注維生素B12,問兩組發(fā)癌率有無差別?,表1 兩組大白鼠發(fā)癌率的比較,2 檢驗(yàn)的基本思想,1、建立假設(shè),

6、H0:兩組發(fā)癌率相等, H1:兩組發(fā)癌率不等, =0.05,*兩組的總體發(fā)癌率相等,均等于合并發(fā)癌率 =91/113=80.5%,為反映所有格子的吻合情況,所有差值求和,(A-T)=0 (正負(fù)抵消),差值和可定義為(A -T)2 ; 相對(duì)比例保持不變,T值越大, (A-T)2值越大,為消除其影響,差值定義為: (A-T)2/T,2、計(jì)算統(tǒng)計(jì)量2 在樣本量足夠大時(shí),該值服從于自由度為=(行數(shù)-1)(列數(shù)-1) 的2 分布。 即2檢驗(yàn)公式: 2 = (A-T)2/T 2分布是一簇連續(xù)性分布,與自由度有關(guān);在自由度固定時(shí), 2值越大,P值越小,反之亦然. 在無效假設(shè)成立時(shí): 2值一般不會(huì)很大,出現(xiàn)大

7、的2值的概率P是很小的,若P( 檢驗(yàn)水準(zhǔn)),則沒有理由拒絕它。,Pearson Chi-square distributions 均值等于自由度,3、 P值與2分布,2值反映了實(shí)際頻數(shù)與理論頻數(shù)的差值大小 2值大小與p值呈反比關(guān)系,即2 值越大,P值越?。环粗嗳?。 2值達(dá)到界值點(diǎn),就有理由認(rèn)為成立的可能性不大,是小概率事件,因而拒絕H0 。對(duì)于四格表資料:0.052=3.84,四格表資料2 檢驗(yàn)計(jì)算結(jié)果,本例2 值=6.48,自由度為1,查2 界值表,得p0.05, 按照=0.05的水準(zhǔn),拒絕H0,而接受H1,可認(rèn)為兩組總體發(fā)癌率不同,四格表資料的應(yīng)用條件,當(dāng)T5,而n40時(shí), 選用一般計(jì)算

8、公式 當(dāng)140時(shí), 需計(jì)算校正公式 當(dāng)T1或n40時(shí),選用Fisher確切概率法1934,連續(xù)性校正僅用于四格表資料,當(dāng)超過四個(gè)格子時(shí),一般不作Yate校正.,3、率差的區(qū)間估計(jì),u檢驗(yàn)也能回答兩個(gè)率是否有差別(或差別有無統(tǒng)計(jì)學(xué)意義)?,兩率比較的可信區(qū)間估計(jì)(miettinen,woolf) 可信區(qū)間為 ,兩組率差值(0.196)的95%可信區(qū)間為0.07-0.33。 應(yīng)用條件:兩組np和n(1-p)5,4、率比(RR和OR)區(qū)間估計(jì),本資料為臨床試驗(yàn)研究,可以同時(shí)計(jì)算RR與OR值,用以分析Vitb12對(duì)發(fā)癌危險(xiǎn)度的大小,OR1表示Vitb12為危險(xiǎn)因素。 以O(shè)R值為例,OR服從對(duì)數(shù)正態(tài)分布

9、,則有:,實(shí)例分析,(二)、2X2列聯(lián)表(配對(duì)設(shè)計(jì)),1、資料特點(diǎn)與分析目的,資料的特點(diǎn):配對(duì)計(jì)數(shù)資料 分析目的: A:兩法檢驗(yàn)結(jié)果有無關(guān)系(四格表2檢驗(yàn)) B:兩法檢驗(yàn)有無差別(專用公式)。,2、假設(shè)檢驗(yàn)(1):相關(guān)分析,檢驗(yàn)?zāi)康模簝煞z驗(yàn)結(jié)果有無關(guān)系。 H0:兩法檢驗(yàn)結(jié)果無關(guān)系 H1:兩法檢驗(yàn)結(jié)果有關(guān)系 =0.05 2值=38.85,=1 確定P值: 查卡方界值表,得P0.005, 按照=0.05的水準(zhǔn),拒絕H0,而接受H1,可認(rèn)為兩法檢驗(yàn)結(jié)果有關(guān)。 計(jì)算Pearson列聯(lián)系數(shù)反映相關(guān)程度sqrt(2/2+n)。(本例為r=0.294),3、假設(shè)檢驗(yàn)(2):差別分析,檢驗(yàn)?zāi)康模簝煞z驗(yàn)結(jié)果

10、有無差別 H0:兩總體b=c H1:兩總體bc =0.05 確定P值: 查卡方界值表,得P0.005, 按照=0.05的水準(zhǔn),拒絕H0,而接受H1,可認(rèn)為兩法檢驗(yàn)結(jié)果不同.甲法的陽性檢出率高。,4、2X2列聯(lián)表差別檢驗(yàn)的應(yīng)用條件,當(dāng)b+c40時(shí),公式可簡(jiǎn)化(McNemar):,5、率差的95%可信區(qū)間,可定義p1-p2=(b-c)/n 則率差的95%可信區(qū)間為: 上例兩法總體率差值的95%可信區(qū)間為(0.200.30)。,2X2列聯(lián)表資料的分析特點(diǎn),對(duì)此類資料可以做兩方面的分析: 相關(guān)分析:采用一般的四格表公式 差別分析:采用專用公式(b、c不宜過小) 對(duì)上例結(jié)果:兩類檢驗(yàn)方法結(jié)果是有關(guān)的,且

11、有差別,甲法好于乙法。,(三)、多個(gè)樣本率比較,適用資料特征:行X列表(RXC)-多個(gè)率比較的 2 檢驗(yàn)。 應(yīng)用條件:不能有1/5格子的理論頻數(shù)小于5,或最小理論頻數(shù)小于2。,實(shí)例演示,例5某醫(yī)師研究物理療法、藥物療法和外用膏藥三種療法治療周圍性神經(jīng)麻痹的療效,問三種療法的有效率有無差別? 分析三種療法的有效率?,表3 三種療法的有效率比較,1、建立假設(shè),H0:三種療法有效率相等, H1:三種療法的有效率不等或不全等 =0.05,2、確定P值與結(jié)論,=17.91, =(3-1)(2-1)=2 查卡方界值表,得P0.005, 按照=0.05的水準(zhǔn),拒絕H0,而接受H1,可認(rèn)為三種療法的有效率不等

12、。 上述結(jié)論只能說明三種療法有效率不同,不能說明哪兩個(gè)不同。需做兩兩比較: 2 分割法,檢驗(yàn)水準(zhǔn)校正a/(k(k-1)/2);a/(k-1),3、兩兩比較-2 分割法,先把率差異最小的兩組乙丙,分割出來,作2檢驗(yàn), 2 值=0.09,=1,得P值0.0125。 后把乙丙兩組合并,再與甲組比較,作2檢驗(yàn), 2=17.83,=1,得P值0.0125,說明二、三組與第一組有差別。,實(shí)例演示,注意事項(xiàng),行X列表2檢驗(yàn)應(yīng)用條件:要求理論頻數(shù)不宜太小,對(duì)于行X列表不宜1/5以上格式的理論頻數(shù)小于5,或有一個(gè)理論頻數(shù)小于2。 若不滿足,可采用方法: 增加樣本例數(shù)以增加理論頻數(shù); 刪除上述理論頻數(shù)太少行或列;

13、 將理論頻數(shù)太小性質(zhì)行或列相近實(shí)際頻數(shù)合并。 Fisher確切概率法,(四)特殊行X列表資料的分析,列聯(lián)表:有序行X列表資料, 行變量、列變量的屬性分為: 雙向均無序 單向有序 雙向均有序?qū)傩韵嗤?雙向均有序?qū)傩圆煌?1、雙向有序資料-列聯(lián)表,特點(diǎn):雙向有序、行變量和列變量屬性不同的資料。 分析目的:獨(dú)立性/相關(guān)性分析。,實(shí)例分析,建立假設(shè): H0:矽肺期次與肺門密度級(jí)別之間無關(guān) H1:矽肺期次與肺門密度級(jí)別之間有關(guān) =0.05 確定P值與下結(jié)論: rs=0.532, 查卡方界值表,得P0.005, 按照=0.05的水準(zhǔn),拒絕H0,而接受H1,可認(rèn)為矽肺期次與肺門密度級(jí)別之間有關(guān)。,2、列聯(lián)表

14、資料的主要分類及統(tǒng)計(jì)分析。 A、對(duì)于雙向無序資料: 若比較多個(gè)樣本率(或構(gòu)成比),可用行列表資料卡方檢驗(yàn); 若分析兩個(gè)分類變量之間有無關(guān)聯(lián)性以及關(guān)系的密切程度時(shí),可用行列表卡方檢驗(yàn)以及Pearson列聯(lián)系數(shù)進(jìn)行分析sqrt(2/2+n)。,B、單向有序資料 分組變量(如年齡)有序,而結(jié)果變量(如傳染病的類型)無序,分析不同組結(jié)果構(gòu)成情況,可用行列表卡方檢驗(yàn)進(jìn)行差別分析。 分組變量(如療法)無序,而結(jié)果變量(如療效按等級(jí)分組)有序,比較不同組別療效,應(yīng)用秩和檢驗(yàn),C、雙向有序、屬性相同資料 兩個(gè)分類變量皆為有序且屬性相同。如兩實(shí)驗(yàn)室、兩人用同一檢測(cè)方法檢測(cè)同一批樣品的測(cè)定結(jié)果。其研究目的通常是分

15、析兩實(shí)驗(yàn)室、兩人測(cè)量結(jié)果的一致性,此時(shí)宜用一致性檢驗(yàn)或稱Kappa檢驗(yàn)。 0.93-1.00 0.81-0.92 0.61-0.80 0.41-0.60 0.21-0.40 0.0-0.20,D、雙向有序、屬性不同資料 若分析不同年齡組患者療效之間有無差別時(shí),可把它視為單向有序表資料,選用秩轉(zhuǎn)換非參數(shù)檢驗(yàn); 若分析兩個(gè)有序分類變量間是否存在相關(guān)關(guān)系,宜用Spearman相關(guān)或Pearson相關(guān)分析; 若分析兩個(gè)有序分類變量間是否存在線性變化趨勢(shì),宜用線性趨勢(shì)檢驗(yàn)。,(五)、其它類型的2 檢驗(yàn)-擬合優(yōu)度檢驗(yàn),1、結(jié)果,2 = (A-T)2/T=37.78, df=3,P0.05。 因此拒絕0,接

16、受 H1 ,說明心肌梗死的發(fā)生有季節(jié)性的差別。,季節(jié),春,夏,秋,冬,發(fā)病例數(shù),60 30 20 70,理論例數(shù),45,45,45,45,差值,15,-,15,-,25 25,三、誤用卡方檢驗(yàn)的實(shí)例分析,實(shí)例10,實(shí)例11,Fisher:0.011,實(shí)例12,例13、某檢驗(yàn)法在病毒感染診斷上的應(yīng)用,表13摘自該文附表,趨勢(shì)卡方值=8.29,例14 將116例癲癇患者隨機(jī)分為兩組,一組70例接受常規(guī)加高壓氧治療(高壓氧組),另一組46例接受常規(guī)治療(常規(guī)組),治療結(jié)果見表。問兩種療法有效率有無差別?,兩種療法治療癲癇的效果,本例 ,故用四格表資料 檢驗(yàn)的校正公式,本資料若不校正時(shí):,檢驗(yàn)效能及計(jì)算,檢驗(yàn)效能:1- Pe,ne分別為干預(yù)組的率與例數(shù);Pc,nc分別為對(duì)照組的率與例數(shù)。 本例檢驗(yàn)效能:0.41,例題一,某醫(yī)生用兩種方法治療肺

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論