第三章 分類變量的描述性統(tǒng)計課件_第1頁
第三章 分類變量的描述性統(tǒng)計課件_第2頁
第三章 分類變量的描述性統(tǒng)計課件_第3頁
第三章 分類變量的描述性統(tǒng)計課件_第4頁
第三章 分類變量的描述性統(tǒng)計課件_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

第三章

分類變量的描述性統(tǒng)計醫(yī)學統(tǒng)計學

第一節(jié)常用的比例指標及其意義

第二節(jié)相對危險度與優(yōu)勢比

第三節(jié)率的標準化法

第四節(jié)動態(tài)數(shù)列

第五節(jié)比例指標應用時的注意事項

第六節(jié)SAS程序第三章分類變量的描述性統(tǒng)計Categoricalvariable分類變量Contingencytable列聯(lián)表Rate率,速率Proportion比率Relativefrequency頻率,相對頻率Constituentratio構成比Ratio比,相對比Relativerisk相對危險度Oddsratio優(yōu)勢比Standardizationofrates率的標準化Barchart直條圖Dynamicseries(Timeseries)動態(tài)數(shù)列(時間序列)Vocabulary第三章分類變量的描述性統(tǒng)計分類變量的整理

(列聯(lián)表與直條圖)婚姻狀況頻數(shù)單身3已婚5離婚2分居4合計1414名成人的婚姻狀況(1維列聯(lián)表—婚姻)編號性別身高婚姻狀況1男175單身2女167單身3男187單身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167離婚10女186離婚11男182分居12女159分居13男167分居14女182分居14名成人的原始數(shù)據(jù)One-dimensionContingencytable第三章分類變量的描述性統(tǒng)計14名成人的婚姻狀況的單式直條圖第三章分類變量的描述性統(tǒng)計分類變量的整理(2)婚姻狀況性別男女單身21已婚23離婚11分居22

不同性別的婚姻狀況(2維列聯(lián)表—婚姻,性別)編號性別身高婚姻狀況1男175單身2女167單身3男187單身4女176已婚5男167已婚6女178已婚7男174已婚8女170已婚9男167離婚10女186離婚11男182分居12女159分居13男167分居14女182分居14名成人的原始數(shù)據(jù)Two-dimensionContingencytable第三章分類變量的描述性統(tǒng)計14名成人按性別及婚姻狀況分類的復式直條圖第三章分類變量的描述性統(tǒng)計一、率:

1.速率(rate)

2.比率(proportion)或頻率(relativefrequency)二、比:

1.構成比(constituentratio)

2.相對比(relativeratio)第一節(jié) 常用的比例指標及其意義第三章分類變量的描述性統(tǒng)計一、率某現(xiàn)象實際發(fā)生數(shù)與可能發(fā)生某現(xiàn)象的總數(shù)之比,用以說明某現(xiàn)象發(fā)生的頻率或強度,又稱頻率指標,具有概率意義。常以百分率、千分率、萬分率或十萬分率表示。計算公式為:率=×K

(3-1)式中分子是實際發(fā)生某種事件的例數(shù),分母是發(fā)生與未發(fā)生某事件的總例數(shù),K為比例基數(shù),如100%,1000‰,萬/萬,十萬/十萬,等。一、率(概率型指標)某現(xiàn)象實際發(fā)生數(shù)與可能發(fā)生某現(xiàn)象的總數(shù)之比,用以說明某現(xiàn)象發(fā)生的頻率或強度,又稱頻率指標,具有概率意義。常以百分率、千分率、萬分率或十萬分率表示。計算公式為:式中分子是實際發(fā)生某種事件的例數(shù),分母是發(fā)生與未發(fā)生某事件的總例數(shù),K為比例基數(shù),如100%,1000‰,萬/萬,十萬/十萬,等。(3-1)

速率(rate):反映單位時間內(nèi)某事件出現(xiàn)的機會大小.2.比例(proportion)或頻率(relativefrequency):反映某事件在總體中出現(xiàn)的機會或概率.

第三章分類變量的描述性統(tǒng)計例3-1某醫(yī)生研究了慢性阻塞性肺病(COPD)病人的吸煙情況,自1998~2000年收治COPD病人356人,其中231人有三十年及以上的經(jīng)常吸煙史(日平均1支以上),在本院其它科室收治的同年齡組段的非COPD病人(無其它呼吸系統(tǒng)疾患)479人,其中有三十年及以上的經(jīng)常吸煙史的183人,試計算并比較兩組病人的吸煙率。吸煙率%是速率型指標,還是頻率型指標?某市20萬人口中在2005年新發(fā)生肺結核病人100人.肺結核病年發(fā)病率為250/20萬=1.25‰.是速率型指標,還是頻率型指標?第三章分類變量的描述性統(tǒng)計二、比:為比較指標

1.構成比(constituentratio):事物內(nèi)部某一部分占事物總體中的比重.(3-2)特點:(1)各部分構成比的合計數(shù)等于1或100%.(2)事物內(nèi)部某一部分的構成比發(fā)生變化時,其他部分的構成比也受到影響而發(fā)生變化.第三章分類變量的描述性統(tǒng)計第三章分類變量的描述性統(tǒng)計吸毒者的職業(yè)構成比重(%)吸毒組(1)吸毒組(2)職業(yè)人數(shù)構成比%職業(yè)人數(shù)構成比%學生41.29學生41.18無業(yè)18359.03無業(yè)18353.82個體5417.42個體5415.88工人5317.10工人5315.59司機30.97司機339.70其他134.19其他133.82合計310100.00合計340100.00在構成比中,事物內(nèi)部某一部分的構成比發(fā)生變化時,其他部分的構成比也受到影響而發(fā)生變化.例子:第三章分類變量的描述性統(tǒng)計

2.相對比(relativeratio,ratio):兩個有關指標之比,說明一個指標是另一個指標的幾倍或百分之幾.(3-3)吸毒者的職業(yè)構成比重(%)職業(yè)人數(shù)構成比%學生41.29無業(yè)18359.03個體5417.42工人5317.10司機30.97其他134.19合計310100.00在吸毒人員中,無業(yè)者者是工人的3.45(倍):第三章分類變量的描述性統(tǒng)計一、相對危險度(relativerisk,RR):危險度(risk)是率的另一名稱.設暴露于危險因素X的發(fā)病率即危險度為P(X=1),不暴露于危險因素X的發(fā)病率即危險度為P(X=0).

不同暴露水平下的兩個發(fā)病率之比即相對危險度第二節(jié) 相對危險度與優(yōu)勢比用于流行病學中的隊列研究和橫斷面研究.Hazard:風險度,為瞬時速率,是生存分析中的核心指標.與危險度的概率意義不同.第三章分類變量的描述性統(tǒng)計二、優(yōu)勢比(oddsratio,OR):在流行病學的病例對照研究中,不能得到發(fā)病率指標,只能計算‘優(yōu)勢(odd)’指標.設病例組暴露于危險因素X的概率P(X=1|D=1),不暴露于危險因素X的概率P(X=0|D=1),其優(yōu)勢為對照組暴露于危險因素X概率為P(X=1|D=0).不暴露于危險因素X概率為P(X=0|D=0).其優(yōu)勢為兩個優(yōu)勢之比稱為優(yōu)勢比,即病例組暴露于某危險因素的優(yōu)勢與非病例組暴露于某危險因素的優(yōu)勢之比。第三章分類變量的描述性統(tǒng)計已有用于優(yōu)勢比多因素分析和相對危險度多因素分析的統(tǒng)計學模型.表3-2COPD病人與非病人關于吸煙狀況的病例-對照研究資料設計分組有吸煙史

X=1無吸煙史

X=0總例數(shù)優(yōu)勢(odd)病人組(D=1)

231

125

356Odd1=231/125=1.848對照組(D=0)

183

296

479Odd0=183/296=0.618COPD病人暴露于吸煙的優(yōu)勢為非COPD者的2.99倍.在發(fā)病率很低的條件下,OR≈RR.第三章分類變量的描述性統(tǒng)計第三節(jié) 率的標準化法

兩個例子第三章分類變量的描述性統(tǒng)計例1.甲乙兩校35歲及以上知識分子的高血壓患病率年齡(歲)甲校乙校檢查人數(shù)病人數(shù)患病率(%)檢查人數(shù)病人數(shù)患病率(%)35~236166.78478336.9045~375277.20379287.3955~384389.902352410.2165~804025914.681572415.29合計139714010.0212491098.73從表中資料可見,甲校各年齡組的高血壓患病率均略低于乙校,但總的患病率則是甲校明顯高于乙校。比較兩校各年齡組的被檢查人數(shù)發(fā)現(xiàn),甲校高年齡組人數(shù)多于乙校,乙校低年齡組人數(shù)多于甲校。根據(jù)醫(yī)學知識,高血壓的發(fā)病與年齡有關。由此可見,導致甲校高血壓患病率高于乙校的原因之一,是甲校受檢者中高年齡組占的比例大于乙校。第三章分類變量的描述性統(tǒng)計例2.某部市甲.乙兩院各科出院和治療人數(shù)科室甲校乙校出院人數(shù)治愈人數(shù)治愈率(%)出院人數(shù)治愈人數(shù)治愈率(%)內(nèi)科687166.78478336.90婦科456277.20379287.39小兒科239389.902352410.21外科2055914.681572415.29合計158714010.0212491098.73從各科治愈率分析,甲院低于乙院,但總治愈率是甲院明顯高于乙院。比較兩院各科出院人數(shù)發(fā)現(xiàn),甲院內(nèi)科病人所占比例多于乙院,其他科的出院病人數(shù)乙院多于甲院。第三章分類變量的描述性統(tǒng)計標準化法是采用統(tǒng)一的標準對內(nèi)部構成不同的各組頻率進行調(diào)整的方法。用于對兩組平均率進行比較.當對兩組(或兩組以上)的平均頻率指標進行對比時,應注意各組對象的內(nèi)部構成是否存在差別以致影響對比結果的正確性。若存在內(nèi)部構成上的差別,并且差別足以影響結果的正確性,則在比較各組平均率前,需用標準化法對其進行調(diào)整。采用統(tǒng)一的標準進行調(diào)整以后所得到的率,稱為標準化率,簡稱為標化率(standardizedrate),亦稱調(diào)整率(adjustedrate)。

第三章分類變量的描述性統(tǒng)計一、方法的選擇計算標準化率的常用方法有直接法和間接法。1.直接法.當已知被觀察人群中各年齡組的患病率(或發(fā)病率、死亡率等)資料。如例1及例2的資料是已知各年齡組的患病率或治愈率,因此可選用直接法。直接法是選擇一個另外的人口作為共同的標準人口重新計算平均患病率,稱標準化率.用標準化率再作比較.2.間接法.若缺乏各年齡組的患病率資料,僅有各年齡組的觀察例數(shù)和總(平均)患病率資料,則選擇間接法.間接法是選擇一個另外的患病率作為共同的標準,重新計算平均患病率,稱標準化率.用標準化率再作比較.第三章分類變量的描述性統(tǒng)計

二、標準的選取1.選一個具有代表性的、內(nèi)部構成相對穩(wěn)定的較大人群(或較大人群的患病率)作為標準2.將要比較的兩組資料內(nèi)部各相應小組的觀察單位數(shù)相加作為標準3.從要比較的兩組中任選一組作為標準。第三章分類變量的描述性統(tǒng)計(一)直接法計算標準化率的計算公式1.已知標準組分科出院人數(shù)Ni時,標化率p’的計算為:⒉已知標準組分科出院人數(shù)構成比時,標化率p’的計算式中Ni

為標準分科病人數(shù),pi:

原分科治愈率

N:標準出院總人數(shù),

NiPi

為分科的預期治愈人數(shù).(NiPi)為各科的預期治愈人數(shù)之和.:為標準分科的出院人數(shù)構成比.第三章分類變量的描述性統(tǒng)計科室標準組甲院乙院出院人數(shù)Ni出院人數(shù)原治愈率(%)Pi預期治愈數(shù)Ni×Pi出院人數(shù)原治愈率(%)Pi預期治愈數(shù)Ni

×Pi(1)(2)(3)(4)(5)(6)(7)(8)內(nèi)科90568730.71277.9621831.65286.44婦科94245687.28822.1848684.77798.57小兒科49123991.63449.9125290.48444.24外科90320596.58872.1769895.96862.90合計3241158764.652422.22165483.192392.15表3-5直接法計算過程(以兩組各科出院人數(shù)之和為標準)從標準化率比較可見,兩醫(yī)院的治愈率很接近,甲院稍高于乙院甲院標準化治愈率p’=(2422.22/3241)×100%=74.74%乙院標準化治愈率p’=(2392.15/3241)×100%=73.81%第三章分類變量的描述性統(tǒng)計表3-6直接法計算過程(以兩組各科合并出院人數(shù)比為標準)科室標準組甲院乙院出院人數(shù)構成比Ni/N原治愈率(%)Pi按標準分配的預期治愈率:(Ni/N)Pi原治愈率(%)Pi按標準分配的預期治愈率:(Ni/N)Pi(1)(2)(3)(4)(5)(6)內(nèi)科0.279230.718.574231.658.8367婦科0.290787.2825.372384.7724.6426小兒科0.151591.6313.881990.4813.7077外科0.278696.5826.907295.9626.6230合計1.000064.6574.731183.1973.8100與用標準出院人數(shù)計算的結果相同.甲院標準化治愈率p’=(2422.22/3241)×100%=74.74%乙院標準化治愈率p’=(2392.15/3241)×100%=73.81%第三章分類變量的描述性統(tǒng)計(二)間接法計算標準化率的計算公式

P為標準平均治愈率,

pi:

為標準分科治愈率

r為實際治愈總人數(shù),

ni:實際分科出院人數(shù),

nipi

為分科的預期治愈人數(shù).(nipi)為各科的預期治愈人數(shù)之和.若缺乏各年齡組的患病率資料,僅有各年齡組的觀察例數(shù)和總(平均)患病率資料,則選擇間接法.間接法是選擇一個另外的患病率作為共同的標準,重新計算平均患病率,稱標準化率.用標準化率再作比較.第三章分類變量的描述性統(tǒng)計科室標準組各科治愈率pi甲院乙院出院人數(shù)預期治愈數(shù)ni

×pi出院人數(shù)預期治愈數(shù)ni

×pi(1)(2)(3)(4)=(2)×(3)(6)(6)=(2)×(5)內(nèi)科0.2926687201.0221863.79婦科0.9107456415.28486442.60小兒科0.9615239229.80252242.30外科0.9786205200.61698683.06合計0.705815871046.7116541431.75表3-7間接法計算標準化治愈率甲院標準化治愈率:乙院標準化治愈率:第三章分類變量的描述性統(tǒng)計關于標化率的注意事項標化率的大小受選擇的方法、標準的影響,同一資料用不同的方法和標準計算的標化率雖然不同,但比較的結論一致。標化率反映相對水平,僅用于比較。原率反映實際水平。報告統(tǒng)計結果時最好報告原率、標化所用的標準和標化率。第三章分類變量的描述性統(tǒng)計第四節(jié)動態(tài)數(shù)列動態(tài)數(shù)列(dynamicseries):一系列按時間順序排列起來的統(tǒng)計指標,用以觀察和比較該事物在時間上的變化和發(fā)展趨勢。常用指標:絕對增長量,發(fā)展速度,增長速度;平均發(fā)展速度與平均增長速度。第三章分類變量的描述性統(tǒng)計表3-8某縣醫(yī)院1990-1994年門診次均費用變化情況的動態(tài)數(shù)列分析年份i符號門診次均費用(元)發(fā)展速度增長量增長速度定基環(huán)比逐期累積定基環(huán)比(1)(2)(3)(4)(5)(6)(7)(8)1990α07.161.001.00------------1991α19.251.291.292.092.090.290.291992α210.571.481.141.323.410.480.141993α312.931.811.222.365.770.810.221994α414.281.991.101.357.120.9

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論