第四講分類變量的統(tǒng)計描述率的標準誤演示文稿_第1頁
第四講分類變量的統(tǒng)計描述率的標準誤演示文稿_第2頁
第四講分類變量的統(tǒng)計描述率的標準誤演示文稿_第3頁
第四講分類變量的統(tǒng)計描述率的標準誤演示文稿_第4頁
第四講分類變量的統(tǒng)計描述率的標準誤演示文稿_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第四講分類變量的統(tǒng)計描述率的標準誤演示文稿當前第1頁\共有58頁\編于星期五\11點(優(yōu)選)第四講分類變量的統(tǒng)計描述率的標準誤當前第2頁\共有58頁\編于星期五\11點6/17/20233基本內容

統(tǒng)計描述統(tǒng)計推斷(1)統(tǒng)計推斷(2)數值變量頻數分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差標準誤均數可信區(qū)間tZF檢驗秩和檢驗直線相關與回歸偏相關多元線性回歸因子分析分類變量相對數(率、比)率的可信區(qū)間2檢驗Logistic回歸當前第3頁\共有58頁\編于星期五\11點主要內容一、分類變量概述二、分類變量的統(tǒng)計描述相對數應用相對數的注意事項動態(tài)數列率的標準化三、分類變量的統(tǒng)計推斷率的標準誤和可信區(qū)間2檢驗當前第4頁\共有58頁\編于星期五\11點分類變量定義通過確定每個觀察單位的某項特征的性質或類別得到的數據。請大家舉出研究中熟悉的分類變量的例子:特點變量值是定性的沒有度量衡單位第一節(jié)、分類變量概述當前第5頁\共有58頁\編于星期五\11點類型無序分類變量:二項分類變量、多項分類變量有序分類變量統(tǒng)計分析中的處理賦值數據轉換SPSS程序:TransformRecodeIntodifferentvariables1=“男性”,2=“女性”出生體重(數值變量)低出生體重、正常出生體重、巨大兒當前第6頁\共有58頁\編于星期五\11點練習SPSS中變量轉換操作:(出生體重-率.sav數據庫)將出生體重從數值變量變成分類變量(低出生體重、正常出生體重、巨大兒)當前第7頁\共有58頁\編于星期五\11點6/17/20238第二節(jié)分類變量的統(tǒng)計描述一、常用相對數二、應用相對數的注意事項三、動態(tài)數列四、率的標準化

當前第8頁\共有58頁\編于星期五\11點6/17/20239為什么引入相對數?2008年甲縣心腦血管疾病死亡人數253人,乙縣為132人,能否說甲縣心腦血管疾病的威脅比乙縣嚴重?當前第9頁\共有58頁\編于星期五\11點6/17/2023102.在某遺傳病的研究中,研究人員發(fā)現(xiàn)該病患者中,有90%是第一個孩子,由此可見該病的遺傳與出生順序有關---更容易遺傳給第一個孩子。這個結論是否正確,為什么?當前第10頁\共有58頁\編于星期五\11點6/17/202311

絕對數:實際觀察得到的數據,反映真實情況。

相對數:兩個有聯(lián)系的指標(數值)之比,用于比較。當前第11頁\共有58頁\編于星期五\11點6/17/202312相對數的種類:

1.率

2.構成比

3.相對比重要區(qū)別:分子、分母

一、常用相對數當前第12頁\共有58頁\編于星期五\11點6/17/2023131.率概念:是指某種現(xiàn)象在一定條件下,實際發(fā)生的觀察單位數與可能發(fā)生該現(xiàn)象的總觀察單位數之比,用以說明某種現(xiàn)象發(fā)生的頻率大小或強度。計算公式:如何選K?①使算得的率至少保留1~2位整數②習慣:IMR——‰,MMR——/10萬注意:不受其它指標的影響;各率相互獨立,求和不一定為1(如是則屬巧合)。當前第13頁\共有58頁\編于星期五\11點6/17/202314常用的頻率/類頻率指標:當前第14頁\共有58頁\編于星期五\11點6/17/202315當前第15頁\共有58頁\編于星期五\11點6/17/202316當前第16頁\共有58頁\編于星期五\11點6/17/202317病名平均人口數死亡人數死亡率(1/10萬)高血壓1726654023.2冠心病172665116.4腦卒中172665253146.5風心病1726653822.0例:某地2007年四種常見心血管病死亡率當前第17頁\共有58頁\編于星期五\11點6/17/2023182.構成比概念:也叫構成指標,是指一事物內部某一組成部分的觀察單位數與該事物各組成部分的觀察單位總數之比,用以說明某一事物內部各組成部分所占的比重或分布。計算公式:注意:各組成部分的構成比之和為100%;

某一部分比重增大,則其它部分相應減少。制圖:一般用圓圖(餅圖)或百分條圖當前第18頁\共有58頁\編于星期五\11點6/17/202319人數%甲區(qū)20050.0乙區(qū)12030.0丙區(qū)8020.0合計400100.0人數%甲區(qū)30060.0乙區(qū)12024.0丙區(qū)8016.0合計500100.0例:某市某病患者的地區(qū)構成當前第19頁\共有58頁\編于星期五\11點6/17/2023202002年全國各地城市農村計劃生育手術構成(%)

城市農村27%46%12%13%2%當前第20頁\共有58頁\編于星期五\11點6/17/202321當前第21頁\共有58頁\編于星期五\11點練習:放環(huán)情況放環(huán)人數失敗人數失敗人數構成比(?)失敗率(?)人工流產后25476月經后8840哺乳期1710合計359126率及構成比的差別?已婚婦女不同情況下放環(huán)失敗比較當前第22頁\共有58頁\編于星期五\11點6/17/2023233.相對比概念:是指兩個有關聯(lián)的指標之比,是對比的最簡單形式。計算公式:A/B(或100%)

表示A是B的若干倍或百分之幾。例如:BMI、性別比、CV等。注意:1.A、B可以是性質相同的,也可以是性質不同的

2.A、B可以是絕對數,也可以是相對數或平均數當前第23頁\共有58頁\編于星期五\11點Country(2010)SexRatioAfrica:Uganda96.5Zimbabwe95.4NorthA.USA95.1SouthA.:Argentina95.6Asia:China106.5India107.9Bangladesh106.1SouthKorea100.7Europe:France94.8U.K.93.9Sweden97.6部分國家人口性別比當前第24頁\共有58頁\編于星期五\11點年代調查活產數出生性別比資料來源70(1972-1979年)33915105.22‰生育率調查(國家計生委)80(1980-1987年)32114109.92‰生育率調查(國家計生委)80(1980-1989年)26268110.92001年全國計劃生育/生殖健康調查(國家計生委)90(1990-2001年)23103124.12001年全國計劃生育/生殖健康調查(國家計生委)2000(1999.11-2000.10出生)11752119.4第五次全國人口普查0.95‰抽樣中國歷年報告的出生性別比1996-20051272006年全國生殖健康調查當前第25頁\共有58頁\編于星期五\11點6/17/202326例1.在某遺傳病的研究中,研究人員發(fā)現(xiàn)該病患者中,有90%是第一個孩子,由此可見該病的遺傳與出生順序有關---更容易遺傳給第一個孩子。這個結論是否正確,為什么?

以(構成)比代替率的錯誤實例分析當前第26頁\共有58頁\編于星期五\11點6/17/202327例2.某項目縣為提高醫(yī)療衛(wèi)生的服務水平,對衛(wèi)生人員進行培訓,但是,經過3年培訓,與培訓前相比,該縣孕產婦的死亡率卻上升,如何解釋?培訓前(2001年):2000名孕產婦死亡2人,100/10萬培訓后(2004年):2010名孕產婦死亡3人,149/10萬計算率時分母不能太小當前第27頁\共有58頁\編于星期五\11點6/17/202328例3.在對肺癌病人的死亡情況進行分析時發(fā)現(xiàn):北醫(yī)三院肺癌病人的死亡率為65%,密云縣醫(yī)院為25%,請問哪家醫(yī)院的治療水平高?兩個資料要有可比性當前第28頁\共有58頁\編于星期五\11點6/17/202329區(qū)名平均人口數新發(fā)病例數發(fā)病率(%)甲區(qū)1000002000020乙區(qū)800001200015丙區(qū)40000650016.25合計22000038500?例4.某市2007年各區(qū)流感的發(fā)病率

請問:全市流感的發(fā)病率?總率的計算不能是各分率的直接相加當前第29頁\共有58頁\編于星期五\11點6/17/202330二、應用相對數時的注意事項分析時不能以(構成)比代(替)率計算相對數時分母不能太小資料的可比性:兩個率要在相同的條件下進行(標準化問題)總率(平均率)的計算:不能直接相加求和樣本相對數的比較應做假設檢驗:樣本相對數存在抽樣誤差,應進行差別的顯著性檢驗.當前第30頁\共有58頁\編于星期五\11點按照一定的時間順序,將一系列描述某事物的統(tǒng)計指標依次排列起來,以便觀察和比較該事物在時間上的變化和發(fā)展趨勢。這些統(tǒng)計指標可以是絕對數、相對數或平均數等。動態(tài)數列分析是建立在相對比基礎上的,采用定基比和環(huán)比兩種方式。常用的分析指標有:絕對增長量、發(fā)展速度與增長速度、平均發(fā)展速度和平均增長速度。三、動態(tài)數列當前第31頁\共有58頁\編于星期五\11點某大學1992~2002年本科專業(yè)招生動態(tài)變化年份符號學生人數絕對增長量發(fā)展速度(%)增長速度(%)累計逐年定基比環(huán)比定基比環(huán)比(1)(2)(3)(4)(5)(6)(7)(8)(9)1992a04200----100.0100.0----1993a14500

300300107.1107.1

7.17.11994a24800

600300114.3106.714.36.71995a34900

700100116.7102.116.72.11996a45150

950250122.6105.122.65.11997a553201120170126.7103.326.73.31998a655101310190131.2103.631.23.61999a757801580270137.6104.937.64.92000a859501750170141.7102.941.72.92001a960001800

50142.9100.842.90.82002a1062002000200147.6103.347.63.3當前第32頁\共有58頁\編于星期五\11點絕對增長量說明事物在一定時期增長的絕對值。累計增長量:報告年的指標與某一固定年(基期水平)指標之差。逐年增長量:報告年的指標與前一年指標之差。當前第33頁\共有58頁\編于星期五\11點發(fā)展速度與增長速度定基發(fā)展速度:報告期指標的水平相當于基期水平的百分比或倍數。定基增長速度:相對于基期水平,報告期指標凈增加的百分比或倍數。當前第34頁\共有58頁\編于星期五\11點35環(huán)比發(fā)展速度:報告期指標的水平相當于上一期水平的百分比或倍數。環(huán)比增長速度:報告期指標比上一期水平凈增加的百分比或倍數。描述時一定要說清楚比較的基數,以區(qū)分定基還是環(huán)比速度。當前第35頁\共有58頁\編于星期五\11點平均發(fā)展速度和平均增長速度平均發(fā)展速度:某事物在一個較長時期內逐年平均發(fā)展變化的速度。是環(huán)比速度的幾何平均數。平均增長速度:某事物在一個較長時期內逐年平均增長的速度。平均增長速度=平均發(fā)展速度-1當前第36頁\共有58頁\編于星期五\11點率及構成比計算的SPSS程序:相對比計算的SPSS程序:AnalyzeDescriptiveStatisticsFrequencies選分析變量入Variable(s)框OKTransformComputeTargetVariable(新變量名)

NumericExpression(計算方式)

OK當前第37頁\共有58頁\編于星期五\11點SPSS練習

(出生體重-率的計算數據庫)某年兒童體檢指標中,男孩占體檢兒童的比例?體檢兒童的母親職業(yè)分布情況?體檢兒童中,低出生體重的發(fā)生率是多少?(出生體重低于2500克為低出生體重)體檢兒童中,出生BMI是多少?當前第38頁\共有58頁\編于星期五\11點6/17/202339四、率的標準化(standardization)條件:內部構成影響總率;要比較的兩組的內部構成不相同;比較兩組的總率。方法:

直接法(適用于已知兩組的內部構成)間接法(略)當前第39頁\共有58頁\編于星期五\11點步驟:選定標準構成在比較的資料中任選一組資料的內部構成作為標準構成;兩組資料各部分之和組成的構成作為標準構成;選擇有代表性的、較固定的、數量較大的人群。2.計算預期發(fā)生數3.求標準化率當前第40頁\共有58頁\編于星期五\11點6/17/202341例:甲乙兩廠同工種工人某病的患病率見下表。某領導因發(fā)現(xiàn)乙廠的總患病率高于甲廠而認為乙廠的患病情況嚴重,并批評了乙廠,但是乙廠不服氣。請你幫助解釋說明真實情況。當前第41頁\共有58頁\編于星期五\11點6/17/202342甲廠乙廠工齡(年)人數患病人數患病率(%)人數患病人數患病率(%)<3400123.010022.0≥31001818.04004010.0合計500306.0500428.4甲乙兩廠同工種工人某病的患病率當前第42頁\共有58頁\編于星期五\11點6/17/202343直接法計算甲乙兩廠的標準化患病率(%)甲廠標準化患病率=105/1000=10.5%乙廠標準化患病率=60/1000=6.0%工齡(年)標準人口數甲廠乙廠原患病率(%)預期患病人數原患病率(%)預期患病人數<35003.0152.010≥350018.09010.050合計10006.01058.460可見,乙廠的患病率低于甲廠,與分工齡組比較的結論一致,消除了工齡構成不同的影響。當前第43頁\共有58頁\編于星期五\11點6/17/202344注意事項:(1)標化率不能反映實際水平,只能用于比較;(2)選用標準不同,標化率會改變,但比較結果只有一個,不能改變;(3)比較兩樣本的標化率,也要進行假設檢驗。當前第44頁\共有58頁\編于星期五\11點6/17/202345基本內容

統(tǒng)計描述統(tǒng)計推斷(1)統(tǒng)計推斷(2)計量資料頻數分布集中趨勢離散趨勢統(tǒng)計圖表抽樣誤差標準誤均數可信區(qū)間tZF檢驗秩和檢驗直線相關與回歸偏相關多元線性回歸因子分析計數資料相對數(率、比)率的可信區(qū)間2檢驗Logistic回歸當前第45頁\共有58頁\編于星期五\11點6/17/202346第三節(jié)分類變量的統(tǒng)計推斷一、率的標準誤和可信區(qū)間

二、2檢驗

(一)成組設計四格表資料的χ2檢驗

(二)配對設計四格表資料的2檢驗

(三)行x列表x2檢驗

(四)趨勢x2檢驗當前第46頁\共有58頁\編于星期五\11點6/17/202347一、率的標準誤和可信區(qū)間樣本率p,總體率抽樣誤差產生的原因、概念1、率的標準誤當前第47頁\共有58頁\編于星期五\11點6/17/202348x率的標準誤P1P2P3…Piσp當前第48頁\共有58頁\編于星期五\11點

π=0.5時,不同n值對應的二項分布

π=0.3時,不同n值對應的二項分布在醫(yī)學領域中,有一些隨機事件是只具有兩種互斥結果的離散型隨機事件,稱為二項分類變量二項分布的圖形現(xiàn)狀取決于n和的取值。隨n增大,圖形逐漸對稱分布當前第49頁\共有58頁\編于星期五\11點6/17/202350率的標準誤計算公式:與樣本量的關系:成反比。當前第50頁\共有58頁\編于星期五\11點6/17/202351例:某市為了解已婚育齡婦女子宮頸糜爛的患病情況,進行了抽樣調查,隨機抽取2000人,患者80例。試求此患病率的標準誤。當前第51頁\共有58頁\編于星期五\11點52點估計:不考慮抽樣誤差的大小,將樣本率直接作為總體率的估計值。區(qū)間估

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論