健管師流統(tǒng)3課件_第1頁
健管師流統(tǒng)3課件_第2頁
健管師流統(tǒng)3課件_第3頁
健管師流統(tǒng)3課件_第4頁
健管師流統(tǒng)3課件_第5頁
已閱讀5頁,還剩84頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

健康管理師流行病學(xué)和醫(yī)學(xué)統(tǒng)計學(xué)基礎(chǔ)第十二章健康管理師/流行病學(xué)與醫(yī)學(xué)統(tǒng)計1.統(tǒng)計工作的四個基本步驟為A.設(shè)計、搜集資料、整理資料和分析資料B.設(shè)計、搜集資料、統(tǒng)計描述和統(tǒng)計推斷C.設(shè)計、整理資料、分析資料和表達資料D.搜集資料、整理資料、統(tǒng)計描述和統(tǒng)計推斷E.搜集資料、整理資料、分析資料和表達資料2.下列有關(guān)概率與頻率,說法正確的是A.概率常用符號M表示B.頻率常用符號P表示C.概率是描述某隨機事件發(fā)生可能性大小的D.概率就是頻率E.概率的取值范圍介于-1和+1之間3.已知某病患者8人的潛伏期(天)分別為:6、8、8、10、12、15、16、>17,其平均潛伏期(天)為A.8B.10C.11D.12E.154.可以全面描述正態(tài)分布資料特征的兩個指標是A.均數(shù)和中位數(shù)B.均數(shù)和標準差C.均數(shù)和極差D.中位數(shù)和方差E.幾何均數(shù)和標準差第二節(jié)醫(yī)學(xué)統(tǒng)計學(xué)基本知識

一、基本概念(一)定義和研究對象1.定義是關(guān)于數(shù)據(jù)收集、表達和分析的普遍原理和方法的科學(xué)。醫(yī)學(xué)統(tǒng)計學(xué)是根據(jù)統(tǒng)計學(xué)原理和方法,研究醫(yī)學(xué)數(shù)據(jù)收集、表達和分析的一門應(yīng)用科學(xué)。2.研究對象統(tǒng)計學(xué)研究的對象是大量具有不確定性的數(shù)據(jù),通過分析找出其蘊藏的規(guī)律。醫(yī)學(xué)統(tǒng)計學(xué)則是對人、動物或生物材料的測量值進性分析。醫(yī)學(xué)統(tǒng)計學(xué)

(還涉及P460實習(xí)七、八)

(二)醫(yī)學(xué)統(tǒng)計學(xué)研究內(nèi)容1.統(tǒng)計設(shè)計調(diào)查設(shè)計:抽樣方法、樣本大小、調(diào)查技術(shù)、統(tǒng)計指標、質(zhì)量控制等。實驗設(shè)計:模型選擇、分組方法、樣本大小、檢測指標等。2.統(tǒng)計描述

對數(shù)據(jù)整理歸納,用適當統(tǒng)計指標,描述其特征,配用統(tǒng)計表和統(tǒng)計圖。

3.統(tǒng)計推斷參數(shù)估計、可信區(qū)間估計和假設(shè)檢驗等。醫(yī)學(xué)統(tǒng)計學(xué)基本概念

(三)醫(yī)學(xué)統(tǒng)計工作基本步驟

1.研究設(shè)計調(diào)查設(shè)計\實驗設(shè)計;專業(yè)設(shè)計\統(tǒng)計設(shè)計。

2.資料收集經(jīng)常性(常規(guī)性)資料和一時性資料。對資料的要求:完整、正確、及時、量足、有代表性和可比性。

3.資料整理原始數(shù)據(jù)檢查和核對,糾錯、補遺,數(shù)據(jù)分組設(shè)計(質(zhì)量分組和數(shù)量分組)和歸納,使資料系統(tǒng)化、條理化。

4.資料分析統(tǒng)計描述和統(tǒng)計推斷,作出專業(yè)的結(jié)論。

(四)醫(yī)學(xué)統(tǒng)計資料的類型醫(yī)學(xué)統(tǒng)計學(xué)基本概念

醫(yī)學(xué)統(tǒng)計學(xué)基本概念

實驗研究的干預(yù)因素

分組因素觀察研究的暴露因素醫(yī)學(xué)研其他感興趣的因素究資料計量資料反應(yīng)變量計數(shù)資料等級資料

3.某地區(qū)抽樣調(diào)查1993~1999年損傷與中毒的病死率資料如下:表1.某地區(qū)1993~1999年損傷與中毒的病死率年度發(fā)病人數(shù)病死人數(shù)病死率(%)199358081.381994570122.101995680162.351996760303.951997942303.1819981100524.7319991085514.70

表3兩個年齡組服OC與MI關(guān)系的病例對照研究<40歲40~合計合計

服OC未服OC服OC未服OC病例2126471888106對照175976795102合計388512325183208

(五)某些重要的統(tǒng)計學(xué)專業(yè)名詞

1.觀察單位2.同質(zhì)與變異3.總體(有限總體、無限總體)與樣本4.參數(shù)與統(tǒng)計量5.誤差:系統(tǒng)誤差\隨機誤差6.概率(對總體)與頻率(對樣本)\確定事件,隨機事件\小概率事件醫(yī)學(xué)統(tǒng)計學(xué)基本概念

隨機測量誤差

抽樣誤差

153.62cm樣本1

某地區(qū)1990年16歲女中學(xué)生平均身高

μ=155.60cm155.36cm樣本2

總體

156.01cm樣本3

抽樣誤差示意n1=100n2=100n3=100

二、統(tǒng)計描述

(一)計量資料(數(shù)值變量)的統(tǒng)計描述1.數(shù)據(jù)處理和表達編制頻數(shù)表和繪制頻數(shù)分布圖(直方圖)。原始數(shù)據(jù)核對無誤后分組,組段8~15個,一般取10個左右。編制頻數(shù)表,繪直方圖,觀察數(shù)據(jù)分布的特征。舉例

統(tǒng)計描述例某地區(qū)1999年130名14歲女孩的身高資料如下,現(xiàn)編制頻數(shù)表和觀察頻數(shù)分布情況。表1.某地區(qū)1999年14歲女孩的身高資料(cm)表2.130名14歲女孩身高資料(cm)的分組頻數(shù)

2.描述集中趨勢的指標根據(jù)數(shù)據(jù)性質(zhì)選用合適的指標。

(1)算術(shù)均數(shù)用于正態(tài)分布或近似正態(tài)分布資料??傮w均數(shù)用希臘字母μ(讀作mu)表示,樣本均數(shù)用表示。計算方法

①直接法當觀察例數(shù)較少時(n<30)用此法。

用例:有9名健康成人的空腹膽固醇測定值(mmol/L)為讀

5.61,3.96,3.67,4.99,4.24,5.06,5.20,4.79,5.93。求其均數(shù)。

②加權(quán)法當觀察例數(shù)較多時用此法。計算公式:計算實例:130名14歲女生身高平均值:將表中的∑fixi=18600及∑fi=130代入公式得

若將該資料用直接法計算均數(shù),得到的均數(shù)為143.22cm。由此可見,加權(quán)法得到的均數(shù)是近似值,但這種算法的近似程度很好。

作業(yè)練習(xí):數(shù)據(jù)如下表,試計算其均數(shù)。表3.某市2002年132名55~58歲健康成人空腹血糖測定值————————————————————————血糖(mmol/L)頻數(shù)(?i)組中值(Xi)fiXi————————————————————————3.6~33.8~34.0~84.2~234.4~244.6~254.8~205.0~125.2~105.4~5.64合計(Σ?i)(Σ?iXi)——————————————————————————用例:有8人接種某疫苗后的抗體滴度為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640,求平均抗體效價。將各抗體效價的倒數(shù)代入公式,得:=lgˉ1(1.752575)=56.57即血清抗體平均滴度為1:56.57。

(3)中位數(shù)

中位數(shù)用符號M表示。中位數(shù)是把一組觀察值,按大小順序排列,位置居中的那個數(shù)值。中位數(shù)是一個位置指標,以中位數(shù)為界,將觀察值分為左右兩半。也是描述資料集中趨勢的指標。其適用條件為:當資料呈明顯的偏態(tài)分布,有些資料一端或兩端無確定數(shù)值(如大于或小于某數(shù)值),或者資料的分布情況不清楚時,算術(shù)均數(shù)失去穩(wěn)定性。用中位數(shù)反映一群同質(zhì)計量資料在位次上的平均水平。①直接計算法當樣本含量不大時使用。

若又觀察了一個人的血壓值為118(mmHg),則為118,120,123,125,127,128,130,132,樣本含量n=8。該值應(yīng)排在第一位,此時位置居中的兩個數(shù)是125和127,中位數(shù)M是M==(125+127)/2=126(mmHg)。

②頻數(shù)表法

當觀察例數(shù)較多時采用。先將觀察值編制成頻數(shù)表,按所分組段由小到大計算累計頻數(shù)和累計頻率,找出中位數(shù)或百分位數(shù)所在組(如下表中,M所在組是累計頻率為50%的所在組,即潛伏期為“8—”這一組。將該組段的下限(L)、組距(i)、頻數(shù)(fm)和小于L的各組段累計頻數(shù)(fL)代入公式,即可求出中位數(shù)M。其計算公式如下:?m=中位數(shù)所在組段的頻數(shù);L=該組段的下限;i=該組段的組距;n=總頻數(shù);Σ?L=小于L的各組段累積頻數(shù)。(即C)

n×50%?C用例:某傳染性疾病的潛伏期(天)見下表,求平均潛伏期M。附表某傳染性疾病的潛伏期(天)的中位數(shù)計算表10.3(天)關(guān)于中位數(shù)——

※對于任何分布的資料都可以用中位數(shù)反映平均水平。

※中位數(shù)不受個別特大或特小值的影響,只受位置居中的觀察值波動的影響。

※若資料呈對稱或正態(tài)分布,理論上講,中位數(shù)應(yīng)和算術(shù)均數(shù)相等。

3.描述離散趨勢的指標

(1)方差與標準差

設(shè)有三個幼兒園各測量5名5歲兒童的身高值(cm)資料如下,先計算三組的平均身高:幼兒園1:98、99、100、101、102幼兒園2:80、99、100、101、120幼兒園3:80、90、100、110、120102120120幼兒園1幼兒園2幼兒園3

用什么指標表示其平均離散程度?描述離散趨勢的指標有標準差、全距(R)、四分位數(shù)間距、變異系數(shù)等,各有優(yōu)缺點。常用的是標準差。先就總體而言,離散情況能否用總體中每個觀察值xi與總體均數(shù)μ之差的總和(稱為離均差之和)反映資料的離散程度呢?但總體均數(shù)通常是未知的,一般用樣本情況研究。現(xiàn)以上述三所幼兒園5名5歲兒童身高為例說明?,F(xiàn)在計算上述三組的身高的離均差和:1組:-2、-1、0、1、22組:-20、-1、0、1、203組:-20、-10、0、10、20如果采用下述方法就可消除為“0”的情況——

現(xiàn)在以1組幼兒身高為例,計算該組觀察值的平均離散程度——標準差:

將1組的5個差值代入上式:

同理可計算得2組S=14.2,3組S=15.8。

標準差的計算:

①總體標準差:②樣本標準差:

◆直接計算法:為便于計算,用下式:應(yīng)用此公式時,一般先列出計算表,以第1組幼兒身高數(shù)據(jù)為例:

第1所幼兒園5名5歲幼兒身高測量值標準差計算表

身高(cm)XX2989604999801100100001011020110210404

500(ΣX)50010(ΣX2)將基本數(shù)據(jù)ΣΧ=500和ΣΧ2=50010代入上式:同樣計算得S2=14.16,S3=15.81。與前式結(jié)果相同。

◆加權(quán)法計算:用公式:130名14歲女孩身高的標準差計算如下:

某地130名14歲女孩身高的特征為血糖(mmol/L)頻數(shù)(?i)組中值(Xi)fiXifiXi2————————————————————————3.6~33.8~34.0~84.2~234.4~244.6~254.8~205.0~125.2~105.4~5.64合計(Σ?i)(Σ?iXi)ΣfiXi2——————————————————————————表3.某市2002年132名55~58歲健康成人空腹血糖測定值

計量資料統(tǒng)計描述的表述在科研報告中,通常表述為本例三所幼兒園個5名5歲兒童身高(cm)的平均值及其標準差分別為第1所100±1.58(cm)

第2所100±14.2(cm)

第3所100±15.8(cm)

意義方差:方差的平方就是方差。

作業(yè)練習(xí):1.教材實習(xí)七實例練習(xí)第1和第3題(P462)

2.計算前例(空腹血糖)的標準差

(2)全距(極差)用R標示。是一組觀察值最大值與最小值之差。意義及優(yōu)缺點。

(3)百分位數(shù)及四分位數(shù)間距

Px或Pr及Q。百分位數(shù)也是一種位置指標。如果將一組計量資料從小到大排成順序,并分成100等份,每一等份含1%的觀察值;則任何一個百分點位置上的數(shù)就是“某百分位數(shù)”。M即P50。百分位數(shù)的計算方法

例某次沙門氏菌食物中毒164例患者的潛伏期見下表,試求其P95分位數(shù)。潛伏期P95計算表潛伏期(h)人數(shù)累計頻數(shù)累計百分率(%)0~252515.212~588350.624~4012375.036~2314689.048~1215896.360~516399.472~1164100.0Q是用于表示偏態(tài)分布資料離散程度的指標,可認為是偏態(tài)分布資料的“標準差”。本例Q計算:

(4)變異系數(shù)用CV表示。常用測量單位不同的多組資料或單位相同但均數(shù)相差懸殊資料變異程度的比較。計算公式:實例分析:某高校對257名成人的膽固醇和甘油三酯水平(mmol/L)測定數(shù)值如下,試比較何者變異較大。

(二)分類資料的統(tǒng)計描述

1.資料描述按事件屬性或性質(zhì)分類,相同事件出現(xiàn)的次數(shù)稱為頻數(shù),將各類事件的頻數(shù)列于統(tǒng)計表中即為頻數(shù)表。頻數(shù)表描述指標用相對數(shù)。相對數(shù)是兩個有關(guān)數(shù)值或指標之比,括率、構(gòu)成比和相對比。

表12-4108例患者心電圖檢查結(jié)果性別檢查人數(shù)異常人數(shù)發(fā)生率(%)構(gòu)成比(%)男704868.5776.19女381539.4723.81合計1086358.33100.00

2.應(yīng)用相對數(shù)應(yīng)注意的問題觀察例數(shù)不宜太少、率與構(gòu)成比的區(qū)別、率的標準化等。

(三)統(tǒng)計表與統(tǒng)計圖

1.統(tǒng)計表

制作原則、簡單表、復(fù)合表。橫標目名稱縱標目1縱標目2…橫標目1數(shù)字a數(shù)字b橫標目2數(shù)字c數(shù)字d合計數(shù)字數(shù)字表號標題2.統(tǒng)計圖條圖、普通線圖、半對數(shù)線圖、圓圖、直方圖、散點圖、均數(shù)標準差圖等(p466,表23-8)。

三、統(tǒng)計推斷

(一)概述1.統(tǒng)計推斷的概念用樣本的信息推斷總體的特征。2.統(tǒng)計推斷的內(nèi)容

統(tǒng)計推斷要做的事情總體樣本抽取部分觀察單位

統(tǒng)計量

參數(shù)

統(tǒng)計推斷如:樣本均數(shù)樣本標準差S樣本率P如:總體均數(shù)總體標準差總體率內(nèi)容:(1)參數(shù)估計包括:點估計與區(qū)間估計(2)假設(shè)檢驗

(二)數(shù)值變量統(tǒng)計推斷的理論基礎(chǔ)——正態(tài)分布

1.正態(tài)分布的形成

統(tǒng)計推斷

2.正態(tài)分布的特征

(1)對稱的鐘形;(2)最高點中垂線與橫軸的交點即為均數(shù);(3)鐘形的高低、寬窄決定于標準差;(4)兩個參數(shù):均數(shù)是位置參數(shù),標準差是形態(tài)參數(shù);(5)正態(tài)曲線下的面積有一定規(guī)律。

3.正態(tài)曲線下的面積規(guī)律

總體:的面積占總面積的的面積占總面積的的面積占總面積的的面積占總面積的的面積占總面積的的面積占總面積的樣本:

4.正態(tài)分布的用途

(1)反映眾多微小且獨立的隨機因素影響的總結(jié)果現(xiàn)象分布特征如隨機誤差的分布、某些生理現(xiàn)象的頻率分布。(2)是研究許多抽樣分布規(guī)律的基礎(chǔ)如χ2分布、t分布、F分布等都是在正態(tài)分布的基礎(chǔ)上推導(dǎo)出來的。(3)某些分布的極限就是正態(tài)分布如二項分布、t分布。(4)用于u檢驗正態(tài)分布或大樣本資料趨于正態(tài)分布的資料,都適用u檢驗。(5)用于服從正態(tài)分布資料的正常值范圍估計。

(三)標準誤1.抽樣誤差2.標準誤的概念:是衡量均數(shù)抽樣誤差大小的指標。影響抽樣誤差大小的因素:(1)個體變異(2)樣本大小如果把每個樣本均數(shù)都看作觀察值,則可以計算出標準差來說明這些均數(shù)間的變異程度,這個指標即為樣本均數(shù)的標準誤(SE)。3.標準誤的計算:總體的標準誤:樣本的標準誤例如:第1所幼兒園5名兒童身高及130名14歲女孩身高的SE分別為:

4.標準誤的應(yīng)用:總體均數(shù)的推斷;t檢驗。5.標準誤的統(tǒng)計學(xué)意義(1)是衡量均數(shù)抽樣誤差大小的指標。(2)對同質(zhì)資料抽樣,可通過增加樣本含量來減小標準誤。

(3)SE與SD的區(qū)別:兩者都是用來說明變量變異程度的指標,但是SD是描述個體變量值之間變異程度的指標,而SE是描述樣本均數(shù)與總體均數(shù)之間差異程度的指標。SE是樣本均數(shù)的標準差。(四)t分布

t分布是一種連續(xù)型分布,又稱為“學(xué)生”分布(“Student”)(1908年Gosset以筆名Student發(fā)表論文)。

統(tǒng)計推斷t分布有如下性質(zhì):①單峰分布,曲線在t=0處最高,并以t=0為中心左右對稱②與正態(tài)分布相比,曲線最高處較矮,兩尾部翹得高(見綠線)③隨自由度增大,曲線逐漸接近正態(tài)分布;分布的極限為標準正態(tài)分布。t分布曲線下面積與t界值雙側(cè)t0.05/2,9=2.262=單側(cè)t0.025,9單側(cè)t0.05,9=1.833雙側(cè)t0.01/2,9=3.250=單側(cè)t0.005,9單側(cè)t0.01,9=2.821雙側(cè)t0.05/2,∞=1.96=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.64t界值表(附表2)

(五)假設(shè)檢驗

1.假設(shè)檢驗的基本原理

假設(shè)檢驗又叫做顯著性檢驗,是一種為了排除因抽樣而導(dǎo)致的隨機誤差對研究結(jié)果的影響的統(tǒng)計學(xué)分析處理技術(shù)。任何建立在抽樣研究基礎(chǔ)上的研究結(jié)果,當進行對總體參數(shù)推斷時,都會存在抽樣誤差影響對結(jié)果的正確判斷。當能夠證實因抽樣誤差對研究結(jié)果影響的可能性很小,甚至為零,那么做出某種判斷是有足夠理由的。例如,美國于1987年報道,隨機抽取了22072人作為研研究樣本隨機分為兩組,進行了如下研究及所得結(jié)果如下:

服用小劑量阿斯匹林預(yù)防CHD發(fā)作效果觀察實驗組觀察人數(shù)CHD發(fā)作例數(shù)率(‰)服藥組110411049.42對照組1103118917.13對此研究結(jié)果能否下結(jié)論說,服用小劑量阿斯匹林能預(yù)防CHD發(fā)作?在作統(tǒng)計學(xué)處理之前,沒有任何理由作出結(jié)論。由樣本獲得的結(jié)果是無數(shù)多個可能結(jié)果中的一個。服阿斯匹林與CHD發(fā)作率的樣本率分布有以下兩類情形:9.42‰17.13‰1.服阿斯匹林與CHD發(fā)作無關(guān)時的樣本率分布

9.42‰服阿斯匹林人群17.13‰服安慰劑人群2.服阿斯匹林與CHD是否發(fā)作有關(guān)時的樣本率分布

假設(shè)檢驗的任務(wù)就是在一定假設(shè)前提下,根據(jù)隨機樣本研究結(jié)果產(chǎn)生一個統(tǒng)計量,并在給定的(可接受的或容許的)犯錯誤機會的條件下,檢驗因抽樣或分組等因素造成的差異是否小于容許犯錯誤的機會(P)?如果小于P,則樣本結(jié)果由抽樣誤差引起的可能性很小,反之,則樣本結(jié)果是抽樣誤差(隨機誤差)所致的可能性很大。

2.假設(shè)檢驗的基本步驟統(tǒng)計推斷(1)建立檢驗假設(shè),確定檢驗水準(2)選定檢驗方法,計算統(tǒng)計量(3)確定P值

(4)結(jié)果判斷

3.t檢驗與u檢驗

計量資料(數(shù)值變量)比較的顯著性檢驗常用t檢驗(小樣本)或u檢驗(大樣本)。包括:樣本均數(shù)與總體均數(shù)比較、兩樣本均數(shù)比較、配對設(shè)計計量資料比較等。

◆兩樣本均數(shù)的比較——t檢驗

相關(guān)的計算公式

兩樣本均數(shù)差值的標準誤:

合并方差:如已知兩樣本標準差,合并方差可按下式計算:

實例計算:

某醫(yī)學(xué)院測得14例老慢支患者及11例健康人尿中17-酮類固醇排出量(mg/dl)如下,試比較兩組的均值有無差別?;颊遆1:2.905.415.484.604.035.104.974.244.362.722.372.097.105.92健康人X2:5.188.793.146.463.726.645.604.577.714.994.01

假設(shè)檢驗的步驟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論