衛(wèi)生統(tǒng)計(jì)學(xué)資料

上傳人：飛*** IP屬地：河北上傳時(shí)間：2025-09-10 格式：PDF 頁(yè)數(shù)：67 大?。?8.67MB 積分：12 舉報(bào) 版權(quán)申訴

已閱讀5頁(yè)，還剩62頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

衛(wèi)生統(tǒng)計(jì)學(xué)資料（精心整理）

統(tǒng)計(jì)工作基本步驟：統(tǒng)計(jì)設(shè)計(jì)（調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì)）、資料分析｛收集資

料、整理資料、分析資料【統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷（參數(shù)估計(jì)和假設(shè)檢驗(yàn)）】。

★統(tǒng)計(jì)推斷：是利用樣本所提供的信息來(lái)推斷總體特征，包括：參數(shù)估計(jì)和

假設(shè)檢驗(yàn)。a參數(shù)估計(jì)是指利

用樣本信息來(lái)估計(jì)總體參數(shù)，主要有點(diǎn)估計(jì)［把樣本統(tǒng)計(jì)量直接作為總體參

數(shù)估計(jì)值）和區(qū)間估計(jì)【按預(yù)先設(shè)定的可信度（l-a）,來(lái)確定總體均數(shù)的所在

范圍】。b假設(shè)檢驗(yàn)：是以小概率反證法的邏輯推理來(lái)判斷總體參數(shù)間是否有質(zhì)

的區(qū)別。

變量資料可分為定性變量、定量變量。不同類(lèi)型的變量可以進(jìn)行轉(zhuǎn)化，通常

是由高級(jí)向低級(jí)轉(zhuǎn)化。

資料按性質(zhì)可分為計(jì)量資料、計(jì)數(shù)資料和等級(jí)資料。

定量資料的統(tǒng)計(jì)描述

1頻率分布表和頻率分布圖是描述計(jì)量資料分布類(lèi)型及分布特征的方法。離

散型定量變量的頻率分布圖可用直條圖表達(dá)。

2頻率分布表（圖）的用途：①描述資料的分布類(lèi)型；②描述分布的集中

趨勢(shì)和離散趨勢(shì)；③便于發(fā)現(xiàn)一些特大和特小的可疑值；④便于進(jìn)一步的統(tǒng)計(jì)

分析和處理；⑤當(dāng)樣本含量足夠大時(shí)，以頻率作為概率的估計(jì)值。

★3集中趨勢(shì)和離散趨勢(shì)是定量資料中總體分布的兩個(gè)重要指標(biāo)。

（1）描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo)：平均數(shù)（算術(shù)均數(shù)、幾何均數(shù)和中位數(shù)）、

百分位數(shù)（是一種位置參數(shù)，用于確定醫(yī)學(xué)參考值范圍，P50就是中位數(shù)）、眾

數(shù)。算術(shù)均數(shù)：適用于對(duì)稱分布資料，特別是正態(tài)分布資料或近似正態(tài)分布資料;

幾何均數(shù)：對(duì)數(shù)正態(tài)分布資料（頻率圖一般呈正偏峰分布）、等比數(shù)列；中位數(shù):

適用于各種分布的資料，特別是偏峰分布資料，也可用于分布末端無(wú)確定值得資

料。

（2）描述離散趨勢(shì)的指標(biāo)：極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系

數(shù)。四分位數(shù)間距：適用于各種分布的資料，特別是偏峰分布資料，常把中位數(shù)

和四分位數(shù)間距結(jié)合起來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì)。方差和標(biāo)準(zhǔn)差：都適

用于對(duì)稱分布資料，特別對(duì)正態(tài)分布資料或近似正態(tài)分布資料，常把均數(shù)和標(biāo)準(zhǔn)

差結(jié)合起來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì)；變異系數(shù)：主要用于量綱不同時(shí)，

或均數(shù)相差較大時(shí)變量間變異程度的比較。

標(biāo)準(zhǔn)差的應(yīng)用：①表示變量分布的離散程度；②結(jié)合均數(shù)計(jì)算變異系數(shù)、

描述對(duì)稱分布資料；③結(jié)合樣本含量計(jì)算標(biāo)準(zhǔn)誤。

定性資料的統(tǒng)計(jì)描述

1定性資料的基礎(chǔ)數(shù)據(jù)是絕對(duì)數(shù)。描述一組定性資料的數(shù)據(jù)特征，通常需要

計(jì)算相對(duì)數(shù)。定性變量可以通過(guò)頻率分布表描述其分布特征。

2常用相對(duì)數(shù)類(lèi)型：頻率型、強(qiáng)度型和相對(duì)比型指標(biāo)。

指標(biāo)頻率型指標(biāo)強(qiáng)度型指標(biāo)相對(duì)比型指標(biāo)

單位時(shí)間內(nèi)某現(xiàn)兩個(gè)有關(guān)聯(lián)的指

概念近似反映某一時(shí)間出現(xiàn)概率

象的發(fā)生頻率標(biāo)A和B之比

某事件發(fā)生的個(gè)體數(shù)1某事件發(fā)生的個(gè)體數(shù)1

計(jì)算公式_______________xk__________________XKA/B

可能發(fā)生某事件的個(gè)體數(shù)觀察人日數(shù)總計(jì)

有無(wú)量綱無(wú)有可有、可無(wú)

取值范圍[0,1]可大于1無(wú)限制

表示相對(duì)于

大樣本時(shí)作為概率近似值的一個(gè)單位，

頻率強(qiáng)度，即概率BA

本質(zhì)有多少個(gè)單位

強(qiáng)度的近似值

分子式分母的一部分

A和B可以

是絕對(duì)數(shù)、相對(duì)

數(shù)和平均數(shù)

A和B的量

綱可相同也可不

同

A和B互不

包含

相對(duì)比：A、B兩指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)。最常見(jiàn)的相對(duì)比是

人口學(xué)中的男女性別比，流行病學(xué)中的相對(duì)危險(xiǎn)度RR=P1/P0也是相對(duì)比指標(biāo)。

3應(yīng)用相對(duì)數(shù)應(yīng)該注意：①防止概念混淆，避免以比代率的錯(cuò)誤現(xiàn)象；②

計(jì)算相對(duì)數(shù)時(shí)分母應(yīng)有足夠數(shù)量，如果例數(shù)較少會(huì)使相對(duì)數(shù)波動(dòng)較大，應(yīng)該使用

絕對(duì)數(shù)；③正確的計(jì)算頻率（或強(qiáng)度）指標(biāo)的合計(jì)值。當(dāng)分組的資料需要合并

起來(lái)估計(jì)頻率（或強(qiáng)度）時(shí)，應(yīng)將各組頻率的分子相加作為合并估計(jì)的分子，各

組的分母相加作為合并估計(jì)的分母；④頻率型指標(biāo)的解釋要緊扣總體和屬性；

⑤相對(duì)數(shù)間比較要具備可比性：要注意觀察對(duì)象是否同質(zhì)、研究方法是否相同、

觀察時(shí)間是否一致、觀察對(duì)象內(nèi)部結(jié)構(gòu)是否一致、對(duì)比不同時(shí)期資料應(yīng)注意客觀

條件是否相同；⑥正確進(jìn)行相對(duì)數(shù)的統(tǒng)計(jì)推斷：在隨機(jī)抽樣的情況下，從樣本

估計(jì)值推斷總體相對(duì)數(shù)應(yīng)該考慮抽樣誤差，因此要進(jìn)行參數(shù)估計(jì)和假設(shè)檢驗(yàn)。

4醫(yī)學(xué)人口統(tǒng)計(jì)資料主要來(lái)源為日常工作記錄（報(bào)告單、卡、冊(cè)）、統(tǒng)計(jì)報(bào)

表、人口調(diào)查（普查和抽樣調(diào)查）。

5描述人口學(xué)特征的常用指標(biāo)一般有人口總數(shù)和反映人口學(xué)基本特征的某

些指標(biāo)。人口學(xué)的基本特征包括性別、年齡、文化、職業(yè)等，最常用來(lái)描述人口

結(jié)構(gòu)的是性別和年齡。人口學(xué)特征指標(biāo)：老年人口系數(shù)、少兒人口系數(shù)、負(fù)擔(dān)系

數(shù)、老少比、性別比。

6有關(guān)生育的常用指標(biāo)有出生率、生育率和人口再生產(chǎn)指標(biāo)。測(cè)量生育水平

的統(tǒng)計(jì)指標(biāo)：粗出生率、總生育率、年齡別生育承、總和生育率。測(cè)量人口再生

育的統(tǒng)計(jì)指標(biāo)：自然增長(zhǎng)率、粗再生率和凈再生率。

7常用的死亡統(tǒng)計(jì)指標(biāo)有：粗死亡率、年齡別死亡率、嬰兒死亡率、新生兒

死亡率、圍生兒死亡率、死因別死亡率、某病病死率和死因構(gòu)成等。

8疾病統(tǒng)計(jì)資料主要來(lái)源于：疾病報(bào)告和報(bào)表材料、醫(yī)療衛(wèi)生工作記錄、疾

病專(zhuān)題調(diào)查資料。

9⑴標(biāo)準(zhǔn)化：兩個(gè)率或多個(gè)率之間進(jìn)行比較時(shí)，為消除內(nèi)部構(gòu)成不同的影響，

采用統(tǒng)一的標(biāo)準(zhǔn)，對(duì)兩組或多組資料進(jìn)行校正（調(diào)整），計(jì)算得到標(biāo)準(zhǔn)化率后再

做比較的方法，稱為其目的是統(tǒng)一內(nèi)部構(gòu)成，消除混雜因素，是資料具有可

比性。

⑵應(yīng)用標(biāo)準(zhǔn)化法的注意事項(xiàng)：

1標(biāo)準(zhǔn)化法的應(yīng)用范圍很廣。當(dāng)某個(gè)分類(lèi)變量在兩組中分布不同時(shí)，這兩個(gè)

分類(lèi)變量就成為兩組頻率比較

的混雜因素，標(biāo)準(zhǔn)化的目的是消除混雜因素。

2標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率，已經(jīng)不再反映當(dāng)時(shí)當(dāng)?shù)氐膶?shí)際水平，只表示相互比

較的資料間的相對(duì)水平。

3標(biāo)準(zhǔn)化法實(shí)質(zhì)是找一個(gè)標(biāo)準(zhǔn)，使兩組得意在一個(gè)共同的平臺(tái)上進(jìn)行比較。

選擇不同的標(biāo)準(zhǔn).算出的標(biāo)準(zhǔn)

化率也會(huì)不同，比較的結(jié)果也未必相同，因此報(bào)告比較結(jié)果時(shí)必須說(shuō)明所選

用的標(biāo)準(zhǔn)和理由

④兩樣本標(biāo)準(zhǔn)化率是樣本值，存在抽樣誤差。比較兩樣本標(biāo)準(zhǔn)化率，當(dāng)樣

本含量較小時(shí)，還應(yīng)作假設(shè)檢驗(yàn)。10常用的動(dòng)態(tài)數(shù)列分析指標(biāo)有：絕對(duì)增長(zhǎng)量、

發(fā)展速度與增長(zhǎng)速度、平均發(fā)展速度與平均增長(zhǎng)速度。

（1）絕對(duì)增長(zhǎng)量：是說(shuō)明事物在一定時(shí)期增長(zhǎng)的絕對(duì)值，可分為：累計(jì)增

長(zhǎng)量（報(bào)告期指標(biāo)與基線期指標(biāo)之差）和逐年增長(zhǎng)量（報(bào)告期指標(biāo)與前一期指標(biāo)

之差）。

（2）發(fā)展速度與增長(zhǎng)速度：均為相對(duì)比，說(shuō)明事物在一定時(shí)期的變化，可

計(jì)算定基比（即報(bào)告期指標(biāo)與基線期指標(biāo)的比：an/aO）和環(huán)比（報(bào)告期指標(biāo)與

其前一期指標(biāo)之比：增長(zhǎng)速度表示的是凈增長(zhǎng)速度，增長(zhǎng)速度;發(fā)展

an/an-1）o

速度-100%。

（3）平均發(fā)展速度與平均增長(zhǎng)速度：用于概括某現(xiàn)象在一段時(shí)期中的平均

在

變化。平均發(fā)展速度是發(fā)展速度的幾何平均數(shù)，平均發(fā)展速度='平均增長(zhǎng)

速度;平均發(fā)展速度-100%。

11統(tǒng)計(jì)表和統(tǒng)計(jì)圖是描述資料特征、呈現(xiàn)統(tǒng)計(jì)分析結(jié)果的重要工具。統(tǒng)計(jì)

表結(jié)構(gòu)標(biāo)題、標(biāo)目、線條、數(shù)字和備注。

12常用統(tǒng)計(jì)圖用途：①條圖：適用于相互獨(dú)立的資料（資料有明確分組、

不連續(xù)）；②百分條圖、圓圖適用于構(gòu)成比資料；③線圖適用于連續(xù)性資料，

表達(dá)事物的動(dòng)態(tài)變化（絕對(duì)差值）；半對(duì)數(shù)線圖適用于連續(xù)性資料，表達(dá)事物的

發(fā)展速度（相對(duì)比）；④直方圖用于描述連續(xù)變量的頻數(shù)分布；⑤散點(diǎn)圖適用

于雙變量資料，用點(diǎn)的排列趨勢(shì)和密集度表示兩變量的相關(guān)關(guān)系。

常用概率分布

1正態(tài)分布（連續(xù)型隨機(jī)變量的概率分布）

（1）正態(tài)概率密度曲線特點(diǎn)：①關(guān)于X=H對(duì)稱；②在x=u處取得該概率

密度函數(shù)的最大值，在x二n±。處有拐點(diǎn)；③曲線下面積為1；④正態(tài)分布有兩

個(gè)參數(shù)：位置參數(shù)口（決定曲線在橫軸上的位置）和變異參數(shù)。（決定曲線的形

狀）；⑤H±1.64O面積為90%,口±1.96。面積為95%,口±2.58。面積為99%。

(2)Z變換與標(biāo)準(zhǔn)正態(tài)分布：對(duì)于任意一個(gè)服從正態(tài)分布N(山02)的隨

機(jī)變量，可作Z變：Z=O,變換后的Z值仍然服從正態(tài)分布，且其總體為數(shù)

為0、總體標(biāo)準(zhǔn)差為L(zhǎng)稱此為標(biāo)準(zhǔn)正態(tài)分布，用N(0,1)表示。①(z)為標(biāo)準(zhǔn)

正態(tài)分布Z變量的累積面積，-8fZ的面積，即下側(cè)累計(jì)面積。

★(3)正態(tài)分布的應(yīng)用：①確定醫(yī)學(xué)參考值范圍：是指特定的“正常〃人群

(排除了對(duì)所研究的指標(biāo)有影響的的疾病和有關(guān)因素的特定人群)的解剖、生理、

生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個(gè)體的取值所在范圍，習(xí)慣用該人

群的95%的個(gè)體某項(xiàng)醫(yī)學(xué)指標(biāo)的取值范圍作為該指標(biāo)的醫(yī)學(xué)參考值范圍。方法:

a百分位數(shù)法：適用于任何分布類(lèi)型的資料；b正態(tài)分布法。②質(zhì)量控制圖：如

果某一波動(dòng)僅僅由個(gè)體差異或隨機(jī)測(cè)量誤差所致，那么觀察結(jié)果服從正態(tài)分布。

控制圖共有7條水平線，中心線位于總體均數(shù)口處，警戒限位于吐2。處，控制

限位于葉3。處，此外還有兩條位于葉。處。

★(4)確定醫(yī)學(xué)參考值的步驟：①?gòu)摹ㄕＨ恕傮w中抽樣，明確研究總體;

②用統(tǒng)一和準(zhǔn)確的方法測(cè)定相應(yīng)的指標(biāo)；③根據(jù)不同的用途選定適當(dāng)?shù)陌俜纸?/p>

限，常用95%；④根據(jù)此指標(biāo)的實(shí)際意義，決定單側(cè)范圍

還是雙側(cè)范圍；⑤根據(jù)此指標(biāo)的分布決定計(jì)算方法，常用的計(jì)算方法：正

態(tài)分布法、百分位數(shù)法。

2二項(xiàng)分布：

(1)是一種離散型隨機(jī)變量的分布類(lèi)型。如果每個(gè)觀察對(duì)象陽(yáng)性結(jié)果的發(fā)生

概率為幾，陰性結(jié)果的發(fā)生概率為(1H)；而且每個(gè)觀察對(duì)象的結(jié)果是相互對(duì)

立的，那么，重復(fù)觀察n個(gè)人，發(fā)生陽(yáng)性結(jié)果的人數(shù)X的概率分布為而二項(xiàng)分布,

CCxTT7------KT

記作B(n,TI)。二項(xiàng)分布的概率函數(shù)P(X):nnv(l-n)n-x,"='?(“—')！⑵

適用條件：①每次實(shí)驗(yàn)只有兩種互斥的結(jié)果；②各次實(shí)驗(yàn)互相獨(dú)立；③發(fā)生成

功事件的概率恒定。

（3）分布特征：二項(xiàng)分布的特征由二項(xiàng)分布的參數(shù)K以及觀察的次數(shù)n決定。

①圖形分布特征：二項(xiàng)分布圖的高峰在處或附近；71=0.5時(shí)，圖形對(duì)

稱；71工0.5時(shí)，分布不對(duì)稱，旦對(duì)同一n,ri離0.5愈遠(yuǎn)，對(duì)稱性愈差。對(duì)于同一

n,隨著n的增大，分布趨于對(duì)稱。當(dāng)n玲8時(shí)，只要兀不太靠近?；?（特別是

當(dāng)rut和n（1m）均大于5時(shí)），二項(xiàng)分布趨于對(duì)稱。

②二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差：

若X服從二項(xiàng)分布B（n,n）,則X的總體均數(shù)為總體方差為。2二rm

（1-n）,總體標(biāo)準(zhǔn)差為。若將出現(xiàn)陽(yáng)性結(jié)果的頻率記為：P=M,

7T（1?7F）

則樣本率P的總體均數(shù)為UP=N,總體方差為=n，總體標(biāo)準(zhǔn)差為

,加（1?以）

op」n,op是頻率P的標(biāo)準(zhǔn)差，又稱頻率的標(biāo)準(zhǔn)誤，反映陽(yáng)性頻率的

抽樣誤差大小。

⑷累積概率計(jì)算：①二項(xiàng)分布出現(xiàn)陽(yáng)性的次數(shù)至多為k次的概率為：P（X<k）

7=0②出現(xiàn)陽(yáng)性的次數(shù)至少為k次的概率為：P

嚴(yán)PF尸

（X>k）=x=ko

3Poisson分布：

⑴是一種離散型隨機(jī)變量的分布類(lèi)型，是二項(xiàng)分布的特例，用以描述單位時(shí)

間、空間、面積等的罕見(jiàn)事件發(fā)生次數(shù)的概率分布。一般記作P（入），入是Poisson

分布的唯一參數(shù)。總體均數(shù)為入=rm。前提條件：互斥、獨(dú)立、恒定。

入X

⑵概率函數(shù)為：P(X)=e-入X!,X為觀察單位內(nèi)稀有事件的發(fā)生次數(shù)，

e=2.71828o

③分布特性：Poisson分布是非對(duì)稱的，總體參數(shù)人值越小，分布越偏；隨

著入玲8,分布趨于對(duì)稱，當(dāng)入220時(shí)，Poisson分布資料可按正態(tài)分布處理。

①Poisson分布總體均數(shù)與總體方差相等，均為入；②Poisson分布的觀察結(jié)果可

加性，即對(duì)于服從Poisson分布的m歌互相獨(dú)立的隨機(jī)變量XI、X2...Xm,它們

的和也服從Poisson分布，其均數(shù)為這個(gè)m隨機(jī)變量的均數(shù)之和。

4概率計(jì)算：如果稀有事件發(fā)生次數(shù)的總體均數(shù)為入，有事件發(fā)生次數(shù)至多

為k次的概率為：P(X<k)=*=0；生次數(shù)至少為k次的概率：P(X>k)

=1-P(X<k-1)

★4三種常用分布之間的關(guān)系：

①二項(xiàng)分布與Poisson分布的關(guān)系：當(dāng)n很大，發(fā)生概率H(或1-n)很小,

二項(xiàng)分布B(n,n)近似于Poisson分布P(nn)；

②二項(xiàng)分布與正態(tài)分布的關(guān)系：當(dāng)n較大，n不接近0或1(特別是當(dāng)rm

和n(1-n)均大于5時(shí)),二項(xiàng)分布B(n,n)近似于正態(tài)分布N(rm,nn(1-n))；

4Poisson分布與正態(tài)分布的關(guān)系：當(dāng)入220時(shí)，Poisson分布漸進(jìn)正態(tài)分布N

(入，入)O

★5二項(xiàng)分布與Poisson分布的區(qū)別：

⑴相同點(diǎn)：都是離散型隨機(jī)變量的常見(jiàn)分布；

⑵區(qū)別：a取值不同。服從二項(xiàng)分布的隨機(jī)變量有n+1個(gè)不同的取值；Poisson

分布的隨機(jī)變量的可能去只有無(wú)限多個(gè)，即非負(fù)整數(shù)0,1,2......；b隨機(jī)變量的

概率不同：二項(xiàng)分布P（X二k）="?（"一k），,Poisson分布P（X二k）

人卜

二e-入k!；c描述的隨機(jī)變量不同。二項(xiàng)分布描述的是一次試驗(yàn)只會(huì)出現(xiàn)兩種對(duì)立

的結(jié)果之一，n次獨(dú)立重復(fù)試驗(yàn)中某種結(jié)果出現(xiàn)次數(shù)的概率分布。Poisson分布

描述的是在單位時(shí)間、面積、空間等范圍中某種事件發(fā)生數(shù)的概率分布。

。很大?很小

⑶聯(lián)系：B（n,n）-Poisson分布。

參數(shù)估計(jì)

1在服從正態(tài)分布的總體中進(jìn)行隨機(jī)抽樣，樣本均數(shù)的抽樣分布特點(diǎn)：①各

樣本均數(shù)未必等于總體均數(shù)；②樣本均數(shù)見(jiàn)存在差異；③樣本均數(shù)圍繞總體均

數(shù)，中間多、兩邊少，左右基本對(duì)稱，呈近似正態(tài)分布；④樣本均數(shù)間的變異

明顯小于原始變量間的變異。

2標(biāo)準(zhǔn)誤：

①均數(shù)的標(biāo)準(zhǔn)誤的理論值：。犬=4〃，總體標(biāo)準(zhǔn)差。通常未知，需用樣本標(biāo)

準(zhǔn)差s來(lái)估計(jì)，均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值為：s*=v'〃；②頻率的標(biāo)準(zhǔn)也老則變

X.（1?萬(wàn)）

量X~B（rvi）,則樣本頻率P=，的總體概率為71,標(biāo)準(zhǔn)誤是。p=Y11,

JP（lP）以POM

頻率標(biāo)準(zhǔn)誤的估計(jì)值：SP二Y"一1Yn（①②增加樣本含量可以

減少樣本誤差）。

★3標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系：

區(qū)別：⑴標(biāo)準(zhǔn)差S（o）：①意義：描述個(gè)體觀察值變異程度的大小。標(biāo)準(zhǔn)

差小，均數(shù)對(duì)?組觀察值得代表性好；②應(yīng)用：與X結(jié)合，用以描述個(gè)體觀察

值的分布范圍，常用于醫(yī)學(xué)參考值范圍的估計(jì)；③與n的關(guān)系：n越大，S越趨

于穩(wěn)定；⑵標(biāo)準(zhǔn)誤S*（a*）：①意義：描述樣本均數(shù)變異程度及抽樣誤差的大

小。標(biāo)準(zhǔn)誤小，用樣本均數(shù)推斷總體均數(shù)的可靠性大；②應(yīng)用于x結(jié)合，用以

估計(jì)總體均數(shù)可能出現(xiàn)的范圍以及對(duì)總體均數(shù)作假設(shè)檢驗(yàn)；③與n的關(guān)系：n

越大，S*越小。

聯(lián)系：①都是描述變異程度的指標(biāo)；②由可知，S*與S成正比。

n一定時(shí)，s越大，S"越大。

4t分布：當(dāng)X服從均數(shù)為H的正態(tài)分布時(shí)，統(tǒng)計(jì)量S/J”服從自由度為

v=n-l的t分布，是小樣本總體均數(shù)的區(qū)間估計(jì)及假設(shè)檢驗(yàn)的理論基礎(chǔ)。

（2）t分布的圖形特征：t值得分布于自由度有關(guān)。t分布只有一個(gè)參數(shù)即V。

特征：①單峰分布，以0為中心，左右對(duì)稱；②v越小，t值越分散，曲線的峰

部越矮，尾部越高；③隨著v逐漸增大，t分布逐漸接近標(biāo)準(zhǔn)正態(tài)分布；當(dāng)v趨

向g時(shí)，t分布趨近標(biāo)準(zhǔn)正態(tài)分布，故標(biāo)準(zhǔn)正態(tài)分布是t分布的特例；④t分布

是一簇曲線。

（3）t界值表：①在自由度相同時(shí)，上?值越大，t分布的尾部概率越小；

②在t臨界值相同時(shí)，雙側(cè)尾部面積概率為單側(cè)尾部面積概率的兩倍。

5參數(shù)估計(jì)：包括點(diǎn)估計(jì)和區(qū)間估計(jì)。置信區(qū)間的兩個(gè)要素：①準(zhǔn)確度：反

映置信度1-a的大小，及區(qū)間包括總體均數(shù)n的理論概率的大小，愈接近1越好;

②精密度：即區(qū)間的寬度，區(qū)間越窄越好，如樣本含量不變，將置信度由95%

提高到99%,則置信區(qū)間由窄變寬，估計(jì)的精度下降。

6總體均數(shù)及總體概率的區(qū)間估計(jì):

1體均數(shù)的置信區(qū)間：t分布法和正態(tài)近似法

Lt分布法：當(dāng)。未知且n較小時(shí)，總體均數(shù)日的雙側(cè)(1-a)置信區(qū)間為

X士ta/2*S*；單側(cè)8)或(-8,X+tawS*)；

H.正態(tài)近似法：①當(dāng)。已知時(shí)，總體均數(shù)日的雙側(cè)(1-a)置信區(qū)間為

X±za/2fvox;單側(cè)(X_z%"X,oo)或(-oo,X+Zafvox)；②當(dāng)。未知但

n足夠大時(shí)(n>50),t分布近似服從標(biāo)準(zhǔn)正態(tài)分布，總體均數(shù)日的雙側(cè)(1-a)

置信區(qū)間為：X±z"2,”X,單側(cè)(X_za*S*,8)或(-8,X+za*s')

⑵總體概率的置信區(qū)間：對(duì)于二項(xiàng)分市的樣本資料，可根據(jù)樣本含量n和樣

本頻率P的大小，選用查表法(n<50,特別是p很接近?；?00%時(shí))或正態(tài)近

似法估計(jì)總體概率71的(1-a)置信區(qū)間。

正態(tài)近似法：當(dāng)n足夠大，且np及n(l-p)均大于5時(shí)，p的抽樣分布近似正

態(tài)分布，總體概率Ji的雙側(cè)(1-a)置信區(qū)間等于P士Z"2sp

★7醫(yī)學(xué)參考值范圍與總體均數(shù)的置信區(qū)間的區(qū)別：

⑴參考值范圍

①意義：絕大多數(shù)人某項(xiàng)指標(biāo)的數(shù)值范圍；

②計(jì)算：正態(tài)分布雙側(cè)X士za/2*s；單側(cè)(X-Z”，8)或(-oo,X+Z")

偏峰分布雙側(cè)PX~P100-X；單側(cè)(PX,8)或(-8,P100-X)

③應(yīng)用：判斷某項(xiàng)指標(biāo)正常與否

⑵總體均數(shù)的置信區(qū)間：

①意義：按一定的置信度估計(jì)總體均數(shù)所在范圍;

②計(jì)算：正態(tài)分布。未知：雙側(cè)X士2/2,吆*,單側(cè)（X_ta"X,8）或

（-8,X+t*”*）；

o已知：雙側(cè)X士Za/2*oX,單側(cè)（X.z%voX,?o）或（.oo,X+2a,vaX）.

正態(tài)分布或偏峰分布：o未知但n足夠大：雙側(cè)X士Z“/2,”x,單側(cè)（X.Za,v

S*,8）或（-8,X+z（r,yS*）

③應(yīng)用：估計(jì)總體均數(shù)所在范圍。

假設(shè)檢驗(yàn)

1假設(shè)檢驗(yàn)的過(guò)程：建立檢驗(yàn)假設(shè)，確定檢驗(yàn)水準(zhǔn)-計(jì)算統(tǒng)計(jì)量玲確定P值

并與給定的a比較好做出推斷

結(jié)論。

2假設(shè)檢驗(yàn)的基本邏輯：在H0成立的條件下（處理因素不起作用），計(jì)算

統(tǒng)計(jì)量和P值，把〃不太可能出

現(xiàn)假陽(yáng)性〃當(dāng)作“不可能出現(xiàn)假陽(yáng)性〃，從而拒絕H0,接受H1（處理因素起作

用）。

3假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤：I型和n型錯(cuò)誤。（見(jiàn)名解）

實(shí)際情況統(tǒng)計(jì)推斷

拒絕H0,有差異不拒絕H0,無(wú)差異

H0成立，無(wú)差異第I類(lèi)錯(cuò)誤（假陽(yáng)性），概率=a正確，概率=l-a

Hl成立，有差異正確，該概率=1予第H類(lèi)錯(cuò)誤（假陰性），概率呻

4t檢驗(yàn)：

⑴應(yīng)用條件：①隨機(jī)樣本：②來(lái)自正態(tài)分布總體；③均數(shù)比較時(shí)，要求兩

總體方差相等（方差齊性）。

⑵單樣本資料的t檢驗(yàn)：實(shí)際上是推斷該樣本來(lái)自的總體均數(shù)日與已知的某

一總體均數(shù)或有無(wú)差別。

檢驗(yàn)假設(shè)：HO：n=pO,Hl：*或；前提條件：樣本來(lái)自正態(tài)總體；計(jì)算公

式：sNn；自由v=

n-lo

配對(duì)設(shè)計(jì)資料的t檢驗(yàn)：配對(duì)資料的分析著眼與每一對(duì)中兩個(gè)觀察值之差，

這些差值構(gòu)成一組資料，用t

檢驗(yàn)推斷差值總體均數(shù)是否為0。

檢驗(yàn)假設(shè)：HO：ud=o,Hl：H”O(jiān)：前提條件：差值服從正態(tài)分布：計(jì)算公

”匕d-0d

式dsd/yjnSd/yjn,

自由度v=n-l（n是對(duì)子數(shù)）。

兩獨(dú)立樣本資料的t檢驗(yàn)：兩樣本均數(shù)的比較。

檢驗(yàn)假設(shè)：HO："1=42,H1：“1工”2；前提條件：兩樣本服從正態(tài)分布，

且具有方差齊性；計(jì)算公式:

，代表兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤,

S2為兩樣本聯(lián)合估

計(jì)的方差,

￡(XL】J+￡(X2生1

n+n-2/11+“2?2

12;自由

度y="1+〃2?2。

5t'檢驗(yàn)：前提條件：兩小樣本來(lái)自正態(tài)總體且方差不等。方差不齊，可采

用的處理方式有：￡'檢驗(yàn)，基

于秩次的非參數(shù)檢驗(yàn)和數(shù)據(jù)變換。非正態(tài)分布，方差不齊：基于秩次的非參

數(shù)檢驗(yàn)和數(shù)據(jù)變換。

檢驗(yàn)假設(shè)：H0："1="2,H1：“1工42；計(jì)算公式:

自由

（產(chǎn)了

V=XA

度“i-l〃2-16兩組獨(dú)立樣本資料的方差齊性檢驗(yàn)：兩組正態(tài)分布隨機(jī)

樣本判斷其總體方差是否齊同:

（較大）

22什2

?=?

5:a12?2當(dāng)H0成立時(shí)，檢驗(yàn)統(tǒng)計(jì)量§2（較?。?

當(dāng)F>3時(shí)，萬(wàn)差不齊。

7大樣本資料的Z檢驗(yàn)（u檢驗(yàn)）：前提條件：樣本足夠大；兩獨(dú)立樣本資

料的Z檢驗(yàn)：假定從兩個(gè)正態(tài)總

體（或非正態(tài)）總體隨機(jī)抽取含量為nl和n2的樣本，總體均數(shù)和方差分別

2物2

O1O2

當(dāng)

和

為11

2,X

n2均較大時(shí)，兩樣本均數(shù)的和與差的分布也服從（或近似服從）正態(tài)分布,

1-X2

“當(dāng)H0成

立時(shí)，這個(gè)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。

★t檢驗(yàn)與Z檢驗(yàn)的比較：兩樣本均數(shù)比較的t檢驗(yàn)適用條件為：樣本含量

小，兩樣本獨(dú)立，來(lái)自正態(tài)總體，

且兩總體方差相等。z檢驗(yàn)是大樣本情況下的t檢驗(yàn)的近似，用于兩總體方

差已知，或總體方差未知但樣本

含量較大（nl>60且n2>60）的兩樣本均數(shù)的比較。樣本量較大時(shí)，兩種檢

驗(yàn)方法都可用。

★8假設(shè)檢驗(yàn)與區(qū)間估計(jì)的關(guān)系：①置信區(qū)間具有假設(shè)檢驗(yàn)的主要功能：在

a水準(zhǔn)上可回答差別有無(wú)統(tǒng)計(jì)

學(xué)意義；②置信區(qū)間可提供假設(shè)檢驗(yàn)沒(méi)有提供的信息：根據(jù)置信區(qū)間上、

下限的數(shù)值大小可判斷差別是否具有實(shí)際意義；③假設(shè)檢驗(yàn)可提供確切的P值,

置信區(qū)間只能在預(yù)先確定的置信度100(1-a)%水平上進(jìn)行推斷，沒(méi)有精確的

概率值，且有可能增大□類(lèi)錯(cuò)誤；④置信區(qū)間推斷量的大小，即推斷總體均數(shù)

范圍；假設(shè)檢驗(yàn)推斷質(zhì)的大小即推斷總體均數(shù)是否存在不同。只有把置信區(qū)間和

假設(shè)檢驗(yàn)結(jié)合起來(lái)，互相補(bǔ)充才是對(duì)問(wèn)題比較的完整分析。

9假設(shè)檢驗(yàn)的注意事項(xiàng)：①根據(jù)研究目的、設(shè)計(jì)類(lèi)型、變量類(lèi)型及樣本大小

選擇恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法；②權(quán)

衡兩類(lèi)錯(cuò)誤的危害以確定a的大小;③正確理解P值的意義:P值很小時(shí)“拒

絕H0,接受Hl〃，不能把很

小的P值誤解為總體參數(shù)間差異很大。拒絕H0只是說(shuō)差異不為0,P值小

只是說(shuō)犯一類(lèi)錯(cuò)誤的機(jī)會(huì)遠(yuǎn)小于

aoP與a本質(zhì)相同，都為概率，P是根據(jù)當(dāng)前實(shí)驗(yàn)計(jì)算的概率，a是預(yù)先給

定的概率，為檢驗(yàn)水準(zhǔn)，是定

義了的小概率上限。

實(shí)驗(yàn)設(shè)計(jì)

1根據(jù)研究者是否認(rèn)為地設(shè)置處理因素，即是否給予干預(yù)措施，可將醫(yī)學(xué)研

究分為調(diào)查研究和實(shí)驗(yàn)研究?jī)深?lèi)。

1調(diào)查研究：又稱觀察件研究或非實(shí)驗(yàn)性研究,確切的說(shuō)應(yīng)是非隨機(jī)化對(duì)比

研究。它對(duì)研究對(duì)象不施加任

何干預(yù)措施，是在完全“自然狀態(tài)〃下對(duì)研究對(duì)象的特征進(jìn)行觀察、記錄，并

對(duì)觀察結(jié)果進(jìn)行描述和對(duì)比研究。

2實(shí)驗(yàn)研究：又稱干預(yù)性研究，是對(duì)研究對(duì)象人為給予干預(yù)措施的研究。

2實(shí)驗(yàn)設(shè)計(jì)的基本要素：受試對(duì)象、處理因素、實(shí)驗(yàn)效應(yīng)。

1受試對(duì)象：是處理因素作用的客體，根據(jù)受試對(duì)象不同，實(shí)驗(yàn)可以分為三

類(lèi)：動(dòng)物實(shí)驗(yàn)、臨床試驗(yàn)、現(xiàn)

場(chǎng)試驗(yàn)。

2處理因素?：是研究者根據(jù)研究目的而施加的特定的實(shí)驗(yàn)措施，又稱為受試

因素。

3實(shí)驗(yàn)效應(yīng)：是處理因素作用下，受試對(duì)象的反應(yīng)或結(jié)局，它通過(guò)觀察指標(biāo)

來(lái)體現(xiàn)。

選擇觀察指標(biāo)時(shí).應(yīng)當(dāng)注意：a客觀性：客觀指標(biāo)具有較好的真賣(mài)性和可靠

性；b精確性：包括準(zhǔn)確度和精密度兩層含義。準(zhǔn)確度指觀察值與真值的接近程

度，主要受系統(tǒng)誤差的影響。精密度指相同條件下對(duì)同一對(duì)象的同一指標(biāo)進(jìn)行重

復(fù)觀察時(shí)，觀察值與其均數(shù)的接近程度，其差值受隨機(jī)誤差的影響。c靈敏性和

特異性：指標(biāo)的靈敏度反映其檢出真陽(yáng)性的能力，靈敏度高的指標(biāo)能將處理因素

的效應(yīng)更好地顯示出來(lái)；指標(biāo)的特異度反映其鑒別真陰性的能力，特異度高的指

標(biāo)不易受混雜因素的干擾。

3實(shí)驗(yàn)設(shè)計(jì)的基本原則：對(duì)照、隨機(jī)化和重復(fù)。

⑴對(duì)照的形式：①安慰劑對(duì)照：目的：在于克服研究者、受試對(duì)象等由心

理因素導(dǎo)致的偏倚。②空臼對(duì)照：即對(duì)照組不接受任何處理，在動(dòng)物實(shí)驗(yàn)和實(shí)

驗(yàn)方法研究中最常見(jiàn)，常用于評(píng)價(jià)測(cè)量方法的準(zhǔn)確度，評(píng)價(jià)實(shí)驗(yàn)是否處于正常狀

態(tài)等。③實(shí)驗(yàn)對(duì)照；④標(biāo)準(zhǔn)對(duì)照：用現(xiàn)有標(biāo)準(zhǔn)方法或常規(guī)方法作為對(duì)照；⑤自

身對(duì)照：對(duì)照與實(shí)驗(yàn)在同一受試對(duì)象身上進(jìn)行。

（2）a隨機(jī)化體現(xiàn)在三方面：①隨機(jī)抽樣：總體中每一個(gè)體都有相同機(jī)會(huì)被抽

到樣本中來(lái)；②隨機(jī)分配：每個(gè)受試對(duì)象被分配到各組的機(jī)會(huì)相等，保證大量

難以控制的非處理因素在對(duì)比組間盡可能均衡，以提高組間的可比性；③實(shí)驗(yàn)

順序隨機(jī)：每個(gè)受試對(duì)象先后接受處理的機(jī)會(huì)相等，它使實(shí)驗(yàn)順序的影響也達(dá)到

均衡。

b在實(shí)驗(yàn)設(shè)計(jì)中常通過(guò)隨機(jī)數(shù)來(lái)實(shí)現(xiàn)隨機(jī)化。獲得隨機(jī)數(shù)的常用方法有：隨

機(jī)數(shù)字表和計(jì)算機(jī)的偽隨機(jī)數(shù)發(fā)生器。隨機(jī)數(shù)字表常用于抽樣研究及隨機(jī)分組。

C常用的兩種隨機(jī)化分組的方法：完仝隨機(jī)化和分層隨機(jī)化(配對(duì)隨機(jī)化和

區(qū)組隨機(jī)化可看成是分層隨機(jī)化的實(shí)際應(yīng)用)。

(3)重復(fù)包括三種情形：①整個(gè)實(shí)驗(yàn)的重復(fù)；②用多個(gè)受試對(duì)象進(jìn)行重復(fù)；

③同一受試對(duì)象的重復(fù)觀察。重復(fù)的主要作用：①估計(jì)變異的大小；②降低變

異大小。

4常用的實(shí)驗(yàn)設(shè)計(jì)方案：

⑴完全隨機(jī)設(shè)計(jì)(completelyrandomizeddesign)：又稱簡(jiǎn)單隨機(jī)設(shè)計(jì),是

最為常見(jiàn)的一種考察單因素兩水平或多水平效應(yīng)的實(shí)驗(yàn)設(shè)計(jì)的方法，它是采用完

全隨機(jī)分組的方法將同質(zhì)的受試對(duì)象分配到各處理組，觀察其實(shí)驗(yàn)效應(yīng)。

⑵配對(duì)設(shè)計(jì)(paireddesign)：是將受試對(duì)象按一定條件配成對(duì)子，再瘠每

對(duì)中的兩個(gè)受試對(duì)象隨機(jī)分配到不同的處理組。據(jù)以配對(duì)的因素應(yīng)為可能影響實(shí)

驗(yàn)結(jié)果的主要混雜因素。配對(duì)設(shè)計(jì)主要有以下情形：①將兩個(gè)條件相同或相近

的受試對(duì)象配成對(duì)子，通過(guò)隨機(jī)化，使對(duì)子內(nèi)個(gè)體分別接受兩種不同的處理；

②同一受試對(duì)象的兩個(gè)部分配成對(duì)子，分別速記地接受兩種不同的處理；③自

身前后配對(duì)，即同一受試對(duì)象，接受某種處理之前和接受該處理后視為配走。

⑶交叉設(shè)計(jì)(cross-overdesign)：是一種特殊的自身對(duì)照設(shè)計(jì)，它按事先設(shè)

計(jì)好的實(shí)驗(yàn)次序，在各個(gè)時(shí)期對(duì)受試對(duì)象先后實(shí)施各種處理，以比較處理組訶的

差異?；厩疤幔簜€(gè)處理方式不能相互影響，即受試對(duì)象在接受第二種處理時(shí)，

不能有前一種處理的剩余效應(yīng)。優(yōu)點(diǎn)：節(jié)約樣本含量；能夠控制個(gè)體差異和時(shí)間

對(duì)處理因素的影響，故效率較高；在臨床試驗(yàn)中，每個(gè)受試對(duì)象均接受了各種處

理，均等的考慮了每個(gè)患者的利益。進(jìn)行交叉設(shè)計(jì)應(yīng)注意：盡可能采用盲法，以

提高受試對(duì)象的依從性，避免偏倚；不宜用于具有自愈傾向或病程較短的疾病研

究。在慢性病觀察過(guò)程中，應(yīng)盡量保持條件的可比性。

⑷隨機(jī)區(qū)組設(shè)計(jì)：又稱單位設(shè)計(jì)、配伍組設(shè)計(jì)，實(shí)際上是配對(duì)設(shè)計(jì)的擴(kuò)展。

通常是將受試對(duì)象按性質(zhì)相同或相近分為b個(gè)區(qū)組（或稱單位組、配伍組），再

將每個(gè)區(qū)組中的k個(gè)受試對(duì)象隨機(jī)分配到k個(gè)處理組。設(shè)計(jì)應(yīng)遵循“區(qū)組間差別

越大越好，區(qū)組內(nèi)差別越小越好〃的原則。

⑸析因設(shè)計(jì)（factorialdesign）:a是將兩個(gè)或多個(gè)處理因素的個(gè)水平進(jìn)行組

合，對(duì)各種可能的組合都進(jìn)行實(shí)驗(yàn)，從而探討個(gè)史理因素的主效應(yīng)以及個(gè)處理因

素間的交互效應(yīng)，又稱完全交叉分組實(shí)驗(yàn)設(shè)計(jì)。所謂交互作用是指兩個(gè)或多個(gè)處

理因素間的效應(yīng)互不獨(dú)立，當(dāng)某一因素取不同水平時(shí)，另一個(gè)或多個(gè)因素的效應(yīng)

相應(yīng)的發(fā)生變化。兩因素間的交互作用為階交互作用，三因素間交互作用為二

階交互作用。

b當(dāng)觀察k個(gè)處理因素，每個(gè)因素均有m個(gè)水平時(shí)，共有mk種組合，簡(jiǎn)記

為mk析因設(shè)計(jì)。

c可獲得三方面的信息：各因素不同水平的效應(yīng)；各因素間的交互作用；通

過(guò)比較尋求最佳組合。

5樣本含量的估算：

⑴確定樣本含量的原則：在保證研究結(jié)論有一定可靠性的前提下，估算最少

需要多少受試對(duì)象。

⑵假設(shè)檢驗(yàn)所需樣本含量取決于四個(gè)要素：

1第一類(lèi)錯(cuò)誤概率a的大?。篴越小，所需樣本量越大；②第二類(lèi)錯(cuò)誤概率

B或檢驗(yàn)功效（If）的大?。?/p>

第二類(lèi)錯(cuò)誤的概率越小，檢驗(yàn)功效越大，所需樣本含量越多；③容許誤差5：

即兩總體參數(shù)的的差值，5越大，所需樣本含量越??；④總體標(biāo)準(zhǔn)差。和總體

概率71：。越大，所需樣本含量越多；總體概率71越接近50%,變異性越大，所

需樣本含量越多。

方差分析

1基本思想：把全部觀察值間的變異按設(shè)計(jì)和需要分解成兩個(gè)或多個(gè)組成部

分，然后將各部分的變異與隨機(jī)誤差進(jìn)行比較，以判斷各部分的變異是否具有統(tǒng)

計(jì)學(xué)意義。

2應(yīng)用條件：①各樣本是相互獨(dú)立的隨機(jī)樣本；②各樣本來(lái)自正態(tài)總體；

③各處理組總體方差相等，即方差齊性。

3任何設(shè)計(jì)方案的SS總和v總算法均相同，即在不考慮數(shù)據(jù)按任何方向分

組的情況下，將所有數(shù)據(jù)看成一個(gè)整體計(jì)算，即SS忌=(N-1)S2,

v總:N-lo

兒種設(shè)計(jì)方案中SS總和v總的分解：

設(shè)計(jì)方案SS總的分解v總

完全隨機(jī)設(shè)計(jì)SS總:SS組間+SS組內(nèi)v總=v組間+v組內(nèi)

隨機(jī)區(qū)組設(shè)計(jì)SS總二SS處理+SS區(qū)組+SS誤差v總:v處理+v區(qū)組+v誤差

析因設(shè)計(jì)55總=55處理+55誤差v3K處理+V誤差

=(SSA+SSB+SSAB)+SS誤差=(vA+vB+vAB)+v誤差

重復(fù)測(cè)量設(shè)計(jì)(兩因素)ss^=ss受試對(duì)象間+SS受試對(duì)象內(nèi)丫總=丫受試

對(duì)象間+v受試對(duì)象內(nèi)

=（SS處理+SS個(gè)體間誤差）+=（v處理+v個(gè)體間誤差）+

（SS時(shí)間+SS處理與時(shí)間交互+SS個(gè)體內(nèi)誤差）（v時(shí)間+v處理與時(shí)間交互

+v個(gè)體內(nèi)誤差）

4重復(fù)測(cè)量資料和隨機(jī)區(qū)組設(shè)計(jì)資料的區(qū)別:①同一受試對(duì)象在不同時(shí)間點(diǎn)

的數(shù)據(jù)高度相關(guān)；②重復(fù)測(cè)量資料中的處理因素在受試對(duì)象（看成區(qū)組）間為

隨機(jī)分配，但受試對(duì)象（看成區(qū)組）內(nèi)的各時(shí)間點(diǎn)是固定的，不能隨機(jī)分配。隨

機(jī)區(qū)組設(shè)計(jì)資料中每個(gè)區(qū)組內(nèi)的受試對(duì)象彼此獨(dú)立，處理只在區(qū)組內(nèi)隨機(jī)分配，

同一區(qū)組內(nèi)的受試對(duì)象接受的處理各不相同。

5重復(fù)測(cè)量資料方差分析的前提條件：①各樣本是相互獨(dú)立的隨機(jī)樣本；

②各樣本來(lái)自正態(tài)總體；③各處理組總體方差相等，即方差齊性；④需滿足協(xié)

方差陣的球形性或復(fù)合對(duì)稱性。

6多各樣本均數(shù)的兩兩比較方法：①未計(jì)劃的每?jī)蓚€(gè)均數(shù)的事后比較，常用

SNK-q檢驗(yàn)；②計(jì)劃好的某些均數(shù)間的兩兩比較，常用Dunnett-t檢驗(yàn)；

③Bonferroni法和sidak法適用于所有的兩兩比較。

方差分析后不能作兩兩比較的t檢驗(yàn)的原因：會(huì)增加犯一類(lèi)錯(cuò)誤的概率。如

果比較次數(shù)為k,每次檢驗(yàn)水準(zhǔn)為a,則犯一類(lèi)錯(cuò)誤的累積概率為1-（1-a）k,

高于原有的a。

7數(shù)據(jù)變換的目的：①使各組達(dá)到方差齊性；②使資料轉(zhuǎn)換為正態(tài)分布，

以滿足方差分析和t檢驗(yàn)的應(yīng)用條件。通常情況下，一種適當(dāng)?shù)暮瘮?shù)轉(zhuǎn)換可使上

述兩個(gè)目的同時(shí)達(dá)到。③曲線直線化。常用于曲線擬合。常用的數(shù)據(jù)變換有對(duì)

數(shù)變換、平方根變換、平方根反正弦變換。

8方差分析中的F檢驗(yàn)是單側(cè)檢驗(yàn)的原因：方差分析中檢驗(yàn)統(tǒng)計(jì)量F的計(jì)算

通常是用某部分的均方（如處理因素，交互效應(yīng)等）除以誤差的均方，其中分母

誤差部分盡含隨機(jī)因素作用，分子某部分的均方含有相應(yīng)處理因素或交互作用的

效應(yīng)，而且還含有隨機(jī)因素的作用，因此得F值從理論上應(yīng)21,不會(huì)小于1,所

以方差分析中F檢驗(yàn)是單側(cè)檢驗(yàn)。

X2檢驗(yàn)

1X2檢驗(yàn)用途：常用于分類(lèi)變量資料的統(tǒng)計(jì)推斷，主要用途包括：①單樣

本分布的擬合優(yōu)度；②比較兩個(gè)或多個(gè)獨(dú)立樣本頻率分布；③比較配對(duì)設(shè)計(jì)兩

樣本頻率和兩頻率分布；④推斷兩個(gè)變量或特征之間有無(wú)關(guān)聯(lián)性。

2X之檢驗(yàn)的理論基礎(chǔ)是X2分布和擬合優(yōu)度檢驗(yàn)。

Q）/分布①是一種連續(xù)型隨機(jī)變量的概率分布，按分布的密度函數(shù)可給出

自由度二1,2,3,......的一簇分布曲線。②》2分布形狀完全依賴于自由度v的

大小，當(dāng)v>l時(shí)，隨著v的增加，曲線逐漸趨于對(duì)稱；當(dāng)自由度v趨于8時(shí)2

分布逼近正態(tài)分布。

⑵擬合優(yōu)度檢驗(yàn)是根據(jù)樣本的頻率分布檢驗(yàn)其總體分布是否等于給定的理

論分布。

3X2檢驗(yàn)的基本思想是：用統(tǒng)計(jì)量度量實(shí)際頻數(shù)和理論頻數(shù)之間的偏離程

之（4-兀）2

度，永遠(yuǎn)是正值，/2檢驗(yàn)統(tǒng)計(jì)量的基本公式是：*2=仁1「,v=k-l-s,

s是用樣本估計(jì)量代替總體參數(shù)的個(gè)數(shù)。若假設(shè)成立，則各格子的實(shí)際頻數(shù)與理

論頻數(shù)相差不應(yīng)該很大，因而算出的X2值也不會(huì)很大，即出現(xiàn)較大值的概率

P很小。若P《a,則認(rèn)為A與T的差別已超出了抽樣誤差允許的范圍，拒絕H0。

若P>a,不拒絕HOo

4獨(dú)立樣本2x2列聯(lián)表資料的檢驗(yàn):

HO：兩總體率相等；Hl：兩總體率不等。

y(4一7)2

lnN40且Tmin25,%嚏/^7,

(nd-bc))

產(chǎn)二(alb)(3d)(o+c)(b+d),v=1;

yi(|4T-0.5)2

2n240且1WTV5,校正公式：2*=乙7，

{\ad-bc\-n/2)2n

%2=(a+b)(c+d)(a+c)(b+d),v=i;

3nV40或TV1,或P=a時(shí)，F(xiàn)isher精確概率法。

5獨(dú)立樣本RxC列聯(lián)表資料的￥?檢驗(yàn)：(多個(gè)獨(dú)立樣本率、獨(dú)立樣本頻率

分布的比較)

H0：多個(gè)總體率相等；H1：多個(gè)總體率不等。

[yAicJ

-二rA乙"刖C/,v=(R-l)(C-l)

要求：理論頻數(shù)不宜太小，一般不宜有1/5以上的格子的理論頻數(shù)小于5,

或不宜有一個(gè)理論頻數(shù)小于1，否則可能會(huì)產(chǎn)生偏性。如果不滿足此要求，處理

方法有：①增加樣本含量(首選)；②結(jié)合專(zhuān)業(yè)知識(shí)考慮是否可以將該格所在

行或列與別的行和列合并，要根據(jù)樣本特性來(lái)確定，但會(huì)損失信息；③改用RxC

表Fisher精確概率法，可以用計(jì)算機(jī)軟件實(shí)現(xiàn)。

RxC列聯(lián)表的分割:

①多個(gè)實(shí)驗(yàn)組間的兩兩比較：分析目的為k個(gè)實(shí)驗(yàn)組間，任兩個(gè)率均進(jìn)行

比較時(shí)，須進(jìn)行‘,

次獨(dú)立的四格表/2檢驗(yàn)，再加上總的行x列表資料的片2檢

驗(yàn)，共次檢驗(yàn)假設(shè)。故檢驗(yàn)水準(zhǔn)a用下式估計(jì)：a=(>)+1,

(力)=2!(〃-2)!,k為樣本率的個(gè)數(shù)。②實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較：分

析目的為各實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較，而各實(shí)驗(yàn)組間不須比較。其檢驗(yàn)水準(zhǔn)

口’用下式估計(jì):。=2(h1)。

6配對(duì)設(shè)計(jì)資料的X2檢驗(yàn)：

⑴配對(duì)2x2列聯(lián)表資料的X2檢驗(yàn)(兩種處理方法陽(yáng)性率的比較)：

H0：兩總體陽(yáng)性率相等；H1：兩總體陽(yáng)性率不等。

QT)?(bi)?

；②當(dāng)時(shí)，校

,ET=b+cfv=lb+c<40

(|b-c|-l)2

正公式/2二b+c,v=lo

⑵配對(duì)RxR列聯(lián)表資料的12檢驗(yàn):

H0：兩變量的概率分布相同；H1：兩變量的概率分布不相同。

(%一叫尸

%+叫一24〃

T=/=1v=k-lo

基于秩次的非參數(shù)檢驗(yàn)

1假設(shè)檢驗(yàn)的方法有：參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。

①參數(shù)檢驗(yàn)：是以特定的總體分布為前提，對(duì)未知的總體參數(shù)做推斷的假

設(shè)檢驗(yàn)方法統(tǒng)稱為如t檢驗(yàn)和

方差分析。

②非參數(shù)檢驗(yàn)：不以特定的總體分布為前提，也不針對(duì)決定總體分布的幾

個(gè)參數(shù)做推斷，進(jìn)行的是分布之間的檢驗(yàn)。一般不直接用樣本觀察值做分析，統(tǒng)

計(jì)量的計(jì)算基于原數(shù)據(jù)在整個(gè)樣本中按大小所占位次。由于丟棄了觀察值的具體

數(shù)據(jù)，只保留了大小次序的信息，凡適合參數(shù)檢驗(yàn)的資料，應(yīng)首選參數(shù)檢驗(yàn)。

2非參數(shù)檢驗(yàn)適用于：①有序變量資料；②總體分布類(lèi)型不明的資料；(3)

分布不對(duì)稱且無(wú)法轉(zhuǎn)化為正態(tài)分布資料；④對(duì)比組間方差不齊，有無(wú)適當(dāng)變換

方法達(dá)到方差齊性的資料；⑤一端或兩端觀察值不確切的資料；⑥等級(jí)資料。

3wilcoxon符號(hào)秩(和)檢驗(yàn)：

⑴目的：可用于推斷總體中位數(shù)是否等于某個(gè)指定值，還可以推斷配對(duì)樣本

差值的總體中位數(shù)是否為0。①單樣本資料的符號(hào)秩檢驗(yàn)常用于不滿足t檢驗(yàn)條

件的單樣本定量變量資料的比較。②配對(duì)設(shè)計(jì)資料的符號(hào)秩和檢驗(yàn)：由檢驗(yàn)配

對(duì)樣本的差值是否來(lái)自中位數(shù)為。的總體，來(lái)推斷兩個(gè)總體中位數(shù)是否相等，即

兩種處理效應(yīng)是否相同。Wilcoxon配對(duì)符號(hào)秩和檢驗(yàn)基本思想：在配對(duì)樣本中，

假定兩種處理效果相同，則差值的總體分布為對(duì)稱分布，并且差值的總體中位數(shù)

為0。若假設(shè)成立，樣本差值的正秩和與負(fù)秩和應(yīng)相差不大，均接近n(n+l)/4；

當(dāng)正負(fù)秩和相差懸殊，超出抽樣誤差可解釋的范圍時(shí)，則有理由懷疑該假設(shè)，從

而拒絕HOo

⑵方法要點(diǎn)：①按差值絕對(duì)值從小到大編秩，差值為正的秩和以T+表示，

為負(fù)的秩和以T-表示，任取T+(或T-)作為檢驗(yàn)統(tǒng)計(jì)量T,查T(mén)界值表確定P

值；②正態(tài)近似法：隨著n的增大，T分布逼近均數(shù)為n(n+1)/4,方差為n

(n+1)(2n+l)/24的正態(tài)分布。當(dāng)n>50,用Z檢驗(yàn)。

③注意事項(xiàng)：①編秩時(shí)遇差值為0舍去，n隨之減??；遇有差值的絕對(duì)值

相等，符號(hào)相同，仍按順序編秩；符號(hào)不同，取其平均秩次；②T++T-=n(n+1)

4wilcoxon秩和檢驗(yàn):

Q)目的是推斷連續(xù)型變量資料或有序變量資料的兩個(gè)獨(dú)立樣本代表的兩個(gè)

總體分布是否有差別。

⑵方法要點(diǎn)：①將兩組數(shù)據(jù)由小到大同一編秩，以樣本列數(shù)小者為nl,其

秩和為T(mén),查T(mén)界值表確定P值；②正態(tài)近似法：當(dāng)nl>10或n2-nl>10時(shí)，T

分布接近均數(shù)為nl(N+1)/2,方差為nlr)2(N+1)/2的正態(tài)分布，可用Z檢

驗(yàn)。

⑶注意事項(xiàng)：①編秩中若有相同的數(shù)據(jù)在同一組則依次編秩；若相同數(shù)值

在不同組內(nèi)，求平均秩次；②當(dāng)相持出現(xiàn)較多時(shí)(超過(guò)25%),需使用校正公

式。

⑷基本思想：假設(shè)含量為nl與n2的兩個(gè)樣本(且nl"2)，來(lái)自同一總體

或分布相同的兩個(gè)總體，則nl樣本的秩和T1與其理論秩和nl(N+D/2相差不

大，即［T-nl(N+1)/2］僅為抽樣誤差所致。當(dāng)二者相差懸殊，超出抽樣誤差可

解釋的范圍時(shí)，則有理由懷疑該假設(shè)，從而拒絕H0。

5Kruskal-WallisH檢驗(yàn)：

⑴目的：用于推斷定量變量或有序分類(lèi)變量的多個(gè)總體分布有無(wú)差別。

⑵方法要點(diǎn)：①先將k組數(shù)據(jù)由小到大同一編秩，求出各組秩和Ri,計(jì)算檢

驗(yàn)統(tǒng)計(jì)量H；②當(dāng)組數(shù)k=3,且各組例數(shù)ni三時(shí)，查H界值表確定P值；若k23

或最小樣本例數(shù)大于5,則H統(tǒng)計(jì)量近似服從v=k-l的12分布。

⑶注意事項(xiàng)：①編秩中若有相同的數(shù)據(jù)在同一組則依次編秩；若相同數(shù)值

在不同組內(nèi)，求平均秩次：②當(dāng)相持出現(xiàn)較多時(shí)(超過(guò)25%),需使用校正公

式；③當(dāng)結(jié)論為拒絕HO,認(rèn)為多組處理效應(yīng)不全相同時(shí)，常需進(jìn)一步作多個(gè)樣

木的兩兩比較的秩和檢驗(yàn)。

兩變量關(guān)聯(lián)性分析

1相關(guān)系數(shù)的意義及計(jì)算：

x和y的協(xié)方差

相關(guān)系數(shù)4行前方差）（丫的方差）。

①總體相關(guān)系數(shù)P，若"0,稱X和Y線性相關(guān)；若p=0,則簡(jiǎn)稱X和Y不

相關(guān)。樣本協(xié)方差是離均差乘積在樣本中的平均，離均差在總體中的平均就是總

體協(xié)方差。

2(X㈤("7)

②樣本相關(guān)系數(shù),是兩個(gè)隨

機(jī)變量之間線性相關(guān)強(qiáng)度和方向的統(tǒng)計(jì)量，沒(méi)有單位，取值范圍為「的

正負(fù)值表示兩變量間線性相關(guān)的方向，r>0為正相關(guān)，r<0為負(fù)相關(guān)，r=0為零相

關(guān)。r的絕對(duì)值大小表示兩變量之間線性相關(guān)的密切程度，I”越接近于1,密

切程度越高;越接近于。，密切程度越低。

2相關(guān)系數(shù)的統(tǒng)計(jì)推斷：

建立建設(shè)：HO：p=0：Hl：p/O,并假定X和Y服從二元正態(tài)分布。

方法：①直接查相關(guān)系數(shù)臨界值表，根據(jù)自由度v=n-2,差臨界值表，比較

"I與臨界值，統(tǒng)計(jì)量越大，概率P越小；統(tǒng)計(jì)量越小，概率P越大。②t檢

r-0Jl-r2

驗(yàn)：統(tǒng)計(jì)量為tr=Sr,Sr為樣本相關(guān)系數(shù)r的標(biāo)準(zhǔn)誤，SrJn^2,H0成立

時(shí)，機(jī)服從自由度為v=n-2的t分布。以上兩種方法的決策規(guī)則相同：若P>0.05,

不拒絕零假設(shè)，即認(rèn)為兩個(gè)變量間無(wú)相關(guān)性；若P<0.05,拒絕冬假設(shè)，接受備擇

假設(shè)，即認(rèn)為兩變量間相關(guān)性有統(tǒng)計(jì)學(xué)意義。

3相關(guān)分析應(yīng)注意的問(wèn)題：①進(jìn)行相關(guān)分析前，應(yīng)先繪制散點(diǎn)圖。只有散點(diǎn)

有線性趨勢(shì)時(shí)，才能進(jìn)行直線相關(guān)分析。②線性相關(guān)分析要求兩個(gè)變量都是隨

機(jī)變量，而且僅適用于二元正態(tài)分布資料；③出現(xiàn)離群值慎用相關(guān)；④相關(guān)關(guān)

系不一定是因果關(guān)系；⑤分層資料盲目合并易出現(xiàn)假象；⑥樣本的相關(guān)系數(shù)接

近零并不意味著兩變量間一定無(wú)相關(guān)性，布?可能是非線性的曲線關(guān)系。

￡(p-p)

4秩相關(guān)系數(shù)的計(jì)算:

-l<r5<lo適用于條件：①不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析的資料;

②總體分布型未知的資料；③用等級(jí)表示的原始資料；④分布端點(diǎn)無(wú)確定數(shù)值

的資料；⑤用相對(duì)數(shù)表示的資料。

5秩相關(guān)系數(shù)的統(tǒng)計(jì)推斷：HO：ps=O：Hl：psxO,a=0.05,當(dāng)n450時(shí)，查

附表14的rs界值表；當(dāng)n>50時(shí)，計(jì)算檢驗(yàn)統(tǒng)計(jì)量u,查t界值表。

6分類(lèi)資料的關(guān)聯(lián)性分析：

⑴對(duì)兩個(gè)定量變量的關(guān)聯(lián)性，可用Pearson積矩相關(guān)系數(shù)或秩相關(guān)系數(shù)來(lái)描

述；對(duì)兩個(gè)分類(lèi)變量，通常是

先根據(jù)交叉分類(lèi)計(jì)數(shù)所得的列聯(lián)表進(jìn)行兩種屬性獨(dú)立性的才、僉驗(yàn)，然后計(jì)

算關(guān)聯(lián)系數(shù)。關(guān)于兩個(gè)分類(lèi)變量關(guān)聯(lián)的程度，用Pearson列聯(lián)系數(shù)來(lái)描述：

r=+〃，列聯(lián)系數(shù)r取值范圍在。?1之間。。表示完全獨(dú)立；1表示完全相

關(guān)；愈接近于0,關(guān)系愈不密切；愈接近于1，關(guān)系愈密切。【對(duì)兩個(gè)反映屬性

的分類(lèi)變量，若有一份隨機(jī)樣本，可做交叉分類(lèi)的頻數(shù)表，利用關(guān)于獨(dú)立性的力

檢驗(yàn)和列聯(lián)系數(shù)來(lái)描述兩變量的關(guān)聯(lián)性】

￥(4一7)2

⑵交叉分類(lèi)2x2表的關(guān)聯(lián)分析：X吆乙T(3)2X2配對(duì)資料的關(guān)聯(lián)

(od-bc)2〃

性分析：*40且Tmin25/2=(°+b)(c+d)(n+c)(b+d)；11240且1<T

(一〃/2)2〃

<5,

2\Lanm]

⑷RxC表分類(lèi)資料的美聯(lián)性分析：X=nKc，每格的T>1且

T<5的格子數(shù)不宜多于格子總數(shù)的1/5o

簡(jiǎn)單回歸分析

1回歸方程：Y=a+bX,b=E(x-x)jxx2線性回歸模型的適

用條件：①線性：因變量Y與自變量X稱線性關(guān)系；②獨(dú)立：每個(gè)個(gè)體觀察值

之間互相獨(dú)立；③正態(tài)性：任意給定X值，對(duì)應(yīng)的隨機(jī)變量Y都服從正態(tài)分布;

④等方差性：在一定范圍內(nèi)不同的X值所對(duì)應(yīng)的隨機(jī)變量Y的方差相等。簡(jiǎn)記

為L(zhǎng)INEo

3總體回歸系數(shù)B的統(tǒng)計(jì)推斷：總體回歸系數(shù)。是否為0的假設(shè)檢驗(yàn)，可用

方差分析或t檢驗(yàn)。

4決定系數(shù)反映了回歸平方和在總平和中所占的比例，常用來(lái)反映回歸的實(shí)

際效果。

5線性回歸的應(yīng)用：①用于計(jì)算總體條件均數(shù)的置信區(qū)間以及總體回歸線的

置信帶；②用于計(jì)算個(gè)體Y預(yù)測(cè)值及其預(yù)測(cè)區(qū)間。線性回歸常用于統(tǒng)計(jì)預(yù)測(cè)和

統(tǒng)計(jì)推斷。

6線性回歸與線性相關(guān)的區(qū)別與聯(lián)系：

⑴區(qū)別：

①單位：相關(guān)系數(shù)r沒(méi)有單位，回歸系數(shù)b有單位；所以，相關(guān)系數(shù)與單

位無(wú)關(guān)，回歸系數(shù)與單位有關(guān)；

②應(yīng)用目的：說(shuō)明兩變量間的關(guān)聯(lián)性用相關(guān)分析，說(shuō)明兩者依存變化的數(shù)

量關(guān)系則用回歸分析?；

③對(duì)資料的要求不

人人文庫(kù)> 全部分類(lèi)> 教育資料 > 輔導(dǎo)培訓(xùn)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

衛(wèi)生統(tǒng)計(jì)學(xué)資料

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

衛(wèi)生統(tǒng)計(jì)學(xué)資料

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔