衛(wèi)生統(tǒng)計(jì)學(xué)資料_第1頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)資料_第2頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)資料_第3頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)資料_第4頁(yè)
衛(wèi)生統(tǒng)計(jì)學(xué)資料_第5頁(yè)
已閱讀5頁(yè),還剩62頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

衛(wèi)生統(tǒng)計(jì)學(xué)資料(精心整理)

統(tǒng)計(jì)工作基本步驟:統(tǒng)計(jì)設(shè)計(jì)(調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì))、資料分析{收集資

料、整理資料、分析資料【統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷(參數(shù)估計(jì)和假設(shè)檢驗(yàn))】。

★統(tǒng)計(jì)推斷:是利用樣本所提供的信息來(lái)推斷總體特征,包括:參數(shù)估計(jì)和

假設(shè)檢驗(yàn)。a參數(shù)估計(jì)是指利

用樣本信息來(lái)估計(jì)總體參數(shù),主要有點(diǎn)估計(jì)[把樣本統(tǒng)計(jì)量直接作為總體參

數(shù)估計(jì)值)和區(qū)間估計(jì)【按預(yù)先設(shè)定的可信度(l-a),來(lái)確定總體均數(shù)的所在

范圍】。b假設(shè)檢驗(yàn):是以小概率反證法的邏輯推理來(lái)判斷總體參數(shù)間是否有質(zhì)

的區(qū)別。

變量資料可分為定性變量、定量變量。不同類(lèi)型的變量可以進(jìn)行轉(zhuǎn)化,通常

是由高級(jí)向低級(jí)轉(zhuǎn)化。

資料按性質(zhì)可分為計(jì)量資料、計(jì)數(shù)資料和等級(jí)資料。

定量資料的統(tǒng)計(jì)描述

1頻率分布表和頻率分布圖是描述計(jì)量資料分布類(lèi)型及分布特征的方法。離

散型定量變量的頻率分布圖可用直條圖表達(dá)。

2頻率分布表(圖)的用途:①描述資料的分布類(lèi)型;②描述分布的集中

趨勢(shì)和離散趨勢(shì);③便于發(fā)現(xiàn)一些特大和特小的可疑值;④便于進(jìn)一步的統(tǒng)計(jì)

分析和處理;⑤當(dāng)樣本含量足夠大時(shí),以頻率作為概率的估計(jì)值。

★3集中趨勢(shì)和離散趨勢(shì)是定量資料中總體分布的兩個(gè)重要指標(biāo)。

(1)描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo):平均數(shù)(算術(shù)均數(shù)、幾何均數(shù)和中位數(shù))、

百分位數(shù)(是一種位置參數(shù),用于確定醫(yī)學(xué)參考值范圍,P50就是中位數(shù))、眾

數(shù)。算術(shù)均數(shù):適用于對(duì)稱分布資料,特別是正態(tài)分布資料或近似正態(tài)分布資料;

幾何均數(shù):對(duì)數(shù)正態(tài)分布資料(頻率圖一般呈正偏峰分布)、等比數(shù)列;中位數(shù):

適用于各種分布的資料,特別是偏峰分布資料,也可用于分布末端無(wú)確定值得資

料。

(2)描述離散趨勢(shì)的指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系

數(shù)。四分位數(shù)間距:適用于各種分布的資料,特別是偏峰分布資料,常把中位數(shù)

和四分位數(shù)間距結(jié)合起來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì)。方差和標(biāo)準(zhǔn)差:都適

用于對(duì)稱分布資料,特別對(duì)正態(tài)分布資料或近似正態(tài)分布資料,常把均數(shù)和標(biāo)準(zhǔn)

差結(jié)合起來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì);變異系數(shù):主要用于量綱不同時(shí),

或均數(shù)相差較大時(shí)變量間變異程度的比較。

標(biāo)準(zhǔn)差的應(yīng)用:①表示變量分布的離散程度;②結(jié)合均數(shù)計(jì)算變異系數(shù)、

描述對(duì)稱分布資料;③結(jié)合樣本含量計(jì)算標(biāo)準(zhǔn)誤。

定性資料的統(tǒng)計(jì)描述

1定性資料的基礎(chǔ)數(shù)據(jù)是絕對(duì)數(shù)。描述一組定性資料的數(shù)據(jù)特征,通常需要

計(jì)算相對(duì)數(shù)。定性變量可以通過(guò)頻率分布表描述其分布特征。

2常用相對(duì)數(shù)類(lèi)型:頻率型、強(qiáng)度型和相對(duì)比型指標(biāo)。

指標(biāo)頻率型指標(biāo)強(qiáng)度型指標(biāo)相對(duì)比型指標(biāo)

單位時(shí)間內(nèi)某現(xiàn)兩個(gè)有關(guān)聯(lián)的指

概念近似反映某一時(shí)間出現(xiàn)概率

象的發(fā)生頻率標(biāo)A和B之比

某事件發(fā)生的個(gè)體數(shù)1某事件發(fā)生的個(gè)體數(shù)1

計(jì)算公式_______________xk__________________XKA/B

可能發(fā)生某事件的個(gè)體數(shù)觀察人日數(shù)總計(jì)

有無(wú)量綱無(wú)有可有、可無(wú)

取值范圍[0,1]可大于1無(wú)限制

表示相對(duì)于

大樣本時(shí)作為概率近似值的一個(gè)單位,

頻率強(qiáng)度,即概率BA

本質(zhì)有多少個(gè)單位

強(qiáng)度的近似值

分子式分母的一部分

A和B可以

是絕對(duì)數(shù)、相對(duì)

數(shù)和平均數(shù)

A和B的量

綱可相同也可不

A和B互不

包含

相對(duì)比:A、B兩指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)。最常見(jiàn)的相對(duì)比是

人口學(xué)中的男女性別比,流行病學(xué)中的相對(duì)危險(xiǎn)度RR=P1/P0也是相對(duì)比指標(biāo)。

3應(yīng)用相對(duì)數(shù)應(yīng)該注意:①防止概念混淆,避免以比代率的錯(cuò)誤現(xiàn)象;②

計(jì)算相對(duì)數(shù)時(shí)分母應(yīng)有足夠數(shù)量,如果例數(shù)較少會(huì)使相對(duì)數(shù)波動(dòng)較大,應(yīng)該使用

絕對(duì)數(shù);③正確的計(jì)算頻率(或強(qiáng)度)指標(biāo)的合計(jì)值。當(dāng)分組的資料需要合并

起來(lái)估計(jì)頻率(或強(qiáng)度)時(shí),應(yīng)將各組頻率的分子相加作為合并估計(jì)的分子,各

組的分母相加作為合并估計(jì)的分母;④頻率型指標(biāo)的解釋要緊扣總體和屬性;

⑤相對(duì)數(shù)間比較要具備可比性:要注意觀察對(duì)象是否同質(zhì)、研究方法是否相同、

觀察時(shí)間是否一致、觀察對(duì)象內(nèi)部結(jié)構(gòu)是否一致、對(duì)比不同時(shí)期資料應(yīng)注意客觀

條件是否相同;⑥正確進(jìn)行相對(duì)數(shù)的統(tǒng)計(jì)推斷:在隨機(jī)抽樣的情況下,從樣本

估計(jì)值推斷總體相對(duì)數(shù)應(yīng)該考慮抽樣誤差,因此要進(jìn)行參數(shù)估計(jì)和假設(shè)檢驗(yàn)。

4醫(yī)學(xué)人口統(tǒng)計(jì)資料主要來(lái)源為日常工作記錄(報(bào)告單、卡、冊(cè))、統(tǒng)計(jì)報(bào)

表、人口調(diào)查(普查和抽樣調(diào)查)。

5描述人口學(xué)特征的常用指標(biāo)一般有人口總數(shù)和反映人口學(xué)基本特征的某

些指標(biāo)。人口學(xué)的基本特征包括性別、年齡、文化、職業(yè)等,最常用來(lái)描述人口

結(jié)構(gòu)的是性別和年齡。人口學(xué)特征指標(biāo):老年人口系數(shù)、少兒人口系數(shù)、負(fù)擔(dān)系

數(shù)、老少比、性別比。

6有關(guān)生育的常用指標(biāo)有出生率、生育率和人口再生產(chǎn)指標(biāo)。測(cè)量生育水平

的統(tǒng)計(jì)指標(biāo):粗出生率、總生育率、年齡別生育承、總和生育率。測(cè)量人口再生

育的統(tǒng)計(jì)指標(biāo):自然增長(zhǎng)率、粗再生率和凈再生率。

7常用的死亡統(tǒng)計(jì)指標(biāo)有:粗死亡率、年齡別死亡率、嬰兒死亡率、新生兒

死亡率、圍生兒死亡率、死因別死亡率、某病病死率和死因構(gòu)成等。

8疾病統(tǒng)計(jì)資料主要來(lái)源于:疾病報(bào)告和報(bào)表材料、醫(yī)療衛(wèi)生工作記錄、疾

病專(zhuān)題調(diào)查資料。

9⑴標(biāo)準(zhǔn)化:兩個(gè)率或多個(gè)率之間進(jìn)行比較時(shí),為消除內(nèi)部構(gòu)成不同的影響,

采用統(tǒng)一的標(biāo)準(zhǔn),對(duì)兩組或多組資料進(jìn)行校正(調(diào)整),計(jì)算得到標(biāo)準(zhǔn)化率后再

做比較的方法,稱為其目的是統(tǒng)一內(nèi)部構(gòu)成,消除混雜因素,是資料具有可

比性。

⑵應(yīng)用標(biāo)準(zhǔn)化法的注意事項(xiàng):

1標(biāo)準(zhǔn)化法的應(yīng)用范圍很廣。當(dāng)某個(gè)分類(lèi)變量在兩組中分布不同時(shí),這兩個(gè)

分類(lèi)變量就成為兩組頻率比較

的混雜因素,標(biāo)準(zhǔn)化的目的是消除混雜因素。

2標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率,已經(jīng)不再反映當(dāng)時(shí)當(dāng)?shù)氐膶?shí)際水平,只表示相互比

較的資料間的相對(duì)水平。

3標(biāo)準(zhǔn)化法實(shí)質(zhì)是找一個(gè)標(biāo)準(zhǔn),使兩組得意在一個(gè)共同的平臺(tái)上進(jìn)行比較。

選擇不同的標(biāo)準(zhǔn).算出的標(biāo)準(zhǔn)

化率也會(huì)不同,比較的結(jié)果也未必相同,因此報(bào)告比較結(jié)果時(shí)必須說(shuō)明所選

用的標(biāo)準(zhǔn)和理由

④兩樣本標(biāo)準(zhǔn)化率是樣本值,存在抽樣誤差。比較兩樣本標(biāo)準(zhǔn)化率,當(dāng)樣

本含量較小時(shí),還應(yīng)作假設(shè)檢驗(yàn)。10常用的動(dòng)態(tài)數(shù)列分析指標(biāo)有:絕對(duì)增長(zhǎng)量、

發(fā)展速度與增長(zhǎng)速度、平均發(fā)展速度與平均增長(zhǎng)速度。

(1)絕對(duì)增長(zhǎng)量:是說(shuō)明事物在一定時(shí)期增長(zhǎng)的絕對(duì)值,可分為:累計(jì)增

長(zhǎng)量(報(bào)告期指標(biāo)與基線期指標(biāo)之差)和逐年增長(zhǎng)量(報(bào)告期指標(biāo)與前一期指標(biāo)

之差)。

(2)發(fā)展速度與增長(zhǎng)速度:均為相對(duì)比,說(shuō)明事物在一定時(shí)期的變化,可

計(jì)算定基比(即報(bào)告期指標(biāo)與基線期指標(biāo)的比:an/aO)和環(huán)比(報(bào)告期指標(biāo)與

其前一期指標(biāo)之比:增長(zhǎng)速度表示的是凈增長(zhǎng)速度,增長(zhǎng)速度;發(fā)展

an/an-1)o

速度-100%。

(3)平均發(fā)展速度與平均增長(zhǎng)速度:用于概括某現(xiàn)象在一段時(shí)期中的平均

變化。平均發(fā)展速度是發(fā)展速度的幾何平均數(shù),平均發(fā)展速度='平均增長(zhǎng)

速度;平均發(fā)展速度-100%。

11統(tǒng)計(jì)表和統(tǒng)計(jì)圖是描述資料特征、呈現(xiàn)統(tǒng)計(jì)分析結(jié)果的重要工具。統(tǒng)計(jì)

表結(jié)構(gòu)標(biāo)題、標(biāo)目、線條、數(shù)字和備注。

12常用統(tǒng)計(jì)圖用途:①條圖:適用于相互獨(dú)立的資料(資料有明確分組、

不連續(xù));②百分條圖、圓圖適用于構(gòu)成比資料;③線圖適用于連續(xù)性資料,

表達(dá)事物的動(dòng)態(tài)變化(絕對(duì)差值);半對(duì)數(shù)線圖適用于連續(xù)性資料,表達(dá)事物的

發(fā)展速度(相對(duì)比);④直方圖用于描述連續(xù)變量的頻數(shù)分布;⑤散點(diǎn)圖適用

于雙變量資料,用點(diǎn)的排列趨勢(shì)和密集度表示兩變量的相關(guān)關(guān)系。

常用概率分布

1正態(tài)分布(連續(xù)型隨機(jī)變量的概率分布)

(1)正態(tài)概率密度曲線特點(diǎn):①關(guān)于X=H對(duì)稱;②在x=u處取得該概率

密度函數(shù)的最大值,在x二n±。處有拐點(diǎn);③曲線下面積為1;④正態(tài)分布有兩

個(gè)參數(shù):位置參數(shù)口(決定曲線在橫軸上的位置)和變異參數(shù)。(決定曲線的形

狀);⑤H±1.64O面積為90%,口±1.96。面積為95%,口±2.58。面積為99%。

(2)Z變換與標(biāo)準(zhǔn)正態(tài)分布:對(duì)于任意一個(gè)服從正態(tài)分布N(山02)的隨

機(jī)變量,可作Z變:Z=O,變換后的Z值仍然服從正態(tài)分布,且其總體為數(shù)

為0、總體標(biāo)準(zhǔn)差為L(zhǎng)稱此為標(biāo)準(zhǔn)正態(tài)分布,用N(0,1)表示。①(z)為標(biāo)準(zhǔn)

正態(tài)分布Z變量的累積面積,-8fZ的面積,即下側(cè)累計(jì)面積。

★(3)正態(tài)分布的應(yīng)用:①確定醫(yī)學(xué)參考值范圍:是指特定的“正常〃人群

(排除了對(duì)所研究的指標(biāo)有影響的的疾病和有關(guān)因素的特定人群)的解剖、生理、

生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個(gè)體的取值所在范圍,習(xí)慣用該人

群的95%的個(gè)體某項(xiàng)醫(yī)學(xué)指標(biāo)的取值范圍作為該指標(biāo)的醫(yī)學(xué)參考值范圍。方法:

a百分位數(shù)法:適用于任何分布類(lèi)型的資料;b正態(tài)分布法。②質(zhì)量控制圖:如

果某一波動(dòng)僅僅由個(gè)體差異或隨機(jī)測(cè)量誤差所致,那么觀察結(jié)果服從正態(tài)分布。

控制圖共有7條水平線,中心線位于總體均數(shù)口處,警戒限位于吐2。處,控制

限位于葉3。處,此外還有兩條位于葉。處。

★(4)確定醫(yī)學(xué)參考值的步驟:①?gòu)摹ㄕH恕傮w中抽樣,明確研究總體;

②用統(tǒng)一和準(zhǔn)確的方法測(cè)定相應(yīng)的指標(biāo);③根據(jù)不同的用途選定適當(dāng)?shù)陌俜纸?/p>

限,常用95%;④根據(jù)此指標(biāo)的實(shí)際意義,決定單側(cè)范圍

還是雙側(cè)范圍;⑤根據(jù)此指標(biāo)的分布決定計(jì)算方法,常用的計(jì)算方法:正

態(tài)分布法、百分位數(shù)法。

2二項(xiàng)分布:

(1)是一種離散型隨機(jī)變量的分布類(lèi)型。如果每個(gè)觀察對(duì)象陽(yáng)性結(jié)果的發(fā)生

概率為幾,陰性結(jié)果的發(fā)生概率為(1H);而且每個(gè)觀察對(duì)象的結(jié)果是相互對(duì)

立的,那么,重復(fù)觀察n個(gè)人,發(fā)生陽(yáng)性結(jié)果的人數(shù)X的概率分布為而二項(xiàng)分布,

n!

CCxTT7------KT

記作B(n,TI)。二項(xiàng)分布的概率函數(shù)P(X):nnv(l-n)n-x,"='?(“—')!⑵

適用條件:①每次實(shí)驗(yàn)只有兩種互斥的結(jié)果;②各次實(shí)驗(yàn)互相獨(dú)立;③發(fā)生成

功事件的概率恒定。

(3)分布特征:二項(xiàng)分布的特征由二項(xiàng)分布的參數(shù)K以及觀察的次數(shù)n決定。

①圖形分布特征:二項(xiàng)分布圖的高峰在處或附近;71=0.5時(shí),圖形對(duì)

稱;71工0.5時(shí),分布不對(duì)稱,旦對(duì)同一n,ri離0.5愈遠(yuǎn),對(duì)稱性愈差。對(duì)于同一

n,隨著n的增大,分布趨于對(duì)稱。當(dāng)n玲8時(shí),只要兀不太靠近?;?(特別是

當(dāng)rut和n(1m)均大于5時(shí)),二項(xiàng)分布趨于對(duì)稱。

②二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差:

若X服從二項(xiàng)分布B(n,n),則X的總體均數(shù)為總體方差為。2二rm

(1-n),總體標(biāo)準(zhǔn)差為。若將出現(xiàn)陽(yáng)性結(jié)果的頻率記為:P=M,

7T(1?7F)

則樣本率P的總體均數(shù)為UP=N,總體方差為=n,總體標(biāo)準(zhǔn)差為

,加(1?以)

op」n,op是頻率P的標(biāo)準(zhǔn)差,又稱頻率的標(biāo)準(zhǔn)誤,反映陽(yáng)性頻率的

抽樣誤差大小。

⑷累積概率計(jì)算:①二項(xiàng)分布出現(xiàn)陽(yáng)性的次數(shù)至多為k次的概率為:P(X<k)

7=0②出現(xiàn)陽(yáng)性的次數(shù)至少為k次的概率為:P

嚴(yán)PF尸

(X>k)=x=ko

3Poisson分布:

⑴是一種離散型隨機(jī)變量的分布類(lèi)型,是二項(xiàng)分布的特例,用以描述單位時(shí)

間、空間、面積等的罕見(jiàn)事件發(fā)生次數(shù)的概率分布。一般記作P(入),入是Poisson

分布的唯一參數(shù)。總體均數(shù)為入=rm。前提條件:互斥、獨(dú)立、恒定。

入X

⑵概率函數(shù)為:P(X)=e-入X!,X為觀察單位內(nèi)稀有事件的發(fā)生次數(shù),

e=2.71828o

③分布特性:Poisson分布是非對(duì)稱的,總體參數(shù)人值越小,分布越偏;隨

著入玲8,分布趨于對(duì)稱,當(dāng)入220時(shí),Poisson分布資料可按正態(tài)分布處理。

①Poisson分布總體均數(shù)與總體方差相等,均為入;②Poisson分布的觀察結(jié)果可

加性,即對(duì)于服從Poisson分布的m歌互相獨(dú)立的隨機(jī)變量XI、X2...Xm,它們

的和也服從Poisson分布,其均數(shù)為這個(gè)m隨機(jī)變量的均數(shù)之和。

4概率計(jì)算:如果稀有事件發(fā)生次數(shù)的總體均數(shù)為入,有事件發(fā)生次數(shù)至多

為k次的概率為:P(X<k)=*=0;生次數(shù)至少為k次的概率:P(X>k)

=1-P(X<k-1)

★4三種常用分布之間的關(guān)系:

①二項(xiàng)分布與Poisson分布的關(guān)系:當(dāng)n很大,發(fā)生概率H(或1-n)很小,

二項(xiàng)分布B(n,n)近似于Poisson分布P(nn);

②二項(xiàng)分布與正態(tài)分布的關(guān)系:當(dāng)n較大,n不接近0或1(特別是當(dāng)rm

和n(1-n)均大于5時(shí)),二項(xiàng)分布B(n,n)近似于正態(tài)分布N(rm,nn(1-n));

4Poisson分布與正態(tài)分布的關(guān)系:當(dāng)入220時(shí),Poisson分布漸進(jìn)正態(tài)分布N

(入,入)O

★5二項(xiàng)分布與Poisson分布的區(qū)別:

⑴相同點(diǎn):都是離散型隨機(jī)變量的常見(jiàn)分布;

⑵區(qū)別:a取值不同。服從二項(xiàng)分布的隨機(jī)變量有n+1個(gè)不同的取值;Poisson

分布的隨機(jī)變量的可能去只有無(wú)限多個(gè),即非負(fù)整數(shù)0,1,2......;b隨機(jī)變量的

概率不同:二項(xiàng)分布P(X二k)="?("一k),,Poisson分布P(X二k)

人卜

二e-入k!;c描述的隨機(jī)變量不同。二項(xiàng)分布描述的是一次試驗(yàn)只會(huì)出現(xiàn)兩種對(duì)立

的結(jié)果之一,n次獨(dú)立重復(fù)試驗(yàn)中某種結(jié)果出現(xiàn)次數(shù)的概率分布。Poisson分布

描述的是在單位時(shí)間、面積、空間等范圍中某種事件發(fā)生數(shù)的概率分布。

。很大?很小

⑶聯(lián)系:B(n,n)-Poisson分布。

參數(shù)估計(jì)

1在服從正態(tài)分布的總體中進(jìn)行隨機(jī)抽樣,樣本均數(shù)的抽樣分布特點(diǎn):①各

樣本均數(shù)未必等于總體均數(shù);②樣本均數(shù)見(jiàn)存在差異;③樣本均數(shù)圍繞總體均

數(shù),中間多、兩邊少,左右基本對(duì)稱,呈近似正態(tài)分布;④樣本均數(shù)間的變異

明顯小于原始變量間的變異。

2標(biāo)準(zhǔn)誤:

0

①均數(shù)的標(biāo)準(zhǔn)誤的理論值:。犬=4〃,總體標(biāo)準(zhǔn)差。通常未知,需用樣本標(biāo)

S

準(zhǔn)差s來(lái)估計(jì),均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值為:s*=v'〃;②頻率的標(biāo)準(zhǔn)也老則變

X.(1?萬(wàn))

量X~B(rvi),則樣本頻率P=,的總體概率為71,標(biāo)準(zhǔn)誤是。p=Y11,

JP(lP)以POM

頻率標(biāo)準(zhǔn)誤的估計(jì)值:SP二Y"一1Yn(①②增加樣本含量可以

減少樣本誤差)。

★3標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系:

區(qū)別:⑴標(biāo)準(zhǔn)差S(o):①意義:描述個(gè)體觀察值變異程度的大小。標(biāo)準(zhǔn)

差小,均數(shù)對(duì)?組觀察值得代表性好;②應(yīng)用:與X結(jié)合,用以描述個(gè)體觀察

值的分布范圍,常用于醫(yī)學(xué)參考值范圍的估計(jì);③與n的關(guān)系:n越大,S越趨

于穩(wěn)定;⑵標(biāo)準(zhǔn)誤S*(a*):①意義:描述樣本均數(shù)變異程度及抽樣誤差的大

小。標(biāo)準(zhǔn)誤小,用樣本均數(shù)推斷總體均數(shù)的可靠性大;②應(yīng)用于x結(jié)合,用以

估計(jì)總體均數(shù)可能出現(xiàn)的范圍以及對(duì)總體均數(shù)作假設(shè)檢驗(yàn);③與n的關(guān)系:n

越大,S*越小。

聯(lián)系:①都是描述變異程度的指標(biāo);②由可知,S*與S成正比。

n一定時(shí),s越大,S"越大。

4t分布:當(dāng)X服從均數(shù)為H的正態(tài)分布時(shí),統(tǒng)計(jì)量S/J”服從自由度為

v=n-l的t分布,是小樣本總體均數(shù)的區(qū)間估計(jì)及假設(shè)檢驗(yàn)的理論基礎(chǔ)。

(2)t分布的圖形特征:t值得分布于自由度有關(guān)。t分布只有一個(gè)參數(shù)即V。

特征:①單峰分布,以0為中心,左右對(duì)稱;②v越小,t值越分散,曲線的峰

部越矮,尾部越高;③隨著v逐漸增大,t分布逐漸接近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)v趨

向g時(shí),t分布趨近標(biāo)準(zhǔn)正態(tài)分布,故標(biāo)準(zhǔn)正態(tài)分布是t分布的特例;④t分布

是一簇曲線。

(3)t界值表:①在自由度相同時(shí),上?值越大,t分布的尾部概率越小;

②在t臨界值相同時(shí),雙側(cè)尾部面積概率為單側(cè)尾部面積概率的兩倍。

5參數(shù)估計(jì):包括點(diǎn)估計(jì)和區(qū)間估計(jì)。置信區(qū)間的兩個(gè)要素:①準(zhǔn)確度:反

映置信度1-a的大小,及區(qū)間包括總體均數(shù)n的理論概率的大小,愈接近1越好;

②精密度:即區(qū)間的寬度,區(qū)間越窄越好,如樣本含量不變,將置信度由95%

提高到99%,則置信區(qū)間由窄變寬,估計(jì)的精度下降。

6總體均數(shù)及總體概率的區(qū)間估計(jì):

1體均數(shù)的置信區(qū)間:t分布法和正態(tài)近似法

Lt分布法:當(dāng)。未知且n較小時(shí),總體均數(shù)日的雙側(cè)(1-a)置信區(qū)間為

X士ta/2*S*;單側(cè)8)或(-8,X+tawS*);

H.正態(tài)近似法:①當(dāng)。已知時(shí),總體均數(shù)日的雙側(cè)(1-a)置信區(qū)間為

X±za/2fvox;單側(cè)(X_z%"X,oo)或(-oo,X+Zafvox);②當(dāng)。未知但

n足夠大時(shí)(n>50),t分布近似服從標(biāo)準(zhǔn)正態(tài)分布,總體均數(shù)日的雙側(cè)(1-a)

置信區(qū)間為:X±z"2,”X,單側(cè)(X_za*S*,8)或(-8,X+za*s')

⑵總體概率的置信區(qū)間:對(duì)于二項(xiàng)分市的樣本資料,可根據(jù)樣本含量n和樣

本頻率P的大小,選用查表法(n<50,特別是p很接近?;?00%時(shí))或正態(tài)近

似法估計(jì)總體概率71的(1-a)置信區(qū)間。

正態(tài)近似法:當(dāng)n足夠大,且np及n(l-p)均大于5時(shí),p的抽樣分布近似正

態(tài)分布,總體概率Ji的雙側(cè)(1-a)置信區(qū)間等于P士Z"2sp

★7醫(yī)學(xué)參考值范圍與總體均數(shù)的置信區(qū)間的區(qū)別:

⑴參考值范圍

①意義:絕大多數(shù)人某項(xiàng)指標(biāo)的數(shù)值范圍;

②計(jì)算:正態(tài)分布雙側(cè)X士za/2*s;單側(cè)(X-Z”,8)或(-oo,X+Z")

偏峰分布雙側(cè)PX~P100-X;單側(cè)(PX,8)或(-8,P100-X)

③應(yīng)用:判斷某項(xiàng)指標(biāo)正常與否

⑵總體均數(shù)的置信區(qū)間:

①意義:按一定的置信度估計(jì)總體均數(shù)所在范圍;

②計(jì)算:正態(tài)分布。未知:雙側(cè)X士2/2,吆*,單側(cè)(X_ta"X,8)或

(-8,X+t*”*);

o已知:雙側(cè)X士Za/2*oX,單側(cè)(X.z%voX,?o)或(.oo,X+2a,vaX).

正態(tài)分布或偏峰分布:o未知但n足夠大:雙側(cè)X士Z“/2,”x,單側(cè)(X.Za,v

S*,8)或(-8,X+z(r,yS*)

③應(yīng)用:估計(jì)總體均數(shù)所在范圍。

假設(shè)檢驗(yàn)

1假設(shè)檢驗(yàn)的過(guò)程:建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)-計(jì)算統(tǒng)計(jì)量玲確定P值

并與給定的a比較好做出推斷

結(jié)論。

2假設(shè)檢驗(yàn)的基本邏輯:在H0成立的條件下(處理因素不起作用),計(jì)算

統(tǒng)計(jì)量和P值,把〃不太可能出

現(xiàn)假陽(yáng)性〃當(dāng)作“不可能出現(xiàn)假陽(yáng)性〃,從而拒絕H0,接受H1(處理因素起作

用)。

3假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤:I型和n型錯(cuò)誤。(見(jiàn)名解)

實(shí)際情況統(tǒng)計(jì)推斷

拒絕H0,有差異不拒絕H0,無(wú)差異

H0成立,無(wú)差異第I類(lèi)錯(cuò)誤(假陽(yáng)性),概率=a正確,概率=l-a

Hl成立,有差異正確,該概率=1予第H類(lèi)錯(cuò)誤(假陰性),概率呻

4t檢驗(yàn):

⑴應(yīng)用條件:①隨機(jī)樣本:②來(lái)自正態(tài)分布總體;③均數(shù)比較時(shí),要求兩

總體方差相等(方差齊性)。

⑵單樣本資料的t檢驗(yàn):實(shí)際上是推斷該樣本來(lái)自的總體均數(shù)日與已知的某

一總體均數(shù)或有無(wú)差別。

檢驗(yàn)假設(shè):HO:n=pO,Hl:*或;前提條件:樣本來(lái)自正態(tài)總體;計(jì)算公

式:sNn;自由v=

n-lo

配對(duì)設(shè)計(jì)資料的t檢驗(yàn):配對(duì)資料的分析著眼與每一對(duì)中兩個(gè)觀察值之差,

這些差值構(gòu)成一組資料,用t

檢驗(yàn)推斷差值總體均數(shù)是否為0。

檢驗(yàn)假設(shè):HO:ud=o,Hl:H”O(jiān):前提條件:差值服從正態(tài)分布:計(jì)算公

”匕d-0d

5

式dsd/yjnSd/yjn,

自由度v=n-l(n是對(duì)子數(shù))。

兩獨(dú)立樣本資料的t檢驗(yàn):兩樣本均數(shù)的比較。

檢驗(yàn)假設(shè):HO:"1=42,H1:“1工”2;前提條件:兩樣本服從正態(tài)分布,

且具有方差齊性;計(jì)算公式:

,代表兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤,

S2為兩樣本聯(lián)合估

計(jì)的方差,

£(XL】J+£(X2生1

n+n-2/11+“2?2

12;自由

度y="1+〃2?2。

5t'檢驗(yàn):前提條件:兩小樣本來(lái)自正態(tài)總體且方差不等。方差不齊,可采

用的處理方式有:£'檢驗(yàn),基

于秩次的非參數(shù)檢驗(yàn)和數(shù)據(jù)變換。非正態(tài)分布,方差不齊:基于秩次的非參

數(shù)檢驗(yàn)和數(shù)據(jù)變換。

檢驗(yàn)假設(shè):H0:"1="2,H1:“1工42;計(jì)算公式:

自由

(產(chǎn)了

V=XA

度“i-l〃2-16兩組獨(dú)立樣本資料的方差齊性檢驗(yàn):兩組正態(tài)分布隨機(jī)

樣本判斷其總體方差是否齊同:

(較大)

22什2

?=?

5:a12?2當(dāng)H0成立時(shí),檢驗(yàn)統(tǒng)計(jì)量§2(較?。?

當(dāng)F>3時(shí),萬(wàn)差不齊。

7大樣本資料的Z檢驗(yàn)(u檢驗(yàn)):前提條件:樣本足夠大;兩獨(dú)立樣本資

料的Z檢驗(yàn):假定從兩個(gè)正態(tài)總

體(或非正態(tài))總體隨機(jī)抽取含量為nl和n2的樣本,總體均數(shù)和方差分別

2物2

O1O2

當(dāng)

為11

2,X

n2均較大時(shí),兩樣本均數(shù)的和與差的分布也服從(或近似服從)正態(tài)分布,

1-X2

Z=

“當(dāng)H0成

立時(shí),這個(gè)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。

★t檢驗(yàn)與Z檢驗(yàn)的比較:兩樣本均數(shù)比較的t檢驗(yàn)適用條件為:樣本含量

小,兩樣本獨(dú)立,來(lái)自正態(tài)總體,

且兩總體方差相等。z檢驗(yàn)是大樣本情況下的t檢驗(yàn)的近似,用于兩總體方

差已知,或總體方差未知但樣本

含量較大(nl>60且n2>60)的兩樣本均數(shù)的比較。樣本量較大時(shí),兩種檢

驗(yàn)方法都可用。

★8假設(shè)檢驗(yàn)與區(qū)間估計(jì)的關(guān)系:①置信區(qū)間具有假設(shè)檢驗(yàn)的主要功能:在

a水準(zhǔn)上可回答差別有無(wú)統(tǒng)計(jì)

學(xué)意義;②置信區(qū)間可提供假設(shè)檢驗(yàn)沒(méi)有提供的信息:根據(jù)置信區(qū)間上、

下限的數(shù)值大小可判斷差別是否具有實(shí)際意義;③假設(shè)檢驗(yàn)可提供確切的P值,

置信區(qū)間只能在預(yù)先確定的置信度100(1-a)%水平上進(jìn)行推斷,沒(méi)有精確的

概率值,且有可能增大□類(lèi)錯(cuò)誤;④置信區(qū)間推斷量的大小,即推斷總體均數(shù)

范圍;假設(shè)檢驗(yàn)推斷質(zhì)的大小即推斷總體均數(shù)是否存在不同。只有把置信區(qū)間和

假設(shè)檢驗(yàn)結(jié)合起來(lái),互相補(bǔ)充才是對(duì)問(wèn)題比較的完整分析。

9假設(shè)檢驗(yàn)的注意事項(xiàng):①根據(jù)研究目的、設(shè)計(jì)類(lèi)型、變量類(lèi)型及樣本大小

選擇恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法;②權(quán)

衡兩類(lèi)錯(cuò)誤的危害以確定a的大小;③正確理解P值的意義:P值很小時(shí)“拒

絕H0,接受Hl〃,不能把很

小的P值誤解為總體參數(shù)間差異很大。拒絕H0只是說(shuō)差異不為0,P值小

只是說(shuō)犯一類(lèi)錯(cuò)誤的機(jī)會(huì)遠(yuǎn)小于

aoP與a本質(zhì)相同,都為概率,P是根據(jù)當(dāng)前實(shí)驗(yàn)計(jì)算的概率,a是預(yù)先給

定的概率,為檢驗(yàn)水準(zhǔn),是定

義了的小概率上限。

實(shí)驗(yàn)設(shè)計(jì)

1根據(jù)研究者是否認(rèn)為地設(shè)置處理因素,即是否給予干預(yù)措施,可將醫(yī)學(xué)研

究分為調(diào)查研究和實(shí)驗(yàn)研究?jī)深?lèi)。

1調(diào)查研究:又稱觀察件研究或非實(shí)驗(yàn)性研究,確切的說(shuō)應(yīng)是非隨機(jī)化對(duì)比

研究。它對(duì)研究對(duì)象不施加任

何干預(yù)措施,是在完全“自然狀態(tài)〃下對(duì)研究對(duì)象的特征進(jìn)行觀察、記錄,并

對(duì)觀察結(jié)果進(jìn)行描述和對(duì)比研究。

2實(shí)驗(yàn)研究:又稱干預(yù)性研究,是對(duì)研究對(duì)象人為給予干預(yù)措施的研究。

2實(shí)驗(yàn)設(shè)計(jì)的基本要素:受試對(duì)象、處理因素、實(shí)驗(yàn)效應(yīng)。

1受試對(duì)象:是處理因素作用的客體,根據(jù)受試對(duì)象不同,實(shí)驗(yàn)可以分為三

類(lèi):動(dòng)物實(shí)驗(yàn)、臨床試驗(yàn)、現(xiàn)

場(chǎng)試驗(yàn)。

2處理因素?:是研究者根據(jù)研究目的而施加的特定的實(shí)驗(yàn)措施,又稱為受試

因素。

3實(shí)驗(yàn)效應(yīng):是處理因素作用下,受試對(duì)象的反應(yīng)或結(jié)局,它通過(guò)觀察指標(biāo)

來(lái)體現(xiàn)。

選擇觀察指標(biāo)時(shí).應(yīng)當(dāng)注意:a客觀性:客觀指標(biāo)具有較好的真賣(mài)性和可靠

性;b精確性:包括準(zhǔn)確度和精密度兩層含義。準(zhǔn)確度指觀察值與真值的接近程

度,主要受系統(tǒng)誤差的影響。精密度指相同條件下對(duì)同一對(duì)象的同一指標(biāo)進(jìn)行重

復(fù)觀察時(shí),觀察值與其均數(shù)的接近程度,其差值受隨機(jī)誤差的影響。c靈敏性和

特異性:指標(biāo)的靈敏度反映其檢出真陽(yáng)性的能力,靈敏度高的指標(biāo)能將處理因素

的效應(yīng)更好地顯示出來(lái);指標(biāo)的特異度反映其鑒別真陰性的能力,特異度高的指

標(biāo)不易受混雜因素的干擾。

3實(shí)驗(yàn)設(shè)計(jì)的基本原則:對(duì)照、隨機(jī)化和重復(fù)。

⑴對(duì)照的形式:①安慰劑對(duì)照:目的:在于克服研究者、受試對(duì)象等由心

理因素導(dǎo)致的偏倚。②空臼對(duì)照:即對(duì)照組不接受任何處理,在動(dòng)物實(shí)驗(yàn)和實(shí)

驗(yàn)方法研究中最常見(jiàn),常用于評(píng)價(jià)測(cè)量方法的準(zhǔn)確度,評(píng)價(jià)實(shí)驗(yàn)是否處于正常狀

態(tài)等。③實(shí)驗(yàn)對(duì)照;④標(biāo)準(zhǔn)對(duì)照:用現(xiàn)有標(biāo)準(zhǔn)方法或常規(guī)方法作為對(duì)照;⑤自

身對(duì)照:對(duì)照與實(shí)驗(yàn)在同一受試對(duì)象身上進(jìn)行。

(2)a隨機(jī)化體現(xiàn)在三方面:①隨機(jī)抽樣:總體中每一個(gè)體都有相同機(jī)會(huì)被抽

到樣本中來(lái);②隨機(jī)分配:每個(gè)受試對(duì)象被分配到各組的機(jī)會(huì)相等,保證大量

難以控制的非處理因素在對(duì)比組間盡可能均衡,以提高組間的可比性;③實(shí)驗(yàn)

順序隨機(jī):每個(gè)受試對(duì)象先后接受處理的機(jī)會(huì)相等,它使實(shí)驗(yàn)順序的影響也達(dá)到

均衡。

b在實(shí)驗(yàn)設(shè)計(jì)中常通過(guò)隨機(jī)數(shù)來(lái)實(shí)現(xiàn)隨機(jī)化。獲得隨機(jī)數(shù)的常用方法有:隨

機(jī)數(shù)字表和計(jì)算機(jī)的偽隨機(jī)數(shù)發(fā)生器。隨機(jī)數(shù)字表常用于抽樣研究及隨機(jī)分組。

C常用的兩種隨機(jī)化分組的方法:完仝隨機(jī)化和分層隨機(jī)化(配對(duì)隨機(jī)化和

區(qū)組隨機(jī)化可看成是分層隨機(jī)化的實(shí)際應(yīng)用)。

(3)重復(fù)包括三種情形:①整個(gè)實(shí)驗(yàn)的重復(fù);②用多個(gè)受試對(duì)象進(jìn)行重復(fù);

③同一受試對(duì)象的重復(fù)觀察。重復(fù)的主要作用:①估計(jì)變異的大小;②降低變

異大小。

4常用的實(shí)驗(yàn)設(shè)計(jì)方案:

⑴完全隨機(jī)設(shè)計(jì)(completelyrandomizeddesign):又稱簡(jiǎn)單隨機(jī)設(shè)計(jì),是

最為常見(jiàn)的一種考察單因素兩水平或多水平效應(yīng)的實(shí)驗(yàn)設(shè)計(jì)的方法,它是采用完

全隨機(jī)分組的方法將同質(zhì)的受試對(duì)象分配到各處理組,觀察其實(shí)驗(yàn)效應(yīng)。

⑵配對(duì)設(shè)計(jì)(paireddesign):是將受試對(duì)象按一定條件配成對(duì)子,再瘠每

對(duì)中的兩個(gè)受試對(duì)象隨機(jī)分配到不同的處理組。據(jù)以配對(duì)的因素應(yīng)為可能影響實(shí)

驗(yàn)結(jié)果的主要混雜因素。配對(duì)設(shè)計(jì)主要有以下情形:①將兩個(gè)條件相同或相近

的受試對(duì)象配成對(duì)子,通過(guò)隨機(jī)化,使對(duì)子內(nèi)個(gè)體分別接受兩種不同的處理;

②同一受試對(duì)象的兩個(gè)部分配成對(duì)子,分別速記地接受兩種不同的處理;③自

身前后配對(duì),即同一受試對(duì)象,接受某種處理之前和接受該處理后視為配走。

⑶交叉設(shè)計(jì)(cross-overdesign):是一種特殊的自身對(duì)照設(shè)計(jì),它按事先設(shè)

計(jì)好的實(shí)驗(yàn)次序,在各個(gè)時(shí)期對(duì)受試對(duì)象先后實(shí)施各種處理,以比較處理組訶的

差異?;厩疤幔簜€(gè)處理方式不能相互影響,即受試對(duì)象在接受第二種處理時(shí),

不能有前一種處理的剩余效應(yīng)。優(yōu)點(diǎn):節(jié)約樣本含量;能夠控制個(gè)體差異和時(shí)間

對(duì)處理因素的影響,故效率較高;在臨床試驗(yàn)中,每個(gè)受試對(duì)象均接受了各種處

理,均等的考慮了每個(gè)患者的利益。進(jìn)行交叉設(shè)計(jì)應(yīng)注意:盡可能采用盲法,以

提高受試對(duì)象的依從性,避免偏倚;不宜用于具有自愈傾向或病程較短的疾病研

究。在慢性病觀察過(guò)程中,應(yīng)盡量保持條件的可比性。

⑷隨機(jī)區(qū)組設(shè)計(jì):又稱單位設(shè)計(jì)、配伍組設(shè)計(jì),實(shí)際上是配對(duì)設(shè)計(jì)的擴(kuò)展。

通常是將受試對(duì)象按性質(zhì)相同或相近分為b個(gè)區(qū)組(或稱單位組、配伍組),再

將每個(gè)區(qū)組中的k個(gè)受試對(duì)象隨機(jī)分配到k個(gè)處理組。設(shè)計(jì)應(yīng)遵循“區(qū)組間差別

越大越好,區(qū)組內(nèi)差別越小越好〃的原則。

⑸析因設(shè)計(jì)(factorialdesign):a是將兩個(gè)或多個(gè)處理因素的個(gè)水平進(jìn)行組

合,對(duì)各種可能的組合都進(jìn)行實(shí)驗(yàn),從而探討個(gè)史理因素的主效應(yīng)以及個(gè)處理因

素間的交互效應(yīng),又稱完全交叉分組實(shí)驗(yàn)設(shè)計(jì)。所謂交互作用是指兩個(gè)或多個(gè)處

理因素間的效應(yīng)互不獨(dú)立,當(dāng)某一因素取不同水平時(shí),另一個(gè)或多個(gè)因素的效應(yīng)

相應(yīng)的發(fā)生變化。兩因素間的交互作用為階交互作用,三因素間交互作用為二

階交互作用。

b當(dāng)觀察k個(gè)處理因素,每個(gè)因素均有m個(gè)水平時(shí),共有mk種組合,簡(jiǎn)記

為mk析因設(shè)計(jì)。

c可獲得三方面的信息:各因素不同水平的效應(yīng);各因素間的交互作用;通

過(guò)比較尋求最佳組合。

5樣本含量的估算:

⑴確定樣本含量的原則:在保證研究結(jié)論有一定可靠性的前提下,估算最少

需要多少受試對(duì)象。

⑵假設(shè)檢驗(yàn)所需樣本含量取決于四個(gè)要素:

1第一類(lèi)錯(cuò)誤概率a的大?。篴越小,所需樣本量越大;②第二類(lèi)錯(cuò)誤概率

B或檢驗(yàn)功效(If)的大?。?/p>

第二類(lèi)錯(cuò)誤的概率越小,檢驗(yàn)功效越大,所需樣本含量越多;③容許誤差5:

即兩總體參數(shù)的的差值,5越大,所需樣本含量越??;④總體標(biāo)準(zhǔn)差。和總體

概率71:。越大,所需樣本含量越多;總體概率71越接近50%,變異性越大,所

需樣本含量越多。

方差分析

1基本思想:把全部觀察值間的變異按設(shè)計(jì)和需要分解成兩個(gè)或多個(gè)組成部

分,然后將各部分的變異與隨機(jī)誤差進(jìn)行比較,以判斷各部分的變異是否具有統(tǒng)

計(jì)學(xué)意義。

2應(yīng)用條件:①各樣本是相互獨(dú)立的隨機(jī)樣本;②各樣本來(lái)自正態(tài)總體;

③各處理組總體方差相等,即方差齊性。

3任何設(shè)計(jì)方案的SS總和v總算法均相同,即在不考慮數(shù)據(jù)按任何方向分

組的情況下,將所有數(shù)據(jù)看成一個(gè)整體計(jì)算,即SS忌=(N-1)S2,

v總:N-lo

兒種設(shè)計(jì)方案中SS總和v總的分解:

設(shè)計(jì)方案SS總的分解v總

完全隨機(jī)設(shè)計(jì)SS總:SS組間+SS組內(nèi)v總=v組間+v組內(nèi)

隨機(jī)區(qū)組設(shè)計(jì)SS總二SS處理+SS區(qū)組+SS誤差v總:v處理+v區(qū)組+v誤差

析因設(shè)計(jì)55總=55處理+55誤差v3K處理+V誤差

=(SSA+SSB+SSAB)+SS誤差=(vA+vB+vAB)+v誤差

重復(fù)測(cè)量設(shè)計(jì)(兩因素)ss^=ss受試對(duì)象間+SS受試對(duì)象內(nèi)丫總=丫受試

對(duì)象間+v受試對(duì)象內(nèi)

=(SS處理+SS個(gè)體間誤差)+=(v處理+v個(gè)體間誤差)+

(SS時(shí)間+SS處理與時(shí)間交互+SS個(gè)體內(nèi)誤差)(v時(shí)間+v處理與時(shí)間交互

+v個(gè)體內(nèi)誤差)

4重復(fù)測(cè)量資料和隨機(jī)區(qū)組設(shè)計(jì)資料的區(qū)別:①同一受試對(duì)象在不同時(shí)間點(diǎn)

的數(shù)據(jù)高度相關(guān);②重復(fù)測(cè)量資料中的處理因素在受試對(duì)象(看成區(qū)組)間為

隨機(jī)分配,但受試對(duì)象(看成區(qū)組)內(nèi)的各時(shí)間點(diǎn)是固定的,不能隨機(jī)分配。隨

機(jī)區(qū)組設(shè)計(jì)資料中每個(gè)區(qū)組內(nèi)的受試對(duì)象彼此獨(dú)立,處理只在區(qū)組內(nèi)隨機(jī)分配,

同一區(qū)組內(nèi)的受試對(duì)象接受的處理各不相同。

5重復(fù)測(cè)量資料方差分析的前提條件:①各樣本是相互獨(dú)立的隨機(jī)樣本;

②各樣本來(lái)自正態(tài)總體;③各處理組總體方差相等,即方差齊性;④需滿足協(xié)

方差陣的球形性或復(fù)合對(duì)稱性。

6多各樣本均數(shù)的兩兩比較方法:①未計(jì)劃的每?jī)蓚€(gè)均數(shù)的事后比較,常用

SNK-q檢驗(yàn);②計(jì)劃好的某些均數(shù)間的兩兩比較,常用Dunnett-t檢驗(yàn);

③Bonferroni法和sidak法適用于所有的兩兩比較。

方差分析后不能作兩兩比較的t檢驗(yàn)的原因:會(huì)增加犯一類(lèi)錯(cuò)誤的概率。如

果比較次數(shù)為k,每次檢驗(yàn)水準(zhǔn)為a,則犯一類(lèi)錯(cuò)誤的累積概率為1-(1-a)k,

高于原有的a。

7數(shù)據(jù)變換的目的:①使各組達(dá)到方差齊性;②使資料轉(zhuǎn)換為正態(tài)分布,

以滿足方差分析和t檢驗(yàn)的應(yīng)用條件。通常情況下,一種適當(dāng)?shù)暮瘮?shù)轉(zhuǎn)換可使上

述兩個(gè)目的同時(shí)達(dá)到。③曲線直線化。常用于曲線擬合。常用的數(shù)據(jù)變換有對(duì)

數(shù)變換、平方根變換、平方根反正弦變換。

8方差分析中的F檢驗(yàn)是單側(cè)檢驗(yàn)的原因:方差分析中檢驗(yàn)統(tǒng)計(jì)量F的計(jì)算

通常是用某部分的均方(如處理因素,交互效應(yīng)等)除以誤差的均方,其中分母

誤差部分盡含隨機(jī)因素作用,分子某部分的均方含有相應(yīng)處理因素或交互作用的

效應(yīng),而且還含有隨機(jī)因素的作用,因此得F值從理論上應(yīng)21,不會(huì)小于1,所

以方差分析中F檢驗(yàn)是單側(cè)檢驗(yàn)。

X2檢驗(yàn)

1X2檢驗(yàn)用途:常用于分類(lèi)變量資料的統(tǒng)計(jì)推斷,主要用途包括:①單樣

本分布的擬合優(yōu)度;②比較兩個(gè)或多個(gè)獨(dú)立樣本頻率分布;③比較配對(duì)設(shè)計(jì)兩

樣本頻率和兩頻率分布;④推斷兩個(gè)變量或特征之間有無(wú)關(guān)聯(lián)性。

2X之檢驗(yàn)的理論基礎(chǔ)是X2分布和擬合優(yōu)度檢驗(yàn)。

Q)/分布①是一種連續(xù)型隨機(jī)變量的概率分布,按分布的密度函數(shù)可給出

自由度二1,2,3,......的一簇分布曲線。②》2分布形狀完全依賴于自由度v的

大小,當(dāng)v>l時(shí),隨著v的增加,曲線逐漸趨于對(duì)稱;當(dāng)自由度v趨于8時(shí)2

分布逼近正態(tài)分布。

⑵擬合優(yōu)度檢驗(yàn)是根據(jù)樣本的頻率分布檢驗(yàn)其總體分布是否等于給定的理

論分布。

3X2檢驗(yàn)的基本思想是:用統(tǒng)計(jì)量度量實(shí)際頻數(shù)和理論頻數(shù)之間的偏離程

之(4-兀)2

度,永遠(yuǎn)是正值,/2檢驗(yàn)統(tǒng)計(jì)量的基本公式是:*2=仁1「,v=k-l-s,

s是用樣本估計(jì)量代替總體參數(shù)的個(gè)數(shù)。若假設(shè)成立,則各格子的實(shí)際頻數(shù)與理

論頻數(shù)相差不應(yīng)該很大,因而算出的X2值也不會(huì)很大,即出現(xiàn)較大值的概率

P很小。若P《a,則認(rèn)為A與T的差別已超出了抽樣誤差允許的范圍,拒絕H0。

若P>a,不拒絕HOo

4獨(dú)立樣本2x2列聯(lián)表資料的檢驗(yàn):

HO:兩總體率相等;Hl:兩總體率不等。

y(4一7)2

lnN40且Tmin25,%嚏/^7,

(nd-bc))

產(chǎn)二(alb)(3d)(o+c)(b+d),v=1;

yi(|4T-0.5)2

2n240且1WTV5,校正公式:2*=乙7,

{\ad-bc\-n/2)2n

%2=(a+b)(c+d)(a+c)(b+d),v=i;

3nV40或TV1,或P=a時(shí),F(xiàn)isher精確概率法。

5獨(dú)立樣本RxC列聯(lián)表資料的¥?檢驗(yàn):(多個(gè)獨(dú)立樣本率、獨(dú)立樣本頻率

分布的比較)

H0:多個(gè)總體率相等;H1:多個(gè)總體率不等。

[yAicJ

-二rA乙"刖C/,v=(R-l)(C-l)

要求:理論頻數(shù)不宜太小,一般不宜有1/5以上的格子的理論頻數(shù)小于5,

或不宜有一個(gè)理論頻數(shù)小于1,否則可能會(huì)產(chǎn)生偏性。如果不滿足此要求,處理

方法有:①增加樣本含量(首選);②結(jié)合專(zhuān)業(yè)知識(shí)考慮是否可以將該格所在

行或列與別的行和列合并,要根據(jù)樣本特性來(lái)確定,但會(huì)損失信息;③改用RxC

表Fisher精確概率法,可以用計(jì)算機(jī)軟件實(shí)現(xiàn)。

RxC列聯(lián)表的分割:

①多個(gè)實(shí)驗(yàn)組間的兩兩比較:分析目的為k個(gè)實(shí)驗(yàn)組間,任兩個(gè)率均進(jìn)行

n2

比較時(shí),須進(jìn)行‘,

次獨(dú)立的四格表/2檢驗(yàn),再加上總的行x列表資料的片2檢

驗(yàn),共次檢驗(yàn)假設(shè)。故檢驗(yàn)水準(zhǔn)a用下式估計(jì):a=(>)+1,

(力)=2!(〃-2)!,k為樣本率的個(gè)數(shù)。②實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較:分

析目的為各實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較,而各實(shí)驗(yàn)組間不須比較。其檢驗(yàn)水準(zhǔn)

口’用下式估計(jì):。=2(h1)。

6配對(duì)設(shè)計(jì)資料的X2檢驗(yàn):

⑴配對(duì)2x2列聯(lián)表資料的X2檢驗(yàn)(兩種處理方法陽(yáng)性率的比較):

H0:兩總體陽(yáng)性率相等;H1:兩總體陽(yáng)性率不等。

QT)?(bi)?

;②當(dāng)時(shí),校

,ET=b+cfv=lb+c<40

(|b-c|-l)2

正公式/2二b+c,v=lo

⑵配對(duì)RxR列聯(lián)表資料的12檢驗(yàn):

H0:兩變量的概率分布相同;H1:兩變量的概率分布不相同。

(%一叫尸

%+叫一24〃

T=/=1v=k-lo

基于秩次的非參數(shù)檢驗(yàn)

1假設(shè)檢驗(yàn)的方法有:參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。

①參數(shù)檢驗(yàn):是以特定的總體分布為前提,對(duì)未知的總體參數(shù)做推斷的假

設(shè)檢驗(yàn)方法統(tǒng)稱為如t檢驗(yàn)和

方差分析。

②非參數(shù)檢驗(yàn):不以特定的總體分布為前提,也不針對(duì)決定總體分布的幾

個(gè)參數(shù)做推斷,進(jìn)行的是分布之間的檢驗(yàn)。一般不直接用樣本觀察值做分析,統(tǒng)

計(jì)量的計(jì)算基于原數(shù)據(jù)在整個(gè)樣本中按大小所占位次。由于丟棄了觀察值的具體

數(shù)據(jù),只保留了大小次序的信息,凡適合參數(shù)檢驗(yàn)的資料,應(yīng)首選參數(shù)檢驗(yàn)。

2非參數(shù)檢驗(yàn)適用于:①有序變量資料;②總體分布類(lèi)型不明的資料;(3)

分布不對(duì)稱且無(wú)法轉(zhuǎn)化為正態(tài)分布資料;④對(duì)比組間方差不齊,有無(wú)適當(dāng)變換

方法達(dá)到方差齊性的資料;⑤一端或兩端觀察值不確切的資料;⑥等級(jí)資料。

3wilcoxon符號(hào)秩(和)檢驗(yàn):

⑴目的:可用于推斷總體中位數(shù)是否等于某個(gè)指定值,還可以推斷配對(duì)樣本

差值的總體中位數(shù)是否為0。①單樣本資料的符號(hào)秩檢驗(yàn)常用于不滿足t檢驗(yàn)條

件的單樣本定量變量資料的比較。②配對(duì)設(shè)計(jì)資料的符號(hào)秩和檢驗(yàn):由檢驗(yàn)配

對(duì)樣本的差值是否來(lái)自中位數(shù)為。的總體,來(lái)推斷兩個(gè)總體中位數(shù)是否相等,即

兩種處理效應(yīng)是否相同。Wilcoxon配對(duì)符號(hào)秩和檢驗(yàn)基本思想:在配對(duì)樣本中,

假定兩種處理效果相同,則差值的總體分布為對(duì)稱分布,并且差值的總體中位數(shù)

為0。若假設(shè)成立,樣本差值的正秩和與負(fù)秩和應(yīng)相差不大,均接近n(n+l)/4;

當(dāng)正負(fù)秩和相差懸殊,超出抽樣誤差可解釋的范圍時(shí),則有理由懷疑該假設(shè),從

而拒絕HOo

⑵方法要點(diǎn):①按差值絕對(duì)值從小到大編秩,差值為正的秩和以T+表示,

為負(fù)的秩和以T-表示,任取T+(或T-)作為檢驗(yàn)統(tǒng)計(jì)量T,查T(mén)界值表確定P

值;②正態(tài)近似法:隨著n的增大,T分布逼近均數(shù)為n(n+1)/4,方差為n

(n+1)(2n+l)/24的正態(tài)分布。當(dāng)n>50,用Z檢驗(yàn)。

③注意事項(xiàng):①編秩時(shí)遇差值為0舍去,n隨之減??;遇有差值的絕對(duì)值

相等,符號(hào)相同,仍按順序編秩;符號(hào)不同,取其平均秩次;②T++T-=n(n+1)

/2

4wilcoxon秩和檢驗(yàn):

Q)目的是推斷連續(xù)型變量資料或有序變量資料的兩個(gè)獨(dú)立樣本代表的兩個(gè)

總體分布是否有差別。

⑵方法要點(diǎn):①將兩組數(shù)據(jù)由小到大同一編秩,以樣本列數(shù)小者為nl,其

秩和為T(mén),查T(mén)界值表確定P值;②正態(tài)近似法:當(dāng)nl>10或n2-nl>10時(shí),T

分布接近均數(shù)為nl(N+1)/2,方差為nlr)2(N+1)/2的正態(tài)分布,可用Z檢

驗(yàn)。

⑶注意事項(xiàng):①編秩中若有相同的數(shù)據(jù)在同一組則依次編秩;若相同數(shù)值

在不同組內(nèi),求平均秩次;②當(dāng)相持出現(xiàn)較多時(shí)(超過(guò)25%),需使用校正公

式。

⑷基本思想:假設(shè)含量為nl與n2的兩個(gè)樣本(且nl"2),來(lái)自同一總體

或分布相同的兩個(gè)總體,則nl樣本的秩和T1與其理論秩和nl(N+D/2相差不

大,即[T-nl(N+1)/2]僅為抽樣誤差所致。當(dāng)二者相差懸殊,超出抽樣誤差可

解釋的范圍時(shí),則有理由懷疑該假設(shè),從而拒絕H0。

5Kruskal-WallisH檢驗(yàn):

⑴目的:用于推斷定量變量或有序分類(lèi)變量的多個(gè)總體分布有無(wú)差別。

⑵方法要點(diǎn):①先將k組數(shù)據(jù)由小到大同一編秩,求出各組秩和Ri,計(jì)算檢

驗(yàn)統(tǒng)計(jì)量H;②當(dāng)組數(shù)k=3,且各組例數(shù)ni三時(shí),查H界值表確定P值;若k23

或最小樣本例數(shù)大于5,則H統(tǒng)計(jì)量近似服從v=k-l的12分布。

⑶注意事項(xiàng):①編秩中若有相同的數(shù)據(jù)在同一組則依次編秩;若相同數(shù)值

在不同組內(nèi),求平均秩次:②當(dāng)相持出現(xiàn)較多時(shí)(超過(guò)25%),需使用校正公

式;③當(dāng)結(jié)論為拒絕HO,認(rèn)為多組處理效應(yīng)不全相同時(shí),常需進(jìn)一步作多個(gè)樣

木的兩兩比較的秩和檢驗(yàn)。

兩變量關(guān)聯(lián)性分析

1相關(guān)系數(shù)的意義及計(jì)算:

x和y的協(xié)方差

相關(guān)系數(shù)4行前方差)(丫的方差)。

①總體相關(guān)系數(shù)P,若"0,稱X和Y線性相關(guān);若p=0,則簡(jiǎn)稱X和Y不

相關(guān)。樣本協(xié)方差是離均差乘積在樣本中的平均,離均差在總體中的平均就是總

體協(xié)方差。

2(X㈤("7)

②樣本相關(guān)系數(shù),是兩個(gè)隨

機(jī)變量之間線性相關(guān)強(qiáng)度和方向的統(tǒng)計(jì)量,沒(méi)有單位,取值范圍為「的

正負(fù)值表示兩變量間線性相關(guān)的方向,r>0為正相關(guān),r<0為負(fù)相關(guān),r=0為零相

關(guān)。r的絕對(duì)值大小表示兩變量之間線性相關(guān)的密切程度,I”越接近于1,密

切程度越高;越接近于。,密切程度越低。

2相關(guān)系數(shù)的統(tǒng)計(jì)推斷:

建立建設(shè):HO:p=0:Hl:p/O,并假定X和Y服從二元正態(tài)分布。

方法:①直接查相關(guān)系數(shù)臨界值表,根據(jù)自由度v=n-2,差臨界值表,比較

"I與臨界值,統(tǒng)計(jì)量越大,概率P越小;統(tǒng)計(jì)量越小,概率P越大。②t檢

r-0Jl-r2

驗(yàn):統(tǒng)計(jì)量為tr=Sr,Sr為樣本相關(guān)系數(shù)r的標(biāo)準(zhǔn)誤,SrJn^2,H0成立

時(shí),機(jī)服從自由度為v=n-2的t分布。以上兩種方法的決策規(guī)則相同:若P>0.05,

不拒絕零假設(shè),即認(rèn)為兩個(gè)變量間無(wú)相關(guān)性;若P<0.05,拒絕冬假設(shè),接受備擇

假設(shè),即認(rèn)為兩變量間相關(guān)性有統(tǒng)計(jì)學(xué)意義。

3相關(guān)分析應(yīng)注意的問(wèn)題:①進(jìn)行相關(guān)分析前,應(yīng)先繪制散點(diǎn)圖。只有散點(diǎn)

有線性趨勢(shì)時(shí),才能進(jìn)行直線相關(guān)分析。②線性相關(guān)分析要求兩個(gè)變量都是隨

機(jī)變量,而且僅適用于二元正態(tài)分布資料;③出現(xiàn)離群值慎用相關(guān);④相關(guān)關(guān)

系不一定是因果關(guān)系;⑤分層資料盲目合并易出現(xiàn)假象;⑥樣本的相關(guān)系數(shù)接

近零并不意味著兩變量間一定無(wú)相關(guān)性,布?可能是非線性的曲線關(guān)系。

£(p-p)

4秩相關(guān)系數(shù)的計(jì)算:

-l<r5<lo適用于條件:①不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析的資料;

②總體分布型未知的資料;③用等級(jí)表示的原始資料;④分布端點(diǎn)無(wú)確定數(shù)值

的資料;⑤用相對(duì)數(shù)表示的資料。

5秩相關(guān)系數(shù)的統(tǒng)計(jì)推斷:HO:ps=O:Hl:psxO,a=0.05,當(dāng)n450時(shí),查

附表14的rs界值表;當(dāng)n>50時(shí),計(jì)算檢驗(yàn)統(tǒng)計(jì)量u,查t界值表。

6分類(lèi)資料的關(guān)聯(lián)性分析:

⑴對(duì)兩個(gè)定量變量的關(guān)聯(lián)性,可用Pearson積矩相關(guān)系數(shù)或秩相關(guān)系數(shù)來(lái)描

述;對(duì)兩個(gè)分類(lèi)變量,通常是

先根據(jù)交叉分類(lèi)計(jì)數(shù)所得的列聯(lián)表進(jìn)行兩種屬性獨(dú)立性的才、僉驗(yàn),然后計(jì)

算關(guān)聯(lián)系數(shù)。關(guān)于兩個(gè)分類(lèi)變量關(guān)聯(lián)的程度,用Pearson列聯(lián)系數(shù)來(lái)描述:

r=+〃,列聯(lián)系數(shù)r取值范圍在。?1之間。。表示完全獨(dú)立;1表示完全相

關(guān);愈接近于0,關(guān)系愈不密切;愈接近于1,關(guān)系愈密切。【對(duì)兩個(gè)反映屬性

的分類(lèi)變量,若有一份隨機(jī)樣本,可做交叉分類(lèi)的頻數(shù)表,利用關(guān)于獨(dú)立性的力

檢驗(yàn)和列聯(lián)系數(shù)來(lái)描述兩變量的關(guān)聯(lián)性】

¥(4一7)2

⑵交叉分類(lèi)2x2表的關(guān)聯(lián)分析:X吆乙T(3)2X2配對(duì)資料的關(guān)聯(lián)

(od-bc)2〃

性分析:*40且Tmin25/2=(°+b)(c+d)(n+c)(b+d);11240且1<T

(一〃/2)2〃

<5,

2\Lanm]

⑷RxC表分類(lèi)資料的美聯(lián)性分析:X=nKc,每格的T>1且

T<5的格子數(shù)不宜多于格子總數(shù)的1/5o

簡(jiǎn)單回歸分析

1回歸方程:Y=a+bX,b=E(x-x)jxx2線性回歸模型的適

用條件:①線性:因變量Y與自變量X稱線性關(guān)系;②獨(dú)立:每個(gè)個(gè)體觀察值

之間互相獨(dú)立;③正態(tài)性:任意給定X值,對(duì)應(yīng)的隨機(jī)變量Y都服從正態(tài)分布;

④等方差性:在一定范圍內(nèi)不同的X值所對(duì)應(yīng)的隨機(jī)變量Y的方差相等。簡(jiǎn)記

為L(zhǎng)INEo

3總體回歸系數(shù)B的統(tǒng)計(jì)推斷:總體回歸系數(shù)。是否為0的假設(shè)檢驗(yàn),可用

方差分析或t檢驗(yàn)。

4決定系數(shù)反映了回歸平方和在總平和中所占的比例,常用來(lái)反映回歸的實(shí)

際效果。

5線性回歸的應(yīng)用:①用于計(jì)算總體條件均數(shù)的置信區(qū)間以及總體回歸線的

置信帶;②用于計(jì)算個(gè)體Y預(yù)測(cè)值及其預(yù)測(cè)區(qū)間。線性回歸常用于統(tǒng)計(jì)預(yù)測(cè)和

統(tǒng)計(jì)推斷。

6線性回歸與線性相關(guān)的區(qū)別與聯(lián)系:

⑴區(qū)別:

①單位:相關(guān)系數(shù)r沒(méi)有單位,回歸系數(shù)b有單位;所以,相關(guān)系數(shù)與單

位無(wú)關(guān),回歸系數(shù)與單位有關(guān);

②應(yīng)用目的:說(shuō)明兩變量間的關(guān)聯(lián)性用相關(guān)分析,說(shuō)明兩者依存變化的數(shù)

量關(guān)系則用回歸分析?;

③對(duì)資料的要求不

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論