版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
衛(wèi)生統(tǒng)計(jì)學(xué)資料(精心整理)
統(tǒng)計(jì)工作基本步驟:統(tǒng)計(jì)設(shè)計(jì)(調(diào)查設(shè)計(jì)和實(shí)驗(yàn)設(shè)計(jì))、資料分析{收集資
料、整理資料、分析資料【統(tǒng)計(jì)描述和統(tǒng)計(jì)推斷(參數(shù)估計(jì)和假設(shè)檢驗(yàn))】。
★統(tǒng)計(jì)推斷:是利用樣本所提供的信息來(lái)推斷總體特征,包括:參數(shù)估計(jì)和
假設(shè)檢驗(yàn)。a參數(shù)估計(jì)是指利
用樣本信息來(lái)估計(jì)總體參數(shù),主要有點(diǎn)估計(jì)[把樣本統(tǒng)計(jì)量直接作為總體參
數(shù)估計(jì)值)和區(qū)間估計(jì)【按預(yù)先設(shè)定的可信度(l-a),來(lái)確定總體均數(shù)的所在
范圍】。b假設(shè)檢驗(yàn):是以小概率反證法的邏輯推理來(lái)判斷總體參數(shù)間是否有質(zhì)
的區(qū)別。
變量資料可分為定性變量、定量變量。不同類(lèi)型的變量可以進(jìn)行轉(zhuǎn)化,通常
是由高級(jí)向低級(jí)轉(zhuǎn)化。
資料按性質(zhì)可分為計(jì)量資料、計(jì)數(shù)資料和等級(jí)資料。
定量資料的統(tǒng)計(jì)描述
1頻率分布表和頻率分布圖是描述計(jì)量資料分布類(lèi)型及分布特征的方法。離
散型定量變量的頻率分布圖可用直條圖表達(dá)。
2頻率分布表(圖)的用途:①描述資料的分布類(lèi)型;②描述分布的集中
趨勢(shì)和離散趨勢(shì);③便于發(fā)現(xiàn)一些特大和特小的可疑值;④便于進(jìn)一步的統(tǒng)計(jì)
分析和處理;⑤當(dāng)樣本含量足夠大時(shí),以頻率作為概率的估計(jì)值。
★3集中趨勢(shì)和離散趨勢(shì)是定量資料中總體分布的兩個(gè)重要指標(biāo)。
(1)描述集中趨勢(shì)的統(tǒng)計(jì)指標(biāo):平均數(shù)(算術(shù)均數(shù)、幾何均數(shù)和中位數(shù))、
百分位數(shù)(是一種位置參數(shù),用于確定醫(yī)學(xué)參考值范圍,P50就是中位數(shù))、眾
數(shù)。算術(shù)均數(shù):適用于對(duì)稱分布資料,特別是正態(tài)分布資料或近似正態(tài)分布資料;
幾何均數(shù):對(duì)數(shù)正態(tài)分布資料(頻率圖一般呈正偏峰分布)、等比數(shù)列;中位數(shù):
適用于各種分布的資料,特別是偏峰分布資料,也可用于分布末端無(wú)確定值得資
料。
(2)描述離散趨勢(shì)的指標(biāo):極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差和變異系
數(shù)。四分位數(shù)間距:適用于各種分布的資料,特別是偏峰分布資料,常把中位數(shù)
和四分位數(shù)間距結(jié)合起來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì)。方差和標(biāo)準(zhǔn)差:都適
用于對(duì)稱分布資料,特別對(duì)正態(tài)分布資料或近似正態(tài)分布資料,常把均數(shù)和標(biāo)準(zhǔn)
差結(jié)合起來(lái)描述資料的集中趨勢(shì)和離散趨勢(shì);變異系數(shù):主要用于量綱不同時(shí),
或均數(shù)相差較大時(shí)變量間變異程度的比較。
標(biāo)準(zhǔn)差的應(yīng)用:①表示變量分布的離散程度;②結(jié)合均數(shù)計(jì)算變異系數(shù)、
描述對(duì)稱分布資料;③結(jié)合樣本含量計(jì)算標(biāo)準(zhǔn)誤。
定性資料的統(tǒng)計(jì)描述
1定性資料的基礎(chǔ)數(shù)據(jù)是絕對(duì)數(shù)。描述一組定性資料的數(shù)據(jù)特征,通常需要
計(jì)算相對(duì)數(shù)。定性變量可以通過(guò)頻率分布表描述其分布特征。
2常用相對(duì)數(shù)類(lèi)型:頻率型、強(qiáng)度型和相對(duì)比型指標(biāo)。
指標(biāo)頻率型指標(biāo)強(qiáng)度型指標(biāo)相對(duì)比型指標(biāo)
單位時(shí)間內(nèi)某現(xiàn)兩個(gè)有關(guān)聯(lián)的指
概念近似反映某一時(shí)間出現(xiàn)概率
象的發(fā)生頻率標(biāo)A和B之比
某事件發(fā)生的個(gè)體數(shù)1某事件發(fā)生的個(gè)體數(shù)1
計(jì)算公式_______________xk__________________XKA/B
可能發(fā)生某事件的個(gè)體數(shù)觀察人日數(shù)總計(jì)
有無(wú)量綱無(wú)有可有、可無(wú)
取值范圍[0,1]可大于1無(wú)限制
表示相對(duì)于
大樣本時(shí)作為概率近似值的一個(gè)單位,
頻率強(qiáng)度,即概率BA
本質(zhì)有多少個(gè)單位
強(qiáng)度的近似值
分子式分母的一部分
A和B可以
是絕對(duì)數(shù)、相對(duì)
數(shù)和平均數(shù)
A和B的量
綱可相同也可不
同
A和B互不
包含
相對(duì)比:A、B兩指標(biāo)可以是絕對(duì)數(shù)、相對(duì)數(shù)或平均數(shù)。最常見(jiàn)的相對(duì)比是
人口學(xué)中的男女性別比,流行病學(xué)中的相對(duì)危險(xiǎn)度RR=P1/P0也是相對(duì)比指標(biāo)。
3應(yīng)用相對(duì)數(shù)應(yīng)該注意:①防止概念混淆,避免以比代率的錯(cuò)誤現(xiàn)象;②
計(jì)算相對(duì)數(shù)時(shí)分母應(yīng)有足夠數(shù)量,如果例數(shù)較少會(huì)使相對(duì)數(shù)波動(dòng)較大,應(yīng)該使用
絕對(duì)數(shù);③正確的計(jì)算頻率(或強(qiáng)度)指標(biāo)的合計(jì)值。當(dāng)分組的資料需要合并
起來(lái)估計(jì)頻率(或強(qiáng)度)時(shí),應(yīng)將各組頻率的分子相加作為合并估計(jì)的分子,各
組的分母相加作為合并估計(jì)的分母;④頻率型指標(biāo)的解釋要緊扣總體和屬性;
⑤相對(duì)數(shù)間比較要具備可比性:要注意觀察對(duì)象是否同質(zhì)、研究方法是否相同、
觀察時(shí)間是否一致、觀察對(duì)象內(nèi)部結(jié)構(gòu)是否一致、對(duì)比不同時(shí)期資料應(yīng)注意客觀
條件是否相同;⑥正確進(jìn)行相對(duì)數(shù)的統(tǒng)計(jì)推斷:在隨機(jī)抽樣的情況下,從樣本
估計(jì)值推斷總體相對(duì)數(shù)應(yīng)該考慮抽樣誤差,因此要進(jìn)行參數(shù)估計(jì)和假設(shè)檢驗(yàn)。
4醫(yī)學(xué)人口統(tǒng)計(jì)資料主要來(lái)源為日常工作記錄(報(bào)告單、卡、冊(cè))、統(tǒng)計(jì)報(bào)
表、人口調(diào)查(普查和抽樣調(diào)查)。
5描述人口學(xué)特征的常用指標(biāo)一般有人口總數(shù)和反映人口學(xué)基本特征的某
些指標(biāo)。人口學(xué)的基本特征包括性別、年齡、文化、職業(yè)等,最常用來(lái)描述人口
結(jié)構(gòu)的是性別和年齡。人口學(xué)特征指標(biāo):老年人口系數(shù)、少兒人口系數(shù)、負(fù)擔(dān)系
數(shù)、老少比、性別比。
6有關(guān)生育的常用指標(biāo)有出生率、生育率和人口再生產(chǎn)指標(biāo)。測(cè)量生育水平
的統(tǒng)計(jì)指標(biāo):粗出生率、總生育率、年齡別生育承、總和生育率。測(cè)量人口再生
育的統(tǒng)計(jì)指標(biāo):自然增長(zhǎng)率、粗再生率和凈再生率。
7常用的死亡統(tǒng)計(jì)指標(biāo)有:粗死亡率、年齡別死亡率、嬰兒死亡率、新生兒
死亡率、圍生兒死亡率、死因別死亡率、某病病死率和死因構(gòu)成等。
8疾病統(tǒng)計(jì)資料主要來(lái)源于:疾病報(bào)告和報(bào)表材料、醫(yī)療衛(wèi)生工作記錄、疾
病專(zhuān)題調(diào)查資料。
9⑴標(biāo)準(zhǔn)化:兩個(gè)率或多個(gè)率之間進(jìn)行比較時(shí),為消除內(nèi)部構(gòu)成不同的影響,
采用統(tǒng)一的標(biāo)準(zhǔn),對(duì)兩組或多組資料進(jìn)行校正(調(diào)整),計(jì)算得到標(biāo)準(zhǔn)化率后再
做比較的方法,稱為其目的是統(tǒng)一內(nèi)部構(gòu)成,消除混雜因素,是資料具有可
比性。
⑵應(yīng)用標(biāo)準(zhǔn)化法的注意事項(xiàng):
1標(biāo)準(zhǔn)化法的應(yīng)用范圍很廣。當(dāng)某個(gè)分類(lèi)變量在兩組中分布不同時(shí),這兩個(gè)
分類(lèi)變量就成為兩組頻率比較
的混雜因素,標(biāo)準(zhǔn)化的目的是消除混雜因素。
2標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)化率,已經(jīng)不再反映當(dāng)時(shí)當(dāng)?shù)氐膶?shí)際水平,只表示相互比
較的資料間的相對(duì)水平。
3標(biāo)準(zhǔn)化法實(shí)質(zhì)是找一個(gè)標(biāo)準(zhǔn),使兩組得意在一個(gè)共同的平臺(tái)上進(jìn)行比較。
選擇不同的標(biāo)準(zhǔn).算出的標(biāo)準(zhǔn)
化率也會(huì)不同,比較的結(jié)果也未必相同,因此報(bào)告比較結(jié)果時(shí)必須說(shuō)明所選
用的標(biāo)準(zhǔn)和理由
④兩樣本標(biāo)準(zhǔn)化率是樣本值,存在抽樣誤差。比較兩樣本標(biāo)準(zhǔn)化率,當(dāng)樣
本含量較小時(shí),還應(yīng)作假設(shè)檢驗(yàn)。10常用的動(dòng)態(tài)數(shù)列分析指標(biāo)有:絕對(duì)增長(zhǎng)量、
發(fā)展速度與增長(zhǎng)速度、平均發(fā)展速度與平均增長(zhǎng)速度。
(1)絕對(duì)增長(zhǎng)量:是說(shuō)明事物在一定時(shí)期增長(zhǎng)的絕對(duì)值,可分為:累計(jì)增
長(zhǎng)量(報(bào)告期指標(biāo)與基線期指標(biāo)之差)和逐年增長(zhǎng)量(報(bào)告期指標(biāo)與前一期指標(biāo)
之差)。
(2)發(fā)展速度與增長(zhǎng)速度:均為相對(duì)比,說(shuō)明事物在一定時(shí)期的變化,可
計(jì)算定基比(即報(bào)告期指標(biāo)與基線期指標(biāo)的比:an/aO)和環(huán)比(報(bào)告期指標(biāo)與
其前一期指標(biāo)之比:增長(zhǎng)速度表示的是凈增長(zhǎng)速度,增長(zhǎng)速度;發(fā)展
an/an-1)o
速度-100%。
(3)平均發(fā)展速度與平均增長(zhǎng)速度:用于概括某現(xiàn)象在一段時(shí)期中的平均
在
變化。平均發(fā)展速度是發(fā)展速度的幾何平均數(shù),平均發(fā)展速度='平均增長(zhǎng)
速度;平均發(fā)展速度-100%。
11統(tǒng)計(jì)表和統(tǒng)計(jì)圖是描述資料特征、呈現(xiàn)統(tǒng)計(jì)分析結(jié)果的重要工具。統(tǒng)計(jì)
表結(jié)構(gòu)標(biāo)題、標(biāo)目、線條、數(shù)字和備注。
12常用統(tǒng)計(jì)圖用途:①條圖:適用于相互獨(dú)立的資料(資料有明確分組、
不連續(xù));②百分條圖、圓圖適用于構(gòu)成比資料;③線圖適用于連續(xù)性資料,
表達(dá)事物的動(dòng)態(tài)變化(絕對(duì)差值);半對(duì)數(shù)線圖適用于連續(xù)性資料,表達(dá)事物的
發(fā)展速度(相對(duì)比);④直方圖用于描述連續(xù)變量的頻數(shù)分布;⑤散點(diǎn)圖適用
于雙變量資料,用點(diǎn)的排列趨勢(shì)和密集度表示兩變量的相關(guān)關(guān)系。
常用概率分布
1正態(tài)分布(連續(xù)型隨機(jī)變量的概率分布)
(1)正態(tài)概率密度曲線特點(diǎn):①關(guān)于X=H對(duì)稱;②在x=u處取得該概率
密度函數(shù)的最大值,在x二n±。處有拐點(diǎn);③曲線下面積為1;④正態(tài)分布有兩
個(gè)參數(shù):位置參數(shù)口(決定曲線在橫軸上的位置)和變異參數(shù)。(決定曲線的形
狀);⑤H±1.64O面積為90%,口±1.96。面積為95%,口±2.58。面積為99%。
(2)Z變換與標(biāo)準(zhǔn)正態(tài)分布:對(duì)于任意一個(gè)服從正態(tài)分布N(山02)的隨
機(jī)變量,可作Z變:Z=O,變換后的Z值仍然服從正態(tài)分布,且其總體為數(shù)
為0、總體標(biāo)準(zhǔn)差為L(zhǎng)稱此為標(biāo)準(zhǔn)正態(tài)分布,用N(0,1)表示。①(z)為標(biāo)準(zhǔn)
正態(tài)分布Z變量的累積面積,-8fZ的面積,即下側(cè)累計(jì)面積。
★(3)正態(tài)分布的應(yīng)用:①確定醫(yī)學(xué)參考值范圍:是指特定的“正常〃人群
(排除了對(duì)所研究的指標(biāo)有影響的的疾病和有關(guān)因素的特定人群)的解剖、生理、
生化指標(biāo)及組織代謝產(chǎn)物含量等數(shù)據(jù)中大多數(shù)個(gè)體的取值所在范圍,習(xí)慣用該人
群的95%的個(gè)體某項(xiàng)醫(yī)學(xué)指標(biāo)的取值范圍作為該指標(biāo)的醫(yī)學(xué)參考值范圍。方法:
a百分位數(shù)法:適用于任何分布類(lèi)型的資料;b正態(tài)分布法。②質(zhì)量控制圖:如
果某一波動(dòng)僅僅由個(gè)體差異或隨機(jī)測(cè)量誤差所致,那么觀察結(jié)果服從正態(tài)分布。
控制圖共有7條水平線,中心線位于總體均數(shù)口處,警戒限位于吐2。處,控制
限位于葉3。處,此外還有兩條位于葉。處。
★(4)確定醫(yī)學(xué)參考值的步驟:①?gòu)摹ㄕH恕傮w中抽樣,明確研究總體;
②用統(tǒng)一和準(zhǔn)確的方法測(cè)定相應(yīng)的指標(biāo);③根據(jù)不同的用途選定適當(dāng)?shù)陌俜纸?/p>
限,常用95%;④根據(jù)此指標(biāo)的實(shí)際意義,決定單側(cè)范圍
還是雙側(cè)范圍;⑤根據(jù)此指標(biāo)的分布決定計(jì)算方法,常用的計(jì)算方法:正
態(tài)分布法、百分位數(shù)法。
2二項(xiàng)分布:
(1)是一種離散型隨機(jī)變量的分布類(lèi)型。如果每個(gè)觀察對(duì)象陽(yáng)性結(jié)果的發(fā)生
概率為幾,陰性結(jié)果的發(fā)生概率為(1H);而且每個(gè)觀察對(duì)象的結(jié)果是相互對(duì)
立的,那么,重復(fù)觀察n個(gè)人,發(fā)生陽(yáng)性結(jié)果的人數(shù)X的概率分布為而二項(xiàng)分布,
n!
CCxTT7------KT
記作B(n,TI)。二項(xiàng)分布的概率函數(shù)P(X):nnv(l-n)n-x,"='?(“—')!⑵
適用條件:①每次實(shí)驗(yàn)只有兩種互斥的結(jié)果;②各次實(shí)驗(yàn)互相獨(dú)立;③發(fā)生成
功事件的概率恒定。
(3)分布特征:二項(xiàng)分布的特征由二項(xiàng)分布的參數(shù)K以及觀察的次數(shù)n決定。
①圖形分布特征:二項(xiàng)分布圖的高峰在處或附近;71=0.5時(shí),圖形對(duì)
稱;71工0.5時(shí),分布不對(duì)稱,旦對(duì)同一n,ri離0.5愈遠(yuǎn),對(duì)稱性愈差。對(duì)于同一
n,隨著n的增大,分布趨于對(duì)稱。當(dāng)n玲8時(shí),只要兀不太靠近?;?(特別是
當(dāng)rut和n(1m)均大于5時(shí)),二項(xiàng)分布趨于對(duì)稱。
②二項(xiàng)分布的均數(shù)和標(biāo)準(zhǔn)差:
若X服從二項(xiàng)分布B(n,n),則X的總體均數(shù)為總體方差為。2二rm
(1-n),總體標(biāo)準(zhǔn)差為。若將出現(xiàn)陽(yáng)性結(jié)果的頻率記為:P=M,
7T(1?7F)
則樣本率P的總體均數(shù)為UP=N,總體方差為=n,總體標(biāo)準(zhǔn)差為
,加(1?以)
op」n,op是頻率P的標(biāo)準(zhǔn)差,又稱頻率的標(biāo)準(zhǔn)誤,反映陽(yáng)性頻率的
抽樣誤差大小。
⑷累積概率計(jì)算:①二項(xiàng)分布出現(xiàn)陽(yáng)性的次數(shù)至多為k次的概率為:P(X<k)
7=0②出現(xiàn)陽(yáng)性的次數(shù)至少為k次的概率為:P
嚴(yán)PF尸
(X>k)=x=ko
3Poisson分布:
⑴是一種離散型隨機(jī)變量的分布類(lèi)型,是二項(xiàng)分布的特例,用以描述單位時(shí)
間、空間、面積等的罕見(jiàn)事件發(fā)生次數(shù)的概率分布。一般記作P(入),入是Poisson
分布的唯一參數(shù)。總體均數(shù)為入=rm。前提條件:互斥、獨(dú)立、恒定。
入X
⑵概率函數(shù)為:P(X)=e-入X!,X為觀察單位內(nèi)稀有事件的發(fā)生次數(shù),
e=2.71828o
③分布特性:Poisson分布是非對(duì)稱的,總體參數(shù)人值越小,分布越偏;隨
著入玲8,分布趨于對(duì)稱,當(dāng)入220時(shí),Poisson分布資料可按正態(tài)分布處理。
①Poisson分布總體均數(shù)與總體方差相等,均為入;②Poisson分布的觀察結(jié)果可
加性,即對(duì)于服從Poisson分布的m歌互相獨(dú)立的隨機(jī)變量XI、X2...Xm,它們
的和也服從Poisson分布,其均數(shù)為這個(gè)m隨機(jī)變量的均數(shù)之和。
4概率計(jì)算:如果稀有事件發(fā)生次數(shù)的總體均數(shù)為入,有事件發(fā)生次數(shù)至多
為k次的概率為:P(X<k)=*=0;生次數(shù)至少為k次的概率:P(X>k)
=1-P(X<k-1)
★4三種常用分布之間的關(guān)系:
①二項(xiàng)分布與Poisson分布的關(guān)系:當(dāng)n很大,發(fā)生概率H(或1-n)很小,
二項(xiàng)分布B(n,n)近似于Poisson分布P(nn);
②二項(xiàng)分布與正態(tài)分布的關(guān)系:當(dāng)n較大,n不接近0或1(特別是當(dāng)rm
和n(1-n)均大于5時(shí)),二項(xiàng)分布B(n,n)近似于正態(tài)分布N(rm,nn(1-n));
4Poisson分布與正態(tài)分布的關(guān)系:當(dāng)入220時(shí),Poisson分布漸進(jìn)正態(tài)分布N
(入,入)O
★5二項(xiàng)分布與Poisson分布的區(qū)別:
⑴相同點(diǎn):都是離散型隨機(jī)變量的常見(jiàn)分布;
⑵區(qū)別:a取值不同。服從二項(xiàng)分布的隨機(jī)變量有n+1個(gè)不同的取值;Poisson
分布的隨機(jī)變量的可能去只有無(wú)限多個(gè),即非負(fù)整數(shù)0,1,2......;b隨機(jī)變量的
概率不同:二項(xiàng)分布P(X二k)="?("一k),,Poisson分布P(X二k)
人卜
二e-入k!;c描述的隨機(jī)變量不同。二項(xiàng)分布描述的是一次試驗(yàn)只會(huì)出現(xiàn)兩種對(duì)立
的結(jié)果之一,n次獨(dú)立重復(fù)試驗(yàn)中某種結(jié)果出現(xiàn)次數(shù)的概率分布。Poisson分布
描述的是在單位時(shí)間、面積、空間等范圍中某種事件發(fā)生數(shù)的概率分布。
。很大?很小
⑶聯(lián)系:B(n,n)-Poisson分布。
參數(shù)估計(jì)
1在服從正態(tài)分布的總體中進(jìn)行隨機(jī)抽樣,樣本均數(shù)的抽樣分布特點(diǎn):①各
樣本均數(shù)未必等于總體均數(shù);②樣本均數(shù)見(jiàn)存在差異;③樣本均數(shù)圍繞總體均
數(shù),中間多、兩邊少,左右基本對(duì)稱,呈近似正態(tài)分布;④樣本均數(shù)間的變異
明顯小于原始變量間的變異。
2標(biāo)準(zhǔn)誤:
0
①均數(shù)的標(biāo)準(zhǔn)誤的理論值:。犬=4〃,總體標(biāo)準(zhǔn)差。通常未知,需用樣本標(biāo)
S
準(zhǔn)差s來(lái)估計(jì),均數(shù)標(biāo)準(zhǔn)誤的估計(jì)值為:s*=v'〃;②頻率的標(biāo)準(zhǔn)也老則變
X.(1?萬(wàn))
量X~B(rvi),則樣本頻率P=,的總體概率為71,標(biāo)準(zhǔn)誤是。p=Y11,
JP(lP)以POM
頻率標(biāo)準(zhǔn)誤的估計(jì)值:SP二Y"一1Yn(①②增加樣本含量可以
減少樣本誤差)。
★3標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系:
區(qū)別:⑴標(biāo)準(zhǔn)差S(o):①意義:描述個(gè)體觀察值變異程度的大小。標(biāo)準(zhǔn)
差小,均數(shù)對(duì)?組觀察值得代表性好;②應(yīng)用:與X結(jié)合,用以描述個(gè)體觀察
值的分布范圍,常用于醫(yī)學(xué)參考值范圍的估計(jì);③與n的關(guān)系:n越大,S越趨
于穩(wěn)定;⑵標(biāo)準(zhǔn)誤S*(a*):①意義:描述樣本均數(shù)變異程度及抽樣誤差的大
小。標(biāo)準(zhǔn)誤小,用樣本均數(shù)推斷總體均數(shù)的可靠性大;②應(yīng)用于x結(jié)合,用以
估計(jì)總體均數(shù)可能出現(xiàn)的范圍以及對(duì)總體均數(shù)作假設(shè)檢驗(yàn);③與n的關(guān)系:n
越大,S*越小。
聯(lián)系:①都是描述變異程度的指標(biāo);②由可知,S*與S成正比。
n一定時(shí),s越大,S"越大。
4t分布:當(dāng)X服從均數(shù)為H的正態(tài)分布時(shí),統(tǒng)計(jì)量S/J”服從自由度為
v=n-l的t分布,是小樣本總體均數(shù)的區(qū)間估計(jì)及假設(shè)檢驗(yàn)的理論基礎(chǔ)。
(2)t分布的圖形特征:t值得分布于自由度有關(guān)。t分布只有一個(gè)參數(shù)即V。
特征:①單峰分布,以0為中心,左右對(duì)稱;②v越小,t值越分散,曲線的峰
部越矮,尾部越高;③隨著v逐漸增大,t分布逐漸接近標(biāo)準(zhǔn)正態(tài)分布;當(dāng)v趨
向g時(shí),t分布趨近標(biāo)準(zhǔn)正態(tài)分布,故標(biāo)準(zhǔn)正態(tài)分布是t分布的特例;④t分布
是一簇曲線。
(3)t界值表:①在自由度相同時(shí),上?值越大,t分布的尾部概率越小;
②在t臨界值相同時(shí),雙側(cè)尾部面積概率為單側(cè)尾部面積概率的兩倍。
5參數(shù)估計(jì):包括點(diǎn)估計(jì)和區(qū)間估計(jì)。置信區(qū)間的兩個(gè)要素:①準(zhǔn)確度:反
映置信度1-a的大小,及區(qū)間包括總體均數(shù)n的理論概率的大小,愈接近1越好;
②精密度:即區(qū)間的寬度,區(qū)間越窄越好,如樣本含量不變,將置信度由95%
提高到99%,則置信區(qū)間由窄變寬,估計(jì)的精度下降。
6總體均數(shù)及總體概率的區(qū)間估計(jì):
1體均數(shù)的置信區(qū)間:t分布法和正態(tài)近似法
Lt分布法:當(dāng)。未知且n較小時(shí),總體均數(shù)日的雙側(cè)(1-a)置信區(qū)間為
X士ta/2*S*;單側(cè)8)或(-8,X+tawS*);
H.正態(tài)近似法:①當(dāng)。已知時(shí),總體均數(shù)日的雙側(cè)(1-a)置信區(qū)間為
X±za/2fvox;單側(cè)(X_z%"X,oo)或(-oo,X+Zafvox);②當(dāng)。未知但
n足夠大時(shí)(n>50),t分布近似服從標(biāo)準(zhǔn)正態(tài)分布,總體均數(shù)日的雙側(cè)(1-a)
置信區(qū)間為:X±z"2,”X,單側(cè)(X_za*S*,8)或(-8,X+za*s')
⑵總體概率的置信區(qū)間:對(duì)于二項(xiàng)分市的樣本資料,可根據(jù)樣本含量n和樣
本頻率P的大小,選用查表法(n<50,特別是p很接近?;?00%時(shí))或正態(tài)近
似法估計(jì)總體概率71的(1-a)置信區(qū)間。
正態(tài)近似法:當(dāng)n足夠大,且np及n(l-p)均大于5時(shí),p的抽樣分布近似正
態(tài)分布,總體概率Ji的雙側(cè)(1-a)置信區(qū)間等于P士Z"2sp
★7醫(yī)學(xué)參考值范圍與總體均數(shù)的置信區(qū)間的區(qū)別:
⑴參考值范圍
①意義:絕大多數(shù)人某項(xiàng)指標(biāo)的數(shù)值范圍;
②計(jì)算:正態(tài)分布雙側(cè)X士za/2*s;單側(cè)(X-Z”,8)或(-oo,X+Z")
偏峰分布雙側(cè)PX~P100-X;單側(cè)(PX,8)或(-8,P100-X)
③應(yīng)用:判斷某項(xiàng)指標(biāo)正常與否
⑵總體均數(shù)的置信區(qū)間:
①意義:按一定的置信度估計(jì)總體均數(shù)所在范圍;
②計(jì)算:正態(tài)分布。未知:雙側(cè)X士2/2,吆*,單側(cè)(X_ta"X,8)或
(-8,X+t*”*);
o已知:雙側(cè)X士Za/2*oX,單側(cè)(X.z%voX,?o)或(.oo,X+2a,vaX).
正態(tài)分布或偏峰分布:o未知但n足夠大:雙側(cè)X士Z“/2,”x,單側(cè)(X.Za,v
S*,8)或(-8,X+z(r,yS*)
③應(yīng)用:估計(jì)總體均數(shù)所在范圍。
假設(shè)檢驗(yàn)
1假設(shè)檢驗(yàn)的過(guò)程:建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn)-計(jì)算統(tǒng)計(jì)量玲確定P值
并與給定的a比較好做出推斷
結(jié)論。
2假設(shè)檢驗(yàn)的基本邏輯:在H0成立的條件下(處理因素不起作用),計(jì)算
統(tǒng)計(jì)量和P值,把〃不太可能出
現(xiàn)假陽(yáng)性〃當(dāng)作“不可能出現(xiàn)假陽(yáng)性〃,從而拒絕H0,接受H1(處理因素起作
用)。
3假設(shè)檢驗(yàn)的兩類(lèi)錯(cuò)誤:I型和n型錯(cuò)誤。(見(jiàn)名解)
實(shí)際情況統(tǒng)計(jì)推斷
拒絕H0,有差異不拒絕H0,無(wú)差異
H0成立,無(wú)差異第I類(lèi)錯(cuò)誤(假陽(yáng)性),概率=a正確,概率=l-a
Hl成立,有差異正確,該概率=1予第H類(lèi)錯(cuò)誤(假陰性),概率呻
4t檢驗(yàn):
⑴應(yīng)用條件:①隨機(jī)樣本:②來(lái)自正態(tài)分布總體;③均數(shù)比較時(shí),要求兩
總體方差相等(方差齊性)。
⑵單樣本資料的t檢驗(yàn):實(shí)際上是推斷該樣本來(lái)自的總體均數(shù)日與已知的某
一總體均數(shù)或有無(wú)差別。
檢驗(yàn)假設(shè):HO:n=pO,Hl:*或;前提條件:樣本來(lái)自正態(tài)總體;計(jì)算公
式:sNn;自由v=
n-lo
配對(duì)設(shè)計(jì)資料的t檢驗(yàn):配對(duì)資料的分析著眼與每一對(duì)中兩個(gè)觀察值之差,
這些差值構(gòu)成一組資料,用t
檢驗(yàn)推斷差值總體均數(shù)是否為0。
檢驗(yàn)假設(shè):HO:ud=o,Hl:H”O(jiān):前提條件:差值服從正態(tài)分布:計(jì)算公
”匕d-0d
5
式dsd/yjnSd/yjn,
自由度v=n-l(n是對(duì)子數(shù))。
兩獨(dú)立樣本資料的t檢驗(yàn):兩樣本均數(shù)的比較。
檢驗(yàn)假設(shè):HO:"1=42,H1:“1工”2;前提條件:兩樣本服從正態(tài)分布,
且具有方差齊性;計(jì)算公式:
,代表兩樣本均數(shù)之差的標(biāo)準(zhǔn)誤,
S2為兩樣本聯(lián)合估
計(jì)的方差,
£(XL】J+£(X2生1
n+n-2/11+“2?2
12;自由
度y="1+〃2?2。
5t'檢驗(yàn):前提條件:兩小樣本來(lái)自正態(tài)總體且方差不等。方差不齊,可采
用的處理方式有:£'檢驗(yàn),基
于秩次的非參數(shù)檢驗(yàn)和數(shù)據(jù)變換。非正態(tài)分布,方差不齊:基于秩次的非參
數(shù)檢驗(yàn)和數(shù)據(jù)變換。
檢驗(yàn)假設(shè):H0:"1="2,H1:“1工42;計(jì)算公式:
自由
(產(chǎn)了
V=XA
度“i-l〃2-16兩組獨(dú)立樣本資料的方差齊性檢驗(yàn):兩組正態(tài)分布隨機(jī)
樣本判斷其總體方差是否齊同:
(較大)
22什2
?=?
5:a12?2當(dāng)H0成立時(shí),檢驗(yàn)統(tǒng)計(jì)量§2(較?。?
當(dāng)F>3時(shí),萬(wàn)差不齊。
7大樣本資料的Z檢驗(yàn)(u檢驗(yàn)):前提條件:樣本足夠大;兩獨(dú)立樣本資
料的Z檢驗(yàn):假定從兩個(gè)正態(tài)總
體(或非正態(tài))總體隨機(jī)抽取含量為nl和n2的樣本,總體均數(shù)和方差分別
2物2
O1O2
當(dāng)
和
為11
2,X
n2均較大時(shí),兩樣本均數(shù)的和與差的分布也服從(或近似服從)正態(tài)分布,
1-X2
Z=
“當(dāng)H0成
立時(shí),這個(gè)統(tǒng)計(jì)量服從標(biāo)準(zhǔn)正態(tài)分布。
★t檢驗(yàn)與Z檢驗(yàn)的比較:兩樣本均數(shù)比較的t檢驗(yàn)適用條件為:樣本含量
小,兩樣本獨(dú)立,來(lái)自正態(tài)總體,
且兩總體方差相等。z檢驗(yàn)是大樣本情況下的t檢驗(yàn)的近似,用于兩總體方
差已知,或總體方差未知但樣本
含量較大(nl>60且n2>60)的兩樣本均數(shù)的比較。樣本量較大時(shí),兩種檢
驗(yàn)方法都可用。
★8假設(shè)檢驗(yàn)與區(qū)間估計(jì)的關(guān)系:①置信區(qū)間具有假設(shè)檢驗(yàn)的主要功能:在
a水準(zhǔn)上可回答差別有無(wú)統(tǒng)計(jì)
學(xué)意義;②置信區(qū)間可提供假設(shè)檢驗(yàn)沒(méi)有提供的信息:根據(jù)置信區(qū)間上、
下限的數(shù)值大小可判斷差別是否具有實(shí)際意義;③假設(shè)檢驗(yàn)可提供確切的P值,
置信區(qū)間只能在預(yù)先確定的置信度100(1-a)%水平上進(jìn)行推斷,沒(méi)有精確的
概率值,且有可能增大□類(lèi)錯(cuò)誤;④置信區(qū)間推斷量的大小,即推斷總體均數(shù)
范圍;假設(shè)檢驗(yàn)推斷質(zhì)的大小即推斷總體均數(shù)是否存在不同。只有把置信區(qū)間和
假設(shè)檢驗(yàn)結(jié)合起來(lái),互相補(bǔ)充才是對(duì)問(wèn)題比較的完整分析。
9假設(shè)檢驗(yàn)的注意事項(xiàng):①根據(jù)研究目的、設(shè)計(jì)類(lèi)型、變量類(lèi)型及樣本大小
選擇恰當(dāng)?shù)慕y(tǒng)計(jì)分析方法;②權(quán)
衡兩類(lèi)錯(cuò)誤的危害以確定a的大小;③正確理解P值的意義:P值很小時(shí)“拒
絕H0,接受Hl〃,不能把很
小的P值誤解為總體參數(shù)間差異很大。拒絕H0只是說(shuō)差異不為0,P值小
只是說(shuō)犯一類(lèi)錯(cuò)誤的機(jī)會(huì)遠(yuǎn)小于
aoP與a本質(zhì)相同,都為概率,P是根據(jù)當(dāng)前實(shí)驗(yàn)計(jì)算的概率,a是預(yù)先給
定的概率,為檢驗(yàn)水準(zhǔn),是定
義了的小概率上限。
實(shí)驗(yàn)設(shè)計(jì)
1根據(jù)研究者是否認(rèn)為地設(shè)置處理因素,即是否給予干預(yù)措施,可將醫(yī)學(xué)研
究分為調(diào)查研究和實(shí)驗(yàn)研究?jī)深?lèi)。
1調(diào)查研究:又稱觀察件研究或非實(shí)驗(yàn)性研究,確切的說(shuō)應(yīng)是非隨機(jī)化對(duì)比
研究。它對(duì)研究對(duì)象不施加任
何干預(yù)措施,是在完全“自然狀態(tài)〃下對(duì)研究對(duì)象的特征進(jìn)行觀察、記錄,并
對(duì)觀察結(jié)果進(jìn)行描述和對(duì)比研究。
2實(shí)驗(yàn)研究:又稱干預(yù)性研究,是對(duì)研究對(duì)象人為給予干預(yù)措施的研究。
2實(shí)驗(yàn)設(shè)計(jì)的基本要素:受試對(duì)象、處理因素、實(shí)驗(yàn)效應(yīng)。
1受試對(duì)象:是處理因素作用的客體,根據(jù)受試對(duì)象不同,實(shí)驗(yàn)可以分為三
類(lèi):動(dòng)物實(shí)驗(yàn)、臨床試驗(yàn)、現(xiàn)
場(chǎng)試驗(yàn)。
2處理因素?:是研究者根據(jù)研究目的而施加的特定的實(shí)驗(yàn)措施,又稱為受試
因素。
3實(shí)驗(yàn)效應(yīng):是處理因素作用下,受試對(duì)象的反應(yīng)或結(jié)局,它通過(guò)觀察指標(biāo)
來(lái)體現(xiàn)。
選擇觀察指標(biāo)時(shí).應(yīng)當(dāng)注意:a客觀性:客觀指標(biāo)具有較好的真賣(mài)性和可靠
性;b精確性:包括準(zhǔn)確度和精密度兩層含義。準(zhǔn)確度指觀察值與真值的接近程
度,主要受系統(tǒng)誤差的影響。精密度指相同條件下對(duì)同一對(duì)象的同一指標(biāo)進(jìn)行重
復(fù)觀察時(shí),觀察值與其均數(shù)的接近程度,其差值受隨機(jī)誤差的影響。c靈敏性和
特異性:指標(biāo)的靈敏度反映其檢出真陽(yáng)性的能力,靈敏度高的指標(biāo)能將處理因素
的效應(yīng)更好地顯示出來(lái);指標(biāo)的特異度反映其鑒別真陰性的能力,特異度高的指
標(biāo)不易受混雜因素的干擾。
3實(shí)驗(yàn)設(shè)計(jì)的基本原則:對(duì)照、隨機(jī)化和重復(fù)。
⑴對(duì)照的形式:①安慰劑對(duì)照:目的:在于克服研究者、受試對(duì)象等由心
理因素導(dǎo)致的偏倚。②空臼對(duì)照:即對(duì)照組不接受任何處理,在動(dòng)物實(shí)驗(yàn)和實(shí)
驗(yàn)方法研究中最常見(jiàn),常用于評(píng)價(jià)測(cè)量方法的準(zhǔn)確度,評(píng)價(jià)實(shí)驗(yàn)是否處于正常狀
態(tài)等。③實(shí)驗(yàn)對(duì)照;④標(biāo)準(zhǔn)對(duì)照:用現(xiàn)有標(biāo)準(zhǔn)方法或常規(guī)方法作為對(duì)照;⑤自
身對(duì)照:對(duì)照與實(shí)驗(yàn)在同一受試對(duì)象身上進(jìn)行。
(2)a隨機(jī)化體現(xiàn)在三方面:①隨機(jī)抽樣:總體中每一個(gè)體都有相同機(jī)會(huì)被抽
到樣本中來(lái);②隨機(jī)分配:每個(gè)受試對(duì)象被分配到各組的機(jī)會(huì)相等,保證大量
難以控制的非處理因素在對(duì)比組間盡可能均衡,以提高組間的可比性;③實(shí)驗(yàn)
順序隨機(jī):每個(gè)受試對(duì)象先后接受處理的機(jī)會(huì)相等,它使實(shí)驗(yàn)順序的影響也達(dá)到
均衡。
b在實(shí)驗(yàn)設(shè)計(jì)中常通過(guò)隨機(jī)數(shù)來(lái)實(shí)現(xiàn)隨機(jī)化。獲得隨機(jī)數(shù)的常用方法有:隨
機(jī)數(shù)字表和計(jì)算機(jī)的偽隨機(jī)數(shù)發(fā)生器。隨機(jī)數(shù)字表常用于抽樣研究及隨機(jī)分組。
C常用的兩種隨機(jī)化分組的方法:完仝隨機(jī)化和分層隨機(jī)化(配對(duì)隨機(jī)化和
區(qū)組隨機(jī)化可看成是分層隨機(jī)化的實(shí)際應(yīng)用)。
(3)重復(fù)包括三種情形:①整個(gè)實(shí)驗(yàn)的重復(fù);②用多個(gè)受試對(duì)象進(jìn)行重復(fù);
③同一受試對(duì)象的重復(fù)觀察。重復(fù)的主要作用:①估計(jì)變異的大小;②降低變
異大小。
4常用的實(shí)驗(yàn)設(shè)計(jì)方案:
⑴完全隨機(jī)設(shè)計(jì)(completelyrandomizeddesign):又稱簡(jiǎn)單隨機(jī)設(shè)計(jì),是
最為常見(jiàn)的一種考察單因素兩水平或多水平效應(yīng)的實(shí)驗(yàn)設(shè)計(jì)的方法,它是采用完
全隨機(jī)分組的方法將同質(zhì)的受試對(duì)象分配到各處理組,觀察其實(shí)驗(yàn)效應(yīng)。
⑵配對(duì)設(shè)計(jì)(paireddesign):是將受試對(duì)象按一定條件配成對(duì)子,再瘠每
對(duì)中的兩個(gè)受試對(duì)象隨機(jī)分配到不同的處理組。據(jù)以配對(duì)的因素應(yīng)為可能影響實(shí)
驗(yàn)結(jié)果的主要混雜因素。配對(duì)設(shè)計(jì)主要有以下情形:①將兩個(gè)條件相同或相近
的受試對(duì)象配成對(duì)子,通過(guò)隨機(jī)化,使對(duì)子內(nèi)個(gè)體分別接受兩種不同的處理;
②同一受試對(duì)象的兩個(gè)部分配成對(duì)子,分別速記地接受兩種不同的處理;③自
身前后配對(duì),即同一受試對(duì)象,接受某種處理之前和接受該處理后視為配走。
⑶交叉設(shè)計(jì)(cross-overdesign):是一種特殊的自身對(duì)照設(shè)計(jì),它按事先設(shè)
計(jì)好的實(shí)驗(yàn)次序,在各個(gè)時(shí)期對(duì)受試對(duì)象先后實(shí)施各種處理,以比較處理組訶的
差異?;厩疤幔簜€(gè)處理方式不能相互影響,即受試對(duì)象在接受第二種處理時(shí),
不能有前一種處理的剩余效應(yīng)。優(yōu)點(diǎn):節(jié)約樣本含量;能夠控制個(gè)體差異和時(shí)間
對(duì)處理因素的影響,故效率較高;在臨床試驗(yàn)中,每個(gè)受試對(duì)象均接受了各種處
理,均等的考慮了每個(gè)患者的利益。進(jìn)行交叉設(shè)計(jì)應(yīng)注意:盡可能采用盲法,以
提高受試對(duì)象的依從性,避免偏倚;不宜用于具有自愈傾向或病程較短的疾病研
究。在慢性病觀察過(guò)程中,應(yīng)盡量保持條件的可比性。
⑷隨機(jī)區(qū)組設(shè)計(jì):又稱單位設(shè)計(jì)、配伍組設(shè)計(jì),實(shí)際上是配對(duì)設(shè)計(jì)的擴(kuò)展。
通常是將受試對(duì)象按性質(zhì)相同或相近分為b個(gè)區(qū)組(或稱單位組、配伍組),再
將每個(gè)區(qū)組中的k個(gè)受試對(duì)象隨機(jī)分配到k個(gè)處理組。設(shè)計(jì)應(yīng)遵循“區(qū)組間差別
越大越好,區(qū)組內(nèi)差別越小越好〃的原則。
⑸析因設(shè)計(jì)(factorialdesign):a是將兩個(gè)或多個(gè)處理因素的個(gè)水平進(jìn)行組
合,對(duì)各種可能的組合都進(jìn)行實(shí)驗(yàn),從而探討個(gè)史理因素的主效應(yīng)以及個(gè)處理因
素間的交互效應(yīng),又稱完全交叉分組實(shí)驗(yàn)設(shè)計(jì)。所謂交互作用是指兩個(gè)或多個(gè)處
理因素間的效應(yīng)互不獨(dú)立,當(dāng)某一因素取不同水平時(shí),另一個(gè)或多個(gè)因素的效應(yīng)
相應(yīng)的發(fā)生變化。兩因素間的交互作用為階交互作用,三因素間交互作用為二
階交互作用。
b當(dāng)觀察k個(gè)處理因素,每個(gè)因素均有m個(gè)水平時(shí),共有mk種組合,簡(jiǎn)記
為mk析因設(shè)計(jì)。
c可獲得三方面的信息:各因素不同水平的效應(yīng);各因素間的交互作用;通
過(guò)比較尋求最佳組合。
5樣本含量的估算:
⑴確定樣本含量的原則:在保證研究結(jié)論有一定可靠性的前提下,估算最少
需要多少受試對(duì)象。
⑵假設(shè)檢驗(yàn)所需樣本含量取決于四個(gè)要素:
1第一類(lèi)錯(cuò)誤概率a的大?。篴越小,所需樣本量越大;②第二類(lèi)錯(cuò)誤概率
B或檢驗(yàn)功效(If)的大?。?/p>
第二類(lèi)錯(cuò)誤的概率越小,檢驗(yàn)功效越大,所需樣本含量越多;③容許誤差5:
即兩總體參數(shù)的的差值,5越大,所需樣本含量越??;④總體標(biāo)準(zhǔn)差。和總體
概率71:。越大,所需樣本含量越多;總體概率71越接近50%,變異性越大,所
需樣本含量越多。
方差分析
1基本思想:把全部觀察值間的變異按設(shè)計(jì)和需要分解成兩個(gè)或多個(gè)組成部
分,然后將各部分的變異與隨機(jī)誤差進(jìn)行比較,以判斷各部分的變異是否具有統(tǒng)
計(jì)學(xué)意義。
2應(yīng)用條件:①各樣本是相互獨(dú)立的隨機(jī)樣本;②各樣本來(lái)自正態(tài)總體;
③各處理組總體方差相等,即方差齊性。
3任何設(shè)計(jì)方案的SS總和v總算法均相同,即在不考慮數(shù)據(jù)按任何方向分
組的情況下,將所有數(shù)據(jù)看成一個(gè)整體計(jì)算,即SS忌=(N-1)S2,
v總:N-lo
兒種設(shè)計(jì)方案中SS總和v總的分解:
設(shè)計(jì)方案SS總的分解v總
完全隨機(jī)設(shè)計(jì)SS總:SS組間+SS組內(nèi)v總=v組間+v組內(nèi)
隨機(jī)區(qū)組設(shè)計(jì)SS總二SS處理+SS區(qū)組+SS誤差v總:v處理+v區(qū)組+v誤差
析因設(shè)計(jì)55總=55處理+55誤差v3K處理+V誤差
=(SSA+SSB+SSAB)+SS誤差=(vA+vB+vAB)+v誤差
重復(fù)測(cè)量設(shè)計(jì)(兩因素)ss^=ss受試對(duì)象間+SS受試對(duì)象內(nèi)丫總=丫受試
對(duì)象間+v受試對(duì)象內(nèi)
=(SS處理+SS個(gè)體間誤差)+=(v處理+v個(gè)體間誤差)+
(SS時(shí)間+SS處理與時(shí)間交互+SS個(gè)體內(nèi)誤差)(v時(shí)間+v處理與時(shí)間交互
+v個(gè)體內(nèi)誤差)
4重復(fù)測(cè)量資料和隨機(jī)區(qū)組設(shè)計(jì)資料的區(qū)別:①同一受試對(duì)象在不同時(shí)間點(diǎn)
的數(shù)據(jù)高度相關(guān);②重復(fù)測(cè)量資料中的處理因素在受試對(duì)象(看成區(qū)組)間為
隨機(jī)分配,但受試對(duì)象(看成區(qū)組)內(nèi)的各時(shí)間點(diǎn)是固定的,不能隨機(jī)分配。隨
機(jī)區(qū)組設(shè)計(jì)資料中每個(gè)區(qū)組內(nèi)的受試對(duì)象彼此獨(dú)立,處理只在區(qū)組內(nèi)隨機(jī)分配,
同一區(qū)組內(nèi)的受試對(duì)象接受的處理各不相同。
5重復(fù)測(cè)量資料方差分析的前提條件:①各樣本是相互獨(dú)立的隨機(jī)樣本;
②各樣本來(lái)自正態(tài)總體;③各處理組總體方差相等,即方差齊性;④需滿足協(xié)
方差陣的球形性或復(fù)合對(duì)稱性。
6多各樣本均數(shù)的兩兩比較方法:①未計(jì)劃的每?jī)蓚€(gè)均數(shù)的事后比較,常用
SNK-q檢驗(yàn);②計(jì)劃好的某些均數(shù)間的兩兩比較,常用Dunnett-t檢驗(yàn);
③Bonferroni法和sidak法適用于所有的兩兩比較。
方差分析后不能作兩兩比較的t檢驗(yàn)的原因:會(huì)增加犯一類(lèi)錯(cuò)誤的概率。如
果比較次數(shù)為k,每次檢驗(yàn)水準(zhǔn)為a,則犯一類(lèi)錯(cuò)誤的累積概率為1-(1-a)k,
高于原有的a。
7數(shù)據(jù)變換的目的:①使各組達(dá)到方差齊性;②使資料轉(zhuǎn)換為正態(tài)分布,
以滿足方差分析和t檢驗(yàn)的應(yīng)用條件。通常情況下,一種適當(dāng)?shù)暮瘮?shù)轉(zhuǎn)換可使上
述兩個(gè)目的同時(shí)達(dá)到。③曲線直線化。常用于曲線擬合。常用的數(shù)據(jù)變換有對(duì)
數(shù)變換、平方根變換、平方根反正弦變換。
8方差分析中的F檢驗(yàn)是單側(cè)檢驗(yàn)的原因:方差分析中檢驗(yàn)統(tǒng)計(jì)量F的計(jì)算
通常是用某部分的均方(如處理因素,交互效應(yīng)等)除以誤差的均方,其中分母
誤差部分盡含隨機(jī)因素作用,分子某部分的均方含有相應(yīng)處理因素或交互作用的
效應(yīng),而且還含有隨機(jī)因素的作用,因此得F值從理論上應(yīng)21,不會(huì)小于1,所
以方差分析中F檢驗(yàn)是單側(cè)檢驗(yàn)。
X2檢驗(yàn)
1X2檢驗(yàn)用途:常用于分類(lèi)變量資料的統(tǒng)計(jì)推斷,主要用途包括:①單樣
本分布的擬合優(yōu)度;②比較兩個(gè)或多個(gè)獨(dú)立樣本頻率分布;③比較配對(duì)設(shè)計(jì)兩
樣本頻率和兩頻率分布;④推斷兩個(gè)變量或特征之間有無(wú)關(guān)聯(lián)性。
2X之檢驗(yàn)的理論基礎(chǔ)是X2分布和擬合優(yōu)度檢驗(yàn)。
Q)/分布①是一種連續(xù)型隨機(jī)變量的概率分布,按分布的密度函數(shù)可給出
自由度二1,2,3,......的一簇分布曲線。②》2分布形狀完全依賴于自由度v的
大小,當(dāng)v>l時(shí),隨著v的增加,曲線逐漸趨于對(duì)稱;當(dāng)自由度v趨于8時(shí)2
分布逼近正態(tài)分布。
⑵擬合優(yōu)度檢驗(yàn)是根據(jù)樣本的頻率分布檢驗(yàn)其總體分布是否等于給定的理
論分布。
3X2檢驗(yàn)的基本思想是:用統(tǒng)計(jì)量度量實(shí)際頻數(shù)和理論頻數(shù)之間的偏離程
之(4-兀)2
度,永遠(yuǎn)是正值,/2檢驗(yàn)統(tǒng)計(jì)量的基本公式是:*2=仁1「,v=k-l-s,
s是用樣本估計(jì)量代替總體參數(shù)的個(gè)數(shù)。若假設(shè)成立,則各格子的實(shí)際頻數(shù)與理
論頻數(shù)相差不應(yīng)該很大,因而算出的X2值也不會(huì)很大,即出現(xiàn)較大值的概率
P很小。若P《a,則認(rèn)為A與T的差別已超出了抽樣誤差允許的范圍,拒絕H0。
若P>a,不拒絕HOo
4獨(dú)立樣本2x2列聯(lián)表資料的檢驗(yàn):
HO:兩總體率相等;Hl:兩總體率不等。
y(4一7)2
lnN40且Tmin25,%嚏/^7,
(nd-bc))
產(chǎn)二(alb)(3d)(o+c)(b+d),v=1;
yi(|4T-0.5)2
2n240且1WTV5,校正公式:2*=乙7,
{\ad-bc\-n/2)2n
%2=(a+b)(c+d)(a+c)(b+d),v=i;
3nV40或TV1,或P=a時(shí),F(xiàn)isher精確概率法。
5獨(dú)立樣本RxC列聯(lián)表資料的¥?檢驗(yàn):(多個(gè)獨(dú)立樣本率、獨(dú)立樣本頻率
分布的比較)
H0:多個(gè)總體率相等;H1:多個(gè)總體率不等。
[yAicJ
-二rA乙"刖C/,v=(R-l)(C-l)
要求:理論頻數(shù)不宜太小,一般不宜有1/5以上的格子的理論頻數(shù)小于5,
或不宜有一個(gè)理論頻數(shù)小于1,否則可能會(huì)產(chǎn)生偏性。如果不滿足此要求,處理
方法有:①增加樣本含量(首選);②結(jié)合專(zhuān)業(yè)知識(shí)考慮是否可以將該格所在
行或列與別的行和列合并,要根據(jù)樣本特性來(lái)確定,但會(huì)損失信息;③改用RxC
表Fisher精確概率法,可以用計(jì)算機(jī)軟件實(shí)現(xiàn)。
RxC列聯(lián)表的分割:
①多個(gè)實(shí)驗(yàn)組間的兩兩比較:分析目的為k個(gè)實(shí)驗(yàn)組間,任兩個(gè)率均進(jìn)行
n2
比較時(shí),須進(jìn)行‘,
次獨(dú)立的四格表/2檢驗(yàn),再加上總的行x列表資料的片2檢
驗(yàn),共次檢驗(yàn)假設(shè)。故檢驗(yàn)水準(zhǔn)a用下式估計(jì):a=(>)+1,
(力)=2!(〃-2)!,k為樣本率的個(gè)數(shù)。②實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較:分
析目的為各實(shí)驗(yàn)組與同一個(gè)對(duì)照組的比較,而各實(shí)驗(yàn)組間不須比較。其檢驗(yàn)水準(zhǔn)
口’用下式估計(jì):。=2(h1)。
6配對(duì)設(shè)計(jì)資料的X2檢驗(yàn):
⑴配對(duì)2x2列聯(lián)表資料的X2檢驗(yàn)(兩種處理方法陽(yáng)性率的比較):
H0:兩總體陽(yáng)性率相等;H1:兩總體陽(yáng)性率不等。
QT)?(bi)?
;②當(dāng)時(shí),校
,ET=b+cfv=lb+c<40
(|b-c|-l)2
正公式/2二b+c,v=lo
⑵配對(duì)RxR列聯(lián)表資料的12檢驗(yàn):
H0:兩變量的概率分布相同;H1:兩變量的概率分布不相同。
(%一叫尸
%+叫一24〃
T=/=1v=k-lo
基于秩次的非參數(shù)檢驗(yàn)
1假設(shè)檢驗(yàn)的方法有:參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)。
①參數(shù)檢驗(yàn):是以特定的總體分布為前提,對(duì)未知的總體參數(shù)做推斷的假
設(shè)檢驗(yàn)方法統(tǒng)稱為如t檢驗(yàn)和
方差分析。
②非參數(shù)檢驗(yàn):不以特定的總體分布為前提,也不針對(duì)決定總體分布的幾
個(gè)參數(shù)做推斷,進(jìn)行的是分布之間的檢驗(yàn)。一般不直接用樣本觀察值做分析,統(tǒng)
計(jì)量的計(jì)算基于原數(shù)據(jù)在整個(gè)樣本中按大小所占位次。由于丟棄了觀察值的具體
數(shù)據(jù),只保留了大小次序的信息,凡適合參數(shù)檢驗(yàn)的資料,應(yīng)首選參數(shù)檢驗(yàn)。
2非參數(shù)檢驗(yàn)適用于:①有序變量資料;②總體分布類(lèi)型不明的資料;(3)
分布不對(duì)稱且無(wú)法轉(zhuǎn)化為正態(tài)分布資料;④對(duì)比組間方差不齊,有無(wú)適當(dāng)變換
方法達(dá)到方差齊性的資料;⑤一端或兩端觀察值不確切的資料;⑥等級(jí)資料。
3wilcoxon符號(hào)秩(和)檢驗(yàn):
⑴目的:可用于推斷總體中位數(shù)是否等于某個(gè)指定值,還可以推斷配對(duì)樣本
差值的總體中位數(shù)是否為0。①單樣本資料的符號(hào)秩檢驗(yàn)常用于不滿足t檢驗(yàn)條
件的單樣本定量變量資料的比較。②配對(duì)設(shè)計(jì)資料的符號(hào)秩和檢驗(yàn):由檢驗(yàn)配
對(duì)樣本的差值是否來(lái)自中位數(shù)為。的總體,來(lái)推斷兩個(gè)總體中位數(shù)是否相等,即
兩種處理效應(yīng)是否相同。Wilcoxon配對(duì)符號(hào)秩和檢驗(yàn)基本思想:在配對(duì)樣本中,
假定兩種處理效果相同,則差值的總體分布為對(duì)稱分布,并且差值的總體中位數(shù)
為0。若假設(shè)成立,樣本差值的正秩和與負(fù)秩和應(yīng)相差不大,均接近n(n+l)/4;
當(dāng)正負(fù)秩和相差懸殊,超出抽樣誤差可解釋的范圍時(shí),則有理由懷疑該假設(shè),從
而拒絕HOo
⑵方法要點(diǎn):①按差值絕對(duì)值從小到大編秩,差值為正的秩和以T+表示,
為負(fù)的秩和以T-表示,任取T+(或T-)作為檢驗(yàn)統(tǒng)計(jì)量T,查T(mén)界值表確定P
值;②正態(tài)近似法:隨著n的增大,T分布逼近均數(shù)為n(n+1)/4,方差為n
(n+1)(2n+l)/24的正態(tài)分布。當(dāng)n>50,用Z檢驗(yàn)。
③注意事項(xiàng):①編秩時(shí)遇差值為0舍去,n隨之減??;遇有差值的絕對(duì)值
相等,符號(hào)相同,仍按順序編秩;符號(hào)不同,取其平均秩次;②T++T-=n(n+1)
/2
4wilcoxon秩和檢驗(yàn):
Q)目的是推斷連續(xù)型變量資料或有序變量資料的兩個(gè)獨(dú)立樣本代表的兩個(gè)
總體分布是否有差別。
⑵方法要點(diǎn):①將兩組數(shù)據(jù)由小到大同一編秩,以樣本列數(shù)小者為nl,其
秩和為T(mén),查T(mén)界值表確定P值;②正態(tài)近似法:當(dāng)nl>10或n2-nl>10時(shí),T
分布接近均數(shù)為nl(N+1)/2,方差為nlr)2(N+1)/2的正態(tài)分布,可用Z檢
驗(yàn)。
⑶注意事項(xiàng):①編秩中若有相同的數(shù)據(jù)在同一組則依次編秩;若相同數(shù)值
在不同組內(nèi),求平均秩次;②當(dāng)相持出現(xiàn)較多時(shí)(超過(guò)25%),需使用校正公
式。
⑷基本思想:假設(shè)含量為nl與n2的兩個(gè)樣本(且nl"2),來(lái)自同一總體
或分布相同的兩個(gè)總體,則nl樣本的秩和T1與其理論秩和nl(N+D/2相差不
大,即[T-nl(N+1)/2]僅為抽樣誤差所致。當(dāng)二者相差懸殊,超出抽樣誤差可
解釋的范圍時(shí),則有理由懷疑該假設(shè),從而拒絕H0。
5Kruskal-WallisH檢驗(yàn):
⑴目的:用于推斷定量變量或有序分類(lèi)變量的多個(gè)總體分布有無(wú)差別。
⑵方法要點(diǎn):①先將k組數(shù)據(jù)由小到大同一編秩,求出各組秩和Ri,計(jì)算檢
驗(yàn)統(tǒng)計(jì)量H;②當(dāng)組數(shù)k=3,且各組例數(shù)ni三時(shí),查H界值表確定P值;若k23
或最小樣本例數(shù)大于5,則H統(tǒng)計(jì)量近似服從v=k-l的12分布。
⑶注意事項(xiàng):①編秩中若有相同的數(shù)據(jù)在同一組則依次編秩;若相同數(shù)值
在不同組內(nèi),求平均秩次:②當(dāng)相持出現(xiàn)較多時(shí)(超過(guò)25%),需使用校正公
式;③當(dāng)結(jié)論為拒絕HO,認(rèn)為多組處理效應(yīng)不全相同時(shí),常需進(jìn)一步作多個(gè)樣
木的兩兩比較的秩和檢驗(yàn)。
兩變量關(guān)聯(lián)性分析
1相關(guān)系數(shù)的意義及計(jì)算:
x和y的協(xié)方差
相關(guān)系數(shù)4行前方差)(丫的方差)。
①總體相關(guān)系數(shù)P,若"0,稱X和Y線性相關(guān);若p=0,則簡(jiǎn)稱X和Y不
相關(guān)。樣本協(xié)方差是離均差乘積在樣本中的平均,離均差在總體中的平均就是總
體協(xié)方差。
2(X㈤("7)
②樣本相關(guān)系數(shù),是兩個(gè)隨
機(jī)變量之間線性相關(guān)強(qiáng)度和方向的統(tǒng)計(jì)量,沒(méi)有單位,取值范圍為「的
正負(fù)值表示兩變量間線性相關(guān)的方向,r>0為正相關(guān),r<0為負(fù)相關(guān),r=0為零相
關(guān)。r的絕對(duì)值大小表示兩變量之間線性相關(guān)的密切程度,I”越接近于1,密
切程度越高;越接近于。,密切程度越低。
2相關(guān)系數(shù)的統(tǒng)計(jì)推斷:
建立建設(shè):HO:p=0:Hl:p/O,并假定X和Y服從二元正態(tài)分布。
方法:①直接查相關(guān)系數(shù)臨界值表,根據(jù)自由度v=n-2,差臨界值表,比較
"I與臨界值,統(tǒng)計(jì)量越大,概率P越小;統(tǒng)計(jì)量越小,概率P越大。②t檢
r-0Jl-r2
驗(yàn):統(tǒng)計(jì)量為tr=Sr,Sr為樣本相關(guān)系數(shù)r的標(biāo)準(zhǔn)誤,SrJn^2,H0成立
時(shí),機(jī)服從自由度為v=n-2的t分布。以上兩種方法的決策規(guī)則相同:若P>0.05,
不拒絕零假設(shè),即認(rèn)為兩個(gè)變量間無(wú)相關(guān)性;若P<0.05,拒絕冬假設(shè),接受備擇
假設(shè),即認(rèn)為兩變量間相關(guān)性有統(tǒng)計(jì)學(xué)意義。
3相關(guān)分析應(yīng)注意的問(wèn)題:①進(jìn)行相關(guān)分析前,應(yīng)先繪制散點(diǎn)圖。只有散點(diǎn)
有線性趨勢(shì)時(shí),才能進(jìn)行直線相關(guān)分析。②線性相關(guān)分析要求兩個(gè)變量都是隨
機(jī)變量,而且僅適用于二元正態(tài)分布資料;③出現(xiàn)離群值慎用相關(guān);④相關(guān)關(guān)
系不一定是因果關(guān)系;⑤分層資料盲目合并易出現(xiàn)假象;⑥樣本的相關(guān)系數(shù)接
近零并不意味著兩變量間一定無(wú)相關(guān)性,布?可能是非線性的曲線關(guān)系。
£(p-p)
4秩相關(guān)系數(shù)的計(jì)算:
-l<r5<lo適用于條件:①不服從雙變量正態(tài)分布而不宜作積差相關(guān)分析的資料;
②總體分布型未知的資料;③用等級(jí)表示的原始資料;④分布端點(diǎn)無(wú)確定數(shù)值
的資料;⑤用相對(duì)數(shù)表示的資料。
5秩相關(guān)系數(shù)的統(tǒng)計(jì)推斷:HO:ps=O:Hl:psxO,a=0.05,當(dāng)n450時(shí),查
附表14的rs界值表;當(dāng)n>50時(shí),計(jì)算檢驗(yàn)統(tǒng)計(jì)量u,查t界值表。
6分類(lèi)資料的關(guān)聯(lián)性分析:
⑴對(duì)兩個(gè)定量變量的關(guān)聯(lián)性,可用Pearson積矩相關(guān)系數(shù)或秩相關(guān)系數(shù)來(lái)描
述;對(duì)兩個(gè)分類(lèi)變量,通常是
先根據(jù)交叉分類(lèi)計(jì)數(shù)所得的列聯(lián)表進(jìn)行兩種屬性獨(dú)立性的才、僉驗(yàn),然后計(jì)
算關(guān)聯(lián)系數(shù)。關(guān)于兩個(gè)分類(lèi)變量關(guān)聯(lián)的程度,用Pearson列聯(lián)系數(shù)來(lái)描述:
r=+〃,列聯(lián)系數(shù)r取值范圍在。?1之間。。表示完全獨(dú)立;1表示完全相
關(guān);愈接近于0,關(guān)系愈不密切;愈接近于1,關(guān)系愈密切。【對(duì)兩個(gè)反映屬性
的分類(lèi)變量,若有一份隨機(jī)樣本,可做交叉分類(lèi)的頻數(shù)表,利用關(guān)于獨(dú)立性的力
檢驗(yàn)和列聯(lián)系數(shù)來(lái)描述兩變量的關(guān)聯(lián)性】
¥(4一7)2
⑵交叉分類(lèi)2x2表的關(guān)聯(lián)分析:X吆乙T(3)2X2配對(duì)資料的關(guān)聯(lián)
(od-bc)2〃
性分析:*40且Tmin25/2=(°+b)(c+d)(n+c)(b+d);11240且1<T
(一〃/2)2〃
<5,
2\Lanm]
⑷RxC表分類(lèi)資料的美聯(lián)性分析:X=nKc,每格的T>1且
T<5的格子數(shù)不宜多于格子總數(shù)的1/5o
簡(jiǎn)單回歸分析
1回歸方程:Y=a+bX,b=E(x-x)jxx2線性回歸模型的適
用條件:①線性:因變量Y與自變量X稱線性關(guān)系;②獨(dú)立:每個(gè)個(gè)體觀察值
之間互相獨(dú)立;③正態(tài)性:任意給定X值,對(duì)應(yīng)的隨機(jī)變量Y都服從正態(tài)分布;
④等方差性:在一定范圍內(nèi)不同的X值所對(duì)應(yīng)的隨機(jī)變量Y的方差相等。簡(jiǎn)記
為L(zhǎng)INEo
3總體回歸系數(shù)B的統(tǒng)計(jì)推斷:總體回歸系數(shù)。是否為0的假設(shè)檢驗(yàn),可用
方差分析或t檢驗(yàn)。
4決定系數(shù)反映了回歸平方和在總平和中所占的比例,常用來(lái)反映回歸的實(shí)
際效果。
5線性回歸的應(yīng)用:①用于計(jì)算總體條件均數(shù)的置信區(qū)間以及總體回歸線的
置信帶;②用于計(jì)算個(gè)體Y預(yù)測(cè)值及其預(yù)測(cè)區(qū)間。線性回歸常用于統(tǒng)計(jì)預(yù)測(cè)和
統(tǒng)計(jì)推斷。
6線性回歸與線性相關(guān)的區(qū)別與聯(lián)系:
⑴區(qū)別:
①單位:相關(guān)系數(shù)r沒(méi)有單位,回歸系數(shù)b有單位;所以,相關(guān)系數(shù)與單
位無(wú)關(guān),回歸系數(shù)與單位有關(guān);
②應(yīng)用目的:說(shuō)明兩變量間的關(guān)聯(lián)性用相關(guān)分析,說(shuō)明兩者依存變化的數(shù)
量關(guān)系則用回歸分析?;
③對(duì)資料的要求不
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 黑龍江省哈爾濱市德強(qiáng)高級(jí)中學(xué)2025-2026學(xué)年高二(上)期末物理試卷(Ⅱ卷)(含答案)
- 甘肅省武威市2025-2026學(xué)年高三(上)期末物理試卷(含答案)
- 2025~2026學(xué)年山東濟(jì)南市天橋區(qū)八年級(jí)語(yǔ)文第一學(xué)期期末考試試題(含答案)
- 危險(xiǎn)化學(xué)品試題及答案
- 部編人教版六年級(jí)數(shù)學(xué)上冊(cè)期末考試題含答案
- 2022~2023民政行業(yè)職業(yè)鑒定考試題庫(kù)及答案第256期
- 2023年房屋建筑學(xué)考試復(fù)習(xí)題及參考答案
- 2022~2023糧油食品檢驗(yàn)人員考試題庫(kù)及答案解析第101期
- 變頻器應(yīng)用技術(shù)要點(diǎn)
- 三峽新能源考試題及答案
- 數(shù)字孿生方案
- 金融領(lǐng)域人工智能算法應(yīng)用倫理與安全評(píng)規(guī)范
- 2026長(zhǎng)治日?qǐng)?bào)社工作人員招聘勞務(wù)派遣人員5人備考題庫(kù)及答案1套
- 機(jī)動(dòng)車(chē)駕校安全培訓(xùn)課件
- 河道清淤作業(yè)安全組織施工方案
- 2025年役前訓(xùn)練考試題庫(kù)及答案
- 2024VADOD臨床實(shí)踐指南:耳鳴的管理課件
- 2026年七臺(tái)河職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)附答案
- 2021海灣消防 GST-LD-8318 緊急啟停按鈕使用說(shuō)明書(shū)
- 煙花爆竹零售經(jīng)營(yíng)安全責(zé)任制度
- 2025廣東潮州府城文化旅游投資集團(tuán)有限公司下屬企業(yè)副總經(jīng)理崗位招聘1人筆試歷年備考題庫(kù)附帶答案詳解2套試卷
評(píng)論
0/150
提交評(píng)論