研究生醫(yī)學(xué)統(tǒng)計(jì)學(xué)考點(diǎn)總結(jié)

上傳人：l*** IP屬地：安徽上傳時(shí)間：2022-08-02 格式：DOC 頁(yè)數(shù)：19 大?。?56KB 積分：28 舉報(bào) 版權(quán)申訴

研究生醫(yī)學(xué)統(tǒng)計(jì)學(xué)考點(diǎn)總結(jié)_第2頁(yè)

研究生醫(yī)學(xué)統(tǒng)計(jì)學(xué)考點(diǎn)總結(jié)_第3頁(yè)

研究生醫(yī)學(xué)統(tǒng)計(jì)學(xué)考點(diǎn)總結(jié)_第4頁(yè)

研究生醫(yī)學(xué)統(tǒng)計(jì)學(xué)考點(diǎn)總結(jié)_第5頁(yè)

已閱讀5頁(yè)，還剩14頁(yè)未讀，繼續(xù)免費(fèi)閱讀

版權(quán)說(shuō)明：本文檔由用戶提供并上傳，收益歸屬內(nèi)容提供方，若內(nèi)容存在侵權(quán)，請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、. 醫(yī)學(xué)統(tǒng)計(jì)學(xué)根本概念：1.醫(yī)學(xué)統(tǒng)計(jì)學(xué)Statistics：醫(yī)學(xué)統(tǒng)計(jì)學(xué)是以醫(yī)學(xué)理論為指導(dǎo)，應(yīng)用概率論與數(shù)理統(tǒng)計(jì)的有關(guān)原理和方法，研究醫(yī)學(xué)資料的搜集、整理、分析和推斷的一門(mén)科學(xué)。2.同質(zhì)和異質(zhì)：具有一樣性質(zhì)的事物稱為同質(zhì)(homogeneous)。否則稱為異質(zhì)的或者間雜的(heterogeneous)。不同質(zhì)的個(gè)體不能籠統(tǒng)地混在一起分析，同質(zhì)和異質(zhì)是相對(duì)的概念。3.變異：同質(zhì)事物之間的差異稱為變異(variation)，亦稱個(gè)體變異。變異的兩個(gè)方面：個(gè)體與個(gè)體間的差異同一個(gè)體重復(fù)測(cè)量值間的差異結(jié)果是隨機(jī)的，不可預(yù)測(cè)的；一種或多種不可控因素(的或未知的)作用下的綜合表現(xiàn)；個(gè)體變異是普遍存在的；個(gè)體

2、變異是有規(guī)律的；沒(méi)有個(gè)體變異，就沒(méi)有統(tǒng)計(jì)學(xué)。4.總體和樣本：總體(population)：根據(jù)研究目的所確定的同質(zhì)觀察單位的全體；分為有限總體和無(wú)限總體。個(gè)體(individual)：是構(gòu)成總體的最根本觀察單位。樣本(sample)：是從總體中按照一定的目的隨機(jī)抽取的一局部具有代表性的個(gè)體集合。樣本含量(sample size)：樣本中包含的個(gè)體個(gè)數(shù)。5.參數(shù)和統(tǒng)計(jì)量：總體參數(shù)(parameter)：描述*總體特征的指標(biāo)，簡(jiǎn)稱參數(shù)，一般用希臘字母表示，如：、、。統(tǒng)計(jì)量(statistic)：描述*樣本特征的指標(biāo)，一般用拉丁字母表示，如：、s、p 。在總體被確定之后，總體參數(shù)就是一個(gè)常

3、數(shù)，是不會(huì)變化的，不管你是否確切知其大??；而統(tǒng)計(jì)量是幾乎總是隨著樣本而變的。6.隨機(jī)(random)：是指時(shí)機(jī)均等，目的是保證樣本對(duì)總體的代表性、可靠性。 7.概率和頻率：頻率( relative frequency )：在n次隨機(jī)試驗(yàn)中，事件A發(fā)生了m次，則比值m/n稱為事件A在這n次試驗(yàn)中出現(xiàn)的頻率。概率(probability)：是隨機(jī)事件發(fā)生可能性大小的一個(gè)度量，是一種參數(shù)，常用P表示，0P 1。8.小概率事件和小概率原理：小概率事件：醫(yī)學(xué)研究中，將概率小于等于0.05或0.01的事件稱為小概率事件。小概率原理：小概率事件并不表示不可能發(fā)生，但在*一次試驗(yàn)中，是不會(huì)發(fā)生的。9.變量的分

4、類(lèi)：按照取值的特性：數(shù)值變量 numerical Variable 定量變量：既有順序的意義，又有間隔的意義，可以認(rèn)為是連續(xù)的;往往有單位；取值間的差異是可以度量的。分類(lèi)變量 categorical Variable 定性變量：取值是是分散、定性的，表現(xiàn)為互不相容的類(lèi)別和屬性。無(wú)序分類(lèi) unordered categorics: 無(wú)順序，無(wú)間隔，僅有分類(lèi)二項(xiàng)分類(lèi)多項(xiàng)分類(lèi)有序分類(lèi) ordered categorics 等級(jí)變量:僅有順序，無(wú)單位；取值間的差異是不可度量的不同分類(lèi)的互相轉(zhuǎn)化數(shù)值變量無(wú)序分類(lèi)變量數(shù)值變量有序分類(lèi)變量有序分類(lèi)變量無(wú)序分類(lèi)變量信息量只有減少，不可增加統(tǒng)計(jì)描述指標(biāo)，呈現(xiàn)

5、方式可分為兩種統(tǒng)計(jì)圖：直觀，但準(zhǔn)確度稍差統(tǒng)計(jì)報(bào)表：能盡量詳細(xì)，準(zhǔn)確，但不夠直觀統(tǒng)計(jì)推斷：從樣本信息外推到總體，以最終獲得對(duì)所感興趣問(wèn)題的解答參數(shù)估計(jì)：樣本所在總體特征假設(shè)檢驗(yàn)：該指標(biāo)可能的影響因素分析頻數(shù)分布1.頻數(shù)表編制步驟求極差：R=*ma*-*min選定適當(dāng)?shù)慕M段數(shù)后估計(jì)組距：組段數(shù)的選取以能反映資料的分布特征為宜，一般取8 12組列出組段：組段的含義:包括組段的下限而不含組段的上限。如：3.2 等價(jià)于 3.2，3.5)。劃記歸組獲得頻數(shù)求頻率，完成頻數(shù)表：相應(yīng)的頻數(shù)除以總數(shù)即為頻率，各組段的頻率總和為1或者100%。2.頻數(shù)分布所提供的信息頻數(shù)分布圖用以表示數(shù)據(jù)的分布規(guī)律。

6、觀察有無(wú)可疑值?？疾旆植嫉念?lèi)型。對(duì)稱分布非對(duì)稱分布(偏態(tài)分布) 左偏態(tài)(負(fù)偏態(tài)) ：指分布的長(zhǎng)尾在峰的左側(cè)。右偏態(tài)(正偏態(tài)) ：指分布的長(zhǎng)尾在峰的右側(cè)?？疾旆植嫉奶卣?集中位置 (Central Tendency)：描述指標(biāo)有平均數(shù)算術(shù)均數(shù)(Mean)、幾何均數(shù)(Geometric Mean) 、中位數(shù)(Median)、百分位數(shù)(Percentile) 。離散趨勢(shì) (Tendency of Dispersion)：描述指標(biāo)有極差(Range)、四分位數(shù)間距(interquartile range) 、方差(Variance) 、標(biāo)準(zhǔn)差(Standard Deviation) 、變異系數(shù)( co

7、efficient of variation ) 。3.平均數(shù)應(yīng)用的考前須知：同質(zhì)的資料計(jì)算平均數(shù)才有意義。均數(shù)適用于：?jiǎn)畏鍖?duì)稱分布的資料。幾何均數(shù)適用于：對(duì)數(shù)變換后單峰對(duì)稱的資料。等比資料、滴度資料、對(duì)數(shù)正態(tài)分布資料。計(jì)算幾何均數(shù)時(shí)：變量值中不能有0同一組變量值不能同時(shí)存在正、負(fù)值，假設(shè)變量值全為負(fù)值，可先將負(fù)號(hào)除去，算出結(jié)果后再冠以負(fù)號(hào)中位數(shù)：理論上可用于任何分布資料，常用于描述偏態(tài)資料，開(kāi)口資料，有不確定值的資料的集中位置。但當(dāng)資料適合計(jì)算均數(shù)或幾何均數(shù)時(shí)，不宜用中位數(shù)。中位數(shù)和百分位數(shù)在樣本含量較少時(shí)不穩(wěn)定，越靠?jī)啥嗽讲环€(wěn)定；中位數(shù)在抗極端值的影響方面，比均數(shù)具有較好的穩(wěn)定性，但不如均

8、數(shù)準(zhǔn)確。不同質(zhì)的資料應(yīng)考慮分別計(jì)算平均數(shù)。百分位數(shù)：樣本含量較少時(shí)不宜計(jì)算靠近兩端的百分位數(shù)。平均數(shù)要與變異指標(biāo)結(jié)合使用。4.變異度指標(biāo)：四分位數(shù)間距(inter-quartile range)：QU QL P75 P25，即中間一半觀察值的極差。方差及標(biāo)準(zhǔn)差：變異系數(shù)(coefficient of variation, CV)：為標(biāo)準(zhǔn)差和均數(shù)的比值，排除了平均水平的影響，并取消了單位。因此變異系數(shù)常用于：比擬度量衡單位不同的兩組或多組資料的變異度比擬均數(shù)相差懸殊的兩組或多組資料的變異度5.變異度的正確應(yīng)用：極差不穩(wěn)定，不靈敏標(biāo)準(zhǔn)差的根本容是離均差，它顯示一組變量值與其均數(shù)的間距，故標(biāo)準(zhǔn)差直

9、接地、總結(jié)地、平均地描述了變量值的離散程度。在同質(zhì)的前提下，標(biāo)準(zhǔn)差大表示變量值的離散程度大，即變量值的分布分散、不整齊、波動(dòng)較大；反之，標(biāo)準(zhǔn)差小表示變量值的離散程度小，即變量值的分布集中、整齊、波動(dòng)較小。變異系數(shù)派生于標(biāo)準(zhǔn)差，其應(yīng)用價(jià)值在于排除了平均水平的影響，并消除了單位。6.總結(jié)：每個(gè)觀察指標(biāo)均有其特定的變異規(guī)律；描述變異：圖形描述統(tǒng)計(jì)量描述平均數(shù)：均數(shù)、幾何均數(shù)、中位數(shù)和百分位數(shù)變異度：極差、方差、標(biāo)準(zhǔn)差、四分位數(shù)間距、變異系數(shù) 不同分布的指標(biāo)，用不同的統(tǒng)計(jì)量描述；用平均數(shù)與變異度共同描述。正態(tài)分布1.公式：如果隨機(jī)變量*的概率密度函數(shù)為 (- *+)則稱*服從正態(tài)分布,記作*N(,2)

10、,其中，為分布的均數(shù)，為分布的標(biāo)準(zhǔn)差。為總體均數(shù)，為總體標(biāo)準(zhǔn)差。為圓周率，e為自然對(duì)數(shù)的底，*為變量，代表橫軸的數(shù)值，f(*)為縱軸數(shù)值。2.正態(tài)分布的特征重要：?jiǎn)畏宸植?；頂峰在均?shù)處；以均數(shù)為中心，均數(shù)兩側(cè)完全對(duì)稱。正態(tài)分布有兩個(gè)參數(shù)(parameter)，即位置參數(shù)(均數(shù))和變異度參數(shù)(標(biāo)準(zhǔn)差)。有些指標(biāo)本身不服從正態(tài)分布，但經(jīng)過(guò)變換之后可以服從正態(tài)分布。正態(tài)曲線下的面積分布有一定的規(guī)律。 *軸與正態(tài)曲線所夾面積恒等于1 ，對(duì)稱區(qū)域面積相等。-1.64 +1.64面積為90%；-1.96 +1.96面積為95%；-2.58 +2.58面積為99%。正態(tài)分布曲線下的面積與標(biāo)準(zhǔn)正態(tài)分布曲線

11、下的面積對(duì)應(yīng)(以標(biāo)準(zhǔn)正態(tài)離差為單位)。3.標(biāo)準(zhǔn)正態(tài)分布：標(biāo)準(zhǔn)正態(tài)分布(standard normal distribution)是均數(shù)為0，標(biāo)準(zhǔn)差為1的正態(tài)分布。記為N(0,1)。標(biāo)準(zhǔn)正態(tài)分布是一條曲線。概率密度函數(shù)為： (- u+) 正態(tài)分布轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布：假設(shè)*N(,2)，作變換：則u服從標(biāo)準(zhǔn)正態(tài)分布，u稱為標(biāo)準(zhǔn)正態(tài)離差(standard normal deviation)4.正態(tài)分布的應(yīng)用：估計(jì)頻數(shù)分布、質(zhì)量控制、確定臨床參考值圍參考值圍：1.參考值圍(reference interval)：是絕大多數(shù)正常人的*觀察指標(biāo)所在的圍，絕大多數(shù)：90%，95%，99%等等。確定參考值圍的意

12、義：用于判斷正常與異常?！罢Ｈ说亩x：排除了影響所研究的指標(biāo)的疾病和有關(guān)因素的同質(zhì)的人群。2.參考值圍確定的原則：選定足夠例數(shù)的同質(zhì)的正常人作為研究對(duì)象：例數(shù)過(guò)少，代表性差；例數(shù)過(guò)多增加本錢(qián)，且易導(dǎo)致正常標(biāo)準(zhǔn)把握不嚴(yán)，影響數(shù)據(jù)的可靠性控制檢測(cè)誤差判斷是否分組(性別,年齡組) 單、雙側(cè)問(wèn)題 (one sided or two sided)選擇百分界值(90%,95%) 確定可疑圍3.參考值圍的估計(jì)方法：正態(tài)分布法、百分位數(shù)法抽樣誤差1概念：由于個(gè)體變異的存在，在抽樣研究中產(chǎn)生樣本統(tǒng)計(jì)量和總體參數(shù)之間的差異，稱為抽樣誤差sampling error。抽樣誤差的表現(xiàn)：樣本均數(shù)和總體均數(shù)間的差異、樣

13、本均數(shù)和樣本均數(shù)間的差異。2.中心極限定理 (central limit theorem)：從均數(shù)為，標(biāo)準(zhǔn)差為的正態(tài)總體中隨機(jī)抽樣，樣本均數(shù)服從均數(shù)為，標(biāo)準(zhǔn)差為的正態(tài)分布。從均數(shù)為，標(biāo)準(zhǔn)差為的任意總體中隨機(jī)抽樣，當(dāng)樣本含量足夠大時(shí)，樣本均數(shù)近似服從均數(shù)為，標(biāo)準(zhǔn)差為的正態(tài)分布。3. 標(biāo)準(zhǔn)誤(standard error)：用樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差來(lái)反映抽樣誤差的大小，又稱標(biāo)準(zhǔn)誤。其中，為總體標(biāo)準(zhǔn)差，n為抽樣的樣本例數(shù) 在研究工作時(shí)，由于總體標(biāo)準(zhǔn)差常常未知，可以利用樣本標(biāo)準(zhǔn)差近似估計(jì)4.標(biāo)準(zhǔn)誤的意義：反映了樣本統(tǒng)計(jì)量樣本均數(shù)，樣本率分布的離散程度，表達(dá)了抽樣誤差的大小。標(biāo)準(zhǔn)誤越大，說(shuō)明樣本統(tǒng)計(jì)量樣

14、本均數(shù)，樣本率的離散程度越大，即用樣本統(tǒng)計(jì)量來(lái)直接估計(jì)總體參數(shù)越不可靠。標(biāo)準(zhǔn)誤的大小與標(biāo)準(zhǔn)差有關(guān)，在例數(shù)n一定時(shí)，從標(biāo)準(zhǔn)差大的總體中抽樣，標(biāo)準(zhǔn)誤較大；而當(dāng)總體一定時(shí)，樣本例數(shù)越多，標(biāo)準(zhǔn)誤越小。說(shuō)明我們可以通過(guò)增加樣本含量來(lái)減少抽樣誤差的大小。t分布1.根據(jù)中心極限定理的容，當(dāng)樣本含量足夠大時(shí)，對(duì)從均數(shù)為，標(biāo)準(zhǔn)差為的任意總體中隨機(jī)抽樣所得的樣本均數(shù)進(jìn)展標(biāo)準(zhǔn)化變換，有2.由于總體標(biāo)準(zhǔn)差往往是未知的，此時(shí)往往用樣本標(biāo)準(zhǔn)差代替總體標(biāo)準(zhǔn)差：這里，為自由度，取值為n-13.t 分布的性質(zhì)：t分布為一簇單峰分布曲線，頂峰在0的位置上，說(shuō)明從正態(tài)總體中隨機(jī)抽樣所得樣本計(jì)算出的t值接近0的可能性較大。t分布以

15、0為中心，左右對(duì)稱。分布的頂峰位置比 u 分布低，尾部高。t分布與自由度有關(guān)，自由度越小，t分布的峰越低，而兩側(cè)尾部翹得越高；自由度逐漸增大時(shí)，t分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布；當(dāng)自由度為無(wú)窮大時(shí)，t分布就是標(biāo)準(zhǔn)正態(tài)分布。每一自由度下的t分布曲線都有其自身分布規(guī)律。t界值表 ?？尚艆^(qū)間1. 統(tǒng)計(jì)推斷(statistical inference)：是指如何抽樣，以及如何用樣本性質(zhì)推斷總體特征，分為參數(shù)估計(jì)(parameter estimation)、假設(shè)檢驗(yàn)(hypothesis testing)。2.參數(shù)估計(jì)：點(diǎn)估計(jì)Point Estimation)：用樣本統(tǒng)計(jì)量作為總體參數(shù)的估計(jì)。區(qū)間估計(jì) (In

16、terval Estimation)：3.可信區(qū)間定義：按一定的概率或可信度(1-)用一個(gè)區(qū)間來(lái)估計(jì)總體參數(shù)所在的圍，該圍通常稱為參數(shù)的可信區(qū)間或者置信區(qū)間(confidence interval，CI),預(yù)先給定的概率(1-)稱為可信度或者置信度(confidence level),常取95%或99%。可信區(qū)間(CL, CU )是一開(kāi)區(qū)間CL、CU 稱為可信限。4.可信區(qū)間的計(jì)算：樣本含量較小時(shí) (n100)：下限：上限：樣本含量較大時(shí) (n100)：下限：上限：5.均數(shù)之差可信區(qū)間的計(jì)算：均數(shù)之差與“均數(shù)之差的標(biāo)準(zhǔn)誤之比，服從自由度= n1+n2 -2的 t 分布。樣本含量較大時(shí)，服從標(biāo)

17、準(zhǔn)正態(tài)分布。合并方差：均數(shù)之差的標(biāo)準(zhǔn)誤：6.可信區(qū)間的兩個(gè)要素：可信度Confidence)：準(zhǔn)確性，可靠性，即1-。一般取90%,95,可人為控制。準(zhǔn)確性(Precision)：區(qū)間的大小，越小越好。必須二者兼顧7.可信區(qū)間的寬度：可信度越大，可信區(qū)間越寬，說(shuō)明用該區(qū)間來(lái)估計(jì)總體參數(shù)總體均數(shù)越可靠。標(biāo)準(zhǔn)差越小，可信區(qū)間就越窄，意味著如果總體變異程度較小時(shí)，在一樣的可信度下，只需要一個(gè)比擬窄的可信區(qū)間就可以估計(jì)總體均數(shù)。隨著樣本含量的增加，可信區(qū)間逐漸變窄。8.正確理解可信區(qū)間：可信度為95%的CI的涵義：每100個(gè)樣本，按同樣方法計(jì)算95%的CI，平均有95%的CI包含了總體參數(shù)。這里的95

18、%，指的是方法本身！而不是*個(gè)區(qū)間！總體參數(shù)雖未知，但卻是固定的值，而不是隨機(jī)變量值。假設(shè)檢驗(yàn)1.假設(shè)檢驗(yàn)的目的：根本目的就是分辨兩個(gè)樣本是否屬一個(gè)總體或兩個(gè)不同的總體，并對(duì)總體作出適當(dāng)?shù)慕Y(jié)論。 2.假設(shè)檢驗(yàn)的一般步驟：步驟1：建立假設(shè)，在假設(shè)的前提下有規(guī)律可尋零假設(shè)(null hypothesis)，記為H0 ，表示目前的差異是由于抽樣誤差引起的。備擇假設(shè)(alternative hypothesis)，記為H1 ，表示目前的差異是主要由于本質(zhì)上的差異引起。步驟2：確立檢驗(yàn)水準(zhǔn)significance level)，用于確定何時(shí)拒絕H0，一般取0.05。步驟3：計(jì)算檢驗(yàn)統(tǒng)計(jì)量和 P 值計(jì)

19、算檢驗(yàn)統(tǒng)計(jì)量，即計(jì)算樣本與所假設(shè)總體的偏離；樣本均數(shù)與總體均數(shù)0間的差異可以用統(tǒng)計(jì)量 t 來(lái)表示統(tǒng)計(jì)量 t 表示，在標(biāo)準(zhǔn)誤的尺度下，樣本均數(shù)與總體均數(shù) 0 的偏離。這種偏離稱為標(biāo)準(zhǔn) t 離差(standard t deviation)。根據(jù)抽樣誤差理論，在H0的假設(shè)前提下，統(tǒng)計(jì)量 t 服從自由度為 n-1的 t 分布，即 t 值在0的附近的可能性大，遠(yuǎn)離0的可能性小，離0越遠(yuǎn)可能性越小。步驟5：界定P值并作結(jié)論3.假設(shè)檢驗(yàn)應(yīng)用的考前須知：A.I型錯(cuò)誤和II型錯(cuò)誤：第一類(lèi)錯(cuò)誤Type I Error：拒絕了實(shí)際上是成立的H0；第二類(lèi)錯(cuò)誤Type II Error：不拒絕實(shí)際上是不成立的H0。B.

20、檢驗(yàn)水準(zhǔn)的選擇：檢驗(yàn)水準(zhǔn)有單雙側(cè)之分。選擇要有專(zhuān)業(yè)背景。檢驗(yàn)水準(zhǔn)大小的選擇要慎重。選擇要在計(jì)算檢驗(yàn)統(tǒng)計(jì)量之前。C.雙側(cè)檢驗(yàn)與單側(cè)檢驗(yàn)：在一樣的檢驗(yàn)水準(zhǔn)下，正確地選擇單側(cè)檢驗(yàn)將比雙側(cè)檢驗(yàn)得到更多的檢驗(yàn)效能。D.P和的涵義：P值意義：從 H0 總體中隨機(jī)獲得等于或大于現(xiàn)有統(tǒng)計(jì)量值的概率。拒絕H0時(shí)所冒的風(fēng)險(xiǎn)。的意義：犯第一類(lèi)錯(cuò)誤的概率；在假設(shè)檢驗(yàn)之前人為規(guī)定；說(shuō)明拒絕H0所冒的風(fēng)險(xiǎn)不可超過(guò)。E.正確對(duì)待統(tǒng)計(jì)結(jié)論和專(zhuān)業(yè)結(jié)論專(zhuān)業(yè)上有差異，假設(shè)檢驗(yàn)拒絕H0：結(jié)果有效，可以下專(zhuān)業(yè)結(jié)論；專(zhuān)業(yè)上無(wú)差異，假設(shè)檢驗(yàn)不拒絕H0：下無(wú)差異的結(jié)論；專(zhuān)業(yè)上有差異，假設(shè)檢驗(yàn)不拒絕H0：增大樣本含量，減少二類(lèi)誤差;專(zhuān)業(yè)上無(wú)差

21、異，假設(shè)檢驗(yàn)拒絕H0：改良試驗(yàn)，減少誤差。F.Significant 的意義4.假設(shè)檢驗(yàn)和可信區(qū)間的區(qū)別：在一樣的之下，假設(shè)假設(shè)檢驗(yàn)拒絕H0(p )，則可信度為(1- )的可信區(qū)間必然不包括總體參數(shù)；反之成立?？尚艆^(qū)間和假設(shè)檢驗(yàn)是對(duì)同一問(wèn)題所作的不同結(jié)論，效果等價(jià)。t檢驗(yàn)1.成組設(shè)計(jì)計(jì)量資料比擬的t檢驗(yàn)：合并方差(方差的加權(quán)平均)：均數(shù)之差的標(biāo)準(zhǔn)誤：自由度= n1+n2 -22.兩組資料比擬的 u 檢驗(yàn)：當(dāng)隨機(jī)抽樣的樣本例數(shù)足夠大時(shí)，t 檢驗(yàn)統(tǒng)計(jì)量的自由度逐漸增大，t 分布逐漸逼近于標(biāo)準(zhǔn)正態(tài)分布，可以利用近似正態(tài)分布的原理進(jìn)展u檢驗(yàn)。3.配對(duì)計(jì)量資料的 t檢驗(yàn)：配對(duì) t 檢驗(yàn)的實(shí)質(zhì)就是檢驗(yàn)樣

22、本差值的總體均數(shù)是否為0。4.均數(shù)的假設(shè)檢驗(yàn)應(yīng)用條件：獨(dú)立性、正態(tài)性、方差齊性與應(yīng)用條件有關(guān)的一些容：正態(tài)性檢驗(yàn)、方差齊性檢驗(yàn)、方差不齊時(shí)的近似 t 檢驗(yàn)、大樣本時(shí)，均數(shù)比擬的 u 檢驗(yàn)5.兩個(gè)方差的齊性檢驗(yàn)：Levene法：從同一總體隨機(jī)抽取的樣本之兩方差，其方差比(大方差/小方差)的分布服從 F分布：6.方差不齊時(shí)兩樣本均數(shù)比擬的近似 t 檢驗(yàn)：7.大樣本時(shí)均數(shù)比擬的u檢驗(yàn)：?jiǎn)螛颖緐檢驗(yàn)兩樣本u檢驗(yàn)方差分析(ANOVA)Analysis of Variancet檢驗(yàn)的局限性單因素兩水平1.因素和水平:因素(factors)：將試驗(yàn)對(duì)象隨機(jī)分為假設(shè)干個(gè)組，加以不同的干預(yù)，稱為處理因素。方差分

23、析中所要檢驗(yàn)的對(duì)象。在一樣的因素下的不同干預(yù)，稱為不同的水平(level)。方差分析中因素的不同表現(xiàn)。2.假設(shè)每次t檢驗(yàn)犯第一類(lèi)錯(cuò)誤的概率是0.05，則要完全地進(jìn)展比擬，犯第一類(lèi)錯(cuò)誤的概率是1(1)k。此為多組間不能進(jìn)展t檢驗(yàn)的原因。3.單因素方差分析：研究的是一個(gè)處理因素的不同水平間效應(yīng)的差異。4.完全隨機(jī)設(shè)計(jì)資料的方差分析：完全隨機(jī)設(shè)計(jì)是醫(yī)學(xué)科研中最為常用的一種實(shí)驗(yàn)設(shè)計(jì)方法，它是將受試者隨機(jī)地分配到各實(shí)驗(yàn)組(可包括對(duì)照組)中，進(jìn)展實(shí)驗(yàn)并觀察實(shí)驗(yàn)效應(yīng)。該設(shè)計(jì)適用面廣，可用于兩組或多組實(shí)驗(yàn)研究，且各組的樣本含量可不相等。證明：5.隨機(jī)區(qū)組配伍組設(shè)計(jì)的方差分析兩因素多個(gè)樣本均數(shù)的比擬：概念：隨機(jī)

24、區(qū)組設(shè)計(jì)又稱配伍組設(shè)計(jì)，是配對(duì)設(shè)計(jì)的擴(kuò)展，也可看作1:*的配對(duì)設(shè)計(jì)。它是將幾個(gè)條件一樣的受試者劃為一個(gè)區(qū)組(block)或配伍組，然后再按隨機(jī)的原則，將同一區(qū)組的受試者隨機(jī)分配到各實(shí)驗(yàn)組中。實(shí)質(zhì)：兩因素方差分析。變異分解，N為總樣本含量，k為水平數(shù)，n為區(qū)組數(shù)；6.多個(gè)樣本均數(shù)的兩兩比擬：又叫多重比擬，Multiple parison;分類(lèi)：事先方案好的多個(gè)試驗(yàn)組與一個(gè)對(duì)照組之間的比擬，多個(gè)組與一個(gè)特定組間的比擬或者特定組間的比擬；Planned Multiple parison 方差分析得到有差異的結(jié)論后多個(gè)組之間的相互比擬的探索性研究Post Hoc；Student-Newman-Keul

25、s法(SNK法)LSD法Dunnet法：7.兩兩比擬的考前須知：對(duì)于方差分析后的兩兩比擬均應(yīng)以方差分析拒絕相應(yīng)的H0為前提，且結(jié)論均不應(yīng)與方差分析的結(jié)論相悖；出現(xiàn)模糊結(jié)論，下結(jié)論應(yīng)該慎重；方差分析拒絕H0，但兩兩比擬得不出有差異的結(jié)論，因?yàn)榉讲罘治鲂矢?。兩種錯(cuò)誤的說(shuō)法：*2所來(lái)自的總體位于*1所來(lái)自的總體和*3所來(lái)自的總體之間；*1和*2來(lái)自同一總體，*2和*3來(lái)自同一總體。只能說(shuō)明無(wú)法判斷樣本2來(lái)自于何總體！不能用t 檢驗(yàn)代替方差分析，也不能用t 檢驗(yàn)代替兩兩比擬。無(wú)論是SNK法還是Dunnett法，用于兩組比擬時(shí)，結(jié)果與t 檢驗(yàn)等價(jià)。8.方差分析的要求：獨(dú)立隨機(jī)抽樣(Independe

26、nce)；正態(tài)性(Normality)；方差齊性(Homoscedascity)9.方差齊性檢驗(yàn)：兩個(gè)方差的齊性檢驗(yàn)：Levene法多個(gè)方差的齊性檢驗(yàn)：Bartlett法10.方差分析小結(jié)：A.均數(shù)、方差的比擬樣本均數(shù)與總體均數(shù)的比擬( t 檢驗(yàn))配對(duì)設(shè)計(jì)樣本均數(shù)的比擬(配對(duì)t 檢驗(yàn))兩樣本均數(shù)的比擬 ( t 檢驗(yàn), u 檢驗(yàn), F 檢驗(yàn), SNK, Dunnett)多樣本均數(shù)的比擬( F 檢驗(yàn)，ANOVA)各組間的比擬(SNK法)；各試驗(yàn)組與*一對(duì)照組間的比擬用(Dunnett法) 兩個(gè)方差的比擬( F 檢驗(yàn))B.兩個(gè)方差的比擬( Bartlett 檢驗(yàn))分析單因素多水平間的比擬或多個(gè)因素對(duì)

27、結(jié)果的影響；要求數(shù)據(jù)滿足正態(tài)性、獨(dú)立性、方差齊性單因素方差分析兩因素方差分析兩兩比擬變量變換方差分析應(yīng)用于兩組資料的比擬時(shí)，等價(jià)于t檢驗(yàn)。11.變量變換(Variable Transformation)方差齊性是一個(gè)很strong的假設(shè)，如果不齊，就一般不能直接進(jìn)展方差分析；變量變換：目的：方差齊性化，正態(tài)化，線性化常用方法：對(duì)數(shù)變換、平方根變換、倒數(shù)變換、平方根反正弦變換分類(lèi)資料的統(tǒng)計(jì)描述statistical description for categorical data1.常用的相對(duì)數(shù)：作用：第一，表示事物出現(xiàn)的頻度。第二，便于比擬。率：說(shuō)明*現(xiàn)象發(fā)生的頻率與強(qiáng)度構(gòu)成比：說(shuō)明*一事物

28、部各組成局部所占比例。比：說(shuō)明A 是B的多少倍，或百分之幾。2相對(duì)數(shù)應(yīng)用的考前須知：計(jì)算相對(duì)數(shù)時(shí)，分母不宜太小對(duì)兩個(gè)或多個(gè)相對(duì)數(shù)指標(biāo)進(jìn)展比擬時(shí)，要考慮抽樣誤差，進(jìn)展假設(shè)檢驗(yàn)，并不能憑相對(duì)數(shù)的數(shù)值大小輕易做出結(jié)論。區(qū)分構(gòu)成比和率合計(jì)率的計(jì)算不是直接求率的平均兩合計(jì)率的比擬需注意兩者的部構(gòu)成是否一樣3.標(biāo)準(zhǔn)化率標(biāo)準(zhǔn)化法就是用統(tǒng)一的標(biāo)準(zhǔn)對(duì)部構(gòu)成不同的各組頻率進(jìn)展調(diào)整和比照的方法。不同的標(biāo)準(zhǔn)，所得標(biāo)準(zhǔn)化率不同；標(biāo)準(zhǔn)化率是相對(duì)的，其作用僅在于比擬，而不表示實(shí)際水平；標(biāo)準(zhǔn)化率不代表總率，也不能完全代替分組比擬。二項(xiàng)分布及其應(yīng)用Binomial distribution and its applicatio

29、n：1.概率分布：隨機(jī)變量的概率分布：離散分布和連續(xù)分布，依賴于相應(yīng)的隨機(jī)變量是離散的還是連續(xù)的。2.概念：令*為n次試驗(yàn)中的二項(xiàng)隨機(jī)變量，成功的概率P(成功)p，則*的取值為0，l，2，n，其聯(lián)合概率分布為二項(xiàng)分布。3.二項(xiàng)分布的概率設(shè)事件A出現(xiàn)的概率為。則在n次獨(dú)立試驗(yàn)中，事件A恰好出現(xiàn) k 次的概率為：4.二項(xiàng)分布的均數(shù)和方差如果*B(n, )，則假設(shè)均數(shù)與標(biāo)準(zhǔn)差不用絕對(duì)數(shù)而用率表示時(shí),二項(xiàng)分布的累計(jì)概率:5.二項(xiàng)分布的圖形:當(dāng)=0.5，分布對(duì)稱；當(dāng)0.5，分布呈偏態(tài)；當(dāng)0.5時(shí)分布呈負(fù)偏態(tài)；特別是當(dāng)n值不是很大時(shí)，偏離0.5愈遠(yuǎn)，分布愈偏。隨著n的增大，二項(xiàng)分布逐漸逼近正態(tài)分布。一般

30、地說(shuō)，如果n或n(1-)大于5時(shí)，常可用正態(tài)近似原理處理二項(xiàng)分布問(wèn)題。 6.二項(xiàng)分布的應(yīng)用條件: 各觀察單位只能有互相對(duì)立的一種結(jié)果，如陽(yáng)性或陰性，生存或死亡等。發(fā)生*一結(jié)果(如陰性)的概率不變，其對(duì)立結(jié)果(如陽(yáng)性)的概率則為1-。n次試驗(yàn)在一樣條件下進(jìn)展，且各觀察單位的結(jié)果互相獨(dú)立。7.二項(xiàng)分布的應(yīng)用率的抽樣分布及其性質(zhì)總體率的可信區(qū)間估計(jì)兩總體率之差1-2的區(qū)間估計(jì)兩樣本率的比擬樣本率與總體率的比擬7.1率的抽樣分布及其性質(zhì)(P37)在n足夠大時(shí)，樣本率 p 的分布近似正態(tài)分布。率的均數(shù)和方差*B(n, p)，p=*/n樣本率的均數(shù)：樣本率的標(biāo)準(zhǔn)差：(率的標(biāo)準(zhǔn)誤)7.2 總體率的可信區(qū)間

31、估計(jì)查表法 n50正態(tài)近似法 np5 n(1-p)5puasp當(dāng)樣本例數(shù)n足夠大，且樣本率p和(1-p)都不太小時(shí)，即np和n(1-p)均大于5時(shí)，樣本率p的抽樣分布近似正態(tài)分布.率的 95%的CI:7.3 兩總體率之差1-2的區(qū)間估計(jì)設(shè)p1=r1/n1，p2=r2/n2是兩個(gè)樣本率，p1p2是它們的差。如果 n1p1，n1(1-p1)，n1p1，n2(1-p2)均大于5，則正態(tài)近似的方法可用于求總體率之差的可信區(qū)間： 7.4 兩樣本率的比擬( n 較大時(shí))(page73)7.5 樣本率與總體率的比擬( n 較小時(shí))2檢驗(yàn)一、兩個(gè)率的比擬1.卡方四格表根據(jù)檢驗(yàn)假設(shè)H0計(jì)算出來(lái)的數(shù)稱作理論頻數(shù)

32、(theoretical frequency)T。2.2檢驗(yàn)的根本思想：如果H0假設(shè)成立，則實(shí)際頻數(shù)與理論頻數(shù)應(yīng)該比擬接近。差值屬于隨機(jī)誤差，用2統(tǒng)計(jì)量表示：H0成立時(shí)，實(shí)際數(shù)與理論數(shù)的差異不會(huì)很大，出現(xiàn)較大2 值概率很小。假設(shè)P，則拒絕H0；假設(shè)P，則尚無(wú)理由拒絕它。3.2檢驗(yàn)的步驟：1假設(shè)兩總體率相等H0：兩組總體存活率一樣，即1=2；H1：兩組總體存活率不同，即12；0.05。2實(shí)際數(shù)與理論數(shù)的差值服從2分布查2分布界值表確定P值并作出推論4.卡方總結(jié)：4.1比擬兩個(gè)樣本率所代表的總體率是否有差異，實(shí)質(zhì)是考察現(xiàn)有的樣本頻數(shù)分布是否與假設(shè)下的理論頻數(shù)分布間差異到底是否包含了本質(zhì)上的差異。2

33、統(tǒng)計(jì)量代表了實(shí)際數(shù)與理論數(shù)吻合的程度。4.22檢驗(yàn)相關(guān)問(wèn)題自由度4.32檢驗(yàn)相關(guān)問(wèn)題四格表專(zhuān)用公式：4.4. 2檢驗(yàn)相關(guān)問(wèn)題2值的校正：2分布是連續(xù)性分布；定性資料；實(shí)際數(shù)過(guò)小，增加了第一類(lèi)錯(cuò)誤。校正公式：4.5. 2檢驗(yàn)相關(guān)問(wèn)題應(yīng)用條件：n 40，T 5，用2檢驗(yàn)； N40，但1 T 5 ，用校正2。n 40，或T 5，用2；n 40，但1 T 5，用校正2。n 40，或T 40；20b+c40用校正2。b+c10或n2-n1 10時(shí)一樣秩次多時(shí)校正4.配對(duì)設(shè)計(jì)樣本比擬的秩和檢驗(yàn)：Wilco*on符號(hào)秩和檢驗(yàn)計(jì)算等級(jí)之差值，對(duì)差值進(jìn)展編秩，按差值的絕對(duì)值從小到大編秩，差值為0則舍去，絕對(duì)值相

34、等則取平均秩次，最后求秩和并冠以差值的符號(hào)。查 T 界值表，或用近似 u檢驗(yàn)，計(jì)算 P 值；界定 P 值，作出結(jié)論。4.1步驟：H0：差值的總體中位數(shù)為0；H1：差值的總體中位數(shù)不為0。 =0.05。當(dāng)n50時(shí)，查界值表當(dāng)n50時(shí)，用u近似4.2符號(hào)秩和檢驗(yàn)的根本思想：總秩和為T(mén)N(N+1)/2如H0成立，則正負(fù)各半，T+ 與 T 均接近 N(N+1)/4。如果相差太大，超出了事先規(guī)定的界值，則H0不成立。5.秩和檢驗(yàn)的正確應(yīng)用主要對(duì)等級(jí)資料進(jìn)展分析；秩和檢驗(yàn)可用于任意分布(distribution free)的資料；秩和檢驗(yàn)用于定量資料：極度偏態(tài)資料，如L型分布，或或個(gè)別數(shù)值偏離過(guò)大而不屬

35、于過(guò)失誤差者各組離散度相差懸殊，即使經(jīng)過(guò)變換也難以到達(dá)方差齊性。資料中*一端或兩端含有不確定值分布型尚未確知時(shí)可以先用秩和檢驗(yàn)法進(jìn)展分析兼有等級(jí)和定量性質(zhì)的資料成組設(shè)計(jì)兩樣本比擬：如資料滿足 t 檢驗(yàn)的條件,應(yīng)該用 t 檢驗(yàn)進(jìn)展分析。此時(shí)，如果對(duì)這類(lèi)資料用Wilco*on秩和檢驗(yàn)，實(shí)際上是將觀察單位的具體數(shù)值舍棄不用，只保存了秩次的信息，使檢驗(yàn)成效降低；尤其樣本含量較小時(shí)，降低更加明顯。如資料不滿足 t 檢驗(yàn)的條件，而用了t 檢驗(yàn)，同樣降低了檢驗(yàn)效能。6.參數(shù)檢驗(yàn)和非參數(shù)檢驗(yàn)參數(shù)檢驗(yàn)Parametric Test：針對(duì)的是總體參數(shù)，需要原始資料的總體分布信息t檢驗(yàn)，u檢驗(yàn)，F(xiàn)檢驗(yàn)非參數(shù)檢驗(yàn)

36、Non Parametric Test，Distribution Free Test ：無(wú)法獲知原始總體的情況；或者，不需要對(duì)原始總體的情況進(jìn)展假定；檢驗(yàn)的對(duì)象并非總體參數(shù)?？ǚ綑z驗(yàn)秩和檢驗(yàn)方差齊性的卡方檢驗(yàn)屬于？大樣本含量的秩和檢驗(yàn)屬于？相關(guān)分析Correlation Analysis 1.相關(guān)概念：當(dāng)兩個(gè)數(shù)值變量之間出現(xiàn)如下情況：當(dāng)一個(gè)變量增大，另一個(gè)也隨之增大(或減少)，我們稱這種現(xiàn)象為共變，也就是有相關(guān)關(guān)系。假設(shè)兩個(gè)變量同時(shí)增加或減少，變化趨勢(shì)是同向的，則兩變量之間的關(guān)系為正相關(guān)(positive correlation)；假設(shè)一個(gè)變量增加時(shí)，另一個(gè)變量減少，變化趨勢(shì)是反向的，則稱為負(fù)

37、相關(guān)(negative correlation)。直線相關(guān)linear correlation，又稱簡(jiǎn)單相關(guān)，用以描述兩個(gè)呈正態(tài)分布的變量之間的線性共變關(guān)系，常簡(jiǎn)稱為相關(guān)。用以說(shuō)明具有直線關(guān)系的兩個(gè)變量間相關(guān)關(guān)系的密切程度和相關(guān)方向的指標(biāo)，稱為相關(guān)系數(shù)correlation coefficient，又稱為積差相關(guān)系數(shù)coefficient of product-moment correlation，Pearson相關(guān)系數(shù) ?？傮w相關(guān)系數(shù)用希臘字母表示，而樣本相關(guān)系數(shù)用r表示，取值圍均為-1,1。直線相關(guān)系數(shù)的計(jì)算：2.相關(guān)系數(shù)確實(shí)定及假設(shè)檢驗(yàn)步驟：1畫(huà)散點(diǎn)圖，判斷是否有線性趨勢(shì)2計(jì)算樣本相關(guān)系數(shù)r3對(duì)r進(jìn)展假設(shè)檢驗(yàn)：H0：0，兩變量間無(wú)直線相關(guān)的關(guān)系；H1：0。4查表，求得P值，作出推論3.總體相關(guān)系數(shù)的區(qū)間估計(jì)從相關(guān)系數(shù)等于0的總體中抽樣，樣本相關(guān)系數(shù)的分布是對(duì)稱的。但是從相關(guān)系數(shù)不等于0的總體中抽樣，樣本相關(guān)系數(shù)的分布是偏態(tài)的。 Fisher(1921) 的z變換，使其趨于正態(tài)分布：z 近似服從均數(shù)為標(biāo)準(zhǔn)差為的正態(tài)分布。將 r 變換為 z ；根據(jù) z 服從正態(tài)分布，估計(jì) z 的可信區(qū)間；再將 z 變換回 r

人人文庫(kù)> 全部分類(lèi)> 行業(yè)資料 > 信息產(chǎn)業(yè)

溫馨提示

1. 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2. 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3. 本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

研究生醫(yī)學(xué)統(tǒng)計(jì)學(xué)考點(diǎn)總結(jié)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

研究生醫(yī)學(xué)統(tǒng)計(jì)學(xué)考點(diǎn)總結(jié)

文檔簡(jiǎn)介

溫馨提示

最新文檔

評(píng)論

相關(guān)文檔