中醫(yī)統(tǒng)計學筆記_第1頁
中醫(yī)統(tǒng)計學筆記_第2頁
中醫(yī)統(tǒng)計學筆記_第3頁
中醫(yī)統(tǒng)計學筆記_第4頁
中醫(yī)統(tǒng)計學筆記_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

緒論

統(tǒng)計學家C.R.勞先生在《統(tǒng)計與真理一怎樣運用偶然性》中指出:在終極的分析中,一切知識都是

歷史;在抽象的意義下,一切科學都是數(shù)學:在理性的基礎上,所有的判斷都是統(tǒng)計學。

一、統(tǒng)計學的概念、發(fā)展簡史及主要內容

1.統(tǒng)計學:是以概率論和數(shù)理統(tǒng)計為基礎,對研究對象的數(shù)據進行搜集、整理和分析,揭示

事物總體特征和規(guī)律的方法論科學。

2.中醫(yī)統(tǒng)計學:是以概率論和數(shù)理統(tǒng)計的原理和方法為基礎,以中醫(yī)理論與實踐為主體,通

過對數(shù)據的搜集、整理和分析,達到探討中醫(yī)理論與方法內在規(guī)律的目的。

3.統(tǒng)計學的發(fā)展趨勢:

①依賴數(shù)學。②與計算機技術結合。

③與實質性學科、統(tǒng)計軟件、現(xiàn)代信息相結合,所發(fā)揮的功效日益增強。

④從描述事物現(xiàn)狀、反映事物規(guī)律,向抽樣推斷、預測未來變化方向發(fā)展。

4.統(tǒng)計學的主要內容

⑴研究設計:專業(yè)設計、統(tǒng)計學設計⑵統(tǒng)計學的基本概念、原理和思維方法

⑶統(tǒng)計描述:統(tǒng)計指標、統(tǒng)計圖表⑷統(tǒng)計推斷:參數(shù)估計、假設檢驗

二、統(tǒng)計工作的基本步驟和特點

1.統(tǒng)計工作的基本步驟

(1)統(tǒng)計學設計

(2)搜集資料:①常規(guī)保存的記錄;②現(xiàn)場調查記錄;③實驗/試驗記錄;④醫(yī)學文獻/網

絡信息。

(3)整理資料-:5總魯;②審核;③計算機檢查;④分組。

(4)分析資料

2.統(tǒng)計學認識現(xiàn)象的特點

(1)數(shù)量性:(2)群體性:(3)具體性:(4)概率性:

三、統(tǒng)計學中常用的概念

1.總體(population):是根據研究目的確定的同質觀察單位的集合。

例①河北省18歲男性的身高和體重分布②某性紅地2005年健康成年男細胞數(shù)

③河北省18歲身高在170-175cm男性的體重分布

⑴有限總體:指總體限定于特定的空間、時間范圍內有限個觀察單位。

⑵無限總體:指沒有空間和時間范圍限制的總體。

2.樣本(sample):從總體中隨機抽取的有代表性的部分觀察單位的集合。

樣本的可靠性:指總體確定后,樣本中的每一個觀察單位確屬預先規(guī)定的同質總體。

樣本的代表性:即樣本能夠充分反映總體的真實情況。

3.隨機(random):即在抽樣、分組、安排試驗順序時,讓總體中每個受試者或觀察單位都

有同等的機會被抽中、被分配或被安排,而不受研究者的主觀意愿驅使。

不能將隨機理解為隨便。

4.事件(event):指事物發(fā)生某種情況或在調查、觀察和實驗中獲得的某種結果。

⑴確定性事件是可預言在一定條件下必然發(fā)生的事件,發(fā)生的概率為lo

⑵隨機事件:指一定條件下可能發(fā)生也可能不發(fā)生的不確定性事件,發(fā)生的概率介于0?1

之間。

⑶模糊事件:事物本身的含義不確定的現(xiàn)象。

5.頻率(frequency):對于隨機事件A,在相同的條件下進行了n次實驗,事件A發(fā)生的次數(shù)為m,比

值m/n為頻率,記為fn(A):

概率(probability):描述某隨機事件A發(fā)生的可能性大小,統(tǒng)計符號為P,0WPW1,記為P(A)。

當n-8時,頻率fn(A)-概率P(A)?

小概率事件:表示某事件發(fā)生的可能性很小,在醫(yī)學研究中,習慣上把PW0.05或PW0.01

的事件稱為小概率事件。

6.變異(variation):總體中各個體之間的差異性。

同質是相對的,研究對象只是在某一方面是性質相同的,同類的觀察對象之間往往也存在著

變異。變異是絕對的、客觀存在的。

7.誤差(error):指測量值與真值之差。

⑴過失誤差:也叫粗差。觀測者粗心大意造成的誤差。

⑵系統(tǒng)誤差:由于儀器未校準、試劑未標定、觀測標準未統(tǒng)?等固定原因造成的誤差。

⑶測量誤差:由事先難于預料的實驗或觀察條件的隨機波動造成的誤差。

⑷抽樣誤差:由抽樣引起的樣本指標(統(tǒng)計量)與總體指標(參數(shù))的差別。

8.統(tǒng)計量(statistical):是反映樣本特征的統(tǒng)計指標。

統(tǒng)計符號為小寫的英文字母。如樣本均數(shù)、排本標準差S、樣本率P等。

9.參數(shù)(parameter):是描述總體特征的統(tǒng)W指標。

統(tǒng)計符號為小寫的希臘字母。如總體均數(shù)口、總體標準差。、總體率n等。

10.統(tǒng)計資料的類型

根據研究目的,對研究對象的某些特征進行觀測,將這些觀測指標或項目稱為變量。

變量的具體數(shù)值(變量值)構成了統(tǒng)計數(shù)據或統(tǒng)計資料。

統(tǒng)計資料分為兩類:

⑴值變量(numericalvariable):亦稱定量資料是指對每個觀察單位用計量方法測得某項

數(shù)值大小所獲得的資料。

特點為其變量值大多有度量衡里位,其具體取值通常是正實數(shù)(零、正整數(shù)和小數(shù)).

如身高1.75m、體重68kg、血壓9.6kPa、血糖6.8mmol/L。

⑵分類變量(categoricalvariab⑹:又稱定性資料。指對每個觀察單位按某方面的特征、

性質或等級分組計數(shù)而得到的資料

特點是變量值表現(xiàn)為互不相容的屬性或類別,無度量衡單位。

分類變量又可分為兩類:

①序分類變量:又稱為名義資料。具體取值通常是具有某種屬性或特征的個數(shù)。

特點是可在非數(shù)字中取值,各類之間具有性質上的差異。

可分為二分變量和多分變量。

二分變量是按互不相容的屬性分成兩類的資料。

多分變量是按某種屬性或特征分成兩類以上的資料

②序分類變量:亦稱等級資料或半定量資料具體取值也是具有某種屬性或特征的個數(shù),

但不同取值之間有半定量的關系。

特點是其各類別間有等級、程度或量的差異,即可按數(shù)量的相對大小或程度的高低排出順序。

四、學習中醫(yī)統(tǒng)計學的目的

1.順應中醫(yī)藥學的發(fā)展趨勢。2.強化中醫(yī)科研的計劃性和科學性。

3.拓寬研究思路。4.學會正確地運用統(tǒng)計方法和合理地解釋統(tǒng)計結果。

五、學習中醫(yī)統(tǒng)計學的注意事項

1.理解和領會基本概念和原理,切忌死記硬背。2.不追究公式的來源和推導,但要掌握其

應用條件。3.重視分析問題和解決問題能力的培養(yǎng)。4.學會使用統(tǒng)計軟件。

數(shù)值變量資料的統(tǒng)計描述

統(tǒng)計描述——概念:即利用原始數(shù)據,選擇適宜的統(tǒng)計指標及統(tǒng)計圖表,簡明準確地探察數(shù)

據的分布類型和數(shù)量特征的基本統(tǒng)計方法。

目的:是根據樣本中所包含的信息,客觀、正確地推論HI其總體規(guī)律。

第一節(jié)頻數(shù)分布

頻數(shù):相同觀察值或觀察結果出現(xiàn)的次數(shù)。

分布:指隨著隨機變量取值的變化,其相應的概率變化的規(guī)律性。

頻數(shù)分布:觀察值(變量值)按大小分組,各個組段內觀察值個數(shù)(頻數(shù))的分布,是了解數(shù)據

分布形態(tài)特征與規(guī)律的基礎。

一、頻數(shù)分布的特征

1.集中趨勢:指一組變量值的集中傾向或中心位置。

2.離散趨勢:即一組變量值的離散傾向。

二、頻數(shù)分布的類型

1.對稱分布:指集中位置居中、左右兩側的2.非對稱分布:亦稱偏態(tài)分布,是集中位置

頻數(shù)分布基本對稱的頻數(shù)分布。偏倚、兩側頻數(shù)的分布不對分為正態(tài)分布和非

正態(tài)分布兩稱的頻數(shù)分布,可分為正

種類型。偏態(tài)和負偏態(tài)分布。

0Ai….…

三、頻數(shù)分布表/圖的作用

1.直觀地揭示數(shù)據的分布類型和特征。

2.便于發(fā)現(xiàn)資料中某些遠離群體的特大或特小的可疑值。

3.描述頻數(shù)分布的集中趨勢與離散趨勢。

4.便于進一步計算統(tǒng)計指標。

四、頻數(shù)表

概念:頻數(shù)分布表的簡稱。指觀察值或某些類別及其相應的頻數(shù)按一定順序排列的表格。

例題:隨機抽取某地120例正常人,測得血清銅的含量(umol/L)如下表,試編制頻數(shù)表。

13.8412.5313.7014.8917.5313.1918.82

14.7317.4413.9914.1012.2912.6114.78

14.5914.7118.6219.0410.9513.8110.53

13.5611.4813.0716.8817.0417.9812.67

11.039.2315.0414.0915.9011.4814.64

13.6414.3915.7413.9911.3117.6116.26

13.5311.6813.2511.8814.2115.2115.29

13.7014.4511.2319.8413.1115.1511.70

頻數(shù)表的編制方法:

1.找極值:Xmax=19.84,Xmin=9.23

2.求至距:R=Xmax-Xmin,R=19.84—9.23=10.61

3?定組數(shù):K=8~15°

4.求組距:i=R/(K-1)(i為組距,k為組段數(shù),R為全距)i=10.61/(ll-l)=1.061?l

5.確定各組段的上下限:

6.歸納計數(shù):

某地120名正常成年人血清銅含量頻數(shù)表

組段頻數(shù)f頻率P(%)fCPC(%)

9.00?32.532.5

10.00?43375.8

11.00?1210.01915.8

12.00?1310.83226.6

13.00?1714.24940.8

14.00?221837159.1

15.00?1815.08974.1

16.00?1310.810284.9

17.00?119.211394.1

18.00?54.211898.3

19.00?21.7120100.0

合計120100.0

五、頻數(shù)圖

概念:亦稱直方圖,是以直方的寬度代表組距,以直方的面積大小表示頻數(shù)的多少、以直方

面積在總面積中的比例表示頻率大小的圖形。

等距分組——以橫軸表示變量,以縱軸表示頻數(shù)。

不等距分組——以橫軸表示變量,但縱軸是頻數(shù)除以組距。

第二節(jié)數(shù)值變量資料集中趨勢的描述

集中趨勢:是度量變量值集中位置和平均水平的數(shù)量指標,其代表值為平均數(shù)。

平均數(shù):是描述?組觀測值平均水平的指標,是對同質基礎上的樣本或總體?般特征的表達

指標。

算術平均數(shù)、幾何平均數(shù)、中位數(shù)、眾數(shù)

L施義:算術平均數(shù)簡稱均數(shù)。是一組觀察值的和與觀察值個數(shù)之商。是數(shù)量上的平均。用

于說明一組觀測值的趨中位置或平均水平。X表示樣本均數(shù),表示總體均數(shù)。

2.適用條件:正態(tài)或近似正態(tài)分布的資料。如生理指標。

3.計算方法:⑴直接法:有n個觀察值,分別為XI,X2,……Xn,

._-+工+…+x,,_Zx

____________?___________囁式中S是求和的符號。

例題:10名12歲男孩身高(cm)分別為125.5,126.0,127.0,128.5,147.0,131.0,132.0,

求#均藪。

141.5,122.5,140.0o

—>工1255+126+…+12N5+140

~~n—-1O

⑵加權法:用于觀察值中相同數(shù)據較多或頻數(shù)表資料。

./i+./;+???+./,“=1737.00/120=14.48(Mmol/L)

二、幾何均數(shù)

覆義:n個數(shù)值連乘積的n次方根。是比例或倍數(shù)上的平均。統(tǒng)計符號G。

2.應用條件:等比數(shù)列資料。如抗體滴度。

3.計算方法:

0=…X-

例題:6份血清抗體滴度為1:2,1:4,1:8,1:8,1:16,1:32,求平均數(shù)。

G=02x4x8x8xl6x32=8平均滴度為1:8o

三、中位數(shù)

1.定義:將一組觀察值按由小到大的順序排列,位次居中的數(shù)值即中位數(shù)。是位次上的平均。

統(tǒng)計符號M。

2.應用條件:不拘分布、分布類型不明或一端無界的資料。如潛伏期、治愈時間和發(fā)病年齡。

3.計算方法:

M=X(n叫M=Xg+Xg、+2

n為奇數(shù)時?2)n為偶數(shù)時L目M」

式中(明、(1)及M均為下標,表示有序數(shù)列中觀察值的位次。

例題:某醫(yī)院用大黃粉治療胃熱血瘀型血證病人9例,其大便轉陰天數(shù)分別為1、1、2、2、

3、4、5、7、10,求其中位數(shù)。

本例n=9,M=X5=3(天)。

如果本例n=10,第10個數(shù)值為16天,則M=(3+4)/2=3.5(天)。

⑵數(shù)表法

用于觀察值例數(shù)較多或契數(shù)表資料。____________=

IV!=1_+—f--------]

fIN)L為M所在組段的下限;i為該組

段的組距;fm為該組段的f;n為總例數(shù);工也為小于L的各組段的fC。

例題:905例男性銀屑病病人的發(fā)病年齡

年齡頻數(shù)f累計頻數(shù)fC累計頻率pC(%)

<1054545.97

10?252306(SfL)33.81

20?346(fM)65272.04

30?12878086.19

40?8486495.47

50?2989398.67

60?589899.23

2707905(n)100.00

M=20+(10/346)(905/2—306)=24.23(歲)

第三節(jié)數(shù)值變量資料的離散趨勢描述

離散趨勢:亦稱變異性,是描述一組同質觀察值的變異程度大小的指標。不但反映研究指標

數(shù)值的穩(wěn)定性和均勻性,而且反映集中性指標的代表性。

極差、四分位數(shù)間距、方差、標準差、變異系數(shù)。

變異指標示意(兩個學生五門成績分布)

學生科目變異指標

12345^RS2SCV

A78798081828042.51.581.98

B60708090100804025015.8119.76

A、B兩個學生五門課程成績的均數(shù)都是80,但各科成績分布情況卻不相同。

A較集中,變異較??;B較分散,變異較大。

一、全距(R)

概念:亦稱極差,是一組觀察值中最小值與最大值之差,反映個體差異的范圍。

R=xmax—xmin

優(yōu)點:1.意義明確、計算簡便。2.穩(wěn)定性較差。3.受n大小的影響。4.可應用于任何分布。

二、百分位數(shù)和四分位間距

1.百分位數(shù):是把?組觀察值從小到大排列,分為100等份,與x%位次所對的數(shù)值即為第

百分之x位數(shù)。以Px表示。

一個Px將全部觀察值分為兩部分,理論上有x%的觀察值比它小,有(100—x)%的觀察值

比它大。是一種位置指標。M即P50。

F?x=1_-+--—(in-x<K>W

■X

2.四分位數(shù)間距:是上四分位數(shù)QU(P75)與下四分位數(shù)QL(P25)之差,符號為QR。

是中間50%觀察值的極差。

QR=QU-QL=P75-P25

用途:⑴常用來描述偏態(tài)分布資料分布以及分布的一端或兩端無確切數(shù)值資料的離散程度。

⑶表示參考值范圍百分位數(shù)的另一個重要用途是表示偏態(tài)分布資料的參考值范圍。

例題:905例男性銀屑病病人的發(fā)病年齡(同前)

計算方法:P25=10+(10/252)X(905X0.25-54)=16.84(^)

P75=30+(10/128)X(905X0.75-652)=32.09()

QR=P75-P25=32.09-16.84=15.25(歲)

三、方差

概念:方差即離均差平方和的均值。總體方差的符號為。2,樣本方差符號為s2。

優(yōu)點:由于s2利用了每個觀察值的信息,反映?批數(shù)據變異程度的穩(wěn)定性和精確性好。

缺點:但在運算時需將各個離均差平方,使原度量單位變成平方單位,不便于進行比較。

2_):(X—M.)2^2(-k——)?

CT=-------------S2N---------------

Z—1

應用條件:要求資料服從正態(tài)或近似正態(tài)分布。

四、標準差

概念:方差的平方根。除了具有方差的優(yōu)點外,還克服了度量單位被平方的不足,運用較方

便。總體標準差的符號為。,樣本標準差的符號為s;英文縮寫為SD?

例題:

A學生:n=5,2X=78+79+80+81+82=400;2X2=782+792+802+812+822=32010

B學生:n=5,》X==400;XX2==33000

/SO10—000尸/33OOO-<2??^i

S?=V-----------ST'——=158s.=V---------g-13-—13XI

用途:⑴表示正態(tài)或近似正態(tài)分布的離散程度。⑵描述數(shù)值變量的頻數(shù)分布特征(X土S)。

⑶制定醫(yī)學參考值范圍。(4)與均數(shù)結合計算變異系數(shù)。(5)與樣本含量結合計算標準誤。

五、變異系數(shù)

概E:一4觀察值的標準差與均數(shù)的百分比。是相對離散量,無單位。統(tǒng)計符號CV

用途:⑴比較度量單位不同或均數(shù)相差懸殊時幾組樣本資料的離散性。

⑵比較實驗指標的穩(wěn)定性及測定方法的精密度。

CV==-X10O%

例題:(1)某單位測得28例成年脾虛病人的紅細胞數(shù)為3.10±0.86X1012/L;血紅蛋白

值為87.2±33.3g/L,試比較該兩項指標的變異程度。

CVRBC=(0.86/3.10)X100%=27.74%;CVHb=(33.3/87.2)X100%=38.19%

可認為Hb的變異程度比RBC大。

(2)某單位測得大鼠的血清谷丙轉氨酶(AU)為29.4±1.4,家兔的ALT為52.8±1.5,

試比較兩種實驗動物ALT指標的實驗穩(wěn)定性。

CV大鼠=(1.4/29.4)X100%=4.76%;CV家兔=(1.5/52.8)X100%=2.84%

可認為家兔ALT的實驗穩(wěn)定性較好,應優(yōu)先考慮以家兔為實驗對象進行ALT的有關研究o

由該例可知,CV對于改進實驗方法,選擇最佳實驗對象、指標等,都具有一定的實際意義。

變異指標:

1.極差較粗,適用于任何分布;

2.標準差與均數(shù)單位相同,最常用,適用于正態(tài)及近似正態(tài)分布的統(tǒng)計描述;

3.集中指標和離散指標分別反映資料的特征,常配套使用:

正態(tài)分布:算術平均數(shù)標準差偏態(tài)分布:中位數(shù)四分位數(shù)間距

等比資料:G

正態(tài)分布及其應用

第一節(jié)正態(tài)分布

某地120例正常人血清銅含量的直方圖。設想觀察人數(shù)逐漸增多組、距不斷細分,作直

方圖。將各直方頂端的中點連接,形成一條光滑的曲線,該曲線即頻數(shù)曲線或頻率曲線,近

似于數(shù)學上的正態(tài)分布曲線。

IS13-4頻數(shù)分布逐漸接近正態(tài)分布示意

一、正態(tài)分布:又稱Gauss分布或常態(tài)分布,是一種最重要的連續(xù)型分布。

正態(tài)分布曲線:是高峰位于中央,兩側逐漸下降,左右對稱,永遠不與橫軸相交的曲線。

二、正態(tài)分布的密度函數(shù)

(-8<X<8)

f(x)為與X對應的正態(tài)曲線的縱坐標高度;U為總體

均數(shù);。為總體標準差;n為圓周率,即3.14159;e為

自然對數(shù)的底,即2.71828。

三、正態(tài)分布的特征

1.在X軸匕方,均數(shù)所在處最高。

2.集中性、對稱性和均勻變動性。

3.正態(tài)分布有兩個參數(shù)U和。。

固定."變化示意m固定?。變化示意

圖3-5正態(tài)分布兩個參數(shù)示意

四、標準正態(tài)分布

由于不同的正態(tài)分布有不同的口和。,用公式計算的隨機變量X落在某個區(qū)間內的概率顯得

非常麻煩。為尋求?個通用的方法,進行標準正態(tài)變換(即U變換):U=(X3)/。。此

變換實質上是作了個坐標軸的平移和尺度變換,使原來的正態(tài)分布變換為U=0、。=1

的標準正態(tài)分布(亦稱u分布),記為N(0,l)o

五、標準正態(tài)分布的密度函數(shù)

oOO=——"

72兀(—8<口<OO)

式中(u)為標準正態(tài)分布的密度函數(shù),即縱坐標高度。

x,X,xZtQZ,Z

態(tài)分布(b)變換后的標準正態(tài)分布

六、正態(tài)曲線下面積分布的規(guī)律:

(1)正態(tài)分布區(qū)間(四,爐。)下的面積,即由范圍的面積占總面積為68.27%3

C2)正態(tài)分布區(qū)同伍L96e,11+1.960),即吐1.96。范圍的面積占總面積為95.弧雕m

(3)正態(tài)分布區(qū)聞仙之胸,財2.馳叨即曲5如瓶固的畫程翔翔0?%*

七、正態(tài)分布的應用

1.統(tǒng)計分析方法的基礎:很多抽樣分布,姆卡方分布、t分布都是建立在正態(tài)分布的基礎上。

2.質量控制:為了控制檢測誤差,常以矢±2s作為上下警戒線;£±3s作為上下控制。

3.估計醫(yī)學參考值范圍。4.進行參數(shù)估計和假設檢驗。

第二節(jié)正態(tài)分布的應用

一、可根據正態(tài)分布的規(guī)律估計觀察值的頻數(shù)分布范圍。

例題已知某地120名正常人血漿銅含量(Umol/L)的均數(shù)=14.48、S=2.27,估計該地120

名正常人血漿銅含量在14.20?15.60(umol/L)范圍內的人數(shù)。

1.計算u值當u和。未知時,u=(x-%)/s。

xl=14.20,ul=(14.20-14.48)/2.27=-0.12

x2=15.60,u2=(15.60-14.48)/2.27=0.49

2.查表-0.12左側的面積就是0.12右側的面積。

當u=0.12時,在表的左側找到0.1,在表的上方找到0.02,二者相交處為0.5478,

0(-0.12)=1-0.5478=0.4522,即標準正態(tài)變量u值小于-0.12的概率為0.4522;

當u=0.49時,①(0.49)=0.6879,即u值小于0.49的概率為0.6879,

3.確定概率

u值在-0.12?0.49范圍內的面積為:①(0.49)—①(-0.12)=0.6879-0.4522=0.2357,

即血漿銅含量在14.20?15.60(口mol/L)范圍內的概率為23.57%。

4.估計區(qū)間內人數(shù)

120名正常人血清銅含量在14.20-15.60(umol/L)范圍的人數(shù)為120X23.57%=28人

二、制定醫(yī)學參考值范圍

1、醫(yī)學參考值的意義

①醫(yī)學參考值:是指包括絕大多數(shù)正常人的解剖、生理、生化、免疫、組織或排泄物中成分

的測量值。

②醫(yī)學參考值范圍慮到變異的影響,提高參考值作為判定正?;虍惓5目煽啃运_定的絕大

多數(shù)正常人醫(yī)學參考值的波動范圍。

③使用“參考值范圍”的目的:個體一臨床上劃分正常人與異常人的參考。人群一制訂不同

性別、年齡兒童某項發(fā)育指標的等級標準,用來評價兒童的發(fā)育水平等。

2、制定參考值范圍的步驟

①選定健康人作為調查對象。②控制測量誤差。①確定樣本含量.④根據實際意義分組。

?決定取單側還是雙側界限。⑥選定適當?shù)陌俜纸缦?。常?5%、80%、90%、99%等。

⑦制定醫(yī)學參考值范圍.

3、制定參考值范圍的常用方法

①正態(tài)分布法適用于正態(tài)或近似正態(tài)分布的資料。表達式為五土"",2$,a為正態(tài)曲線下

單側或雙側尾部的面見U。為a相應的標準正態(tài)離差。

雙側95%的界限值為:下土

單側95%的上限值為:元+1-石45"

單側95%的下限值為:元一1“63歲

例題:某地調查正常成年男子144人的紅細胞數(shù),得均數(shù)5.38(1012/L),標準差0.44(1012/L),

試估計該地成年男子紅細胞數(shù)的95%參考值范圍。

因紅細胞數(shù)過多或過少均為異常,用雙側界值。

下限:-1.965=5.38-1.96X0.44=4.52

上限:+1.96s=5.38+1.96X0.44=6.24

該地成年男子幻:細胞數(shù)的95%參考值范圍(4.52—6.24)1012/L?

②百分位數(shù)法:是利用兩個百分位數(shù)作為雙側參考值范圍的上、下限,或者用一個百分位數(shù)

作為參考值的上限或下限。

適用于非正態(tài)分布或分布未知的資料。

1)雙側95%參考值范圍:P2.5~P97.52)單側95%參考值范圍上限值:P95

3)單側95%參考值范圍下限值:P5

總體均數(shù)的估計

參數(shù)估計:是通過樣本信息估計其總體相應指標的數(shù)值及數(shù)值范圍的統(tǒng)計分析方法,即用統(tǒng)

計量估計總體參數(shù)的方法,是統(tǒng)計推斷的一個重要方面。

第一節(jié)抽樣分布與抽樣誤差

?醫(yī)學科研的常用方法是抽樣研究。

?由于個體差異的存在,測算的樣本指標值很難恰好等于總體指標值。這種由個體差異和抽

樣造成的樣本與總體、樣本與樣本相應統(tǒng)計指標之間的差異即抽樣誤差。

一、樣本均數(shù)的抽樣分布與標準誤

1.樣本均數(shù)的抽樣分布:指某種統(tǒng)計量的頻數(shù)分布。用樣本統(tǒng)計量作為該樣本的代表值,這些

個樣本代表值的大小就形成了一個抽樣分布。

2.抽樣分布的特點:(1)各統(tǒng)計量間存在差異,統(tǒng)計量不一定等于參數(shù)。

(2)統(tǒng)計量的變異范圍比原變量的變異范圍大大縮小。

(3)隨著n增加,樣本均數(shù)的變異程度減小。

(4)如果原始變量服從正態(tài)分布,則統(tǒng)計量也服從正態(tài)分布。

如果原始變量不服從正態(tài)分布,若n較大,則統(tǒng)計量服從正態(tài)分布;若n較小,則統(tǒng)計量為

非正態(tài)分布。

3.抽樣誤差:是因抽樣產生曲貓本盲樣本、樣本與總體相應統(tǒng)計指標之間的差異。

?由于存在個體差異,且樣本又未包含總體的全部信息,因此抽樣誤差是無法避免的。

?抽樣誤差的大小主要取決于樣本含量的多少和研究指標的變異程度。

4.標準誤:?表示樣本指標值在抽樣分布中的變異情況。

?SE越小,說明抽樣誤差越小,用統(tǒng)計量來估計參數(shù)時的可靠程度越大;反之,

SE越大,說明抽樣誤差越大,用統(tǒng)計量來估計參數(shù)忖越不可靠。

均數(shù)的標準誤:?樣本均數(shù)的標準差也稱均數(shù)的標準誤。

?反映樣本均數(shù)間的離散程度,反映樣本均數(shù)與相應總體均數(shù)間的差異,

說明均數(shù)抽樣誤差的大小。品

估計標準誤:?由于。往往未知,常以S替代,算得的標準誤稱估計標準誤。其統(tǒng)計符號。

?山于標準誤與抽樣誤差成正比,與樣本均數(shù)的代表性成反比,故在實際工

作中可將標準誤作為描述統(tǒng)計指標可靠性的依據。

5.標準差與標準誤的比較

標準差均屬標準誤

意義描述個體觀察值之間的離散性(變異程描述同一總體中隨機抽出樣本含量相

度)同的多個樣本均數(shù)間的離散性

公式

7%走XJc

與n的關系隨著n的增大逐漸趨于穩(wěn)定隨著n的增大逐漸減小,與n的平方

根成反比。

用途表示觀察值得變異大小;結合樣本均數(shù)描述表示樣本均數(shù)抽樣誤差的大??;描述樣本均

正態(tài)分布的特征;在正態(tài)分布時做參考值范數(shù)的可靠性;結合樣本均數(shù)估計總體均數(shù)的

圍的估計;計算變異系數(shù)和均數(shù)的標準誤CI:進行均數(shù)間差別的假設檢驗

例題:已知某樣本資料的s=2.27(umol/L),n=120,求其標準誤。

代入公式得.Sm——2-2*7/-\/12O——0.21jjmol/L

二、t分布及其應用

l.t分布:若對正態(tài)分布總體多次重復抽取若干樣本含量相同的樣本,樣本均數(shù)圍繞總體均

數(shù)口呈現(xiàn)正態(tài)分布。若將所有樣本均數(shù)按公

式進行數(shù)學變換,可得u圍繞。的標準正態(tài)二

分布「=@-〃)/仆//\

由于總體標準差未知,只能求出標準誤的估計值,變/\

換公式求t值,可得到若干t值。一^/

將這些t值繪成直方圖,若樣本無限多,可繪成一條1..1

光滑的曲線t分布曲線,此時所得的t值

圍繞o呈現(xiàn)的就是t分布。r=(元一〃)/萬至

2.t分布的特征:(1)是一簇單峰分布曲線,以0為中心,左右對稱。

(2)其形態(tài)變化與自由度V的大小有關——v越小,則t值越分散,t分

布曲線越低平,t分布的峰部越矮而尾部翹得越高;v越大,t分布

越逼近正態(tài)分布。

(3)t分布的單側概率和雙側概率

在t界值表中,橫標目為自由度v,縱標目為概率(P或a)。

一側尾部面積稱為單側概率或單尾概率;

兩側尾部面積之和稱為雙側概率或雙尾概率。

表中數(shù)字表示當v和a確定時,對應的t的界值,其中與單尾概率相

對應的t界值用表示,與雙尾概率相對應的t界值用J2,表

示。

查t界值表注意:由于t分布是以0為中心的對稱分布,故附表2只列出正值,查表時,不

管t值正負,均可用其絕對值It|查表得概率P值。

①相同自由度時,It|值增大,概率P減??;

②在相同It|值時,雙尾概率P是單尾概率P的兩倍。

如雙尾品’,呼入??=單尾ra-O5.LO=1.812

3.t分布的用途:總體均數(shù)的區(qū)間估計;t檢驗。

第二節(jié)總體均數(shù)的估計

是根據樣本分布的特點,由樣本均數(shù)推測總體均數(shù)的大小及其范圍。

總體均數(shù)估計的方法有點估計和區(qū)間估計兩種。

一、總體均數(shù)的點估計

點估計概念:用樣本確定的統(tǒng)計量的值來直接估計總體參數(shù)的數(shù)值.

方法:以樣本統(tǒng)計量及其標準誤作為被估計參數(shù)的點估計值,一般是以統(tǒng)計量加

減標準誤的方式給出參數(shù)的點估計值。

優(yōu)點:方法簡單。缺點:未考慮抽樣誤差的影響。

二、區(qū)間估計——根據抽樣分布原理,按預先給定的概率水準,給出被估計參數(shù)可能的數(shù)值

范圍。統(tǒng)計學稱這一范圍為被估計參數(shù)的可信區(qū)間(CI)。稱預先給定的概率水準為可信度或

可信系數(shù),符號為1-a,常取95%或99%。稱按95%或99%水準確定的CI為95%CI或

99%CI。

1.大樣本資料均數(shù)的可信區(qū)間

樣本例數(shù)n足夠大(n2100)時,可按正態(tài)分布原理,用以下公式估計總體均數(shù)N的CI。

X

95%CI=±L96£M99%Q=X±2.58s黛

例題:測得某地296例成年男性發(fā)鋅的均數(shù)為200Qppm,標準差為21.8ppm?試估計該地

成年男性發(fā)鋅總體均數(shù)的95%CI。

本例n=296,%=200,s=21.8,抬=$/后=1.27。

95%CI=200.0±1.96X1.27=(197.51,202.49)

該地成年男性發(fā)鋅總體均數(shù)的95%CI為197.51?202.4ppm。

2.小樣本資料均數(shù)的可信區(qū)間

當n較小(n<100)時,一般按t分布原理,用以工公式估計總體均數(shù)□的CL

95%(:1=*±?0'°"多「部、99%CI=*±*o.oi/2?Sw

式中to.os/2,V與to.oi/2,V為to.05與to.01的雙側界值。

例題:測得某地12例腎虛失鈉型哮喘病人甲皺微循環(huán)管伴長度的均數(shù)為208.33um,標準

差為67.07Um。試估計該地腎虛失鈉型哮喘病人甲皺微循環(huán)管神長度總體均數(shù)的95%

CL

本例n=12,%=208.33,s=67.07,

S*=19.36v=n-1=12-1=11。

查t界值表得《05/2,11=2.201,按公式求得:

95%CI=208.33±2.201X19.36=(165.72,250.94)

該地腎虛失鈉型哮喘病人甲皺微循環(huán)管神長度總體均數(shù)的95%CI為165.72?250.94um

3.可信區(qū)間的要素

(1)準確度:是CI包含總體參數(shù)的概率大小,用可信度的大小1-a表示??尚哦仍浇咏?,

可信程度越高,準確度越高。如可信度99%比95%可信程度高。

(2)精密度:是對總體參數(shù)的估計范圍或長度的度量,反映在C1即長度愈小愈精密。

每一次估計間的差異越小,CI愈小,即CI的長度越小,其估計的精密度越高。

4.可信區(qū)間的特點

(1)當n確定后,CI范圍的大小與可信度1-a的高低呈正比,與估計結果的精密度呈反比。

(2)當可信度1-a確定后,n的大小與CI范圍的大小呈反比;與估計結果的精密度呈正比。

因為增加樣本例數(shù)會減小標準誤,使CI的范圍縮小。CI的范圍越小,真實值靠近點估

計值的可能性越大,靠近CI邊緣的可能性越小,估計的精確度也隨之提高,其統(tǒng)計效

力就越大。

5.可信區(qū)間與可信限的關系

CI為某一整體內的一個分段,是以上、下可信限為界的開區(qū)間(不包含界值在內)。CU

與CL是C的上下兩個界值。如95%a為(165.6,251.0)um。165.6Um是Cl的下限(L),251.0

um為Cl的上限(U)。

6.CI與參考值范圍的比較

(1)可信區(qū)間:是參數(shù)的估計范圍,需用標準誤(SE)計算,表示總體指標的可能范圍。

(2)參考值范圍:表示大多數(shù)正常人的解剖、生理、生化某項指標的波動范圍,需用標準

差計算,用于判斷觀察對象的某項指標正常與否。

假設檢驗

一、假設檢驗的概念與分類

概念:亦稱顯著性檢驗,是利用樣本信息,根據一定的概率水準,推斷樣本指標(統(tǒng)計

量)與總體指標(參數(shù))、不同樣本指標間的差別有無意義的統(tǒng)計分析方法。

(-)參數(shù)檢驗和非參數(shù)檢驗

1.參數(shù)檢驗概念:依賴總體分布的具體形式的統(tǒng)計方法,簡稱參數(shù)法。常用的參數(shù)法有X2檢

驗、t檢驗、F檢驗等。使用條件是抽樣總體的分布已知。

優(yōu)點:能充分利用樣本信息;檢驗效率較高。缺點:應用條件限制較多。

2.非參數(shù)檢驗概念:一類不依賴總體分布的具體形式的統(tǒng)計方法。如Ridit分析、秩和檢驗、

符號檢驗、中位數(shù)檢驗、序貫試驗、等級相關分析等。

優(yōu)點:①對總體的分布形式不要求;②可用于不能精確測量的資料?;

③易于理解和掌握;④計算簡便。

缺點:不能充分利用資料所提供的信息,使檢驗效率降低。

(-)單因素分析與多因素分析

1.單因素分析——亦稱一元分析,是在主要的非處理因素相同的條件下,不管影響結果的處

理因素(如病人年齡、病情、辯證分型、病理類型、藥物劑型、用藥途徑、

療程等)有多少,每次僅分析一個處理因素與效應之間關系的統(tǒng)計方法。

2.多因素分析——亦稱多變量分析或多元分析,是研究多因素和多指標之間的關系以及具有

這些因素的個體之間關系的?種統(tǒng)計分析方法。

二、假設檢驗的基本思想

先假設差別山抽樣造成,即總體間本無差異,在此假設成立的前提下做抽樣研究,如果該次

抽樣屬小概率事件,則樣本信息不支持原假設的成立,拒絕它。

三、假設檢驗的基本步驟

例題:根據大量調查,已知健康成年男子的脈搏均數(shù)為72次/分。某醫(yī)生在某醫(yī)院隨機調查

30名脾虛男子,求得脈搏均數(shù)為74.2次/分,標準差為7.5次/分。脾虛病人的脈搏

是正態(tài)分布,問脾虛男子的脈搏均數(shù)與?般成年男子的脈搏均數(shù)是否相等?

分析:

把一般成年男子的脈搏均數(shù)看作一個總體均數(shù),脾虛男子的脈搏均數(shù)為樣本均數(shù)。

口0=74n=30,X=74.2,s=7.5。

UoWX的原因:

①抽樣誤差所致。②脾虛致兩個均數(shù)間有本質性差異。

1.建立假設、確定檢驗水準

⑴無效假設:記為H°,即樣本均數(shù)所代表的總體均數(shù)u與已知的總體均數(shù)u0相等。樣本

均數(shù)與口。的差異是由抽樣誤差引起,無統(tǒng)計學意義。

⑵備擇假設:記為Hi,即樣本均數(shù)所代表的總體均數(shù)口與口。不相等,樣本均數(shù)與口。的差

異是本質性差異,有統(tǒng)計學意義。

假設檢驗有雙側檢驗和單側檢驗

若目的是推斷兩總體均數(shù)是否不等,應選用雙側檢驗。Ho:U=U。,出:KWH。

若從專業(yè)知識已知不會出現(xiàn)N<U0(或U>口0)的情況,則選用單側檢驗。

Ho:U=Ho,H1;口<口0(或U>口o)確定檢驗水準

檢驗水準亦稱顯著性水準,符號為a,是事先規(guī)定的對假設成立有否作出判斷的根據。

a常取0.05或0.01。

2.選擇檢驗方法、計算統(tǒng)計量

根據:①研究目的,②資料的類型和分布,③設計方案,④統(tǒng)計方法的應用條件,⑤樣本含

量大小等;選擇適宜的統(tǒng)計方法并計算出相應的統(tǒng)計量。

3.確定P值、做出推論

假設檢驗中的P值是指在由無效假設所規(guī)定的總體作隨機抽樣,獲得等于及大于(和/或

等于及小于)現(xiàn)有統(tǒng)計量的概率。即各樣本統(tǒng)計量的差異來自抽樣誤差的概率,它是判斷H.

成立與否的依據。

確定P值的方法主要有兩種

⑴查表法根據檢驗水準、樣本自由度直接查相應的界值表求出P值。

⑵計算法用特定的公式直接求出P值。

推論:若P>a,就沒有理由懷疑H。的真實性,則結論為不拒絕H。,做出不否定此樣本是

來自于該總體的結論,也即差別無顯著性意義:

若PWa,則拒絕H。,接受出,也就是說這些統(tǒng)計量來自不同的總體,其差別不能

由抽樣誤差來解釋,下結論為差別有顯著性意義。

t檢驗

以t分布為理論基礎,對一個或兩個樣本的數(shù)值變量資料進行假設檢驗常用的方法,屬

于參數(shù)檢驗。

第二節(jié)單樣本t檢驗

概念:亦稱樣本均數(shù)與總體均數(shù)比較的t檢驗。用于從正態(tài)總體中獲得含量為n的樣本,算

得均數(shù)和標準差,判斷其總體均數(shù)u是否與某個已知總體均數(shù)u。相同。

已知總體均數(shù)一般為標準值、理論值或經大量觀察得到的較穩(wěn)定的指標值。

一、適用條件:1.對正態(tài)分布的數(shù)值變量資料,需用t檢驗。

2.對于非正態(tài)分布的資料,若經過變量變換使成正態(tài)分布,可按t檢驗處理;

否則,用非參數(shù)檢驗的方法。

二、正態(tài)性檢驗的方法

檢驗假設H。為總體分布是正態(tài)分布,當P>a時,不拒絕H。,認為樣本所來自的總體

服從正態(tài)分布;而PWa時,拒絕H。,認為樣本所來自的總體不服從正態(tài)分布。

1.W檢驗Shapiro-Wilk檢驗是基于次序統(tǒng)計量對它們期望值的回歸而構成的。所用檢驗統(tǒng)

計量為W,又稱為W檢驗。在樣本量3WnW50時使用。

2.D檢驗Kolmogorov-Smirnov檢驗的統(tǒng)計量為D,所以也稱D檢驗,在樣本量50WnW1000

時使用。

三、計算公式

式中暑為樣本均數(shù),U為總體均數(shù),n為樣本含量,s為樣本標準差,v為自由度。

四、檢驗步驟

1.建立假設、確定檢驗水準HO:U=U0,Hl:uWuO,a=0.05

t=----------r.........1.607

2.選擇檢驗方法、計算統(tǒng)計量7.6/、顧

3.確定P值、做出推論

v=30-1=29,查t值表,t0.05/2.29=2.045,

/V*t=1.60705/2-29TP>0.05o

按Q=0.05水準,不拒絕Ho,根據現(xiàn)有樣本信息,不能認為脾虛男子脈搏數(shù)與健康人不同

第三節(jié)配對設計資料均數(shù)的t檢驗

配對設計——將觀察單位按照某些特征(如性別、年齡、病情等可疑混雜因素)配成條件相同

或相似的對子,每對中的兩個觀察單位隨機分配到兩個組,給予不同的處理,

觀察指標的變化。

①同一觀察單位實驗(或治療)前后的比較;②同?樣品用兩種方法檢驗結果的比較:

③配對的兩個觀察單位分別接受兩種處理后的數(shù)據比較。

配對t檢驗

配對t檢驗——又稱成對t檢驗,是將對子差數(shù)d看做變量,先假設兩種處理的效應相同,

口1一口2=0,無顯著性,推斷兩種處理因素的效果有無差別或某處理因素有無

作用。由于此種設計使影響結果的非被試因素相似或相同,因而提高了研究效率。

一、適用條件:1.設計類型是配對設計。2.數(shù)值變量的對子差值是正態(tài)分布。

二、計算公式

*-y7”工閨"—WS——-Sd/-'s/w

V=n—1,式中d為各個對子數(shù)值的差數(shù),d為差數(shù)的平均數(shù),Sa為差數(shù)的標準差,后■

為差數(shù)的標準誤,n為對子數(shù)。

三、檢驗步驟

例題:對10名患者分別用濕式熱消化-雙硫蹤法和硝酸-高錦酸鉀冷消化法測定尿鉛,問兩

法測得結果有無差別。

用兩種方法測定尿鉛結果(口mol/L)

患者號冷消化法熱消化法差值dd2

12.412.80-0.390.1521

212.0711.240.830.6889

32.903.04-0.140.0196

41.641.83-0.190.0361

52.751.880.870.7569

61.061.45-0.390.1521

73.233.43-0.200.04

80.770.92-0.150.0225

93.673.81-0.140.0196

104.494.010.480.2304

合計0.582.118

1.建立假設、確定檢驗水準

a

Ho:口=口0,Hi:uW口o,—0.05

2.計算統(tǒng)計量t值

先計算差值d及d2(如表),得Ed=0.58,Ed2=2.1182

Jyyf_Jaya—(d??尸一

-T----n-f0-T-------十A/。

S---0-^132t=—=-0Sa=0.361

計算差值的標準誤%而3182=M52sa01522

3.確定P值、做出推論

v=n—1=10—1=9,查t界值表,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論