數(shù)值變量資料的統(tǒng)計分析.ppt_第1頁
數(shù)值變量資料的統(tǒng)計分析.ppt_第2頁
數(shù)值變量資料的統(tǒng)計分析.ppt_第3頁
數(shù)值變量資料的統(tǒng)計分析.ppt_第4頁
數(shù)值變量資料的統(tǒng)計分析.ppt_第5頁
已閱讀5頁,還剩38頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、1,第九章 數(shù)值變量資料的統(tǒng)計分析,中山大學(xué)公共衛(wèi)生學(xué)院 醫(yī)學(xué)統(tǒng)計與流行病學(xué)系 張晉昕 2010.03.01,2,統(tǒng)計描述 統(tǒng)計分析 統(tǒng)計推斷,3,統(tǒng)計描述 統(tǒng)計分析 統(tǒng)計推斷,4,表9-1 某地140名健康成年男子的血清尿素氮濃度(nmol/L)資料。,5,表9-1 某地區(qū)140名健康成年男性血清尿素氮濃度(nmol/L),6,第一節(jié) 數(shù)值變量資料的統(tǒng)計描述,【例9-1】某地用隨機(jī)抽樣的方法對140名健康成年男性血清尿素氮(BUN)濃度進(jìn)行了檢測,資料如下,請描述男性血清尿素氮的情況。 表9-1的140個數(shù)據(jù),無論多認(rèn)真審視,也說不清這些女孩身高的情況怎樣、特征如何 統(tǒng)計描述就是解決此問題的

2、方法,即用統(tǒng)計表、統(tǒng)計圖和統(tǒng)計指標(biāo)來描述樣本數(shù)據(jù)的特征,7,表9-1 某地區(qū)140名健康成年男性血清尿素氮濃度(nmol/L),8,一、數(shù)值變量資料的頻數(shù)分布,頻數(shù)(frequency): 變量值出現(xiàn)的次數(shù),即例數(shù) 頻數(shù)表(frequency distribution table): 反映變量值與頻數(shù)之間關(guān)系的統(tǒng)計表,9,表9-2 某地區(qū)140名健康成年男性血清尿素氮濃度(nmol/L) 頻數(shù)表,10,頻數(shù)表的制作步驟: 1. 計算極差(range): 本例R6.55-2.10=4.45(nmol/L) 2. 決定組數(shù)、組段和組距(取方便數(shù)) 3列表劃記:見表9-2。,11,表9-2 某地區(qū)1

3、40名健康成年男性血清尿素氮濃度 (nmol/L) 頻數(shù)表,12,從頻數(shù)表可看出有兩個重要的特征: 集中趨勢(central tendency): 多數(shù)數(shù)據(jù)向中間集中 離散趨勢(tendency of dispersion): 少數(shù)數(shù)據(jù)向兩端分散,13,(二) 頻數(shù)分布圖(直方圖)及其制作,頻數(shù)分布圖: 反映變量值與頻數(shù)之間關(guān)系的統(tǒng)計圖(直方圖)。 將表9-2資料繪制成頻數(shù)分布圖(圖9-1),可見圖形中間高兩邊低、兩邊對稱 ,認(rèn)為近似服從正態(tài)分布。,14,15,(三)頻數(shù)表與頻數(shù)圖比較,頻數(shù)表不夠直觀,但讀出數(shù)據(jù)精確 頻數(shù)圖比較直觀,但讀出數(shù)據(jù)不精確,16,(四) 分布類型簡述,正態(tài)分布:圖9

4、-1可稱為正態(tài)或近似正態(tài)分布(后述) 對數(shù)正態(tài)分布:指數(shù)據(jù)的對數(shù)值呈正態(tài)分布 偏態(tài)分布:若高峰位于一側(cè),便被稱之為偏態(tài)分布(高峰偏左為正偏態(tài),反之為負(fù)偏態(tài)) 分類意義:不同分布類型資料,其描述性統(tǒng)計方法不同(應(yīng)對號入座),17,圖9-2 頻數(shù)分布逐漸向正態(tài)分布接近,18,二、平均水平指標(biāo),平均數(shù)(average):描述數(shù)值變量資料平均水平(或集中趨勢)的指標(biāo)。 平均數(shù)種類:算術(shù)平均數(shù)(簡稱均數(shù))、幾何平均數(shù)、中位數(shù),另有眾數(shù)以及調(diào)和均數(shù)。,19,(一)均數(shù)(mean),均數(shù)符號:總體均數(shù)為(讀作mu),樣本均數(shù)為 1直接法計算均數(shù): (9-1) 為求和的符號,讀作sigma,xi為觀察值,n為

5、例數(shù) 【例9-2】10名女孩的身高(cm)的平均值為 142.2(cm),20,2加權(quán)法計算均數(shù) 加權(quán)法(頻數(shù)表法)基本思想:以組中值代表組內(nèi)的變量值(近似法),簡化計算 計算:表9-3中fixi=616.80,fi =140,得,(9-2),(nmol/L ),21,【注】直接法計算得均數(shù)為4.38 (nmol/L) ,可見加權(quán)法近似效果很好 。,22,(二)幾何均數(shù)(geometric mean),定義:是將n個觀察值x的乘積再開n次方,所得的平方根,記為G 適用情形: (1)觀察值呈倍數(shù)關(guān)系(等比級數(shù)資料)或近似倍數(shù)關(guān)系,如抗體滴度; (2)對數(shù)正態(tài)資料。,23,1直接法:,24,【例9

6、-3】8份血清的抗體效價為 1:200,1:25,1:400,1:800,1:50,1:100, 1:50,1:25 平均抗體效價為,=lg-12=100,即 1 : 100,25,2加權(quán)法:,(9-4),26,例9-4 112名兒童接種疫苗一月后的血清抗體效價為: 1人1:4,3人1:8,15人1:16,32人1:32,43人1:64,11人1:128,5人1:256,2人1:512, 得,即這112名兒童的血清平均抗體效價為1:48,27,【注】計算幾何均數(shù)的觀察值不能小于或等于0,因為無法求對數(shù)。,先加上一常數(shù)即可,如X=KX,則X可取對數(shù)。 最終的幾何均數(shù)結(jié)果:G = GK,28,(三

7、)中位數(shù)(median) 與百分位數(shù)(percentile),中位數(shù):一組觀察值按大小順序排列,位置居中的那個數(shù)值稱為中位數(shù),記為M。 百分位數(shù):一組數(shù)據(jù)從小到大排列,并分成100等份,第x等份之分割位置的數(shù)值稱為第x百分位數(shù),記為Px 例如:x=50,記為P50,讀作“第五十百分位數(shù)”(即中位數(shù)),29,適用情形: 適用于任意分布,常用于 : 偏態(tài)分布(如發(fā)汞、尿鉛); 一端或兩端無確定數(shù)值; 分布情況不明。,30,常用百分位數(shù): P50,P25,P75,P5,P95,P2.5,P97.5 怎樣求解中位數(shù)和百分位數(shù)?,31,1中位數(shù)的直接估計:, n為奇數(shù)時,正中位置的數(shù)值就是M; MX(n

8、+1)/2 1,2,6,10,19 n為偶數(shù)時,居中位置兩個數(shù)值的平均數(shù)就是M。 MXn/2Xn/2+12 2,4,8,10,15,20,32,2中位數(shù)和百分位數(shù)的頻數(shù)表法:,L為百分位數(shù)對應(yīng)組段的下限值,i為該組段的組距,fx為該組段頻數(shù),fL為前一組累計頻數(shù),33,三、離散程度指標(biāo),平均指標(biāo)描述樣本數(shù)據(jù)的集中趨勢(一般水平) 變異指標(biāo)描述樣本數(shù)據(jù)的離散趨勢(差別大小),34,(一)全距(range),全距用R表示,是最大值與最小值之差(又稱極差)。 優(yōu)點(diǎn) 簡便; 缺點(diǎn) 不穩(wěn)?。ㄖ貜?fù)抽樣時結(jié)果變化很大),因只利用了2個數(shù)據(jù)的信息。 應(yīng)用 一般分析。,35,(二)四分位數(shù)間距(quartile

9、 interval),四分位數(shù)間距用Q表示,是上四分位數(shù)QU(P75)和下四分位數(shù)QL(P25)之差(中間半數(shù)個體的全距)。 優(yōu)點(diǎn) 比全距稍穩(wěn)?。?缺點(diǎn) 多數(shù)數(shù)據(jù)的信息仍未利用; 應(yīng)用 偏態(tài)分布資料。,36,【例9-7】 用表9-5的資料計算四分位數(shù)間距得:,( mol/L ),( mol/L ),( mol/L ),37,(三)方差與標(biāo)準(zhǔn)差,方差(variance):離均差平方的均值,(9-8),(9-9),38,* 2為總體方差,S2為樣本方差 * 方差利用了所有數(shù)據(jù)的信息,反映平均差別(但量綱是平方單位) * 式(9-7)中“n1”為自由度,數(shù)理統(tǒng)計認(rèn)為用自由度作分母較好(無偏估計) *

10、 標(biāo)準(zhǔn)差(standard deviation):方差的平方根便是標(biāo)準(zhǔn)差,其實質(zhì)是離均差的均值,反映平均差別大小,39,方差開平方后,使平方單位變?yōu)槠胀ǖ亩攘繂挝?為總體標(biāo)準(zhǔn)差,S為樣本標(biāo)準(zhǔn)差 方差和標(biāo)準(zhǔn)差的意義:都反映資料的變異程度大小,40,標(biāo)準(zhǔn)差的用途: 反映一組觀察值的離散程度 用于計算變異系數(shù) 計算標(biāo)準(zhǔn)誤(見第三節(jié)) 估計參考值的范圍(見第二節(jié)),41,(四)變異系數(shù)(coefficient of variation)記為CV,【例9-10】 某地40名7歲兒童身高均數(shù)為121.48cm,標(biāo)準(zhǔn)差為4.65cm;體重均數(shù)為22.18kg,標(biāo)準(zhǔn)差2.35kg。試比較其身高和體重的變異程度。 應(yīng)用: (1) 變量的度量單位不同; (2) 變量的度量單位相同,但是均數(shù)的數(shù)量級相差懸殊。,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論