衛(wèi)生統(tǒng)計(jì)學(xué)專題四:定量資料的統(tǒng)計(jì)描述_第1頁
衛(wèi)生統(tǒng)計(jì)學(xué)專題四:定量資料的統(tǒng)計(jì)描述_第2頁
衛(wèi)生統(tǒng)計(jì)學(xué)專題四:定量資料的統(tǒng)計(jì)描述_第3頁
全文預(yù)覽已結(jié)束

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1 專題四 定量資料的統(tǒng)計(jì)描述 一、頻數(shù)表與頻數(shù)圖 頻數(shù)表 :表達(dá)變量取值及其不同取值頻數(shù)分布情況的統(tǒng)計(jì)表。 頻數(shù)表的編制 連續(xù)型定量資料的頻數(shù)表 求極差(全距): R=xmax-xmin 確定組數(shù)和組距: 根據(jù)樣本含量的大小及研究目的確定組數(shù),一般設(shè)為 815組。用 R除以組數(shù)得到的商,取與此接近較為整齊的數(shù)值作為組距,組距即為各組的上、下限之差。 注:各組的組距可以相等,可以不等,一般多采用等距分組。 確定 組段 :即 確定每一組的起點(diǎn)和終點(diǎn)(下限與上限) 注: 第一組段包括全部觀察值中的最小值,最末組段包 含全部觀察值中的最大值;各組段包含的數(shù)值范圍是大于等于下限,小于上限;頻數(shù)表中除最末組同時(shí)寫出下限和上限外,其余各組均只寫出下限; 歸組計(jì)數(shù)整理成表; 離散型定量資料的頻數(shù)表的編制:將變量值及其對(duì)應(yīng)的頻數(shù)列出即可。 頻數(shù)表的用途 揭示資料的頻數(shù)分布特征和頻數(shù)分布類型 : 分 布特征:集中趨勢、離散趨勢,對(duì)于定量資料可從兩個(gè)方面去描述其分布特征。 分布類型:對(duì)稱分布,即高峰位中,兩側(cè)對(duì)稱。 偏態(tài)分布 ,高峰偏于一側(cè),偏向數(shù)值小的一側(cè),稱為 正偏態(tài)分布 ;偏向數(shù)值大的一側(cè),為 負(fù)偏態(tài)分布 。 便于發(fā)現(xiàn)某些特 大或特小的可疑值; 便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)處理。 頻數(shù)圖 : 更直觀、形象。 以變量值為橫坐標(biāo),以頻數(shù)為縱坐標(biāo)(等距分組時(shí)可以頻率為縱坐標(biāo),不等距分組時(shí)以頻率 /組距 =頻率密度作為縱坐標(biāo)),即每個(gè)等寬長方形面積表示每組頻數(shù)(或頻率)。 注:連續(xù)型定量資料,其頻數(shù)圖中各長方形是相連的,又稱為直方圖;離散型 定量資料,其頻數(shù)圖中各長方形是 間隔 的,又稱為直 條 圖 。 二、集中趨勢的描述 對(duì)于定量資料集中趨勢的描述常用平均數(shù),平均數(shù)表達(dá)了一組同質(zhì)定量數(shù)據(jù)的平均水平或集中位置。 算術(shù)平均數(shù)(均數(shù)) 幾何均數(shù)(倍數(shù)均數(shù)) 符號(hào) x (樣本), (總體) G 計(jì) 算 方 法 (直接法) nxxxnxx n 21 (加權(quán)法) i iik kk f kffff xfxfxfx 21 2211k為組段數(shù), xk為各組段相應(yīng)頻數(shù)。 (直接法 ,用于樣本含量較少時(shí) ) G=nn xxx 21=lg-1 nxxx nlglglg 21 =lg-1nxlg (加權(quán)法 ,用于觀察值較多,或資料已編成頻數(shù)表 時(shí) ) G=lg-1 k kkfff xfxfxf 21 2211 lglglg=lg-1 i ii f xf lg應(yīng)用 應(yīng)用于對(duì)稱分布,特別是正態(tài)分布資料集中趨勢的描述。 對(duì)數(shù)對(duì)稱(含對(duì)數(shù)正態(tài)分布),即數(shù)據(jù)經(jīng) 對(duì)數(shù)變換后呈對(duì)稱分布或正態(tài)分布的資料。 等比級(jí)數(shù)資料,即觀察值之間呈倍數(shù)或近似倍數(shù)變化的資料,如抗體滴度、抗體效價(jià)。 說明 計(jì)算幾何均數(shù)時(shí),觀察值中不能有 0,因?yàn)?0不能取對(duì)數(shù),此時(shí)可以加上 1個(gè)很小的數(shù),算后再減去該數(shù)值即可。 觀察值不能同時(shí)有正有負(fù)。 續(xù)表 中位數(shù) 百分位數(shù) 符 號(hào) M Px 觀察個(gè)數(shù)為奇時(shí), M=x 21n 2 計(jì) 算 方 法 觀察個(gè)數(shù)為偶時(shí), (直接法) M= 12221nn xx(頻數(shù)表法) M=L+ LMfnfi 2 L為頻數(shù)表中 M所在組段的下限, i為 M所在組段的組距,fM為 M 所在組段的頻數(shù), fL為小于 L 的各組段累積頻數(shù)。 Px=L+ Lx fxnfi % 其中 L為 Px所在組段下限, i為組距, fx為 Px所在組段頻數(shù), fL為小于 L的各 組段的累積頻數(shù)。 應(yīng)用 適用于描述偏態(tài)分布資料、一端或兩端無確切值的資料及總體分布不確定資料的集中趨勢 用于描述一組數(shù)據(jù)某一百分位置的水平,多個(gè)百分位數(shù)結(jié)合應(yīng)用,可全面描述一組觀察值的分布特征; 用于確定非正態(tài)分布資料的醫(yī)學(xué)參考值范圍。 說明 將觀察值由小到大排序后,居于中間位置的數(shù)值。 在全部觀察中,小于和大宇中位數(shù)的觀察值個(gè)數(shù)相等。 Px 是指將觀察值由小到大排序后,將其平均分為 100份,對(duì)于每一分割位置上的數(shù)值即為一個(gè)百分?jǐn)?shù)。 四分位數(shù): P25( Ql)、 P50(中位數(shù))、 P75( Qu) ; 應(yīng)用百分位數(shù)時(shí),樣本含量要足夠大,否則不宜取太靠近兩端的百分位數(shù)。 三、 離散趨勢的描述 離散 趨勢 ,反映了觀察值之間的變異情況。 極差 四分位數(shù)間距 方差 符號(hào) R Q 2( 總體 ) , s2( 樣本 ) 計(jì) 算 方 法 R=minmax xx Q=Qu-Ql=P75-P25 2=離均差平方和 /N= ( x-n) 2 N s2= ( x-x ) 2 ( n-1為自由度) n-1 應(yīng)用 僅用于初步了解資料的 變異程度,概括地描述全部數(shù)據(jù)所在范圍。 描述偏態(tài)分布以及分布的一端或兩端無確切數(shù)值資料的離散程度。 描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的離散程度。 說明 R 大,反映了全部觀察值所在范圍的變異程度大,數(shù)據(jù)較為分散; R小 ,反映了全部觀察值所在范圍的變異程度 小 ,數(shù)據(jù)較為 集中 ; 不能反映組內(nèi)其他觀察值的變異程度。 不受兩端極大值或極小值影響 ,較全距穩(wěn)定,但仍不能概括所有觀察值的變異情況 。 相同指標(biāo),方差越大,說明數(shù)據(jù)圍繞均屬分布越分散,變異程度越大;反之, 方差越 小 ,說明數(shù)據(jù)圍繞均屬分布越 集中 ,變異 程度越 小 ; 續(xù)表 標(biāo)準(zhǔn)差 變異系數(shù) 符號(hào) ( 總體 ) , s( 樣本 ) CV 計(jì) 算 方 法 2 = Nx 2 s=122 nnXX(直接法) s= 122iiiiiffxfxf i(加權(quán)法) CV=xS 100% 應(yīng)用 描述對(duì)稱分布,特別是正態(tài)分布或近似正態(tài)分布資料的離散程度。 常用于比較度量單位不同或單位相同均數(shù)相差懸殊的兩組或 多組資料的變異程度。 說明 表示每個(gè)觀察值與均數(shù)之間距離(絕對(duì)距離)的平均水平。 沒有單位,是一種相對(duì)變異指標(biāo) 四、正態(tài)分布及其應(yīng)用 正態(tài)分布的概念 如果連續(xù)型隨機(jī)變量 x的概率密度函數(shù)為 f( x) = 21 222 xe , - x ;則稱隨機(jī)變量 x服從參數(shù)為 和 3 的正態(tài)分布,記作 XN( , )。式子中 為圓周率, e為自然對(duì)數(shù)的底, 為總體均數(shù), 為總體標(biāo)準(zhǔn)差, x為正態(tài)變量。 正態(tài)分布的特征 正態(tài)曲線:橫軸上方均數(shù)處最 高,向兩側(cè)下降,并以均數(shù)為中心,左右對(duì)稱,但兩端與橫軸永不相交,呈鐘型曲線。 正態(tài)分布有兩個(gè)參數(shù),即均數(shù) 和標(biāo)準(zhǔn)差 。 為位置均數(shù),固定不變時(shí),越大,曲線沿橫軸越向右;反之,越小,曲線沿橫軸越向左。 為形狀均數(shù),固定不變時(shí),越大,曲線越平闊;越小,曲線越尖峭。 正態(tài)曲線下面積的分布有一定的規(guī)律。 正態(tài)曲線下 一定區(qū)間內(nèi)的 面積 代表了取值于相應(yīng)區(qū)間內(nèi)的觀察值個(gè)數(shù)在全部觀察值總數(shù)中所占的比例(頻率),或者是觀察值落在該區(qū)間內(nèi)的概率。 無論 和 取何值,正態(tài)曲線下面積分布規(guī)律有: 正態(tài)曲線與橫軸之間的面積恒等于 1或 100% 正態(tài)分布為對(duì)稱分布,其對(duì)稱軸兩側(cè)面積各為 50% 區(qū)間( -, +)的面積為 68.27%;區(qū)間( -1.96, +1.96)的面積為 95.00%;區(qū)間( -2.58, +2.58)的面積為 99。 00%; 標(biāo)準(zhǔn)正態(tài)分布 (教材圖 4-4,正態(tài)分布于標(biāo)準(zhǔn)正態(tài)分布曲線 ) 由總體時(shí) z=x, 由樣本估計(jì)時(shí) z=sxx若 X 服從正態(tài)分布 N( , ),則 z服從 N( 0,1)。 在區(qū)間 ( -z, +z)內(nèi),若 求 一般正態(tài)分布曲線下某區(qū)間內(nèi)面積,則需先進(jìn)行 z變換,然后借助標(biāo)準(zhǔn)正態(tài)分布表(教材附表 3)求得 。 正態(tài)分布的應(yīng)用 估計(jì)正態(tài)分布或近似正態(tài)分布資料的頻數(shù)分布 舉例:求在某值及其以下者所占比例、求在某范圍內(nèi)者所占比例、求大于等于某值者所占比例。 制定醫(yī)學(xué)參考值范圍(正常值范圍) 制定醫(yī)學(xué)參考值范圍 時(shí):確定一批樣本含量足夠大的“正常人”;根據(jù)研究目的和使用要求選定適當(dāng)?shù)陌俜纸缰?,常?95%;根據(jù)專業(yè)知識(shí)確定單側(cè)或雙側(cè)界值;根據(jù)資料分布特點(diǎn),選用恰當(dāng)?shù)挠?jì)算方法。 制定 醫(yī)學(xué)參考值范圍 的常用方法有: 正態(tài)分布法( 適用于正態(tài)分布或近似正態(tài)分布的資料 ) 雙側(cè)界值: x Z/2S 單側(cè)上界: x + ZS或單側(cè)下界: x - ZS Z和 Z/2為標(biāo)準(zhǔn)正態(tài)分布在給定小概率 (如 =0.05)時(shí)相應(yīng)的單側(cè)界值或雙側(cè)界值。 Z 表示 z Z 或 z -Z 的概率為 ,只考慮單側(cè)尾部的概率分布。 Z/2表示 z Z/2和 z Z/2的概率為 ,同時(shí)考慮兩側(cè) 尾部的概率分布。 常用 z值表 參考值范圍 單側(cè) 雙側(cè) 80 0.842 1.28

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論