第02章計量資料的統(tǒng)計描述_第1頁
第02章計量資料的統(tǒng)計描述_第2頁
第02章計量資料的統(tǒng)計描述_第3頁
第02章計量資料的統(tǒng)計描述_第4頁
第02章計量資料的統(tǒng)計描述_第5頁
已閱讀5頁,還剩56頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二章,計量資料的統(tǒng)計描述,1,重要概念回顧,1.Population2.Sample3.Error4.Probability,2,重要問題回顧,1.常見的醫(yī)學(xué)數(shù)據(jù)資料有哪些類型?各有些什么特點?2.醫(yī)學(xué)研究中常見的誤差類型有哪些?各有什么特點?3.醫(yī)學(xué)研究工作中與統(tǒng)計學(xué)相關(guān)的基本步驟有哪些?,3,統(tǒng)計描述,統(tǒng)計描述是指用統(tǒng)計指標(biāo)和適當(dāng)?shù)慕y(tǒng)計圖表來描述資料的分布規(guī)律及其數(shù)量特征。,5,主要內(nèi)容,第一節(jié)頻數(shù)分布第二節(jié)集中趨勢的描述第三節(jié)離散趨勢的描述第四節(jié)正態(tài)分布第五節(jié)醫(yī)學(xué)正常值范圍的制定,6,第一節(jié)頻數(shù)分布,一.頻數(shù)分布表1.求極差2.確定組段和組距3.根據(jù)組距寫出組段4.分組劃記并統(tǒng)計頻數(shù),

2、7,如何對這份資料進行整理和匯報?,1998年100名18歲健康女大學(xué)生身高的頻數(shù)分布,二.頻數(shù)分布圖,10,三.頻數(shù)表和頻數(shù)分布圖的用途1.描述頻數(shù)分布的類型2.描述頻數(shù)分布的特征3.便于發(fā)現(xiàn)一些特大或者特小值4.便于進一步做統(tǒng)計分析或處理,11,第二節(jié)集中趨勢,集中位置的描述,即大多數(shù)數(shù)值落在什么位置。,12,描述集中趨勢的幾種指標(biāo):1.算術(shù)均數(shù)(均數(shù))2.幾何均數(shù)3.中位數(shù),1.算術(shù)均數(shù)(均數(shù)),意義:一組性質(zhì)相同的觀察值在數(shù)量上的平均水平。表示:(總體)X(樣本)計算:直接法、頻數(shù)表法、計算機特征:(X-X)=0估計誤差之和為0。應(yīng)用:正態(tài)分布或近似正態(tài)分布,對稱分布注意:使用頻數(shù)表法

3、求算數(shù)均數(shù)時,需要合理分組。,13,14,2.幾何均數(shù)(GeometricMean),應(yīng)用:原始數(shù)據(jù)分布不對稱,經(jīng)對數(shù)轉(zhuǎn)換后呈對稱分布的資料。例如抗體滴度。意義:N個數(shù)值的乘積開N次方即為這N個數(shù)的幾何均數(shù)。表示:G計算:,15,例2.2測得10個人的血清滴度的倒數(shù)分別為2,2,4,4,8,8,8,8,32,32,求平均滴度。,16,17,18,負(fù)偏態(tài)正偏態(tài),19,平均數(shù)=中位數(shù)=眾數(shù)平均數(shù)中位數(shù)眾數(shù),3.中位數(shù)(Median)、百分位數(shù)(Percentile),中位數(shù)意義:將一組觀察值從小到大排序后,居于中間位置的那個值或兩個中間值的平均值。表示:M、PX計算:百分位數(shù):將N個觀察值從小到大

4、依次排列,再分成100等份,對應(yīng)于X%位的數(shù)值即為第X百分位數(shù)。中位數(shù)是百分位的特殊形式。應(yīng)用:偏態(tài)資料,開口資料,20,將一組觀察值從小到大按順序排列,居中心位置的數(shù)值即為中位數(shù)。如測得5個人的VLDL中的apo_B的含量(mg/dl)為0.84、2.85、5.46、8.58、9.60,則M=5.46(mg/dl)若測量結(jié)果:0.84、2.85、8.58、9.6,則M=(2.85+8.58)/2=5.72(mg/dl),21,表2-4某地630名正常女性血清甘油三脂含量(mg/dl),L、iM、fM分別為M所在組段的下限、組距和頻數(shù),fL為M所在組段之前各組段的累積頻數(shù)。,中位數(shù),百分位數(shù)(

5、Percentile),L:組段的下限;iM:組距;fx:頻數(shù);fL:Px所在組段之前的累積頻數(shù)。例2.5計算例2.4的百分位數(shù)P25、P75、P90。,三個指標(biāo)的區(qū)別,1.算術(shù)均數(shù)2.幾何均數(shù)3.中位數(shù),25,26,27,對甲乙2名高血壓患者連續(xù)觀察5天,測得的收縮壓如下,請問兩組資料有什么異同?甲患者(mmHg)162145178142186()乙患者(mmHg)164160163159166(),甲乙患者收縮壓的均數(shù)很相似,但是甲患者的血壓波動范圍較大。,第三節(jié)離散趨勢,常用指標(biāo):極差(全距)四分位數(shù)間距方差標(biāo)準(zhǔn)差變異系數(shù),28,描述一組數(shù)據(jù)參差不齊的程度。,按間距計算:極差和四分位數(shù)間

6、距按平均偏差計算:離均差平方和、方差、標(biāo)準(zhǔn)差和變異系數(shù),極差(全距),一組變量的最大值和最小值之差。P182-11甲、乙、丙組的身高均數(shù)均為100cm,但極差各不相同。傳染病、食物中毒的最長和最短潛伏期。,29,四分位數(shù)間距,Q=P75P252-12QR=67.7-39.2=28.5(天),30,31,50歲60歲正常女性血清甘油三脂含量的百分位數(shù)P25和P75的位置分別為63.2mg/dl和135.7mg/dl,則四分位間距為:四分位數(shù)間距主要用于描述明顯偏態(tài)分布資料的變異程度。,以上指標(biāo)沒有考慮每一個測得值的情況。平均偏差=,32,標(biāo)準(zhǔn)差,相關(guān)概念:離均差、離均差平方和、方差(2,S2)標(biāo)

7、準(zhǔn)差的符號:S計算:,33,對于樣本資料,分母取n1作為自由度(degreeoffreedom,df),式中MS為樣本方差,方差越大說明數(shù)據(jù)的變異越大。,請大家計算下列三組同齡男孩的身高標(biāo)準(zhǔn)差:甲組:9095100105110乙組:9698100102104丙組:9699100101104,34,35,36,如果是頻數(shù)表資料,可用以下的公式:,37,標(biāo)準(zhǔn)差,意義:全面反映了一組觀察值的變異程度.(越大說明圍繞均數(shù)越離散,反之說明較集中在均數(shù)周圍,均數(shù)的代表性越好)標(biāo)準(zhǔn)差的量綱與原變量一致。標(biāo)準(zhǔn)差可以直接用于代數(shù)運算。標(biāo)準(zhǔn)差與均數(shù)結(jié)合能夠完整地概括一個正態(tài)分布。標(biāo)準(zhǔn)差越大意味著個體差異越大。應(yīng)用

8、:描述變異程度、計算標(biāo)準(zhǔn)誤、計算變異系數(shù)、描述正態(tài)分布、估計正常值范圍,37,變異系數(shù),意義:標(biāo)準(zhǔn)差與均數(shù)之比用百分?jǐn)?shù)表示。符號:CV計算:無單位應(yīng)用:,38,不同量綱的變量間變異程度的比較。均數(shù)差別較大的變量間變異程度的比較。,39,第四節(jié)正態(tài)分布,1、圖形2、特征3、面積,40,43,正態(tài)分布例2.1中,將紅細(xì)胞數(shù)的橫坐標(biāo)用變量X表示,第i組的組距和人數(shù)分別為Xi和fi表示,n為總觀察例數(shù)各矩形的面積恰好等于紅細(xì)胞在區(qū)間內(nèi)的頻率(f(X)Xi=fi/n)面積的總和為1。,44,假設(shè)觀察的人數(shù)增多,組段不斷細(xì)分,則直方圖將逐漸接近于一條均勻連續(xù)的曲線,這條曲線所描述的分布,簡稱為正態(tài)分布。,

9、45,正態(tài)分布的密度函數(shù),曲線方程為:,和e是圓周率和自然對數(shù)的底,其近似值分別為3.14159和2.71828。和是正態(tài)分布的兩個參數(shù),分別是總體的均數(shù)和標(biāo)準(zhǔn)差。,用總體均數(shù)計算標(biāo)準(zhǔn)差時,自由度是n而不是n-1,一.正態(tài)分布的概念和特征,均數(shù)處最高;均數(shù)為中心對稱;2個參數(shù)N(u,)標(biāo)準(zhǔn)正態(tài)分布:N(0,1);標(biāo)準(zhǔn)正態(tài)變換(變換公式):;曲線下的面積有一定規(guī)律。,46,48,正態(tài)分布完全由參數(shù)和決定。,49,標(biāo)準(zhǔn)正態(tài)分布曲線下的面積分布規(guī)律,橫軸上、曲線下的面積為1;曲線下,橫軸上對稱于0的面積相等。,二.標(biāo)準(zhǔn)正態(tài)分布(StandardNormalDistribution),對任何參數(shù)的正態(tài)

10、分布,都可以通過一個簡單的變量變換化成和的標(biāo)準(zhǔn)正態(tài)分布。通常,可以利用標(biāo)準(zhǔn)正態(tài)分布表求出與原始變量X有關(guān)的概率值。,51,正態(tài)分布的應(yīng)用醫(yī)學(xué)參考值范圍的估計.置信區(qū)間的估計.準(zhǔn)確地進行誤差分析和質(zhì)量控制.正態(tài)分布是以后學(xué)習(xí)各種統(tǒng)計推斷方法的理論基礎(chǔ).,第五節(jié)醫(yī)學(xué)正常值范圍的制定,定義:又稱參考值范圍,是指特定健康人群的解剖、生理、生化等各種數(shù)據(jù)的波動范圍。采用包括95%的人的界值為最為常用的正常值范圍。單雙側(cè):根據(jù)指標(biāo)的實際用途,有的指標(biāo)有上下界值(雙側(cè))。某些指標(biāo)只需確定上限(單);某些指標(biāo)只需確定下限(單)。估計的方法:1、正態(tài)分布法2、百分位數(shù)法,52,53,醫(yī)學(xué)參考值范圍的制定方法選擇

11、足夠數(shù)量的正常人作為參照樣本。對選定的正常人進行準(zhǔn)確的測定。決定取單側(cè)范圍還是雙側(cè)范圍值。選擇適當(dāng)?shù)陌俜址秶?54,估計參考值范圍的界限。,55,應(yīng)用條件:正態(tài)分布或近似正態(tài)分布資料計算(雙側(cè)):95%正常值(醫(yī)學(xué)參考值)范圍公式:(x1.96S,x1.96S)即(x1.96S),1、正態(tài)分布法,56,例某地成年男性紅細(xì)胞數(shù)的均數(shù)為4.781012/L,標(biāo)準(zhǔn)差為0.381012/L,試估計該地成年男性紅細(xì)胞數(shù)的95%參考值范圍。1.正常成年男性紅細(xì)胞數(shù)近似服從正態(tài)分布。2.紅細(xì)胞數(shù)過多或過少均屬異常,所以要計算雙側(cè)參考值范圍。下限:上限:,2、百分位數(shù)法,應(yīng)用條件:偏態(tài)分布資料計算公式:雙側(cè)界值:P2.5P97.5單側(cè)上界:P95單側(cè)下界:P5,57,58,例見表2-4的資料。為該地區(qū)5060歲女性高血脂診斷與治療提供參考依據(jù),試估計其血清甘油三酯含量的95%單側(cè)參考值范圍。1.頻數(shù)表提示,甘油三酯呈正偏態(tài)分布,考慮用百分位數(shù)方法處理。2.目前認(rèn)為血清甘油三酯過高屬于異常。,59,百分位數(shù)法與正態(tài)分布法前者適合任何分布類型的資料,實際中最為常用。后者僅適用于正態(tài)分布資料,適用范圍較狹窄。,重點內(nèi)容及概念回顧,60,AverageMeanGeometricmeanMedianQuartileVariance/MeansquaredeviationStandard

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論