(推薦課件)定量變量的統(tǒng)計(jì)描述_第1頁(yè)
(推薦課件)定量變量的統(tǒng)計(jì)描述_第2頁(yè)
(推薦課件)定量變量的統(tǒng)計(jì)描述_第3頁(yè)
(推薦課件)定量變量的統(tǒng)計(jì)描述_第4頁(yè)
(推薦課件)定量變量的統(tǒng)計(jì)描述_第5頁(yè)
已閱讀5頁(yè),還剩95頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、定量變量的統(tǒng)計(jì)描述:1、用統(tǒng)計(jì)表概括數(shù)據(jù),用統(tǒng)計(jì)圖直觀地表達(dá)分布模式和分布之間的關(guān)系,用于描述定量數(shù)據(jù)統(tǒng)計(jì)指標(biāo)的重要性和計(jì)算。2、3、4、統(tǒng)計(jì)、5、統(tǒng)計(jì)描述:從數(shù)據(jù)中獲取信息的最基本方法,掌握數(shù)據(jù)的基本特征,為統(tǒng)計(jì)分析奠定基礎(chǔ),6、表2-2 120名18-35歲健康男性居民的血清鐵含量(UMOL/L),7,目的:描述本問題1。這組居民的平均血清鐵含量是多少?問題4。用表格/圖表顯示血清鐵的分布?問題2。血清鐵含量的范圍?最高的是什么?最低是多少?問題3。血清鐵含量主要集中在哪個(gè)范圍?8、教學(xué)要求,了解頻數(shù)分布表的編制方法和應(yīng)用,掌握常用的統(tǒng)計(jì)描述指標(biāo)數(shù)值變量數(shù)據(jù)的平均水平和變異程度,以及它們各

2、自的應(yīng)用。9,第1節(jié)頻率和頻率分布,頻率:重復(fù)觀察隨機(jī)變量,其中一個(gè)變量值出現(xiàn)的次數(shù)。頻率分布表:變量值及其對(duì)應(yīng)的頻率系列被制成表格。實(shí)施例2-2某地區(qū)120名18-35歲健康男性居民血清鐵含量抽樣調(diào)查。頻率表的編制:1。連續(xù)定量變量的頻率分布;10.(2)連續(xù)變量頻率表的編制方法:步驟11。找到范圍(縮寫為R ):是一組數(shù)據(jù)中的最大值(Xmax)和最小值(Xmin)之間的差值,也稱為極端差值。全距離(r)=xmax-xmin=29.64 7.42=22.22(umol/l),12,2。設(shè)置組距離:將整個(gè)距離分成幾段,稱為組段。群體之間的距離稱為群體距離。小寫I.在原則:(1)中,“組”的數(shù)量

3、一般為8-15;(2)“組距離”一般用R/10四舍五入;(3)為便于計(jì)算,根據(jù)群體距離采用整數(shù)法。本示例:組距離(i)=總距離/預(yù)分組段=22.22 /10=2.222(umol/L),13,3。將總距離分成幾段的過(guò)程。原則:(1)第一組數(shù)據(jù)段應(yīng)該包括Xmin,最后一組應(yīng)該包括xmax(2)每組用下限值加表示,上限值和下限值在最后一組中同時(shí)顯示。注意:每組線段不能重疊,每組線段是半開半閉的區(qū)間。4。列表標(biāo)記:根據(jù)預(yù)定的組段和組距,對(duì)原始數(shù)據(jù)進(jìn)行標(biāo)記排序。表2-3 120名18-35歲健康男性居民血清鐵含量頻數(shù)分布表,一個(gè)為陽(yáng)性,一個(gè)為陽(yáng)性,另一個(gè)為陽(yáng)性,另一個(gè)為陽(yáng)性,另一個(gè)為陽(yáng)性,另一個(gè)為陽(yáng)性

4、,最后一個(gè)為陽(yáng)性,1 3 6 8 12 20 27 18 12 8 4 1,斷面,標(biāo)記,頻數(shù), 表2.2血清鐵含量頻率表段頻率%累計(jì)頻率累計(jì)頻率% 6 1 0.83 1 0.83 8 3 2.50 4 3.33 10 6 5.00 10 8.33 12 8 6.67 18 15.00 14 12 10.00 30 25.00 16 20 16.67 50 41.67 18 27 22.50 7 64.17 20 18 18 特征:中間高、邊、頻率分布圖:根據(jù)頻率分布表繪制的直方圖,以變量值為橫坐標(biāo),頻率為縱坐標(biāo)。 17的頻率為7,頻率為7.3%。3次檢查的頻率為11次,頻率為11.5%。對(duì)于超

5、過(guò)5次的檢查,頻率為12次,頻率為12.5%。檢查0次的頻率為4,其頻率為4.2%。檢查0,3,2,0,1,5,6,3,2,4,1,0,6,5,1,3,3,4,7,2,離散數(shù)量變量的頻率??v坐標(biāo)是頻率,即在被統(tǒng)計(jì)的婦女中進(jìn)行過(guò)k次產(chǎn)前檢查的婦女的百分比。圖中等寬矩形條的高度與相應(yīng)檢查次數(shù)的頻率成正比。頻率:每個(gè)組的頻率除以病例總數(shù)的比率。頻率描述每個(gè)組頻率在整個(gè)人口中的比例,每個(gè)組頻率的總和等于100%。累計(jì)頻率:該組的頻率與前一組的頻率相加;累積頻率:每組的累積頻率除以病例總數(shù)。21、3的頻率分布有兩個(gè)特點(diǎn),即集中趨勢(shì):血清鐵含量集中在中部,即中部含量大多集中在18組,這是一個(gè)集中趨勢(shì)。離散

6、趨勢(shì):頻率分布從中部向兩側(cè)逐漸減小,血清鐵含量值不均勻,最低接近6,最高接近30。這種現(xiàn)象被稱為離散趨勢(shì)。由于同質(zhì)性,所有測(cè)量值趨向于相同值的趨勢(shì)稱為濃度趨勢(shì)。離散趨勢(shì)或變化程度是指觀察值之間的不均勻程度。表2-2某處101名正常成年女性血清總膽固醇頻率表,共140份,血清膽固醇值集中于中部,即中含量者多集中于中部,23份,頻數(shù)分布,4份,頻數(shù)分布類型,對(duì)稱分布類型:指集中位置在中部,左右兩側(cè)頻數(shù)分布一般對(duì)稱。偏置分布型:指集中位置向一側(cè)傾斜,頻率分布不對(duì)稱。偏斜度分布,正偏斜度分布:集中位置偏向小值側(cè)。負(fù)偏度分布:集中位置偏向值大的一側(cè)。24、25、26、27、(3)頻率表的使用:1。揭示變

7、量的分布特征,圖3.1某市100名8歲男童身高(厘米)的頻數(shù)分布、分散趨勢(shì)、集中趨勢(shì)和分散趨勢(shì)的結(jié)合能充分反映頻數(shù)分布特征,集中28,2。揭示了分布類型、頻率分布、偏度分布、正偏、負(fù)偏,集中在中間,末端較少,左右兩側(cè)基本對(duì)稱,為對(duì)稱(正態(tài))分布。對(duì)稱分布,集中部分在較小值的一側(cè)(左側(cè)),而較大值的方向逐漸減小,這是一個(gè)正的偏斜分布。集中部分在較大值的一側(cè)(右側(cè)),較小值的方向逐漸減小,呈負(fù)偏態(tài)分布。29,4。便于統(tǒng)計(jì)指標(biāo)的進(jìn)一步計(jì)算和統(tǒng)計(jì)分析。找到一些異常值或極值是很方便的。圖3.1高(厘米)、高(厘米)、頻、30、1的頻率分布。集中趨勢(shì)統(tǒng)計(jì)指數(shù):反映整體內(nèi)的同質(zhì)性。二.離差的統(tǒng)計(jì)指標(biāo):反映人

8、口中個(gè)體之間的差異。三.分布模式的統(tǒng)計(jì)指標(biāo):反映峰值的模式。第二節(jié)描述了平均水平的統(tǒng)計(jì)指標(biāo),31,平均值:描述了一組同質(zhì)測(cè)量數(shù)據(jù)的集中趨勢(shì);反映一組觀察值的平均水平。常用的平均值有算術(shù)平均值、幾何平均值和中位數(shù)。算術(shù)平均值:指平均值,總平均值用希臘字母表示,樣本平均值用拉丁字母表示。1.計(jì)算方法1)直接法:適用于小樣本數(shù)n的數(shù)據(jù).X1、X2Xn是變量值,n是樣本號(hào)。32,2)加權(quán)法:適用于變量較多的數(shù)據(jù)。K=1,2,3。fk是第k組的頻率,X0k是第k組的組中值,組中值=(該組的下限低于該組的下限)/2。重量,即更多的頻率,更大的重量,更大的效果,更少的頻率,更少的重量和更少的效果。33,10

9、,10,10,15,10有三個(gè),權(quán)重為3,在計(jì)算平均值時(shí)起3/5的作用。頻率多,權(quán)重大,效果好,15有兩個(gè),權(quán)重為2,在計(jì)算平均值時(shí),權(quán)重為2/5。試著找出它的算術(shù)平均值。實(shí)施例2-4為了找到120名18-35歲健康男性居民的血清鐵含量平均值由于均值位于分布的中心,它能最好地反映數(shù)據(jù)的集中趨勢(shì)。(2)幾何平均數(shù):(幾何平均數(shù)也叫多重平均數(shù),用G) 1表示。幾何平均數(shù)的計(jì)算方法1)直接法:適用于樣本數(shù)較少的數(shù)據(jù)。將X1、X2和X3Xn的n個(gè)觀察值的乘積開成n次方對(duì)數(shù)形式:g=LG-1(LGX 1 LGX 2 LGX 3 LGXN)/n=LG-1(LGX/N),38、2-5 7例慢性遷延性肝炎患者

10、的HBsAg滴度數(shù)據(jù)為1: 16、1: 32、1: 32。找到平均滴度。7個(gè)乙型肝炎表面抗原樣本的平均滴度為1: 64,39,2)加權(quán)法:適用于樣本數(shù)較多的數(shù)據(jù),其中X1和X2Xn為各組的滴度或倒數(shù)滴度。F1和f2fn是每組的頻率。40、40、2-6 52例慢性肝炎患者HBsAg滴度數(shù)據(jù)見表,并計(jì)算平均滴度。52例慢性肝炎患者HBsAg滴度的幾何平均數(shù)為1:119.74705,41,2)應(yīng)用幾何平均數(shù)的注意事項(xiàng):1)幾何平均數(shù)常用于等比數(shù)據(jù)或?qū)?shù)正態(tài)分布數(shù)據(jù)。2)觀察值不能為0。3)觀察值不能同時(shí)具有正值和負(fù)值。42,練習(xí):1。8份血清樣本的抗體滴度分別為:1:5、1:10、1:20、1:40

11、、1:80、13360160、13360320、1:640。2.血清抗體滴度為50,分別為5 1:10、9 1:20、20 1336040、10 1336080和6 1:160。43,中值(m):按從小到大的順序排列一組變量值,中間等級(jí)的變量值為中值。(3)中值和百分位,百分位,Px):指數(shù)據(jù)從小到大排列后位于X%位置的值。有n個(gè)觀察值X1、X2Xn,它們按照從小到大的順序排列為X1X2X3Xn。這n個(gè)觀察值平均分成100個(gè)相等部分,每個(gè)相等部分對(duì)應(yīng)的值是一個(gè)百分點(diǎn)。對(duì)應(yīng)于以前的X%位置的值稱為X百分位,用Px表示。Px百分位將總體或樣本的所有觀察值分為兩部分。理論上,X%的觀測(cè)值小于它,而(

12、100-X)%的觀測(cè)值大于它。44,1。中位數(shù)和百分位數(shù)的計(jì)算1)直接法:適用于小樣本數(shù)n的數(shù)據(jù)。觀測(cè)值按大小順序排列。當(dāng)n是奇數(shù)時(shí),中間的數(shù)字是中位數(shù)。當(dāng)n為偶數(shù)時(shí),中間兩個(gè)數(shù)的平均值為中間值。在實(shí)施例2-7中,制藥廠觀察到口服高山紅景天醇提取物后9只小鼠的存活時(shí)間(分鐘)如下:49.1、60.8、63.3、63.6、63.6、65.6、65.8、68.6和69.0 n為奇數(shù),M=63.6(2)。一種疾病有8名患者,潛伏期由小到大分別為5、6、8、9、11、11、13和16天。46,2)頻率表法計(jì)算中值和百分位數(shù):適用于有大量樣本病例的數(shù)據(jù)n .累計(jì)頻率:該組的頻率加到以前組的頻率上;累積頻

13、率:每組的累積頻率除以病例總數(shù)。公式為l為百分位組的下限,I為組距離,fx為組頻率,fL為百分位組前一組的累計(jì)頻率,N為病例總數(shù)。鏈球菌性心絞痛50例,潛伏期(h ), 47,2-8。1 1 2 7 8 16 11 19 38 11 30 60 7 37 74 5 42 84 4 46 92 2 48 96 2 50 100,48,P25,P75。49、2。中值和百分比1)中值的應(yīng)用通常用于描述偏斜分布數(shù)據(jù)的集中趨勢(shì),反映中間位置觀察值的平均水平。在對(duì)稱分布的數(shù)據(jù)中,中值和平均值在理論上是相同的。2)百分位可用于確定醫(yī)學(xué)參考值的范圍(詳見下文)。3)分布在中間的百分位數(shù)是相當(dāng)穩(wěn)定和有代表性的,但是只有當(dāng)有足夠的樣本時(shí),靠近兩端的百分位數(shù)才是穩(wěn)定的。應(yīng)用平均值1時(shí)的注意事項(xiàng)。平均值的計(jì)算和應(yīng)用必須有均勻的基礎(chǔ),首先必須合理分組。不同的定性事物應(yīng)該分別平均,以便分析和比較。2.根據(jù)數(shù)據(jù)分布,選擇合適的平均值。對(duì)稱分布數(shù)據(jù),尤其是正態(tài)分布數(shù)據(jù),應(yīng)同時(shí)使用均值和中值,而偏斜分布數(shù)據(jù)應(yīng)更好地表示中值,對(duì)數(shù)正態(tài)分布和等比序列數(shù)據(jù)應(yīng)使用幾何均值。51,4。mode是一組觀測(cè)值中頻率最高的觀測(cè)值;如果是分組數(shù)據(jù),模式是頻率最高的段。16名高血壓患者的發(fā)病年齡分別為42、45、48、51、52、54、55、55、58、58、58、58、61、62、62歲。頻率最高的值

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論