版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
定量資料的統(tǒng)計(jì)描述課程信箱主要內(nèi)容頻數(shù)分布表的編制和用途頻數(shù)分布的特征和類型集中趨勢(shì)指標(biāo)均數(shù)、幾何均數(shù)、中位數(shù)離散趨勢(shì)指標(biāo)極差、四分位數(shù)間距、方差、標(biāo)準(zhǔn)差、變異系數(shù)百分位數(shù)計(jì)算器的應(yīng)用連續(xù)型資料和離散型資料連續(xù)型資料(continuousdata)
理論上在任何兩個(gè)連續(xù)型數(shù)據(jù)之間都還有無(wú)窮多個(gè)數(shù)據(jù);只要測(cè)量?jī)x器足夠精確,連續(xù)型數(shù)據(jù)可以精確到小數(shù)點(diǎn)后第無(wú)限位,比如體重在60.1和60.2kg之間理論上存在著無(wú)限多個(gè)數(shù)據(jù)。離散型資料(discretedata)
往往是一種計(jì)數(shù),這種計(jì)數(shù)只能是0和正整數(shù),不會(huì)是負(fù)數(shù),也沒(méi)有小數(shù)點(diǎn);比如心率、脈搏、兒童齲齒個(gè)數(shù)、血小板數(shù)、某年某地交通事故死亡人數(shù)等。隨機(jī)變量和研究資料的類型頻數(shù)分布表
為了了解資料的分布特征,當(dāng)觀察值很多時(shí),直接從原始數(shù)據(jù)很難得出概括的印象。這時(shí)可以通過(guò)資料的整理,編制頻數(shù)分布表(簡(jiǎn)稱頻數(shù)表),來(lái)顯示數(shù)據(jù)分布的范圍、數(shù)據(jù)最集中的區(qū)間和分布的形態(tài)。找出最大值和最小值,計(jì)算極差。極差(R)也叫全距,它是一組變量值中最大值與最小值之差。最大值為51.2kg,最小值為20.1kg,極差R=51.2-20.1=31.1kg。按極差大小決定組段數(shù)、組段和組距斯梯階公式:經(jīng)驗(yàn)劃分:組段數(shù)的多少一般根據(jù)觀察單位的多少來(lái)確定,過(guò)多或過(guò)少均不能更好地反映資料的分布特征,以能夠反映頻數(shù)分布的特點(diǎn)為宜,一般分為8~15組。本例初步確定為10個(gè)組。按極差大小決定組段數(shù)、組段和組距
相鄰組段下限值之差稱為組距,一般分組時(shí)取組距相等。組距=極差/組數(shù),常取整數(shù)作組距,取整只是為了方便資料的整理匯總。本例組距=31.1/10=3.11≈3。頻數(shù)表的編制本例最小值為20.1,故取20為第一組的下限。第二組下限即20+3=23,余類推。
最后一個(gè)組段為50~53,包括最大值51.2。列表劃記,統(tǒng)計(jì)各組段頻數(shù)。計(jì)算頻率與累計(jì)頻率。150名12歲男童體重(kg)頻數(shù)分布表
組段頻數(shù)f頻率(%)累計(jì)頻數(shù)累計(jì)頻率(%)20~21.321.323~74.796.026~106.71912.729~1510.03422.732~2516.75939.335~3523.39462.738~2315.311778.041~1812.013590.044~85.314395.347~53.314898.750~5321.3150100.0合計(jì)150100.0某地150名12歲男童體重頻數(shù)分布圖
頻數(shù)分布的類型
頻數(shù)分布分為對(duì)稱分布和偏態(tài)分布兩種。對(duì)稱分布是指集中位置在正中,左右兩側(cè)頻數(shù)分布大體對(duì)稱,如上圖。某地150名12歲男童體重頻數(shù)分布圖實(shí)際應(yīng)用中,頻數(shù)分布的形態(tài)很重要,分布不同,計(jì)算的統(tǒng)計(jì)指標(biāo)及方法也不同。偏態(tài)分布集中位置偏向一側(cè),頻數(shù)分布不對(duì)稱。正、右偏態(tài)(峰)分布:集中位置偏于左側(cè),頻數(shù)尾部向右側(cè)延伸,如一些以兒童為主的傳染病的年齡分布。鏈球菌感染咽炎患者潛伏期分布圖(正偏峰分布)負(fù)、左偏態(tài)(峰)分布:集中位置偏向右側(cè),頻數(shù)尾部向左側(cè)延伸,如一些慢性病患者的年齡分布。207例某惡性腫瘤患者年齡分布(負(fù)偏峰分布)鏈球菌感染咽炎患者潛伏期分布圖(正偏峰分布)頻數(shù)表的用途
作為統(tǒng)計(jì)資料描述的一種表達(dá)方式,可以揭示資料分布類型與特征。便于發(fā)現(xiàn)資料中遠(yuǎn)離群體的某些特大或特小的可疑值,必要時(shí)經(jīng)檢驗(yàn)后舍去。作為正態(tài)性判斷的圖示法。便于計(jì)算統(tǒng)計(jì)指標(biāo)和進(jìn)一步分析處理。集中趨勢(shì)指標(biāo)
平均數(shù)(average)用來(lái)描述一組變量的集中趨勢(shì)、中心位置或平均水平,常作為一組資料的代表值,使資料產(chǎn)生簡(jiǎn)明概括的印象,又便于組間的比較。平均數(shù)的計(jì)算和應(yīng)用必須具備同質(zhì)基礎(chǔ)。常用的平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。均數(shù)(mean)均數(shù)是算術(shù)均數(shù)的簡(jiǎn)稱,它反映了一組觀察值在數(shù)量上的平均水平。總體均數(shù)用希臘字母μ表示,樣本均數(shù)用表示。均數(shù)的計(jì)算
均數(shù)的計(jì)算方法有直接法和加權(quán)法,計(jì)算機(jī)運(yùn)算中多采用直接法。均數(shù)的計(jì)算加權(quán)法
當(dāng)資料中相同觀察值較多時(shí),可將相同觀察值的個(gè)數(shù),即頻數(shù)f乘以該觀察值x,以代替相同觀察值逐個(gè)相加。對(duì)于頻數(shù)表資料,可用各組段的頻數(shù)為f,以相應(yīng)的組中值為x,代入公式計(jì)算均數(shù)。組中值:該組段下限和上限的均值,或該組段下限和下一個(gè)組段下限的均值。組中值組段組中值頻數(shù)f頻率(%)20~21.521.323~24.574.726~27.5106.729~30.51510.032~33.52516.735~36.53523.338~39.52315.341~42.51812.044~45.585.347~48.553.350~5351.521.3合計(jì)150100.0均數(shù)的應(yīng)用
描述呈對(duì)稱分布的資料,特別是正態(tài)分布或者近似正態(tài)分布的資料的平均水平,因?yàn)檫@時(shí)均數(shù)位于分布的中心,最能反映分布的集中趨勢(shì)。幾何均數(shù)(geometricmean,G)有些醫(yī)學(xué)資料,如抗體的滴度、細(xì)菌計(jì)數(shù)、傳染病的潛伏期等,其頻數(shù)分布明顯偏態(tài),各觀察值之間呈倍數(shù)變化,這時(shí)應(yīng)該用幾何均數(shù)反映其平均增(減)倍數(shù)。用途:用于描述等比級(jí)數(shù)資料和對(duì)數(shù)正態(tài)分布資料等的平均水平。幾何均數(shù)的計(jì)算直接法:是將n個(gè)觀察值x1,x2,x3…xn的乘積開(kāi)n次方所得的根。加權(quán)法:幾何均數(shù)應(yīng)用的注意事項(xiàng)觀察值不能為0。因?yàn)?不能取對(duì)數(shù),也不能與任何其它數(shù)呈對(duì)數(shù)關(guān)系。可以把所有的變量值均加上一個(gè)較小的常數(shù),如加0.001。觀察值不能同時(shí)有正值和負(fù)值。若全是負(fù)值,計(jì)算時(shí)可把負(fù)號(hào)去掉,得出結(jié)果后再加上負(fù)號(hào)。中位數(shù)(median,M)中位數(shù)是將一組觀察值從小到大按順序排列,位次居中的數(shù)值對(duì)應(yīng)的觀察值就是中位數(shù)。因而全部觀察值中,大于和小于中位數(shù)的觀察值的個(gè)數(shù)相等。用途:中位數(shù)常用于描述偏態(tài)分布或末端無(wú)確定數(shù)據(jù)時(shí)資料的平均水平或集中位置。因?yàn)橹形粩?shù)不是由全部觀察值的數(shù)量值綜合計(jì)算出來(lái)的,只受居中變量值波動(dòng)的影響,不受兩端特小值和特大值的影響。直接法計(jì)算中位數(shù)
將原始觀察值按大小順序排列:n為奇數(shù)時(shí),
n為偶數(shù)時(shí),
例:臨床觀察7名某病患者,其潛伏期(天)分別為:2,3,3,5,6,9,16,求其平均潛伏天數(shù)。M=5臨床觀察8名某病患者,其潛伏期(天)分別為:2,3,3,5,6,9,16,20求其平均潛伏天數(shù)。M=(5+6)/2=5.5頻數(shù)表法計(jì)算中位數(shù)
頻數(shù)表法是以第50位百分位數(shù)(P50)作為中位數(shù)。百分位數(shù)(percentile,P)是指把一組資料的全部觀測(cè)值分為兩部分,理論上講,有x%的觀測(cè)值比Px小,有(100-x)%的觀測(cè)值比Px大。頻數(shù)表法
M=P50Lx:第x百分位數(shù)所在組段的下限;fx:第x百分位數(shù)所在組段的頻數(shù);ix:第x百分位數(shù)所在組段的組距;ΣfL:小于L各組段的累計(jì)頻數(shù)。某醫(yī)師檢測(cè)120例鏈球菌感染咽炎患者咽痛至發(fā)熱出現(xiàn)的時(shí)間(小時(shí)),試計(jì)算中位數(shù)、第25、75百分位數(shù)。潛伏期病例數(shù)累計(jì)頻數(shù)累計(jì)頻率(%)12-221.724-202218.336-365848.348-288671.760-109680.072-810486.784-811293.396-411696.7108-4120100.0合計(jì)120中位數(shù)所在組段P25所在組段P75所在組段某醫(yī)師檢測(cè)120例鏈球菌感染咽炎患者咽痛至發(fā)熱出現(xiàn)的時(shí)間(小時(shí)),試計(jì)算中位數(shù)、第25、75百分位數(shù)。百分位數(shù)的應(yīng)用
百分位數(shù)用于描述樣本或總體觀察值序列在某百分位置水平,多個(gè)百分位數(shù)結(jié)合應(yīng)用時(shí),可更全面地描述總體或樣本的分布特征,可用來(lái)確定醫(yī)學(xué)參考值范圍。由于位于中部的百分位數(shù)比較穩(wěn)定,所以最常用的百分位數(shù)是中位數(shù),它有較好的代表性。離散程度指標(biāo)三組同性別、同年齡兒童的體重(kg)如下,分析其集中趨勢(shì)與離散趨勢(shì)。甲組2628303234Mean=30kgR=8S=3.16乙組2427303336Mean
=30kgR=12S=4.74丙組2629303134Mean
=30kgR=8S=2.91哪一組數(shù)值的代表性好?離散程度指標(biāo)離散趨勢(shì)即個(gè)體值之間的變異程度,數(shù)據(jù)越分散,變異程度越高。極差四分位數(shù)間距方差標(biāo)準(zhǔn)差變異系數(shù)極差(range,R)極差也叫全距,表示一組觀察值中最大值與最小值之差,反映個(gè)體差異的范圍。極差大,說(shuō)明變異度大,各變量值離均數(shù)越遠(yuǎn),數(shù)據(jù)越分散;反之亦然。缺點(diǎn):由于計(jì)算極差時(shí)只采用了最大值和最小值,未考慮組內(nèi)其它數(shù)據(jù)的變異程度,因此用極差反映變異度不夠全面,穩(wěn)定性也差;當(dāng)樣本例數(shù)增大時(shí),得到較大或較小觀察值的機(jī)會(huì)可能會(huì)變大,所以極差也可能更大。四分位數(shù)間距(quartilerange,QR)QR=QU-QL=P75–P25四分位數(shù)間距包含一半的觀測(cè)值,其值越大,變異程度越大;其值越小,變異程度越小。優(yōu)點(diǎn):采用四分位數(shù)間距來(lái)反映一組資料的變異程度,比極差穩(wěn)定。實(shí)際工作中,常與中位數(shù)結(jié)合使用,描述偏態(tài)分布資料的分布特征。
缺點(diǎn):不能全面地反映所有觀察值的變異程度。離散趨勢(shì)指標(biāo)極差R離均差(x-μ)離均差總和(x)=0離均差平方和(x)2
均方(方差)σ2=(x)2/N
標(biāo)準(zhǔn)差四分位數(shù)間距QR方差與標(biāo)準(zhǔn)差但是在實(shí)際工作中,總體方差往往是未知的,常用樣本方差s2來(lái)估計(jì)。在公式中,用代替,用n代替N,這時(shí)計(jì)算的結(jié)果往往比總體方差σ2要小,所以分母用n-1來(lái)代替N,即公式變?yōu)椋簶颖痉讲顂2是總體方差σ2的無(wú)偏估計(jì)。N-1:自由度,常用ν或df表示,是指隨機(jī)樣本研究中,可獨(dú)立地隨機(jī)選擇變動(dòng)的觀測(cè)值的個(gè)數(shù)。標(biāo)準(zhǔn)差(s,SD)的計(jì)算通常所說(shuō)的標(biāo)準(zhǔn)差為樣本標(biāo)準(zhǔn)差。標(biāo)準(zhǔn)差的計(jì)算包括直接法和加權(quán)法兩種。標(biāo)準(zhǔn)差的應(yīng)用標(biāo)準(zhǔn)差是反映數(shù)據(jù)變異程度的指標(biāo),其大小受每一個(gè)觀察值的影響,變異程度大,標(biāo)準(zhǔn)差也大。常用于描述對(duì)稱分布,尤其是正態(tài)分布或近似正態(tài)分布資料的離散程度。各觀察值同加(或減)一個(gè)不為零的常數(shù),標(biāo)準(zhǔn)差仍保持不變;但每一個(gè)觀察值同乘(或除)一個(gè)不為零的常數(shù),其標(biāo)準(zhǔn)差等于原標(biāo)準(zhǔn)差乘(或除)以該常數(shù)的絕對(duì)值。誰(shuí)的離散程度大?身高:Mean=172cm,SD=8cm體重:Mean=63kg,SD=6kg身高(30歲):Mean=172cm,SD=8cm身高(3歲):Mean=98cm,SD=5cm變異系數(shù)(CV)
CV=s/×100%它是反映相對(duì)變異度的指標(biāo)。變異系數(shù)常用于:測(cè)量單位不同的幾組資料變異度的比較;均數(shù)相差懸殊的幾組資料變異度的比較。誰(shuí)的離散程度大?身高:Mean=172cm,SD=8cm,CV=0.047體重:Mean=63kg,SD=6kg,CV=0.095身高(30歲):Mean=172cm,SD=8cm,CV=0.047身高(3歲):Mean=98cm,SD=5cm,CV=0.051計(jì)算器功能簡(jiǎn)介MODE或D·R·G:模式轉(zhuǎn)換DEG:degree角度RAD:radian弧度GRA:gradient梯度INV、SHIFT或2ndF:第二功能SD或
STAT:統(tǒng)計(jì)功能
,Σx,Σx2,σn(σXσ),σn-1(sX,s),n。X、data或DT:數(shù)據(jù)儲(chǔ)存
Xi
×fdata小結(jié)
頻數(shù)的分布特征:集中趨勢(shì)和離散趨勢(shì)。頻數(shù)的分布類型:對(duì)稱分布和偏態(tài)分布。平均數(shù)是描述頻數(shù)分布集中位置的指標(biāo),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 3D打印心臟補(bǔ)片的組織相容性評(píng)價(jià)
- 3D打印導(dǎo)板在神經(jīng)外科手術(shù)中的精準(zhǔn)固定技術(shù)
- 2025年寧波市鎮(zhèn)海區(qū)龍賽醫(yī)療集團(tuán)公開(kāi)招聘編外工作人員備考題庫(kù)含答案詳解
- 3D可視化技術(shù)在神經(jīng)介入手術(shù)中的輔助價(jià)值
- 小清新總結(jié)匯報(bào)模板
- 2025年常熟市交通產(chǎn)業(yè)投資集團(tuán)有限公司(系統(tǒng))招聘14人備考題庫(kù)及參考答案詳解1套
- 2025年鄭州大學(xué)第二附屬醫(yī)院公開(kāi)招聘員額制工作人員(碩士)23人備考題庫(kù)附答案詳解
- 2025年中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)實(shí)驗(yàn)動(dòng)物研究所第三批公開(kāi)招聘工作人員備考題庫(kù)及參考答案詳解
- 2025年吉林省路橋工程(集團(tuán))有限公司西南地區(qū)項(xiàng)目部勞務(wù)派遣人員招聘13人備考題庫(kù)及完整答案詳解1套
- 2025年中路財(cái)產(chǎn)保險(xiǎn)股份有限公司校園招聘6人備考題庫(kù)及參考答案詳解1套
- 2025大理州強(qiáng)制隔離戒毒所招聘輔警(5人)筆試考試備考題庫(kù)及答案解析
- 2025年安全培訓(xùn)計(jì)劃表
- 2026年榆林職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)技能測(cè)試題庫(kù)參考答案詳解
- 2025年沈陽(yáng)華晨專用車有限公司公開(kāi)招聘筆試歷年參考題庫(kù)附帶答案詳解
- 2026(蘇教版)數(shù)學(xué)五上期末復(fù)習(xí)大全(知識(shí)梳理+易錯(cuò)題+壓軸題+模擬卷)
- 垃圾中轉(zhuǎn)站機(jī)械設(shè)備日常維護(hù)操作指南
- 單證主管助理客戶服務(wù)能力提升方案
- 汽車行業(yè)可信數(shù)據(jù)空間方案
- 畜牧業(yè)機(jī)械化培訓(xùn)課件
- 工程質(zhì)量管理工作制度
- 云南交投集團(tuán)筆試試題及答案
評(píng)論
0/150
提交評(píng)論