版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、計量資料的統(tǒng)計描述,隨機變量和研究資料的類型,計量資料 等級資料 計數(shù)資料,計量資料,計量資料(measurement data,quantitative data)是指每個觀察單位某個變量用測量或其他定量方法觀察結(jié)果,一般有計量單位。 計量資料的各個觀察值之間有量的區(qū)別,沒有性質(zhì)的不同。,計數(shù)資料,計數(shù)資料(count data,qualitative data,nominal data),計數(shù)資料是按照事物的屬性分組,然后清點各組的觀察單位個數(shù)得到的資料。 其變量值是定性的,表現(xiàn)為無不相容的類別或?qū)傩?,定性變量的屬性指?biāo)的分類是無序的。 各觀察單位之間一般沒有量的區(qū)別,但有質(zhì)的不同。,等級
2、資料,等級資料(ordinal data)是介于計量資料和計數(shù)資料之間的半定量觀察結(jié)果,通常有兩個以上的等級。 等級資料也是先將觀察單位按照某種屬性或某個標(biāo)志分組,然后清點各組觀察單位的數(shù)目得來的,但是所分的各組之間有等級的順序,各個類別之間存在著大小和程度上的差別,這一點不同于計數(shù)資料。,連續(xù)型資料和離散型資料,連續(xù)型資料(continuous data) 理論上在任何兩個連續(xù)型數(shù)據(jù)之間都還有無窮多個數(shù)據(jù); 只要測量儀器足夠精確,連續(xù)型數(shù)據(jù)可以精確到小數(shù)點后第無限位,比如體重,在60.1和60.2kg之間理論上存在著無限多個數(shù)據(jù)。 離散型資料(discrete data) 往往是一種計數(shù),這
3、種計數(shù)只能是0和正整數(shù),不會是負數(shù),也沒有小數(shù)點; 比如心率、脈搏、兒童齲齒個數(shù)、血小板數(shù)、某年某地交通事故死亡人數(shù)等,,例2-1 某地兒研所測得該地150名12歲健康男童 體重(kg)原始數(shù)據(jù)如下,試編制頻數(shù)表。,25.2 34.9 34.3 38.1 41.3 27.8 33.8 37.7 28.4 33.5 47.3 34.8 30.5 36.2 51.0 38.0 43.8 40.9 37.5 36.6 33.4 47.4 36.4 41.4 36.5 42.5 33.7 29.3 39.6 37.5 39.6 33.2 32.1 29.9 43.7 33.8 35.1 37.8 32
4、.4 38.5 28.2 36.5 23.4 35.8 34.1 27.6 42.6 23.1 37.1 44.0 35.6 44.5 46.5 35.0 31.8 36.4 36.2 47.9 38.7 20.5 37.1 29.2 38.2 41.1 36.2 43.5 32.8 36.3 31.8 30.6 38.5 39.6 28.7 33.7 35.1 42.9 20.1 35.4 26.5 42.0 39.6 38.7 35.4 51.2 31.4 34.1 25.3 29.6 38.2 43.7 33.8 24.5 29.2 45.9 32.5 23.5 36.8 27.2 34
5、.0 34.7 44.4 41.2 35.3 42.6 34.1 30.0 31.4 40.8 27.3 48.6 35.8 29.7 45.6 41.8 33.0 28.3 33.3 35.1 40.6 38.2 37.6 25.5 37.3 37.5 41.5 38.4 44.2 43.2 31.5 40.2 34.5 37.4 37.8 33.4 32.2 33.4 32.4 32.8 36.8 45.7 41.2 40.9 36.5 47.9 35.7 39.3 42.2 35.3 30.1 27.2,1.找出最大值和最小值,計算極差。,最大值為51.2kg, 最小值為20.1kg,
6、極差R=51.2-20.1=31.1kg。 極差(R)也叫全距,它是一組變量值中最大值與最小值之差。,2.按極差大小決定組段數(shù)、組段和組距。,組距=極差/組數(shù),常取整數(shù)作組距,取整只是為了方便資料的整理匯總。 斯梯階公式 第一組段必須包括最小值,一般取略小于最小值的整數(shù)作為第一組的下限;最后一個組段應(yīng)該包括最大值,并且封口,但最后一個組段的上限不能等于最大值。,頻數(shù)表的編制,3.列表劃記,統(tǒng)計各組段頻數(shù)。 4.計算頻率與累計頻率,頻數(shù)分布的兩個特征,體重雖有輕有重,但都向35組段集中,數(shù)據(jù)大多數(shù)集中在3238組段,共83人,占總?cè)藬?shù)的55%,這種趨勢稱為集中趨勢。 另一方面,隨體重逐漸變大或變
7、小,仍有小部分變量值存在,稱這種特征為離散趨勢。 集中趨勢和離散趨勢是頻數(shù)分布的兩個重要特征。,頻數(shù)分布的類型,頻數(shù)分布分為對稱分布和偏態(tài)分布兩種類型。 對稱分布是指集中位置在正中,左右兩側(cè)頻數(shù)分布大體對稱,如表2-1所示。若將其繪制成頻數(shù)分布直方圖2.1,則更清楚。,頻數(shù)分布的類型,偏態(tài)分布指集中位置偏向一側(cè),頻數(shù)分布不對稱。 一些以兒童為主的傳染病,患者的年齡分布,集中位置偏于年齡小的一側(cè),頻數(shù)尾部向右側(cè)延伸,稱為右偏態(tài)、正偏態(tài)(峰)分布,如圖2-2; 一些慢性病患者的年齡分布,其集中位置偏向年齡大的一側(cè),頻數(shù)尾部向左側(cè)延伸,稱為左偏態(tài)、負偏態(tài)(峰)分布,如圖2-3。,集中趨勢指標(biāo),平均數(shù)
8、(average)用來描述一組變量的集中趨勢、中心位置或平均水平,常作為一組資料的代表值,使資料產(chǎn)生簡明概括的印象,又便于組間的比較。 平均數(shù)的計算和應(yīng)用必須具備同質(zhì)基礎(chǔ)。 常用的平均數(shù)有均數(shù)、幾何均數(shù)和中位數(shù)。,均數(shù)(mean),均數(shù)是算術(shù)均數(shù)(arithmetic mean)的簡稱,它反映了一組觀察值在數(shù)量上的平均水平??傮w均數(shù)用希臘字母表示,樣本均數(shù)用 表示。 均數(shù)的計算 均數(shù)的計算方法有直接法和加權(quán)法,計算機運算中多采用直接法。,均數(shù)的應(yīng)用,用途:用來描述一組變量值的平均水平,具有代表性,因此變量值必須是同質(zhì)的。 應(yīng)用條件:適用于呈對稱分布的資料,特別是正態(tài)分布或者近似正態(tài)分布的資料,
9、因為這時均數(shù)位于分布的中心,最能反映分布的集中趨勢。,幾何均數(shù)(geometric mean,G),幾何均數(shù)的計算 直接法:是將n個觀察值x1,x2,x3xn的乘積開n次方所得的根。 加權(quán)法:,幾何均數(shù)的應(yīng)用,用于對數(shù)正態(tài)分布資料, 如:某些傳染病的潛伏期、抗體滴度、細菌計數(shù)等。 觀察值不能為0。因為0不能取對數(shù),也不能與任何其它數(shù)呈對數(shù)關(guān)系??梢园阉械淖兞恐稻由弦粋€較小的常數(shù),如加1。 觀察值不能同時有正值和負值。若全是負值,計算是可把負號去掉,得出結(jié)果后再加上負號。,中位數(shù)(M)和百分位數(shù)(P),中位數(shù)(median, M)是將一組觀察值從小到大按順序排列,位次居中的數(shù)值對應(yīng)的觀察值就
10、是中位數(shù)。因而全部觀察值中,大于和小于中位數(shù)的觀察值的個數(shù)相等。 百分位數(shù)(percentile,P)是指把一組資料的全部觀測值分為兩部分,理論上講,有x%的觀測值比Px小,有(100-x)%的觀測值比Px大。中位數(shù)是特定的百分位數(shù),即P50,它是表示一組資料集中位置的指標(biāo)。,直接法計算中位數(shù),將原始觀察值按大小順序排列: n為奇數(shù)時, n為偶數(shù)時,,頻數(shù)表法,M=P50 Lx: 第x百分位數(shù)所在組段的下限; fx:第x百分位數(shù)所在組段的頻數(shù); ix:第x百分位數(shù)所在組段的組距; fL:小于L各組段的累計頻數(shù)。,中位數(shù)和百分位數(shù)的應(yīng)用,中位數(shù)不是由全部觀察值的數(shù)量值綜合計算出來的,只受居中變量
11、值波動的影響,不受兩端特小值和特大值的影響,僅僅反映了位次居中的觀察值的水平,因此中位數(shù)常用于描述偏態(tài)分布或末端無確定數(shù)據(jù)時資料的集中位置。 百分位數(shù)用于描述樣本或總體觀察值序列在某百分位置水平,多個百分位數(shù)結(jié)合應(yīng)用時,可更全面地描述總體或樣本的分布特征,可用來確定醫(yī)學(xué)參考值范圍。,離散趨勢指標(biāo),極差R 四分位數(shù)間距QR 離均差(x-) 離均差總和(x)=0 離均差絕對值和|x| 離均差平方和(x)2 均方(方差)2=(x)2/N 標(biāo)準(zhǔn)差,方差與標(biāo)準(zhǔn)差,但是在實際工作中,總體方差往往是未知的,常用樣本方差s2來估計。在公式中,用 代替,用n代替N,這時計算的結(jié)果往往比總體方差2要小,所以分母用n-1來代替N,即公式變?yōu)椋?這時樣本方差s2是總體方差2的無偏估計。 N-1:自由度,常用或df表示,是指隨機樣本研究中,可獨立地隨機選擇變動的觀測值的個數(shù)。,標(biāo)準(zhǔn)差的應(yīng)用,標(biāo)準(zhǔn)差是反映數(shù)據(jù)變異程度的指標(biāo),其大小受每一個觀察值的影響。 常用于描述對稱分布,尤其是正態(tài)分布或近似正態(tài)分布資料的離散程度。 隨著樣本量增大,標(biāo)準(zhǔn)差逐漸趨于穩(wěn)定。,變異系數(shù)(CV),CV =s/ 100% 它是反映相對變異度的指標(biāo)。 變異系數(shù)常用于: 測量單位不同的幾組資料變異度的比較; 均數(shù)相差懸殊的幾組資料變異度的比較。,計算器功能簡介,MODE或DRG
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 廈門外代倉儲有限公司2025年倉儲事業(yè)部客服崗社會招聘備考題庫及1套完整答案詳解
- 2026年湖南長城銀河科技有限公司招聘備考題庫及完整答案詳解一套
- 2026年祖廟街道公有企業(yè)招聘工作人員備考題庫及參考答案詳解1套
- 2026年襄陽有崗湖北省大學(xué)生鄉(xiāng)村醫(yī)生專項計劃招錄386人備考題庫及參考答案詳解1套
- 2026年深圳市建筑科學(xué)研究院股份有限公司北京分公司招聘備考題庫及一套參考答案詳解
- 2026年潤曜(北京)國際醫(yī)藥科技有限公司招聘備考題庫及1套參考答案詳解
- 中學(xué)圖書館借閱制度
- 養(yǎng)老院老人心理咨詢師行為規(guī)范制度
- 企業(yè)內(nèi)部培訓(xùn)與外部合作制度
- 企業(yè)職業(yè)健康安全事故調(diào)查處理指南(標(biāo)準(zhǔn)版)
- 上海市嘉定區(qū)2026屆初三一模英語試題(含答案)
- DB34T 5346-2025水利工程建設(shè)安全生產(chǎn)風(fēng)險管控六項機制規(guī)范
- 2026年新媒體運營推廣合同協(xié)議
- 2025-2026學(xué)年人教版九年級上冊歷史期末試卷(含答案和解析)
- 重癥醫(yī)學(xué)科ICU知情同意書電子病歷
- 小區(qū)配電室用電安全培訓(xùn)課件
- 醫(yī)院科室文化建設(shè)與禮儀
- 2025貴州磷化(集團)有限責(zé)任公司12月招聘筆試參考題庫及答案解析
- 征信修復(fù)合同范本
- 2025年公安部遴選面試題及答案
- 中煤集團機電裝備部副部長管理能力考試題集含答案
評論
0/150
提交評論