版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第二章計(jì)量資料的統(tǒng)計(jì)描述醫(yī)學(xué)統(tǒng)計(jì)學(xué)---供研究生用數(shù)值變量資料的統(tǒng)計(jì)描述數(shù)值變量資料的頻數(shù)分布集中趨勢的描述離散趨勢的描述正態(tài)分布醫(yī)學(xué)參考值范圍的制定第一節(jié)頻數(shù)分布
一、頻數(shù)分布表簡稱頻數(shù)表(frequencytable)例2-1從某單位1999年的職工體檢資料中獲得101名正常成年女子的血清總膽固醇(mmol/L)的測量結(jié)果如下,試編制頻數(shù)分布表。2.354.213.325.354.174.132.784.263.584.344.844.414.783.953.92 3.583.664.283.263.502.704.614.752.913.914.594.19 2.684.524.913.183.684.833.873.953.914.154.554.80 3.414.123.955.084.533.923.585.353.843.603.514.06 3.073.554.233.574.833.523.844.503.964.503.274.52 3.194.593.753.984.134.263.633.875.713.304.734.17 5.133.784.573.803.933.783.994.484.284.065.265.25 3.985.033.513.863.023.704.333.293.254.154.364.95 3.003.26試編制頻數(shù)分布表。1、頻數(shù)表的編制找全距(range)定組距(classinterval):
一般分為10~15組,如組距約為全距/10寫組段:每個組段的起點(diǎn)稱為下限,lowerlimit;每個組段的終點(diǎn)稱為上限,upperlimit;下限≤X<上限頻數(shù)表的編制--續(xù)1.計(jì)算極差:極大值-極小值5.71-2.35=3.362.組數(shù):10
組距3.36/10=0.336取0.33.分組段:最小組段2.3~最大組段5.6~5.94.列表劃記:
101名正常成年女子的血清總膽固醇頻數(shù)分布總膽固醇組段頻數(shù)2.30~12.60~32.90~63.20~83.50~173.80~204.10~174.40~124.70~95.00~55.30~5.60~5.9021二、頻數(shù)分布圖(graphoffrequencydistribution)以各組段總膽固醇含量為橫軸,頻數(shù)為縱軸。SPSS中的操作:1.建立數(shù)據(jù)庫2.先使用Recode命令,對變量進(jìn)行重新劃計(jì)分組,注意新變量取組中值。3.再用Frequencies命令1、Recode—>IntoDifferentVariables
2、將“膽固醇”選入NumericVariable欄,在OutputVariable欄輸入新變量“Y”,單擊Change按鈕,
單擊OldandNewValues按鈕。3、在OldandNewvalues對話框,按對變量值重新劃分要求輸入相應(yīng)數(shù)據(jù)后,單擊Add按鈕。重復(fù)進(jìn)行該操作。新變量可直接取組中值。語法命令:RECODE
膽固醇(2.3thru2.599=2.45)(2.6thru2.899=2.75)(2.9thru3.199=3.05)(3.2thru3.499=3.35)(3.5thru3.799=3.65)(3.8thru4.099=3.95)(4.1thru4.399=4.25)(4.4thru4.699=4.55)(4.7thru4.999=4.85)(5.0thru5.299=5.15)(5.3thru5.599=5.45)(5.6thru5.89=5.75)INTOY.EXECUTE.頻數(shù)分布的類型對稱分布:集中位置居中,左右兩邊對稱偏態(tài)分布:正偏態(tài)分布(右偏態(tài))峰左尾右
負(fù)偏態(tài)分布(左偏態(tài))正偏態(tài)分布對稱分布負(fù)偏態(tài)分布三、頻數(shù)表和頻數(shù)分布圖的用途揭示變量的分布特征和分布類型;便于進(jìn)一步計(jì)算指標(biāo)和統(tǒng)計(jì)分析處理;便于發(fā)現(xiàn)某些特大或特小的可疑值。頻數(shù)分布的兩個特征集中趨勢,centraltendency指變量值的中心數(shù)值或中心位置所在。離散趨勢,tendencyofdispersion指變量值圍繞中心數(shù)值或中心位置的分布情況。第二節(jié)集中趨勢的描述平均數(shù)(average):用于觀察一組同質(zhì)變量值的平均水平/集中位置。亦稱中心位置指標(biāo)。它不但給人一個簡明概括的印象,而且便于事物間的分析比較。常用的平均數(shù)算術(shù)均數(shù)(arithmeticmean/mean)幾何均數(shù)(geometricmean)中位數(shù)(median)一、算術(shù)均數(shù),簡稱均數(shù)
(arithmeticmean/mean)均數(shù)是算術(shù)均數(shù)的簡稱??傮w均數(shù)用希臘字母μ(繆,mu)表示樣本均數(shù)(Xbar)表示。均數(shù)反映一組觀察值在數(shù)量上的平均水平。均數(shù)的應(yīng)用主要用于對稱性或近似對稱性分布的資料;尤其是在正態(tài)分布或近似正態(tài)分布上的應(yīng)用。計(jì)算方法1.直接法Σ:希臘字母(西格馬,sigma),求和符號例9.2有8名正常人的空腹血糖值(mmol/L):6.2,5.4,5.7,5.3,6.1,6.0,5.8,5.9
2.頻數(shù)表法(加權(quán)法)組段頻數(shù)f組中值XfXfX22.30~12.452.456.002.60~32.758.2522.692.90~63.0518.3055.823.20~83.3526.8089.783.50~173.6562.05226.483.80~203.9579.00312.054.10~174.2572.25307.064.40~124.5554.60248.434.70~94.8543.65211.705.00~55.1525.75132.615.30~25.4510.9059.415.60~5.9015.755.7533.06合計(jì)101——409.751705.09頻數(shù)表計(jì)算均數(shù):Xj為各組的組中值。組中值等于該組的上限加下限之和除以2。fj為各組的頻數(shù)。101名正常成年女子的血清總膽固醇均值為:
=409.75/101=4.06(mmol/L)補(bǔ)充:均數(shù)的兩個重要特征(1)離均差之和為零均數(shù)的兩個重要特征(2)離均差平方和為最?。ǘ缀尉鶖?shù)Geometricmean,G反映一組呈倍數(shù)關(guān)系的觀察值的平均水平適用:數(shù)據(jù)呈正偏態(tài)分布,經(jīng)對數(shù)轉(zhuǎn)換后呈正態(tài)分布。多用于觀察值之間呈倍數(shù)關(guān)系,如抗體滴度計(jì)算方法直接法加權(quán)法1.直接法例:有8份血清的抗體效價為為1:5,1:10,1:20,1:40,1:80,1:160,1:320,1:640。求平均效價。用直接法計(jì)算G將各效價的倒數(shù)代入公式,得該8份血清的平均抗體效價為1:56.57,近似為1:57注意:變量值不能有02.頻數(shù)表法式中f為頻數(shù)。用頻數(shù)表法計(jì)算G例30名麻疹易感兒童接種麻疹疫苗一個月后,血凝抑制抗體滴度如下表所示,試求其平均抗體滴度。30名麻疹易感兒童血凝抑制抗體滴度抗體滴度人數(shù)f滴度倒數(shù)XlgXflgX1:8280.90311.80621:166161.20417.22461:325321.50517.52551:6410641.806118.06201:12841282.10728.42881:25622562.40824.81641:51215122.70932.7093合計(jì)30∑flgX=50.5830名麻疹易感兒童接種麻疹疫苗一個月后血凝抑制抗體滴度為1:48.5同一組資料求得的幾何均數(shù)小于均數(shù)。SPSS求幾何均數(shù)時有三種方法1.是先計(jì)算對數(shù)的均數(shù),然后求其反對數(shù),得出幾何均數(shù);2.直接用ReportCaseSummaries命令;3.用CompareMeans命令,但要個增加分組變量。使用頻數(shù)表資料時SPSS操作中應(yīng)注意的事項(xiàng)頻數(shù)表資料要用weight命令;進(jìn)行數(shù)據(jù)輸入時要使用組中值;并且在Frequencies命令中要選擇
Valuesaregroupmidpoints:根據(jù)分組資料計(jì)算百分位數(shù)。
(三)中位數(shù)Median,M將一組觀察值從小到大按順序排列,位次居中的觀察值,即為中位數(shù)。一半的值比M小,一半的值比M大。例:1,3,5,7,18(奇數(shù))1,3,5,7,18,20(偶數(shù))計(jì)算n為奇數(shù)時n為偶數(shù)時M計(jì)算方法例:9人某病潛伏期(天)分別為3,4,4,5,6,7,7,19,19,求中位數(shù)。例:6名新生兒身長(cm)分別為50.1,52.0,53.0,55.0,55.0,56.0,求中位數(shù)。中位數(shù)的應(yīng)用中位數(shù)可用于任何分布的定量資料;資料的分布呈明顯偏態(tài),特別是負(fù)偏態(tài);分布的一端或兩端無確定的數(shù)值;
(如:>50,或<10)資料的分布不清。注意:在完全對稱的單峰曲線分布中,同一組資料的均數(shù)與中位數(shù)相同,Mean=Median中位數(shù)的優(yōu)缺點(diǎn)優(yōu)點(diǎn):不受個別特大或特小的觀察值影響;其它平均數(shù)不宜使用時,中位數(shù)就顯示出它的優(yōu)越性。缺點(diǎn):掉失了大量信息,其敏感性不夠。百分位數(shù)(Percentile,Px)百分位數(shù)位置指標(biāo);界值;分布數(shù)列的百等份分割值。有x%的比Px小,有(100-x)%的比Px大。中位數(shù)是一個特定的百分位數(shù)P50。百分位數(shù)的計(jì)算fX
為PX所在組段的頻數(shù),
i為該組段的組距,
L為該組段的下限,
fL
為小于L各組段的累計(jì)頻數(shù)。某傳染性疾病的潛伏期(天)如下表,求其
中位數(shù)和百分位數(shù)P95潛伏期(小時)人數(shù)f累計(jì)頻數(shù)∑f累計(jì)頻率%4~262624.048~487468.5212~259991.6716~610597.2220~3108100.00百分位數(shù)的應(yīng)用描述一組觀察值在某百分位置上的水平。用于確定醫(yī)學(xué)正常值范圍。用一組百分位數(shù)描述一組觀察值的變異度,如四分位數(shù)。應(yīng)用平均數(shù)時的注意事項(xiàng)同質(zhì)的變量值才能求平均數(shù);根據(jù)資料的分布特點(diǎn),選用適應(yīng)的平均數(shù)指標(biāo)。第三節(jié)離散趨勢指標(biāo)例有3組同齡男孩體重(kg)如下,其體重均數(shù)都是30(kg),試分析離散程度。甲組2628303234乙組2427303336丙組2629303134離散程度(或變異程度)指數(shù)據(jù)參差不齊的程度,反映資料的離散趨勢。將反映平均水平與離散程度的指標(biāo)結(jié)合起來使用,可全面地描述數(shù)據(jù)的分布規(guī)律。(一)全距(或極差,Range)全距=最大值–最小值優(yōu)點(diǎn):簡單明了缺點(diǎn):不能反映組內(nèi)其他數(shù)據(jù)的變異,樣本含量相差較大時,不宜用極差比較分布的離散程度。(二)四分位數(shù)間距
inter-quartilerange百分位數(shù):指把數(shù)據(jù)從小到大排列后處于第X百分位置的數(shù)值。它將全部數(shù)據(jù)分為兩部分,在不包括PX的全部數(shù)據(jù)中有X%數(shù)據(jù)小于PX,有1-X%的數(shù)據(jù)大于PX%。中位數(shù)是一個特定的百分位數(shù)P50。四分位數(shù):下四分位數(shù)P25;上四分位數(shù)P75P0——P25——P50
——P75——P100
四分位數(shù)間距:P75-P25或QU-QL
比極差穩(wěn)定,但仍未考慮每個數(shù)據(jù)的大小。常和中位數(shù)結(jié)合使用描述數(shù)據(jù)的分布規(guī)律。(三)方差(variance)和
標(biāo)準(zhǔn)差(standarddeviation)離均差平方和:考慮每個觀察值,但受N的影響。對離均差平方和求均數(shù),得總體方差
2,開根號得標(biāo)準(zhǔn)差
。一般未知,常常用來估計(jì)之,數(shù)理統(tǒng)計(jì)證明,如用樣本的變量個數(shù)n來代替N,計(jì)算出的樣本方差比實(shí)際
2低,需要用n-1校正,得樣本方差S2。開根號得樣本標(biāo)準(zhǔn)差s。
自由度,degreeoffreedom方差計(jì)算公式中的n-1被稱為自由度,它描述了當(dāng)選定時,n個X中能自由變動的X(變量值)的個數(shù)。例:某樣本含有5個數(shù)據(jù),要求∑X=15。則在自由確定了四個數(shù)據(jù)后,第5個數(shù)據(jù)只能是15-(x1+x2+x3+x4)。即有4個數(shù)據(jù)可以自由變動,其自由度=4。推而廣之,任何統(tǒng)計(jì)量的自由度
=n-k,k為限制條件的個數(shù)。自由度:是隨機(jī)變量可以“自由”取值的個數(shù)??傮w標(biāo)準(zhǔn)差樣本標(biāo)準(zhǔn)差標(biāo)準(zhǔn)差standarddeviation標(biāo)準(zhǔn)差的計(jì)算甲組2628303234標(biāo)準(zhǔn)差3.16乙組24273033364.74丙組26293031342.92甲組:∑X=26+28+30+32+34=150∑X2=262+282+302+322+342=4540用頻數(shù)表法計(jì)算標(biāo)準(zhǔn)差組段頻數(shù)f組中值XfXfX22.30~12.452.456.002.60~32.758.2522.692.90~63.0518.3055.823.20~83.3526.8089.783.50~173.6562.05226.483.80~203.9579.00312.054.10~174.2572.25307.064.40~124.5554.60248.434.70~94.8543.65211.705.00~55.1525.75132.615.30~25.4510.9059.415.60~5.9015.755.7533.06合計(jì)101——409.751705.09標(biāo)準(zhǔn)差的用途:反映一組觀察值的離散程度;計(jì)算變異系數(shù);計(jì)算標(biāo)準(zhǔn)誤;估計(jì)參考值范圍。標(biāo)準(zhǔn)差與算術(shù)均數(shù)之比,
反映了相對離散程度常用于比較度量衡單位不同的多組資料的變異度均數(shù)相差懸殊的多組資料的變異度(四)變異系數(shù)
CV
coefficientofvariation例:度量衡單位不同的變異度某地20歲男子110名身高=172.73cm,
s=4.09cm;體重=55.04kg,s=4.10kg,試比較兩組資料的變異程度,即身高、體重的變異程度哪個大?例:均數(shù)相差懸殊的變異度某地成年人舒張壓和收縮壓的變異程度均數(shù)標(biāo)準(zhǔn)差變異系數(shù)(%)舒張壓77.510.713.8收縮壓122.917.113.9SPSS命令及操作AnalyzeDescriptiveStatistics
FrequenciesDescriptivesFrequencies、Descriptives、
Means和CaseSummaries命令這四個命令都可以計(jì)算均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤等主要指標(biāo)。如果只計(jì)算上述3個主要指標(biāo),選用Descriptives命令較為方便;如果需計(jì)算中位數(shù)、百分位數(shù)和繪制頻數(shù)分布圖,應(yīng)選用Frequencies命令;如果需分組計(jì)算均數(shù)、中位數(shù)、幾何均數(shù)、標(biāo)準(zhǔn)差、標(biāo)準(zhǔn)誤等指標(biāo),應(yīng)選用Means命令(必須有分組變量)。如果計(jì)算幾何均數(shù),選用CaseSummaries命令較為方便。第四節(jié)正態(tài)分布及其應(yīng)用
正態(tài)分布(normaldistribution)的概念和特征正態(tài)分布的兩個參數(shù)正態(tài)曲線下面積分布規(guī)律
標(biāo)準(zhǔn)正態(tài)分布標(biāo)準(zhǔn)正態(tài)分布與標(biāo)準(zhǔn)化變換標(biāo)準(zhǔn)正態(tài)分布表
正態(tài)分布的應(yīng)用估計(jì)頻數(shù)分布制定參考值范圍質(zhì)量控制統(tǒng)計(jì)方法的基礎(chǔ)一、正態(tài)分布
(一)正態(tài)分布的圖形
例:某地7歲男童身高的
頻數(shù)分布10/17/202360正態(tài)分布圖形特點(diǎn)正態(tài)分布
頻數(shù)分布是中間(靠近均數(shù))頻數(shù)多,兩邊頻數(shù)少,且左右對稱。正態(tài)曲線呈鐘型:兩頭低中間高,左右對稱若指標(biāo)X的頻數(shù)分布圖接近正態(tài)分布曲線,則初步判斷該指標(biāo)服從正態(tài)分布。正態(tài)分布的概率密度函數(shù):為總體均數(shù),為標(biāo)準(zhǔn)差,記為:X~N(m,s)記為:X~N(m
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職(市場營銷)市場實(shí)訓(xùn)綜合測試題及答案
- 2025年大學(xué)一年級(食品科學(xué)與工程)食品微生物學(xué)試題及答案
- 2026年機(jī)械原理(機(jī)械運(yùn)動優(yōu)化)試題及答案
- 2025年中職大數(shù)據(jù)技術(shù)與應(yīng)用(大數(shù)據(jù)處理基礎(chǔ))試題及答案
- 2025年中職(旅游服務(wù)與管理)旅游管理綜合階段測試試題及答案
- 2026年客服管理(投訴處理)試題及答案
- 2025年高職衛(wèi)生檢驗(yàn)與檢疫技術(shù)(檢驗(yàn)檢疫應(yīng)用)試題及答案
- 2025年高職汽車電子技術(shù)(電子控制系統(tǒng))試題及答案
- 2025年高職物流統(tǒng)計(jì)(物流統(tǒng)計(jì))試題及答案
- 2025年大學(xué)大四(輕化工程)造紙廢水處理技術(shù)綜合測試試題及答案
- 2024全員安全生產(chǎn)應(yīng)知應(yīng)會手冊
- 大學(xué)生創(chuàng)新創(chuàng)業(yè)基礎(chǔ)(創(chuàng)新創(chuàng)業(yè)課程)全套教學(xué)課件
- 苗木修剪施工方案
- 通用變速箱4L60E培訓(xùn)
- 220KVSF6斷路器檢修指導(dǎo)作業(yè)書
- 采購崗位職責(zé)及考核人員要求
- GB/T 97.1-2002平墊圈A級
- GB/T 4436-2012鋁及鋁合金管材外形尺寸及允許偏差
- GB/T 4389-2013雙頭呆扳手、雙頭梅花扳手、兩用扳手頭部外形的最大尺寸
- ESC心臟瓣膜病指南解讀-課件
- 急性左心衰的搶救配合及護(hù)理課件
評論
0/150
提交評論