醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:第2講 計(jì)量資料統(tǒng)計(jì)描述_第1頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:第2講 計(jì)量資料統(tǒng)計(jì)描述_第2頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:第2講 計(jì)量資料統(tǒng)計(jì)描述_第3頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:第2講 計(jì)量資料統(tǒng)計(jì)描述_第4頁
醫(yī)學(xué)統(tǒng)計(jì)學(xué)課件:第2講 計(jì)量資料統(tǒng)計(jì)描述_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、1,第二章計(jì)量資料的統(tǒng)計(jì)描述,基本內(nèi)容,3,本章在臨床資料處理中的用途,資料整理階段,判斷資料適合何種方法 分析的初步階段,對(duì)變量的特點(diǎn)進(jìn)行描述 (求出均數(shù)和標(biāo)準(zhǔn)差)為假設(shè)檢驗(yàn)做準(zhǔn)備,為了比較國產(chǎn)藥和進(jìn)口藥對(duì)治療更年期婦女骨質(zhì)疏松效果是否相同,研究人員采取隨機(jī)雙盲的試驗(yàn)方法,對(duì)39名病人進(jìn)行隨機(jī)分組,國產(chǎn)藥組20例,進(jìn)口藥組19例,評(píng)價(jià)指標(biāo)為第2-4腰椎骨密度的改變值(骨密度.sav)。,1 -5.00 1 64.00 1 63.00 1 77.00 1 74.00 1 25.00 1 38.00 1 68.00 1 45.00 1 29.00 1 9.00 1 77.00 1 -2.00 1

2、 89.00 1 77.00 1 63.00 1 70.00 1 36.00 1 82.00 1 -14.00 2 -17.00 2 48.00 2 47.00 2 60.00 2 58.00 2 11.00 2 23.00 2 52.00 2 30.00 2 15.00 2 -4.00 如何建立數(shù)據(jù)庫?,(注意:在研究的設(shè)計(jì)和分析階段都用到統(tǒng)計(jì)學(xué)),5,常用的設(shè)計(jì)類型,一組樣本與總體的比較 兩組樣本的比較(成組和配對(duì)t、 2檢驗(yàn) ) 單因素多組樣本的比較(單因素F分析, 2檢驗(yàn) ) 雙因素多組樣本的比較(配伍組F方差分析) 三因素三組及以上設(shè)計(jì)(拉丁方設(shè)計(jì)) 三個(gè)或以上因素并交互作用(正交設(shè)

3、計(jì)),6,主要內(nèi)容,第一節(jié) 計(jì)量資料的頻數(shù)分布 第二節(jié) 集中趨勢 第三節(jié) 離散趨勢,7,第一節(jié) 頻數(shù)分布,什么是頻數(shù) 頻數(shù)分布的特點(diǎn) 頻數(shù)分布的類型,9,SPSS建立數(shù)據(jù)庫,進(jìn)入SPSS操作窗口 進(jìn)入數(shù)據(jù)編輯窗口(data editor) Variable View 變量名 類型 整數(shù)位 小數(shù)位 輸入數(shù)據(jù):Data View,10,檢查輸入的數(shù)據(jù)(打開數(shù)據(jù)庫) 找出最大值、最小值(數(shù)據(jù)排序) data View窗口datasort cases身高sort by-身高 身高主要集中在什么階段? (這個(gè)程序能否看得出來大多數(shù)人身高在何處? 應(yīng)該怎么辦?),12,變量變換:將身高轉(zhuǎn)化成一個(gè)新變量(組

4、段) Transform-recode-into different variables(身高組段)-changeold and new-old value (range)-new value (value)-oldnewaddcontinue (可以試用不同的分組方法,例如“5”“2”) 產(chǎn)生新變量(組段),1998年100名18歲健康女大學(xué)生身高的頻數(shù)分布,14,產(chǎn)生頻數(shù)表,Analyze-Descriptive Statistics-Frequencies組段display frequency table,頻數(shù)表,計(jì)量資料等級(jí)資料,17,頻數(shù):當(dāng)匯總大量的原始數(shù)據(jù)時(shí),把數(shù)據(jù)按類型分組,其

5、中每個(gè)組的數(shù)據(jù)個(gè)數(shù),稱為該組的頻數(shù)。 頻數(shù)表(頻數(shù)分布):表示各組及它們對(duì)應(yīng)的組頻數(shù)的表格稱為頻數(shù)表或頻數(shù)分布。 (見前兩張幻燈),18,頻數(shù)分布的兩個(gè)特征: 集中趨勢與離散趨勢(共性與個(gè)性) 頻數(shù)分布的類型: 對(duì)稱分布與偏態(tài)分布(集中位置偏向小的一側(cè)叫正偏態(tài),反之叫負(fù)偏態(tài)) 頻數(shù)表的主要用途: 1. 揭示分布類型 2. 發(fā)現(xiàn)特大值和特小值 3. 計(jì)算集中趨勢指標(biāo)與離散趨勢指標(biāo),總結(jié)前面,19,第二節(jié) 集中趨勢,集中位置的描述,即大多數(shù)數(shù)值落在什么位置上。(針對(duì)一個(gè)變量的若干個(gè)數(shù)值),描述集中趨勢的幾種指標(biāo)(用不同的方法將不同類型數(shù)值的集中位置表示出來) 1.算術(shù)均數(shù)(均數(shù)mean) 2.幾何

6、均數(shù)(geometric mean) 3.中位數(shù)(median) 4.眾數(shù)(Mode),20,1.算術(shù)均數(shù)(均數(shù)),意義:一組性質(zhì)相同的觀察值在數(shù)量上的平均水平。 表示 (總體) X(樣本)(spss:“mean”) 應(yīng)用:正態(tài)分布或近似正態(tài)分布 注意:合理分組,才能求均數(shù),否則沒有意義。 計(jì)算方法:直接法和加權(quán)法,21,22,均數(shù)的特征,23,用SPSS計(jì)算均數(shù),File-Open-Data-身高-Analyze-Descriptive Statistics-Frequencies-Statistics-Mean-Continue-OK,24,有一組血中抗體滴度數(shù)據(jù):32,2,4, 8, 4

7、,16,1,1,4,1,1,2,2,2,4, 8,16,2,4, 32,4, 8,4,求它們的平均水平,25,首先看這組數(shù)據(jù)的頻數(shù)分布,大概集中在什么位置。 用“mean”求,看結(jié)果如何。 File-Open-Data-抗體滴度-Analyze-Descriptive Statistics-Frequencies-Statistics-Mean-Continue-OK,26,2.幾何均數(shù),意義:N個(gè)數(shù)值的乘積開N次方即為這N 個(gè)數(shù)的幾何均數(shù)。 表示:G 應(yīng)用:原始數(shù)據(jù)分布不對(duì)稱,經(jīng)對(duì)數(shù)轉(zhuǎn)換后呈對(duì)稱分布的資料。數(shù)值范圍跨越多個(gè)數(shù)量級(jí)。例如抗體滴度。,27,SPSS計(jì)算幾何均數(shù),File-Open

8、-Data-抗體滴度-Analyze-Reports-Case Summaries-抗體滴度Statistics-Geometric Mean-Continue-OK,Case Summaries,a,1.00,1.00,1.00,1.00,2.00,2.00,2.00,2.00,2.00,4.00,4.00,4.00,4.00,4.00,4.00,4.00,8.00,8.00,8.00,16.00,16.00,32.00,32.00,23,4.00,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,23,N,Grouped Me

9、dian,Total,抗體滴度,Limited to first 100 cases.,a.,29,1、幾何均數(shù)適用于對(duì)數(shù)正態(tài)分布,如藥物的效價(jià)、抗體的滴度、傳染性疾病的潛伏期等資料。 2、變量x服從對(duì)數(shù)正態(tài)分布,即表示變量lg(xi)服從正態(tài)分布。對(duì)于lg(xi),具有正態(tài)分布的所有特性。,幾何均數(shù)的特征,30,3.中位數(shù)、百份位數(shù),意義:將一組觀察值從小到大排序后,居于中間位置的那個(gè)值或兩個(gè)中間值的平均值。(身高排隊(duì)) data editordatasort cases 表示:M 、PX 百分位數(shù):將N個(gè)觀察值從小到大依次排列,再分成100等份,對(duì)應(yīng)于X%位的數(shù)值即為第X百分位數(shù)。中位數(shù)是

10、百分位的特殊形式。 應(yīng)用:偏態(tài)資料,開口資料,31,11個(gè)大鼠存活天數(shù): 4,10,7,50,3,15,2,9,13,60,60 平均存活天數(shù)? (一)中位數(shù)(median) 是將每個(gè)變量值從小到大排列,位置居于中間的那個(gè)變量值。,存活天數(shù) 2, 3, 4, 7, 9, 10, 13, 15, 50,60,60 秩次 1 2 3 4 5 6 7 8 9 10 11,32,計(jì)算,公式: n為奇數(shù)時(shí) n為偶數(shù)時(shí),33,例 9名中學(xué)生甲型肝炎的潛伏期分別為12,13,14, 14, 15, 15, 15, 17, 天,求其中位數(shù)。,19,34,頻數(shù)表資料的中位數(shù),下限值L,上限值U,i; fm,中位

11、數(shù)M,偏態(tài)資料用算術(shù)均數(shù)處理會(huì)產(chǎn)生什么樣的結(jié)果? 大家試舉一個(gè)偏態(tài)資料的例子。,2503 1283 56000 1500 1520 1600 1680 1920 2000 2300 2300 2530,2580 9501 3000 3000 4210 3100 3120 3210 3210 4102 4520 68120,37,SPSS計(jì)算中位數(shù)、百分位數(shù),File-Open-Data-收入(抗體滴度)-Analyze-Descriptive Statistics-Frequencies-Statistics-Median(mean)-Continue-OK,38,中位數(shù)的特征,計(jì)算時(shí)只利用了

12、位置居中的測量值 優(yōu)點(diǎn):對(duì)極值不敏感 缺點(diǎn):并非考慮到每個(gè)觀測值 適用于各種分布類型的資料, 特別適合于:大樣本偏態(tài)分布資料 或者一端或兩端無確切數(shù)值的資料,39,四、眾數(shù)(Mode) 是一群數(shù)據(jù)中出現(xiàn)次數(shù)(頻數(shù))最多的值。適用于大樣本;較粗糙。 例 有16例高血壓病人的發(fā)病年齡(歲)為:42,45,48,51,52,54,55,55, ,61,61,62,62,試求眾數(shù)。 眾數(shù)的特征 1、對(duì)于某些數(shù)據(jù)而言,例如均勻分布,并不存在眾數(shù); 2、對(duì)于某些數(shù)據(jù)存在兩個(gè)或多于兩個(gè)的眾數(shù); 3、定性數(shù)據(jù)可以存在眾數(shù); 眾數(shù)對(duì)于進(jìn)一步的統(tǒng)計(jì)學(xué)計(jì)算與分析不具備應(yīng)用價(jià)值。,58,58,58,58,40,第三節(jié)

13、 離散趨勢,描述一組數(shù)據(jù)參差不齊的程度,41,全距 四分位數(shù)間距 方差 標(biāo)準(zhǔn)差 變異系數(shù),常用指標(biāo),42,標(biāo)準(zhǔn)差,相關(guān)概念:離均差、離均差之和、離均差平方和、方差(2 S2 ) 標(biāo)準(zhǔn)差的符號(hào): S (SPSS:Std. deviation) 意義:全面反映了一組觀察值的變異程度 (大小) 應(yīng)用:描述變異程度、計(jì)算標(biāo)準(zhǔn)誤、計(jì)算變異系數(shù)、描述正態(tài)分布、估計(jì)正常值范圍,43,用SPSS計(jì)算標(biāo)準(zhǔn)差,File-Open-Data-身高-Analyze-Descriptive Statistics-Frequencies-Statistics-Std.deviation-Continue-OK,44,隨機(jī)變量xi的標(biāo)準(zhǔn)化,如果隨機(jī)變量xi服從正態(tài)分布,均數(shù)和標(biāo)準(zhǔn)差分別為 和s,則隨機(jī)變量xi的標(biāo)準(zhǔn)化正態(tài)離差值(Standard normal deviation)又稱為標(biāo)準(zhǔn)化得分值(Standard Scores )為:,45,變異系數(shù),意義:標(biāo)準(zhǔn)差與均數(shù)之比用百分?jǐn)?shù)表示。 符號(hào): CV 計(jì)算: CV=(S/X)100% 無單位 應(yīng)用:單位不同的多組數(shù)據(jù)比較 均數(shù)相差懸殊的多組資料,46,四分位數(shù)間距(inter-quartile range),四分位數(shù)間距

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論