版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
影像、法醫(yī)、生物麻醉等)醫(yī)學生(5年制、7年制、8年制等)必修課。WilliamOslerMedicineisascienceofuncertaintyandanartofprobability。在醫(yī)學科研中,具有重要性觀察性研究(observationalstudy)、實驗性研究(experimentalstudy)。橫斷面研究(cross-sectionalstudy)、病例對照研究(case-controlstudy)、隊列研究(cohort實驗性研究分為:動物實驗(animalexperiment)、臨床試驗(clinicaltrial)、社區(qū)干預試驗(communityinterventiontrial)。統(tǒng)計分析(statisticalysis):統(tǒng)計描述(statisticaldescription);統(tǒng)計推斷(statisticalinference)20072007300samplesize)數(shù)據(jù)或資料(data):是由具有若干變量值的觀測單位所組成的。概率(probability,P不確定的,稱為隨機事件(randomevent),簡稱事件。01小概率事件(smallprobabilityevent):當某事件發(fā)生的概率小于或等于0.05時,稱為小定量資料的統(tǒng)計描述(tative頻數(shù)分布表(frequencytable)將組別和相應(yīng)的頻數(shù)列表---頻數(shù)表。2.12005102完成次數(shù)頻率累計頻數(shù)2333745678491--連續(xù)型定量變量的頻數(shù)20051209(L),求全距(range)/極差:R確定各組段的上限(upperlimit)(lower2.220051209(L)組段頻率累計頻數(shù)5557644--頻數(shù)分布圖:直方圖(連續(xù)變量2.1?20051209集中趨勢(centraltendency):指一組數(shù)據(jù)向某一個位置或集中的傾向正偏態(tài)(positiveskewness):負偏態(tài)(negativeskewness):圖2.22004年我國麻疹患者的分圖2.3某市219名患者術(shù)后康復期生存質(zhì)量評分的分均數(shù)(mean):算術(shù)均數(shù)(arithmeticmean)的簡稱。2.21209法(weightmethod適用于單峰對稱分布資料,特別是正態(tài)分布或近似正態(tài)分布的資料。易受值影響,幾何均數(shù)(geometricmean):布,試求其平均密度。2.0不能取對數(shù)數(shù)據(jù)中若有0,可將觀察值加常數(shù)k, x+k>0,計算結(jié)果再還原即-k3.觀察值若同時有正、負值,可將觀察值加常數(shù)k,使x+k>0,計算結(jié)果再還原,即中位數(shù)(median)M直接法:可用于各種分布的資料,在正態(tài)分布資料位數(shù)等于均數(shù);在對數(shù)正態(tài)分布資料中不受值的影響,主要用于不對稱分布類型的資料、兩端無確切值或分布不明確的資某醫(yī)學院用自編生存質(zhì)量量表測得三組同、同中年的軀體功能維度得分,889111256818甲組R=12-8=4(分)R=15-5=10(R=19-1=18(百分位數(shù)(percentile,Px)xx%Px,有(100-x)%Px。P50=nx%=INT(nx%)時nx%>INT(nx%)INT(nx%):nx%222333333344444444444444445555555555555555555555555555555556666666666666666666666667777777777777788889n=102,102X80%=81.6,nx%>例2.12?用表2.4(見下)的資料求219名患者術(shù)后康復期生存質(zhì)量評分的P25P75表2.4219名患者康復期生存質(zhì)量評222437(inter-quartileP25,QL;P75,QU。四分位數(shù)間距=QU-QL例2.13求219名患者術(shù)后康復期生存質(zhì)量評分的四分位數(shù)間距。(n-l)度(degreeof (standard2.152.21209三、變異系數(shù)(coefficientof例2.17某年某市城區(qū)120名5歲身高均數(shù)為110.10cm,標準差為5.90cm;體重均數(shù)17.71kg1.44kg,比較身高與體重的離散程度。可見,該市城區(qū)5歲體重的變異大于身高的變異第四節(jié)正態(tài)分布及其應(yīng)用(一)連續(xù)型隨量及其概率分隨量X取各種值的概率的規(guī)律稱為概率分布規(guī)律,簡稱分布正態(tài)分布(normaldistribution)是一種重要的連續(xù)型隨量的分布類型(二)正態(tài)分布的圖若變量X的頻率曲 近數(shù)學上的正態(tài)分布曲線,則稱該變量服從正態(tài)分布(三)正態(tài)分布的特正態(tài)分布有兩個參數(shù),即位置參 和形態(tài)參數(shù)。若固定,改變值,曲線沿著軸平行移動,其形態(tài)不變。若固定、越小,曲線越陡峭;反之曲線越低平,但中心在圖2.5不同 的正態(tài)分布示意通常用記 ,表示均數(shù)為、標準差 的正態(tài)分布9X1.672L0.298LX~N(1.672,0.2982)1②以直線x 為對稱軸 與 范圍內(nèi)曲線下的面積相等,各占 )內(nèi)的面積為95.00%,區(qū)間( 的面積為99.00%。2.6正態(tài)曲線下面積的分布規(guī)律若X服從正態(tài)分布 分布N(0,1),稱為標準正態(tài)分布(standardnormaldistribution)或Z分布。第四節(jié)正態(tài)分布及其應(yīng)用服從正態(tài)分布(同同正常兒童的身高同健康成人的紅細胞數(shù))或?qū)?shù)正態(tài)分例2.21?已知120名9歲男孩的肺活量 =1.672L,S=0.298L,欲估計該市肺活量介于1.200~1.500L范圍內(nèi)的9歲男孩的比例。查附表2標準正態(tài)分布曲線下的面積 值得1.200~1.500L922.39%。(二)制定醫(yī)學參考值范圍(medicalreferencerange)包括絕大多數(shù)正常人的形態(tài)、功能和代謝產(chǎn)物等各種生理及生化指標觀察值的波動范測定方法應(yīng)、準采用公認的或機構(gòu)的標準方法培訓操作;分析儀器的靈敏度應(yīng)較高;新儀器、新方法須經(jīng)校正和驗證、,樣品、儲藏和分析中要嚴格防止污染內(nèi)和間通過測定已知濃度的、,RBC:分和成人、兒童制定參考值范圍過高或過低均屬異常(白細胞計數(shù))僅過高為異常(血鉛)—單側(cè)參考值范圍(上限);僅過低為異常(肺活量)(下限)正常人和患者的數(shù)據(jù)分布有交叉,若減少假率,假陽性率增加,二者應(yīng)兼顧。用于確診,旨在減少假陽性,應(yīng)選99%;用于初篩,旨在減少假,可選90%圖2.8正常人與患者觀察值分布示意2.5參考值范圍的制定正態(tài)分布 百分位數(shù)參考值范圍
單 單只有下 只有上 只有下限只有上 P2.5-P97.5 P0.5-P99.5 例2.22某地正常成年男子200人的紅細胞數(shù)95%參考值范圍為:上限9554.52×1012/L~56.00×1012/L。2.23?20051209=1.672L,S=0.298L995%參考值范圍。995%l.183L例2.24抽樣測定某城市125名55~60歲組健康居民的低密度脂蛋白(LDL-C)含量(mmol/L),如表4.6所示,試制定該市55~60歲組健康居民的LDL-C的95%95%參考值范圍:該市55~60歲組健康居民的LDL-C的95%參考值范圍為1.49~4.58mmol/L。表2.6某市125名55~60歲健康居民LDL-C(mmol/L)頻數(shù)分布累計頻率55274542t檢驗、F檢驗及相關(guān)回歸分析等要求分析的變量服從正態(tài)分布或近似正態(tài)分布。比例基數(shù)K:選100%、1000‰或100000/10萬等,主要根據(jù)用法或使計算結(jié)果保史,吸煙的肺癌患者有166例,而同時期同段的1855名非肺癌患者中,吸煙的有速率(rate):例3.2在一項隨訪研究中,對125人追蹤隨訪了2年,結(jié)果有2人,則用以說明事物各組成部分所占的3.320033.1構(gòu)成比1100%②事物各組成部分之間此消彼長在構(gòu)成中若比例增加則女性比例減少。數(shù)、相對度、比。分子和分母可以是絕對數(shù)、相對數(shù)或平均數(shù)。例3.4為了解新生兒的鋅營養(yǎng)狀況,分別測量某醫(yī)院足月兒及早產(chǎn)兒的臍血鋅含量,結(jié)果顯示,足月兒及早產(chǎn)兒的臍血鋅含量的均數(shù)分別為1.85mg/L和1.41mg/L,則該醫(yī)院足月兒與早產(chǎn)兒的臍血鋅含量之比為1.85/1.41=1.31,即該醫(yī)院足月兒臍血1.31若用某種療療2例患者,1例有效,則有效率是50%;如果2例都有效,則有效率構(gòu)成比說明事物各組成部分所占的,不能說明某現(xiàn)象發(fā)生的頻率或強度大小。表3.3門診慢性支氣管炎患者的構(gòu)成組患者構(gòu)成比 表3.5兩種療療某病的病死新療 一般療治療人數(shù)人數(shù)病死率(%)治療人數(shù)人數(shù)病死率普通 重 合 五、樣本率或樣本構(gòu)成比的比較應(yīng)設(shè)檢抽樣誤差(samplingerror)1:m=4.5,s=0.25、10、20、50,各樣本10004n=201004.14.2100111112335778833554.60-114.24.3二、均數(shù)的標準誤 樣本均數(shù)的標準差稱為均數(shù)的標準誤(standarderrorofmean,SEM),說明各樣本均數(shù)圍繞總體均數(shù)的離散程度,可樣本均數(shù)的抽樣誤差大小。 隨機抽取某地正常成年200名,測得其膽固醇的均數(shù)為3.64mmo1/L,標準差1.20mmol/L,試估計其抽樣誤差。tt分布的概 轉(zhuǎn)化為標準正態(tài)布(Z分布)N(0,1)。正態(tài)變 服從正態(tài)分 ,Z變換 化為標準正態(tài)分布(Z分布)N(0,1)。實際工作中, 未知,用 代替,則( 再服從標準正態(tài)分布,而服從t分布(t-distribution),即:n:度(degreeoffreedom)度:指能取值的變量個數(shù)。X+Y+Z=15,n=2。n=n-kn t時,度n=n-1t分布主要用于總體均數(shù)的區(qū)間估計及t檢驗t分布最早由英計學家W.S.Gosset(K.Pearson的學生)于1908年用筆名Studentt分布(Student'st-distribution)t分布的特t分布只有一個參數(shù):度νt分布是與度有關(guān)的一簇曲線圖6.4度為1、5、∞時的t分布曲t以t=0為中心左右對稱的單峰分布度的增大,t分布逐漸近標準正態(tài)分布;當度趨于∞時,t分布就是標準正態(tài)分t當度確定后,t分布曲線下,雙側(cè)尾部的面積或單側(cè)尾部的面積為指定概率a時,橫t界值是多少?tP439橫標目:度;縱標目:概率(P或a)單側(cè)/尾概率(one-tailedprobability):一側(cè)尾部面積;雙側(cè)/尾概率(two-tailed~):兩側(cè)尾部面積之和。t界值(t-criticalvalue):表中數(shù)字。t界值:ta,n;與雙側(cè)概率對應(yīng)的t界值:ta/2,nt分布以0為中心左右對稱,表中只列出正t值,查表時,不管t值正負,只用絕對值。 t界值表可見:①在相同度時,∣t∣值越大,概率P越小②在相同∣t∣值時,同一度的雙尾概率P為單尾概率P的兩倍。t0.10/2,10t0.05,10=1.812參數(shù)估計(parameterestimation):指用樣本統(tǒng)計量(statistic)來估計總體參數(shù)(parameter)。能反映抽樣誤差的影響,無法評價這種估計的程度20067ms1507=123.8cm,S=4.7cm123.8cmm7123.8cm;4.7cms的點估計值。區(qū)間估計(intervalestimation):是按一定的概率(1-a)個范圍稱為參數(shù)的置信區(qū)間(confidenceinterval,CI)。1-a)稱為置信度(confidencelevel9599%,如果沒有特別95%。置信區(qū)間(CL,CU(confidencelimit,CL置信下限(lowerconfidencelimit):CL置信上限(upperconfidencestm1-aν=n- n>100,t分布近標準正態(tài)分布,總體均數(shù)的雙側(cè)(1-a)置信區(qū)6.32572/min,標準差為8次/min.試估計該地成年脈率總體均數(shù)的95%置信區(qū)間.本例,n=25,a0.05,ν=25-1=24tt0.05/2,可推斷該地成年脈率總體均數(shù)的95%置信區(qū)間為(68.7,75.3)次/min。6.420040 S=0.72mmol/L,試估計該地40歲以上正常人群空腹血糖值的總體均數(shù)本例 a0.05,從正態(tài)總體中重復100次抽樣每次樣本含量均為n,每個樣本均按 計算95%而有5個置信區(qū)間未包含總體均數(shù)(估計錯誤),即犯錯誤的概率是5%。第一:準確度1精確度/精密度:反映為置信區(qū)間的寬度CL~CU。置信區(qū)間的寬度取決 a,tZ),精確度會下降,勢必降低置信區(qū)間的實用價值。不能簡單認為99%95%的置信區(qū)間。實際工作中為了較好地兼顧準確度和精確度,一般95%置信區(qū)間。區(qū)間估計屬于統(tǒng)計推斷(statisticalinference)的內(nèi)容之一,假設(shè)檢驗(hypothesis7.1AB7.1。7.1ABB因此,這里不能立刻得出A治療方法優(yōu)于B治療方法的結(jié)論。A組與B組有效率之差為12.7%,其產(chǎn)生的原因可能有兩種:12.7%的有效率之差究竟是偶然性造成的,還是體現(xiàn)了兩種療法總體有效率的差異假設(shè)檢驗(hypothesistest)更的情況(大于12.7%)的可能性有多大?如果能夠算出這個可能性(即概率P值)的大小,就可以下結(jié)論了在本例中,如果算出的概率P值小于等于5%,就可以“A療法和B療法的總體有效率如果P值大于5%,則還不能“A療法和B療法的總體有效率相等”的假設(shè),目前尚不AB假設(shè)檢驗(HypothesisTest)患者進行4周的治療,其療效。評價療效的一個指標是鍛煉持續(xù)時間的增加量(min)。3min?,抽樣誤差造 零假設(shè)(nullhypothesis)H0,表示目前的差異由抽樣誤差備擇假設(shè)(alternativehypothesis)H1H0:μ=μ03min;包括:μ>μ0μ<μ0Figure1.Definingareasofacceptanceandrejectioninhypothesistestingα=A:Two-tailedornondirectional.B:One-tailedordirectionallowertailC:One-tailedordirectionalupper如何確定概率PXN(μ,σ2),總體標準差σ在零假設(shè)成立的情況下,μ=μ0=3min,則基于t分布的知識,可以得查t界值表,度近似取50,可得到P<0.0013min”。1min值。若P小于等于檢驗水準(如%),結(jié)就是零假設(shè),認為總體參數(shù)之間存在異。若P大于檢驗水準,就不能零假設(shè),尚不能認為總體參數(shù)之間存在差異。確定P值,作出統(tǒng)計推140g/L60年進行檢查,測得血紅蛋白均數(shù)為155g/L,標準差為24g/L??煞裾J為高原地區(qū)成年居民的血紅蛋白平均水平不同于一般正常成年男子H0:μ=μ0高原地區(qū)成年居民血紅蛋白的總體均數(shù)等于140H1:μ≠μ0高原地區(qū)成年居民血紅蛋白的總體均數(shù)不等于140α=0.05(levelofsignificance,levelofatest):事先規(guī)定的一個小的概率0.050.01。確定P值,作出統(tǒng)計推查t界值表,度近似取60,可得到雙側(cè)P<0.001H0,接受H1,認為高原地區(qū)成年的血紅蛋白平均水平不等于140g/L。當P≤α時,H0,接受H1;當P>α時,不H0進行假設(shè)檢驗時,無論是零假設(shè),還是不零假設(shè),都有可能犯錯誤。Ⅰ型錯誤(typeIerror):指了實際上正確的零假設(shè),這類棄真的錯誤如果將H0看作“無病”,H1看作“有病”,則Ⅰ型錯誤就是“誤診推斷,如果P值小于等于α,則H0,推斷差異具有統(tǒng)計學意義,此時犯Ⅰ型錯誤的概Ⅱ型錯誤(typeII指不實際上不成立的零假設(shè),這類存?zhèn)蔚腻e誤如果將H0看作事件,H1看作陽性事件,則Ⅱ型錯誤可看成假。如果將H0看作“無病”,H1看作“有病”,則Ⅱ型錯誤就是“漏診”。當樣本量確定時,α越小,β越大;反之,α越大,β越小兩型錯誤示意圖(以單側(cè)t檢驗為例真實情 H0 不H0正Ⅰ型錯誤H0不正Ⅱ型錯誤poweroftest)H1:μ≠μ0使用假設(shè)檢驗方法能夠發(fā)現(xiàn)這種差異的能力,記為(1-β)。H1的內(nèi)容直接反映了檢驗的單雙側(cè)H1只是μ>μ0μ<μ0,則此檢驗為單側(cè)檢驗(one-sidedtest),它不僅考慮有無差異,1μμ0(two-siddest)tt檢驗要求:兩組資料相應(yīng)的總體分別P值的含義前樣本的越傾向于H0,當P值小于等于事先規(guī)定的檢驗水準時,就H0。P值的大小不僅與總體參數(shù)間的差別有關(guān),而且與抽樣誤差等有關(guān)。不能認為P值越小,總體參數(shù)間的差別越大。P值越小,說明實際觀測到的差異與H0之間不一致的程度就越大,犯I型錯誤;不H0,可能犯Ⅱ型錯誤。按α=0.05H0的情形。還有可能出現(xiàn)對同一份資料,雙側(cè)檢驗不H0而單側(cè)檢驗H0的情況 P和α的大小接近時,下結(jié)論尤其要慎重統(tǒng)計學的結(jié)論:是否H0,差異是否有統(tǒng)計學意義4就同一份資料若假設(shè)檢驗的結(jié)果是P<αH0接受H1則1α)的置信間必0P利用前述資料,計算高原地區(qū)成年血紅蛋白的總體均數(shù)的95%置信區(qū)間H0:μ=μ0=140g/L不在此區(qū)間內(nèi)這與按照α=0.05水準H0的推斷結(jié)論等價。說明置信區(qū)間可以回答假設(shè)檢驗的問題。置信區(qū)間能提供假設(shè)檢驗沒有提供的信息置信區(qū)間的結(jié)果不僅說原地區(qū)成年男子的血紅蛋白的平均水平不等于140g/L,而且高原地區(qū)成年男子的血紅蛋白的平均水平為148.8~161.2g/L。圖中的(d)與(e)均無統(tǒng)計學意義,但(d),(e):因此,學術(shù)期刊編輯建議在報告假設(shè)檢驗結(jié)論的同時,應(yīng)該報告相應(yīng)的區(qū)間估計結(jié)果:16t檢驗(ttest/Student’sttt檢驗)(onesamplet3.36kg403.27kg,0.44kg,問該地農(nóng)村新生兒出生體重是否與該地新生兒平均出(1)建立檢驗假設(shè),確定檢驗水準ν=n-1=40-(3)P根據(jù)度39和t=-1.294的絕對值查t界值表,得0.2<P<0.4,則按α=0.05的檢驗水準,不H0,差別無統(tǒng)計學意義,尚不能認為該地農(nóng)村新生兒體重與該地新生兒平均出t檢驗)(pairedsamplest①配對的兩個受試對象分別接受兩種不同處理之后的數(shù)據(jù),如把同、相近且相同配對t檢驗目的:推斷兩種處理(或方法)的結(jié)果有無差別對24名兒童接種卡介苗,按同、同配成12對,每對中的2名兒童分別接種兩種結(jié)核菌素,一種為標準品,另一種為新制品,分別注射在兒童的前臂,72h1,問兒童皮膚對兩種不同結(jié)核菌素的反應(yīng)性有無差別?-123456789(1)H0:μd=0,兒童皮膚對不同結(jié)核菌素的反應(yīng)性無差別H1:μd≠0,兒童皮膚對不同結(jié)核菌素的反應(yīng)性有差別(3)P查t界值表,得t0.001/2,11=4.437,而4.520>4.437, P<0.001。按α=0.05水準H0,接受H1,差異具有統(tǒng)計學意義,可認為兩種不同結(jié)核菌素對兒童皮膚反應(yīng)性有差tt檢驗)(independentsamplesttest)(假定兩樣本所代表的總體分別服從正態(tài)分布N(μ1,s12),N(μ2,s22)若兩總體方差相某醫(yī)生研究白介素-6(IL-6)與銀屑病的關(guān)系,收集了12例處于進行期的銀屑病患者及12例正常人的標本進行IL-6檢測,得到表2結(jié)果,問銀屑病患者與正常人的IL-6表2銀屑病組與正常對照組的IL-(1)?H0:μ1=μ2,銀屑病患者與正常人的IL-6均數(shù)相等H1:μ1≠μ2,銀屑病患者與正常人的IL-6均數(shù)不相等(3)P認為銀屑病患者與正常人的IL-6均數(shù)不同,銀屑病患者的IL-6較高。對大樣本兩組均數(shù)的Z檢驗(兩組樣本含量均大于50),χ2(chi-squareχ2檢驗是英計學家K.Pearson于1900年,以χ2分布(chi-squaredistribution)和擬合優(yōu)度檢驗(goodness-of-fittest)為理論依據(jù),是一種應(yīng)用范圍很廣獨立樣本列聯(lián)表資料的χ2例7.1某研究者欲比較甲、乙兩藥治療小兒上消化道的效果,將90名患兒隨機分為兩兒上消化道的有效率是否有差別?表7.1甲、乙兩藥治療小兒上消化道的效果甲藥2718 乙藥405 合計6723 上消化道的有效率有無差別的結(jié)論。χ27.212n(fourfoldtable)例7.1的效假設(shè)0π1=2兩種藥物治療小兒上消化道的有效率相同兩樣本0π=π274.44%稱為理論頻數(shù)(theoreticalfrequecy),T;(actualfrequency)AH074.444574.44=33.5(1(rw)1(column)格子的理論頻數(shù)為:越大,χ2就越大,相應(yīng)的P值也就越小,當P≤α,則AT相差較大,有理由認為無效假設(shè)不成立,繼而H0,作出統(tǒng)計推斷。 的大小有關(guān)外,還與格子數(shù)(度)有關(guān)。n=k-1-s=(R-1)(C-3變動了,故能取值的格子數(shù)為1。按此Pearsonχ2公式算得的χ2值近似服從度為n的χ2分布χ2分布是一種連續(xù)型隨量的概率分布。設(shè)有n個相互獨立的標準正態(tài)分布隨Z1,Z2,...,ZV,則Z12+Z22+...+ZV2的分布稱為服從度為ν的χ2分布 Z12圖7.13種度對應(yīng)的χ2分布的概率密度曲時,χ2分布近正態(tài)分布。χ2α時的臨界值記為χ2ανχ2χ2H0:π1=π2,即兩種藥物治療小兒上消化道的有效率相同H1:π1≠π2,即兩種藥物治療小兒上消化道的有效率不同α=0.05計算χ2值和ν=確 P值,作出統(tǒng)計推查χ2界值表,得P<0.005,按α=0.05水準,H0,接受H1,差異有統(tǒng)計學意義,可以認為兩種藥物治療小兒上消化道的有效率不同,乙藥的有效率高于甲藥。四格表公式7.1為改善χ2統(tǒng)計量分布的連續(xù)性,英計學家F.Yates提出連續(xù)性校正(correctionforcontinuityYates(Yates’Scorrection)。1的χ2當n≥40,且T≥5時,用Pearsonχ2公式或公式計算χ2值當n≥40,且有1≤T<5時,用校正公式計算校正的χ2值,或用四格表的確切概率法n<40T<1用四格表的確切概率法例7.2某研究欲比較甲、乙兩藥治療下呼吸道的療效,將66例下呼吸道者隨機等7.33233問兩藥治療下呼吸道的有效率有無差異?表7.3兩種藥物治療下呼吸道的效甲8乙2 故應(yīng)計算校正的χ2值。查χ2界值表,得P>0.05,按α=0.05水準,不H0,差異無統(tǒng)計學意義,尚不能認為兩種藥物治療下呼吸道的有效率不同。檢驗R×C列聯(lián)表資料的χ2R×C列聯(lián)表的形式2×2 R×2列聯(lián)表,即多個樣本率的比較2×C或R×Cn=k-1-s=(R-1)(C-例7.3某研究者欲比較A、B、C三種方案治療輕、中度高血壓的療效,將在50~70歲的240例輕、中度高血壓患者隨機等分為3組,分別采用三種方案治療。一個療程后觀察療7.4。問三種方案治療輕、中度高血壓的有效率有無差別?7.4A6BC9H0:π1=π2=π3H1ν=(3-1)(2-P<0.005,按a=0.05水準,H0,接受H1,差異有統(tǒng)計學意義,可以認為三種方案治療7.4的甲、乙兩個國家級貧困縣(其中甲縣2006年已開展新型農(nóng)村合作醫(yī)療;乙縣2006年尚未開展)分別進行抽樣,得到2006年應(yīng)住院者未住院原因,見表7.5。問甲、乙兩縣應(yīng)住經(jīng)濟甲乙:甲、乙兩縣應(yīng)住院者未住院原因的總體構(gòu)成比不同 =0.05水準,不 R×C列聯(lián) 檢驗注意事計 值的大小與頻數(shù)大小有關(guān)1 組可以合并,但不同血型就不能合并。Ridit甲乙 3 配對2×2列聯(lián)表資料的 表7.8配對四格表形式甲乙+-+ab-cdn 配對設(shè)計四格表 檢驗公McNemarMcNemar’stestb+c40ad反映的是甲乙兩種屬性一致的情況由于ad兩個格子差異因此當a、d比較、c比較小時,若得到差異有統(tǒng)計學意義,需結(jié)合兩樣本率差異的大小得出例7.6某研究者欲比較心電圖和生化測定低鉀血癥的價值,分別采用兩種方法對79名7.9。問兩種方法的檢測結(jié)果是否不同?表7.9兩種方法低鉀血癥的結(jié)
+-459b+c=29<P<0.005,按 水準 ,接受,差異有統(tǒng)計學意義,可以認為兩種方秩和檢假設(shè)檢驗分為:參數(shù)檢驗(parametrictest)非參數(shù)檢驗 (nonparametrictest)t檢驗和方差分析均要求樣本來自正態(tài)總體,屬于參數(shù)檢驗。非參數(shù)檢驗不以特定的總體分布為前提,也不對總體參數(shù)作推斷,故也稱為任意分布檢(distribution-freetest一端或兩端,甚至分布未知,都能適用。樣本中按大小所占的位次。的小樣本數(shù)據(jù),非參數(shù)檢驗在剔除這些數(shù)據(jù)前后所得結(jié)論顯示出了較好的穩(wěn)健性。非參數(shù)檢驗方法很多,有秩和檢驗(ranksumtest)、符號檢驗、游程檢驗、等級相關(guān)分析秩和檢驗在非參數(shù)檢驗中占有重要地位且檢驗功效相對較Wilcoxon符號秩和檢1945年WilcoxonWilcoxon符號秩和檢驗(Wilcoxonsigned-ranktest),亦稱符一、配對設(shè)計的兩樣本配對設(shè)計資料主要是對差值進行分通過檢驗配對樣本的差值是否來自中位數(shù)為0即推斷兩種處理的效應(yīng)是否不同。例8.1某研究用甲、乙兩種方法對某地方性砷地區(qū)水源中砷含量(mg/L)進定,測10處,測量值如表8.1的(2)、(3)欄。問兩種方法的測定結(jié)果有無差別?本例為定量數(shù)據(jù)配對設(shè)計的小樣本資料,其配對差值經(jīng)正態(tài)性檢驗得077=.01即差值從正態(tài)分布,故不宜選用配對t檢驗,而應(yīng)使用Wilcoxon符號秩和檢驗。8.1?甲、乙兩種方法測定某地區(qū)10中砷含量的結(jié)果
di正差值秩次負差值秩次 (2)(3)(4)=(2)- 1-—22-—33—4-—5——68—71—8-—49-—97—合 21.5(T+)23.5(T-建立檢驗假設(shè),確定檢驗水H0:兩種方法測定結(jié)果差值的總體中位數(shù)等于H1:兩種方法測量結(jié)果差值的總體中位數(shù)不等于計算檢驗統(tǒng)計量T值(秩和求差值編秩:依差值的絕對值由小到差值為0次編秩或求平均秩次,并冠以原差值的正、負號。5定點不參與編秩,有效對子數(shù)為9。差0.0200.020次5、6,符號求正秩和(T+)、負秩和(TT++Tn(n+1)/2,T+大,T-小;T+小,T-大本例:T+=21.5,T-=23.5,TT9(9+1)/245,秩和計算無誤確定P查表法n≤50n和TT界值表(配對比較的符號正態(tài)近似法:隨著n的增大,T分布逐漸近均數(shù)為(+1)/4,方差為n(+1)(2+1)/24的正態(tài)分布。當>50時,近似程度較滿意,用本法(見專業(yè)書籍)。查表法:n所在的行,用所得T值與相鄰一欄的界值做比較,若T在界值內(nèi),確定P值大于相應(yīng)的概率T等于界值P值等于相應(yīng)概率;若T在界值外,P值小于相應(yīng)概率,右移一欄,再做比較,直至較好地估計出P值。由T界值表可知,按照 水準,當n≤5時,配對符號秩和檢驗不能得出雙側(cè)概率,故n必須大于5。本例n=9,T=21.5或T=23.5,查表,得雙側(cè)P>0.10。按照 ?水準不H0,Wilcoxon配對符號秩和檢驗的基本思想在配對樣本中,由于隨機誤差的存在,其對差值的影響不可避免。假定兩種處理的效應(yīng)相0的正秩和與負秩和應(yīng)相差不大,均接近(n+1)/4;當正負秩和相差懸殊,超出抽樣誤差可解釋的范圍時,則有理由懷疑該假設(shè),從而0。二、單一樣本與總體中位數(shù)比(定值)有無差別,常用于不滿足單樣本t檢驗應(yīng)用條件的資料。例8.2某醫(yī)生從其接診的不明原因患者中隨機抽取14例,測得其發(fā)銅含(g/g)見表8.2。已知該地健康人銅含量的中位數(shù)為11.2g/g。問患者發(fā)銅含表8.214名不明原因患者發(fā)銅含量(g/g)測定結(jié)------------9--8--7--6--5--4--21-3--101(T-8.2第(2)體中位數(shù)的差值,對差值做正態(tài)性檢驗得W=0.861,P=0.031,不滿足單樣本t檢驗條件,故選用Wilcoxon符號秩和檢驗。H0:差值的總體中位數(shù)等于0,即患者發(fā)銅含量與該地健康人群相同H1:差值的總體中位數(shù)小于0,即患者發(fā)銅含量低于該地健康人群T+=4,T-=101,TT14(14+1)/2105,秩和計算無T=4查表,得單側(cè)P<0.01。按照 水準,H0,接受H1,差異有統(tǒng)計學意義,可以認為患者發(fā)銅含量低于該地健康人群。成組設(shè)計兩樣本比較的秩和檢Wilcoxon和檢驗(Wilcoxonranksumtest),目的是推斷連續(xù)型變量資料或有序變量資一、原始數(shù)據(jù)(連續(xù)性變量資料)的兩樣本比例8.3某地職業(yè)病防治欲比較使用二巰基丙磺酸鈉與二巰基丁二酸鈉的驅(qū)效果。將例患者隨機分配到兩組,分別測定并計算出兩組驅(qū)的排比值,并將結(jié)果列于8.3。試問兩藥驅(qū)效果有無差別?表8.3兩種驅(qū)藥物排效果比較丁二酸 丙磺酸排比排比3845679n1=10H0:兩種藥物排比值的總體分布位置相H1:兩種藥物排比值的總體分布位置不將兩組數(shù)據(jù)由小到大編秩。編秩時,遇相同數(shù)值在同一組內(nèi),可順次編秩;當相同值出現(xiàn)在不同組時,則必須求平均秩次++若n1≠n2,則T=T1;若n1=n2T=T1T=T2。本例n1≠n2,故T=T1=75.5查表,得雙側(cè)P<0.01。按照 水準,H0,接受H1,差異有統(tǒng)計學意義,可認為丙磺酸鈉驅(qū)效果好于丁二酸鈉。(前者平均秩次177.5/12=14.79較高)二、等級資料的兩樣本例8.4某醫(yī)生欲比較中西醫(yī)療法與西醫(yī)療療急性腎盂腎炎的臨床療效將患者隨機分為兩組分別給予中西醫(yī)療法或西醫(yī)療療并觀察療效問兩種療法療效是否有差別?表8.4兩種療療急性腎盂腎炎的療效患者秩療療合秩次范平均秩中西療西醫(yī)療痊顯進無48合——建立檢驗假設(shè),確定檢驗水:兩種療療急性腎盂腎炎的療效總體分布位置相:兩種療療急性腎盂腎炎的療效總體分布位置不=計算檢驗統(tǒng)計量T編秩:將兩組數(shù)據(jù)按等級順序由小到大編秩計算各等級的合計、確定各等級秩次范圍、計算各等級的平均秩次如,“痊愈”共54人,秩次范圍:1~54,平均秩次:(1+54)/2=27.5,余仿此求各組秩和(T1,T2)以各療效等級的平均秩次分別與各等級例數(shù)相乘,再求和得T1=6060,T2=6820確定檢驗統(tǒng)計量Tn168較小n),n292,取檢驗統(tǒng)計量T=6060確定P查表當n1≤10且n2n1≤10時T界值表(兩樣本比較的秩和檢驗用找到n1n2n1相交處對應(yīng)的4行界值,將求得的T值與T界值表中逐若T值在界值范圍內(nèi),P值大于相應(yīng)概率;若T值等于界值,P值等于相應(yīng)概率;若T值在界值范圍外,P值小于相應(yīng)概率,下移一行,再做比較,直至估計出P值。正態(tài)近似法(Z檢驗當n1>10或n2-n1>10時,超出T界值表(兩樣本比較的秩和檢驗用)的可查范圍,根據(jù)中心極限定理,這時T1的分布已接近均數(shù)為,方差為正態(tài)分布,故可由公式(8.1Z值當相持(tie,指排序時出現(xiàn)相同秩次的現(xiàn)象)出現(xiàn)較258.1)計算的Z值偏小,可改用公式(8.2)進行校正:第j種相持的秩次個本例n168>10超出了T界值表(兩樣本比較的秩和檢驗用)范圍Z檢驗。由于相持較多,每個等級的人數(shù)為相同秩次的個數(shù)tj,故需按式(8.1)和式(8.2)計算Zc。查t界值表 )得0.02<P<0.05,按=0.05水準 ,接受,差有統(tǒng)計學意義,可認為兩種療法療效分布不同。中西醫(yī)療法組平均秩6820/92=74.1,西醫(yī)療法組平均秩次為6060/68=89.1(越小越好),可以認為中西醫(yī)療療急性腎盂腎炎雙變量關(guān)聯(lián)性分雙變量關(guān)聯(lián)性:指兩個隨量之間在數(shù)量上存在某種協(xié)同變化的關(guān)系隨著凝血酶的升高,凝血時間降低。關(guān)聯(lián)性只反映變量間數(shù)量上的關(guān)系或關(guān)聯(lián),不表示專業(yè)上的因果關(guān)系雙變量關(guān)聯(lián)性分析用于:判斷雙變量間關(guān)聯(lián)性是否存在?描述關(guān)聯(lián)的方向與密切程度直線相關(guān)的概念與性9.1某醫(yī)師測量15名正常成年人的體重(kgCT雙腎體積(mL)大小,數(shù)據(jù)如表表9.115名正常成年重和雙腎體積的測量值體重雙腎體積體重雙腎體積192345678圖9.115名正常成年重和雙腎體積的散點初步判斷兩變量間關(guān)系最直觀有效的方法就是在平面直角坐標系中繪圖,其中一個變量用x表示,另一變量用y表示,在平面直角坐標系中可繪制這些實測點的分布情況,稱為散點圖 (scatterplot)。統(tǒng)計學上,兩個隨量之間呈直線趨勢的關(guān)系,稱為直線相關(guān)(linearcorrelation)或簡單相關(guān)(simplecorrelation)。9.2常見的散點直線相關(guān)的 正相關(guān)(positivecorrelation)兩變量同時增大或減小,變化趨勢同向。 負相關(guān)(negativecorrelation)其中一個變量隨著另一個變量的增大而減小,變化趨勢相反。完全相關(guān):全部數(shù)據(jù)點恰好散布在一條直線上 無相關(guān)或零相關(guān)(zerocorrelation)在非直線相關(guān)。直線相關(guān)系數(shù)(linearcorrelationcoefficient)或PearsonPearsonproductmomentcoefficient):是定量描述兩個變量間直線關(guān)系的方向和密切程度的指正相關(guān)0<r<1 負相關(guān)-1<r<0 零相關(guān)r=09.2計算例9.1體重與雙腎體積之間的樣本相關(guān)系說明兩變量間呈正相關(guān),雙腎體積隨體重增加而增大。需進行假設(shè)檢驗,以推斷總體上相關(guān)系數(shù)的假設(shè)檢用樣本計算出來的相關(guān)系數(shù)r是一個樣本統(tǒng)計量,存在抽樣誤差,需要對總體相關(guān)系數(shù)是否為0設(shè)檢驗。假定隨量x和y均服從正態(tài)分布,可用t檢驗和查表法進行推斷t檢驗樣本相關(guān)系數(shù)r的標 成立時,tr服從度為 的t分布。 ,查相關(guān)系數(shù)界值表, 越大,P值越小; 越小,P值越以上兩種方若得 , ,可認為兩變量間存在直線相關(guān)關(guān)系 ,則不 ,尚不能認為兩變量間存在直線相關(guān)關(guān)系。例9.3例9.2中算得r=0.875,試檢驗該相關(guān)系數(shù)是否具有統(tǒng)計學意義 建立檢驗假設(shè),確定檢,即體重和雙腎體積之間無直線相關(guān)關(guān)系,即體重和雙腎體積之間有直線相關(guān)關(guān)系計算檢確定P值,作出統(tǒng)查t界值表, , 水準,,接受,相關(guān)系數(shù)有統(tǒng)計學意義,可認為體重和雙腎體積之間有直線相關(guān)關(guān)系。查表直接查相關(guān)系數(shù)界值表法一致,,結(jié)果t檢直線相關(guān)分析的步驟繪制散點圖:若兩變量間有直計算樣本相關(guān)系相關(guān)系數(shù)的假設(shè)檢驗(t檢驗和查表說明兩個變量之間相伴隨而呈線性變化的趨勢和關(guān)聯(lián)強度。不能用其中一個變量來一個變量的值?;貧w分析用內(nèi)脂肪含量。第一一、直線回歸的概直線回歸(linearregression)、簡單回歸(simpleregression)用于研究兩個連續(xù)型變因變量(dependentvariable)、反應(yīng)變量(responsevariable):y是回歸分析中,估測的隨量;自變量(independentvariable)、解釋變量(explanatoryvariable):x是回歸分析中,y所依存的變量。例14.1某研究欲探討腰圍與腹腔內(nèi)脂肪面積的關(guān)系對20名志愿受試者測量其腰圍(cm),并采用磁成像法測量其腹腔內(nèi)脂肪面積(cm2),結(jié)果如表14.1所示。試建立腹腔內(nèi)脂肪面積(y)和腰圍(x)的直線回歸方程表14.120 志愿受試者腰圍和腹腔內(nèi)脂肪面積的測量面積面面積面積123456789
腹腔內(nèi)脂
腰圍
腹腔內(nèi)脂14.1兩變量直線回歸關(guān)系散點回歸直線上各點的縱坐標是當x取某一值時因變量y的平均估計值直線回歸方程/直線回歸模型:(linearregressionequation)a回歸直線的截距/常數(shù)項,表示x0y的平均估計值b回歸直線的斜率/回歸回歸系數(shù)(regression表示x改變一個單位時y的平均改變量b>0,表示回歸直線從左下方右上方,即y隨x增大而增大;b<0,表示回歸直線從左上方右下方,即y隨x增大而減??;b=0,表示回歸直線平行于x軸,即y與x無線性依存關(guān)系。(一)回歸方程估計的最小二乘求解、b值i與這條“理想”的回歸直線的估計值最接近。最小二乘eastsquaremethod):指 建立直線回歸方程的步14.1),若二者存在直線趨勢,進行直線回歸分由樣本數(shù)據(jù)計算如計算回歸系 b及截距在x的實測值范圍內(nèi)任取相距較遠且易讀數(shù)的兩個x值代人方程得到兩個 本例x分別取值79和88,得到 分別為70.340和89.335,連接點(79,70.340)和(88,第二直線回歸的統(tǒng)計推一、總體回歸系 的假設(shè)檢總體回歸方和是a和b所對應(yīng)的總體參數(shù); 為對應(yīng)于各x值的y的總體均數(shù),即總體條件均數(shù); 當總體回歸系數(shù)為00變量是否存在回歸關(guān)系,還需對總體回歸系數(shù)是否等于0進行統(tǒng)計推斷。(一)方差分14.2因變量的離均差平方和分解示意例14.2試用方差分析對例14.1的樣本回歸方程設(shè)檢驗建立檢驗假設(shè),確定 ,即腹腔內(nèi)脂肪面積與腰圍之間無直線回歸關(guān) ,即腹腔內(nèi)脂肪面積與腰圍之間有直線回歸關(guān)計算檢驗確定P查F界值表(附表4), ,得P<0.01。按水準H0,回歸方程有統(tǒng)計學意義,可以認為腹腔內(nèi)脂肪面積與腰圍之間有直線回歸關(guān)系l4.2vFP1(二)t檢樣本回歸系數(shù)b的標剩余標準差(residualstandarddeviation)是指扣除x對y的影響后,y對于回歸直線的離散程度。例14.3試用t檢驗對例14.1資料的樣本回歸方程設(shè)檢驗 ,查t界值表(附表3),得P<0.001, 水H0,回歸方程有統(tǒng)計學意義對同一資料作總體回歸系 是否為0的假設(shè)檢驗,方差分析和t檢驗是一致的 二、決定系數(shù)(coefficientofR2取值在01間,無單位R2反映回歸貢獻的相對程度,即在因變量y的總變異中用y與x的回歸關(guān)系所例14.12=0.581說明的腰圍信息可以解釋其腹腔內(nèi)脂肪面積變異的58.1%還有剩余41.9%的信息需通過腰圍以外的其他因素加以解釋。第三散點呈直線趨 直線回歸分析離群點(outlier):圖中明顯遠離主體數(shù)據(jù)的觀測點不能簡單剔除離群點來提高擬合效果。認真核對原始數(shù)據(jù)、查清原因,剔除或采用線回歸等方法。二、用殘差圖模型假設(shè)條觀測值獨立等。殘差圖(residualplot):回歸模型的假設(shè)條件。各點殘 14.4圖14.4(a):較理想的殘差圖如果數(shù)據(jù)符合模型的假設(shè)條件,殘差與回歸值的散點應(yīng)均勻分布在直線兩側(cè),此數(shù)據(jù)可用于擬合直線回歸方程。圖14.4(b):某廠工人的工齡x與全血膽堿酯酶活性y進行直線回歸分析得到的殘差圖。一個離群點,殘差較大。由樣品溶血過差導致,刪除或改用直線回歸圖14.4(c):1~3歲兒童x與其錫克反應(yīng)陽性率y經(jīng)直線回歸得到的殘差圖。殘圖14.4(d):女童x與舒張壓y之間直線回歸的殘差圖。殘差呈喇叭口形狀,說圖14.4(e)線回歸方法。反映自變量對因變量數(shù)量上影響大小的統(tǒng)計量是回歸系數(shù),而不是假設(shè)檢驗的P值。P值越小只能說明越有理由認為變量間的直線回歸關(guān)系存在,而不能說明影響越大或關(guān)系直線回歸用于時,適用范圍不應(yīng)超出樣本中自變量的取值范圍內(nèi)插(interpolation):在正常范圍內(nèi)求得的值;外推(extrapolation):超過自變的外推。 資料要求:直線相關(guān)分析要求x、y服從雙變量正態(tài)分布,二者無主次之分;直線回歸分析要求在給定某個x值時y服從正態(tài)分布,y的均數(shù)隨x變化而變化,而x是可以精確測量和嚴格控制的變量。應(yīng)用:直線相關(guān)分析用于說明兩變量間的相互關(guān)系,關(guān)系是的;直線回歸分析用于說明兩變量的數(shù)量依存關(guān)系,表明yx而變化。意義:相關(guān)系r說明具有直線關(guān)系的兩變量間相互關(guān)系的方向與密切程度;回歸系b表示x每改變一個單位所引起的y的平均改變量。計算公取值范單位:r沒有單位,b有單位。計算出的b與r正負號一致。相關(guān)系數(shù)與回歸系數(shù)的假設(shè)檢驗等價,即對于同一樣本,tb=tr由于相關(guān)系數(shù)的假設(shè)檢驗可以方便地查表得到P值,所以可用相關(guān)系數(shù)的假設(shè)檢驗來回對于服從雙變量正態(tài)分布的同一組資料,其相關(guān)系數(shù)r和回歸系數(shù)b算用回歸可以解釋相決定系數(shù)R2=SS回/SS總,為相關(guān)系數(shù)的平方。反映回歸貢獻的相對程度,即在y的總變異中能用 y與x的回歸關(guān)系解釋的比例。當SS總固定時,SS回的大小決定了相關(guān)的密切程度。SS回越接SS總,則相關(guān)系數(shù)和決定系數(shù)都越1,說明引入回歸效果越好。常用統(tǒng)計表與統(tǒng)計一、常用統(tǒng)計表(statisticaltable)(一)統(tǒng)計表的意義簡潔、有條理地羅列數(shù)據(jù)和統(tǒng)計量,方便閱讀、比較和計(二)重點突出:一張表只表達一個中心 層次清楚:標目的安排及分組符合邏輯,便于分析比較。主語為橫標目,賓語為縱標目,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2026年初三化學(溶液)上學期試題及答案
- 2025年大學工商管理(創(chuàng)業(yè)管理基礎(chǔ))試題及答案
- 高中二年級化學(化學反應(yīng)原理)2026年上學期期末測評卷
- 2025年中職汽車美容(汽車清潔養(yǎng)護)試題及答案
- 2023年中考數(shù)學復習微專題靶向提升練習+二次函數(shù)+選擇題、填空題專練+
- 2025年it部個人年終總結(jié)報告
- 2025個人質(zhì)量總結(jié)報告檢驗員個人年終總結(jié)
- 深度解析(2026)《GBT 18132-2016絲綢服裝》
- 深度解析(2026)《GBT 17980.121-2004農(nóng)藥 田間藥效試驗準則(二) 第121部分殺菌劑防治葡萄白腐病》
- 深度解析(2026)《GBT 17980.5-2000農(nóng)藥 田間藥效試驗準則(一) 殺蟲劑防治棉鈴蟲》
- CJ/T 123-2016 給水用鋼骨架聚乙烯塑料復合管
- 跟著音樂游中國智慧樹知到期末考試答案章節(jié)答案2024年廣州大學
- 硬科技早期投資-項目評估指南
- 2024年陜西省中考英語真題(A卷)
- 中國法律史-第二次平時作業(yè)-國開-參考資料
- (高清版)JTGT D81-2017 公路交通安全設(shè)施設(shè)計細則
- 餐飲服務(wù)人員職業(yè)道德培訓課件
- 大學生當兵職業(yè)生涯規(guī)劃書
- GB/T 31167-2023信息安全技術(shù)云計算服務(wù)安全指南
- 北京師范大學研究生培養(yǎng)方案
- 新防火門使用說明書
評論
0/150
提交評論