衛(wèi)生管理統(tǒng)計(jì)學(xué)課件:第八章 參數(shù)估計(jì)與假設(shè)檢驗(yàn)基礎(chǔ)_第1頁(yè)
衛(wèi)生管理統(tǒng)計(jì)學(xué)課件:第八章 參數(shù)估計(jì)與假設(shè)檢驗(yàn)基礎(chǔ)_第2頁(yè)
衛(wèi)生管理統(tǒng)計(jì)學(xué)課件:第八章 參數(shù)估計(jì)與假設(shè)檢驗(yàn)基礎(chǔ)_第3頁(yè)
衛(wèi)生管理統(tǒng)計(jì)學(xué)課件:第八章 參數(shù)估計(jì)與假設(shè)檢驗(yàn)基礎(chǔ)_第4頁(yè)
衛(wèi)生管理統(tǒng)計(jì)學(xué)課件:第八章 參數(shù)估計(jì)與假設(shè)檢驗(yàn)基礎(chǔ)_第5頁(yè)
已閱讀5頁(yè),還剩53頁(yè)未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第八章參數(shù)估計(jì)與假設(shè)檢驗(yàn)基礎(chǔ)本章要求:掌握標(biāo)準(zhǔn)誤的概念和測(cè)量;t分布特點(diǎn);假設(shè)檢驗(yàn)基本思想和步驟熟悉樣本均數(shù)的抽樣分布特點(diǎn);假設(shè)檢驗(yàn)兩類錯(cuò)誤的統(tǒng)計(jì)含意了解檢驗(yàn)效能的概念第一節(jié)抽樣分布與抽樣樣誤差假定某地全體大一女生身高服從總體均數(shù)μ=165.70cm,標(biāo)準(zhǔn)差σ=3.21cm的正態(tài)分布?,F(xiàn)從當(dāng)?shù)嘏畬W(xué)生中隨機(jī)抽取了100次,每次抽取20名為一個(gè)樣本Xi。(見表8-1)由于個(gè)體之間的差異,每次樣本平均數(shù)不大可能恰好等于該地女學(xué)生身高的總體均數(shù)(μ=165.70cm)。這種由個(gè)體變異產(chǎn)生的差異稱為抽樣誤差(samplingerror)。在抽樣研究中,抽樣誤差是不可避免的,但怎樣估計(jì)抽樣誤差的大小,這是進(jìn)行統(tǒng)計(jì)推斷必須考慮的問題。實(shí)驗(yàn)表8-1從N(165.70,3.212)抽到的100份隨機(jī)樣本的計(jì)算結(jié)果(n=20)編號(hào)均數(shù)標(biāo)準(zhǔn)差編號(hào)均數(shù)標(biāo)準(zhǔn)差編號(hào)均數(shù)標(biāo)準(zhǔn)差圖8-1重復(fù)抽樣獲得各樣本均數(shù)的分布特點(diǎn)一、樣本均數(shù)的抽樣分布與抽樣誤差1.各樣本均數(shù)未必等于總體均數(shù);2.各樣本均數(shù)之間存在差異;3.樣本均數(shù)的分布具有近似對(duì)稱性;4.樣本均數(shù)的變異范圍較之原變量的變異范圍大大縮小。鏈接4種不同總體的抽樣返回雙峰分布負(fù)指數(shù)分布三角分布均勻分布均數(shù)抽樣誤差的測(cè)算-------均數(shù)標(biāo)準(zhǔn)誤(standarderror)抽樣誤差越大,由樣本均數(shù)估計(jì)總體均數(shù)的可靠性越差。抽樣誤差越小,由樣本均數(shù)估計(jì)總體均數(shù)的可靠性越好?!纠砍槿∧车亟】党赡昴凶?7名,得到血紅蛋白量的均數(shù)為125g/L,標(biāo)準(zhǔn)差為15g/L。試估計(jì)該樣本均數(shù)的抽樣誤差?!颈?-1】中每組樣本的抽樣誤差編號(hào)均數(shù)標(biāo)準(zhǔn)差標(biāo)準(zhǔn)誤1165.823.060.3062164.983.040.3043165.753.070.307…………98165.603.070.30799165.823.140.314100165.923.180.318二、樣本頻率的抽樣分布與抽樣誤差假定一口袋中有黑白兩種球,已知黑球比例為20%(總體率π=0.2)?,F(xiàn)從口袋中任摸一球看清顏色后放回,重復(fù)摸球50次(n=50),計(jì)算摸到黑球的百分比(樣本率p)。重復(fù)這樣的實(shí)驗(yàn)100次,每次得到黑球的比例及頻數(shù)結(jié)果見表??傮w率的估計(jì)公式增加樣本含量降低率的抽樣誤差實(shí)驗(yàn)2

π=20%時(shí)的隨機(jī)抽樣結(jié)果黑球比例%頻數(shù)樣本頻率%8~22.0010~44.0012~88.0014~77.0016~1111.0018~1313.0020~1919.0022~1111.0024~1111.0026~66.0028~33.0030~44.0032~11.00合計(jì)100100.0率的抽樣誤差估計(jì)【例】某市隨機(jī)調(diào)查50歲以上中老年婦女776人,其中骨質(zhì)疏松癥者322人,樣本患病率為41.5%,試估計(jì)樣本率的抽樣誤差。標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系概念不同:標(biāo)準(zhǔn)差是描述個(gè)體值的變異程度的指標(biāo),值越小,表示變量值圍繞均數(shù)的波動(dòng)越?。粯?biāo)準(zhǔn)誤是描述樣本均數(shù)間變異度的指標(biāo),值越小,表示樣本均數(shù)圍繞總體均數(shù)波動(dòng)越小。用途不同:

當(dāng)資料呈正態(tài)分布時(shí),標(biāo)準(zhǔn)差與均數(shù)結(jié)合可估計(jì)參考值范圍,計(jì)算CV

等;標(biāo)準(zhǔn)誤可用于估計(jì)參數(shù)的置信區(qū)間,進(jìn)行假設(shè)檢驗(yàn)。標(biāo)準(zhǔn)差與標(biāo)準(zhǔn)誤的區(qū)別與聯(lián)系與樣本例數(shù)關(guān)系不同:樣本量足夠大時(shí),標(biāo)準(zhǔn)差趨向于穩(wěn)定,標(biāo)準(zhǔn)誤隨例數(shù)的增加而減小,甚至趨近于0,若樣本量趨向總例數(shù),則標(biāo)準(zhǔn)誤接近0;二者聯(lián)系:均為變異指標(biāo),若把總體中各樣本均數(shù)看作一個(gè)變量,則標(biāo)準(zhǔn)誤可稱為樣本均數(shù)的標(biāo)準(zhǔn)差,當(dāng)樣本量不變時(shí),均數(shù)的標(biāo)準(zhǔn)誤與標(biāo)準(zhǔn)差成正比。二者均可與均數(shù)結(jié)合運(yùn)用,但描述的內(nèi)容各不相同。第二節(jié)t分布(t-distribution)一、t分布的概念t分布形成t分布主要用于總體均數(shù)的區(qū)間估計(jì)和t檢驗(yàn)。二、t分布圖和特征圖8-2不同自由度v下的t分布圖t界值表t

分布曲線(ν=9)相同自由度時(shí),∣t∣值越大,概率P越小;∣t∣值越小,概率P越大;②在相同∣t∣值時(shí),同一自由度的雙側(cè)概率是單側(cè)概率的兩倍。t值與P值歸納:隨機(jī)變量XN(μ,σ2)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Z變換均數(shù)N(μ,σ2/n)標(biāo)準(zhǔn)正態(tài)分布N(0,12)Studentt分布自由度:n-1t分布的特征t分布不是一條曲線,而是一簇曲線;以0為中心,單峰分布,左右對(duì)稱;自由度ν

越小,越大,t

值越分散,曲線的峰越矮,尾部越粗;自由度ν

越大,越小,t值越集中,隨著自由度的增大,分布逐漸逼近標(biāo)準(zhǔn)正態(tài)分布,當(dāng)ν

趨近于∞時(shí),分布就完全成為標(biāo)準(zhǔn)正態(tài)分布。因此標(biāo)準(zhǔn)正態(tài)分布可以視為是分布的特例。第三節(jié)總體均數(shù)和總體率的估計(jì)參數(shù)估計(jì)(parameterestimation) 通過樣本統(tǒng)計(jì)指標(biāo)(統(tǒng)計(jì)量)來推斷總體統(tǒng)計(jì)指標(biāo)值(參數(shù))的過程。 一般分為兩大類:1.點(diǎn)估計(jì)(pointestimation)2.置信區(qū)間估計(jì)(confidenceinterval)一、置信區(qū)間的概念及計(jì)算區(qū)間估計(jì)是按預(yù)先給定的概率(1–α)所確定的包含未知總體參數(shù)的一個(gè)范圍。該范圍稱為參數(shù)的可信區(qū)間或置信區(qū)間(confidenceinterval,CI),用L~U表示,(1–α)稱為置信度,(1–α)常取95%或99%。一、總體均數(shù)的置信區(qū)間1.t分布法【例】

從大一新生中隨機(jī)抽取男生40人。男生平均身高174.5cm,標(biāo)準(zhǔn)差2.54cm。

試求大一新生中男生身高的95%和99%的置信區(qū)間。男生身高的95%的置信區(qū)間:男生身高的99%的置信區(qū)間:t界值表2.正態(tài)分布法

【例】某市2000年隨機(jī)測(cè)量90名19歲健康男大學(xué)生的身高,其均數(shù)為172.2cm,標(biāo)準(zhǔn)差為4.5cm,試估計(jì)該市2000年19歲健康男大學(xué)生平均身高的95%置信區(qū)間。本例n=90>50,Z0.05/2=1.96二、總體率的置信區(qū)間1.查表法(n≤50)【例】

醫(yī)院對(duì)39名前列腺患者實(shí)施開放手術(shù)治療,術(shù)后有合并者2人,試估計(jì)合并者發(fā)生率的95%置信區(qū)間。解:查百分率置信區(qū)間表(附表)在n=39橫行和x=2的縱列交叉處的數(shù)值為1~17。即該手術(shù)術(shù)后合并者發(fā)生率的95%可信區(qū)間為(1%,17%)。百分率置信區(qū)間【例】

假定某高校的50名男生中有5名來自西部,26人來自東部,試分別估計(jì)西部生源和東部生源比率的95%置信區(qū)間。解:查百分率置信區(qū)間表(附表)在n=50橫行和x=5的縱列交叉處的數(shù)值為2~19。即該手術(shù)術(shù)后合并者發(fā)生率的95%可信區(qū)間為(2%,19%)。同樣,在n=50橫行和x=26>n/2用x'=n-x=24查表的縱列交叉處的數(shù)值為34~63。再用100減去所查的數(shù)值,得有效率的95%置信區(qū)間為(37%,66%)。2.正態(tài)近似法總體率的1-α可信區(qū)間為:【例】從某高校大一女生中隨機(jī)抽取100名,測(cè)得體重超重率為10%。計(jì)算女生超重率的95%置信區(qū)間。解:n=100(較大),p=0.1,np=10,n(1-p)=90均大于5要求n較大,當(dāng)np和n(1-p)均大于>5時(shí),置信區(qū)間含義補(bǔ)充說明如果能進(jìn)行重復(fù)抽樣試驗(yàn),當(dāng)取α=0.05,則表明在100次抽樣中平均有95次算得的可信區(qū)間包含了總體參數(shù)。根據(jù)小概率原理,統(tǒng)計(jì)學(xué)認(rèn)為一次抽樣的結(jié)果是可信的。置信區(qū)間的兩個(gè)要素

可靠性:

反映可信度1-

的大小精確性:

用區(qū)間長(zhǎng)度U-L衡量置信區(qū)間與醫(yī)學(xué)參考值范圍的區(qū)別區(qū)別點(diǎn)置信區(qū)間參考值范圍意義按預(yù)先給定的概率,確定的未知參數(shù)的可能范圍?!罢H恕钡慕馄省⑸?、生化某項(xiàng)指標(biāo)的波動(dòng)范圍。計(jì)算公式用途估計(jì)總體均數(shù)判斷觀察對(duì)象的某項(xiàng)指標(biāo)是否正常第四節(jié)假設(shè)檢驗(yàn)基本思想及步驟1.小概率原理

小概率事件在一次隨機(jī)試驗(yàn)中幾乎是不可能發(fā)生2.假設(shè)檢驗(yàn)處理問題的特點(diǎn)⑴從全局的范圍,即從總體上對(duì)問題作出判斷⑵不可能對(duì)總體的每個(gè)個(gè)體均作觀察一、假設(shè)檢驗(yàn)基本概念及原理假設(shè)檢驗(yàn)(hypothesistest)又稱顯著性檢驗(yàn)(significancetest),是用于判斷樣本指標(biāo)與總體指標(biāo)之間,或樣本指標(biāo)與樣本指標(biāo)之間的差異有無統(tǒng)計(jì)學(xué)意義的一種統(tǒng)計(jì)方法。假設(shè)檢驗(yàn)基本思想反證法思想

首先提出假設(shè),假定某事實(shí)成立,在此基礎(chǔ)上選用適當(dāng)?shù)慕y(tǒng)計(jì)方法來估計(jì)該事實(shí)成立的概率p。如果p>α說明,該事件不是小概率事件,尚不能認(rèn)為該事實(shí)不成立;如果p≤α,說明該事件的發(fā)生屬于小概率事件,我們就有理由懷疑原假設(shè)的正確性。統(tǒng)計(jì)推斷思路總體樣本抽樣獲取統(tǒng)計(jì)量統(tǒng)計(jì)推斷參數(shù):,,PathofStatisticalinference估計(jì)探討成年男性肺炎患者與男性健康成年的血紅蛋白(g/dl)有無區(qū)別?在這兩個(gè)人群中隨機(jī)抽取各10例:組別12345678910均數(shù)肺炎11.910.910.110.29.89.910.39.39.88.910.11健康13.914.214.014.313.713.914.114.713.513.613.99肺炎人群μ1

n=10,樣本均數(shù)10.11健康人群μ2

n=10,樣本均數(shù)13.99推測(cè):1.均數(shù)的差別是本質(zhì)上的?2.均數(shù)的差別是非本質(zhì)上的?偶然的?抽樣誤差造成的?≌?二、假設(shè)檢驗(yàn)步驟【例】在某城區(qū)6所小學(xué)按概率抽樣方法抽取了400名小學(xué)生進(jìn)行視力干預(yù)方法研究。在基線調(diào)查時(shí),干預(yù)組200人,屈光度的均數(shù)為-0.34D,標(biāo)準(zhǔn)差為0.12D;對(duì)照組200人,屈光度的均數(shù)為-0.57D,標(biāo)準(zhǔn)差為0.36D。試問干預(yù)組和對(duì)照組小學(xué)生屈光度在基線時(shí)總體均數(shù)有無差別?在實(shí)際應(yīng)用中,還會(huì)遇到這樣的問題:某一樣本均數(shù)是否來自已知均數(shù)總體?假設(shè)檢驗(yàn)(hypothesistest)可以回答這類問題。在抽樣研究中,即使是隨機(jī)抽樣,觀察到的樣本均數(shù)與已知總體均數(shù)或兩樣本均數(shù)間差異也可能并不代表總體真實(shí)情況。其原因有:1.可能是總體均數(shù)不同;2.可能是總體均數(shù)相同,但差別僅僅是抽樣造成的。二、假設(shè)檢驗(yàn)步驟假設(shè)檢驗(yàn)一般步驟1.建立假設(shè)和確定檢驗(yàn)水準(zhǔn)2.選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量3.確定P值和作出推斷結(jié)論建立假設(shè)和確定檢驗(yàn)水準(zhǔn)建立假設(shè)1.推斷總體均數(shù)有無差別。不管是干預(yù)組學(xué)生的屈光度高于對(duì)照組,還是低于對(duì)照組,兩種可能性都存在,研究者都同等關(guān)心,應(yīng)當(dāng)用雙側(cè)檢驗(yàn)。2.根據(jù)專業(yè)知識(shí),已知干預(yù)后屈光度不會(huì)低于對(duì)照組,或者研究者只關(guān)心是否高于對(duì)照組,應(yīng)當(dāng)用單側(cè)檢驗(yàn)。確定檢驗(yàn)水準(zhǔn)根據(jù)小概率原則,設(shè)計(jì)一個(gè)通常在5%及以下的概率,符號(hào)為α,稱檢驗(yàn)水準(zhǔn)亦稱顯著性水準(zhǔn),在實(shí)際工作中α常取0.05。作為幫助判斷“假設(shè)”是否成立的依據(jù)。假設(shè)檢驗(yàn)的設(shè)計(jì)樣本均數(shù)(其總體均數(shù)為μ)與已知的總體均數(shù)μ0作比較:

目的H0H1

(無效假設(shè))(備擇假設(shè))雙側(cè)檢驗(yàn)是否μ≠μ0μ=μ0μ≠μ0單側(cè)檢驗(yàn)是否μ>μ0μ=μ0μ>μ0

或是否μ<μ0μ=μ0μ<μ0

兩樣本均數(shù)(其總體均數(shù)分別為μ1與μ2)作比較:

目的H0H1雙側(cè)檢驗(yàn)是否μ1≠μ2μ1=μ2μ1≠μ2單側(cè)檢驗(yàn)是否μ1>μ2μ1=μ2

μ1>μ2

或是否μ1<μ2μ1=μ2μ1<μ2

選定檢驗(yàn)方法和計(jì)算檢驗(yàn)統(tǒng)計(jì)量要根據(jù)研究設(shè)計(jì)的類型和統(tǒng)計(jì)推斷的目的選用不同的檢驗(yàn)方法。如成組設(shè)計(jì)的兩樣本均數(shù)的比較用t檢驗(yàn)(小樣本)或Z檢驗(yàn)(大樣本),兩樣本方差的比較用F檢驗(yàn)。檢驗(yàn)統(tǒng)計(jì)量是用于抉擇是否拒絕H0(無效假設(shè))的統(tǒng)計(jì)量,其統(tǒng)計(jì)分布在統(tǒng)計(jì)推斷中是至關(guān)重要的。不同的檢驗(yàn)方法要用不同的公式計(jì)算現(xiàn)有樣本的檢驗(yàn)統(tǒng)計(jì)量值。確定P值和作出推斷結(jié)論

P值是指由H0所規(guī)定的總體作隨機(jī)抽樣,獲得等于及大于(或等于及小于)現(xiàn)有樣本獲得的檢驗(yàn)統(tǒng)計(jì)量值的概率。當(dāng)求得檢驗(yàn)統(tǒng)計(jì)量的值后,一般可通過特制的統(tǒng)計(jì)用表直接查出P值。當(dāng)P≤α?xí)r,結(jié)論為按所取α檢驗(yàn)水準(zhǔn)拒絕H0,接受H1,這樣作出結(jié)論的理由是:在H0成立的條件下,出現(xiàn)等于及大于現(xiàn)有檢驗(yàn)統(tǒng)計(jì)量值的概率P≤α,是小概率事件,這在一次抽樣中是不大可能發(fā)生的,即現(xiàn)有樣本信息不支持H0因而拒絕它;相反,P>α即樣本信息支持H0,就沒有理由拒絕它,此時(shí)只好接受它。假設(shè)檢驗(yàn)操作步驟路線圖H0:μ=μ0H1:μ≠μ0α=0.05計(jì)算統(tǒng)計(jì)量確定P值做推斷結(jié)論拒絕H0,接受H1可能犯Ⅰ型錯(cuò)誤不拒絕H0,可能犯Ⅱ型錯(cuò)誤第五節(jié)假設(shè)檢驗(yàn)的兩類錯(cuò)誤

須知:拒絕H0不能認(rèn)為H0肯定不成立,因?yàn)樵贖0成立的條件下,出現(xiàn)現(xiàn)有檢驗(yàn)統(tǒng)計(jì)量值及更極端情況的概率雖小,但仍有可能出現(xiàn),只是可能性很小而已;同理,不拒絕H0,也不能認(rèn)為H0肯定成立。因?yàn)榧僭O(shè)檢驗(yàn)時(shí),必須對(duì)被檢驗(yàn)的假設(shè)作出明確判斷,只能從“拒絕”或“不拒絕”中選擇一個(gè)較為合理的決定。當(dāng)原假設(shè)客觀上是“真”,由于抽樣的偶然性得到一個(gè)較小的P而拒絕原假設(shè),稱為第一類錯(cuò)誤(或Ⅰ型錯(cuò)誤)。

(如無病說成有?。ㄕ`診)、假陽性、無效夸為有效等)當(dāng)原假設(shè)客觀上是“偽”,也由于抽樣的偶然性得到一個(gè)較大的P而不拒絕原假設(shè),稱為第二類錯(cuò)誤(或Ⅱ

型錯(cuò)誤)。(如有病說成無?。┰\)、假陰性、有效認(rèn)為無效等)推斷結(jié)論和兩類錯(cuò)誤客觀實(shí)際假設(shè)檢驗(yàn)結(jié)果拒絕H0不拒絕H0H0成立Ⅰ型錯(cuò)誤(α)推斷正確(1-α)H0不成立推斷正確(1-β)Ⅱ型錯(cuò)誤(β)Ⅰ型錯(cuò)誤(typeⅠerror):拒絕了實(shí)際上成立的H0Ⅱ型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論