醫(yī)學(xué)統(tǒng)計(jì)學(xué)第講抽樣誤差與分布_第1頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第講抽樣誤差與分布_第2頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第講抽樣誤差與分布_第3頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第講抽樣誤差與分布_第4頁(yè)
醫(yī)學(xué)統(tǒng)計(jì)學(xué)第講抽樣誤差與分布_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第三章

抽樣誤差與t分布如:總體均數(shù)總體標(biāo)準(zhǔn)差

如:樣本均數(shù)樣本標(biāo)準(zhǔn)差S

總體樣本抽取部分觀察單位

統(tǒng)計(jì)量參數(shù)

統(tǒng)計(jì)推斷統(tǒng)計(jì)推斷在醫(yī)療衛(wèi)生實(shí)踐和醫(yī)學(xué)研究中,往往難以對(duì)所要研究的總體進(jìn)行全部觀察,通常從總體中隨機(jī)抽取樣本進(jìn)行觀察,然后由樣本的信息去推斷總體特征,這種研究方法叫做抽樣研究方法。用樣本的信息去推斷總體特征,這種分析方法稱為統(tǒng)計(jì)推斷?;臼侄沃苯油茢啵▍?shù)估計(jì))間接推斷(假設(shè)檢驗(yàn))總體參數(shù)的估計(jì)均數(shù)的抽樣誤差t分布總體均數(shù)的估計(jì)抽樣誤差的定義假如事先知道某地七歲男童的平均身高為119.41cm。為了估計(jì)七歲男童的平均身高(總體均數(shù)),研究者從所有符合要求的七歲男童中每次抽取100人,共計(jì)抽取了三次。μ=119.41cmσ=4.38cm三次抽樣得到了不同的結(jié)果!?。?!原因何在????如果沒有個(gè)體變異……NoVariation!NoSamplingError!NoRandomsampling!NoSamplingError!如果沒有抽樣研究……三次抽樣得到了不同的結(jié)果,原因何在?個(gè)體變異隨機(jī)抽樣不同男童的身高不同每次抽到的人幾乎不同抽樣誤差【定義】由于個(gè)體變異的存在,在抽樣研究中產(chǎn)生樣本統(tǒng)計(jì)量和總體參數(shù)之間的差異,稱為抽樣誤差(samplingerror)。各種參數(shù)估計(jì)都有抽樣誤差,這里我們以均數(shù)為研究對(duì)象抽樣誤誤差產(chǎn)產(chǎn)生的的條件件抽樣研研究個(gè)體變變異抽樣誤差的表現(xiàn)樣本均數(shù)和總體均數(shù)間的差別樣本均數(shù)和樣本均數(shù)間的差別抽樣誤誤差是是不可可避免免的,,可以以通過過保證證總體體的同同質(zhì)性性及增增大樣樣本含含量來來縮小小抽樣樣誤差差。從正態(tài)分分布總總體N(5.00,0.502)中,每每次隨隨機(jī)抽抽取樣樣本含含量n=5,并計(jì)計(jì)算其其均數(shù)數(shù)與標(biāo)標(biāo)準(zhǔn)差差;重重復(fù)抽抽取1000次次,獲獲得1000份份樣本本;計(jì)計(jì)算1000份份樣本本的均均數(shù)與與標(biāo)準(zhǔn)準(zhǔn)差,,并對(duì)對(duì)1000份樣樣本的的均數(shù)數(shù)作直直方圖圖。按上述述方法法再做做樣本本含量量n=10、樣本本含量量n=30的抽樣樣實(shí)驗(yàn)驗(yàn);比比較計(jì)計(jì)算結(jié)結(jié)果。。抽樣誤誤差的的規(guī)律律性——正態(tài)分分布抽抽樣抽樣試試驗(yàn)((n=5))抽樣試試驗(yàn)((n=10)抽樣試試驗(yàn)((n=30)1000份份樣本本抽樣樣計(jì)算算結(jié)果果總體的均數(shù)總體標(biāo)準(zhǔn)差s均數(shù)的均數(shù)均數(shù)標(biāo)準(zhǔn)差n=55.000.504.990.22120.2236n=105.000.505.000.15800.1581n=305.000.505.000.09200.09133個(gè)抽抽樣實(shí)實(shí)驗(yàn)結(jié)結(jié)果圖圖示非正態(tài)態(tài)分布布抽樣樣分別從從各總總體中中抽取取10000個(gè)個(gè)樣本本含量量為n的樣本本,計(jì)計(jì)算每每個(gè)樣樣本的的均數(shù)數(shù),并并繪制制頻數(shù)數(shù)分布布圖。。n分別取取2、、4、、10、25。。偏三角角分布布抽樣樣

均勻分分布指數(shù)分分布雙峰分分布從正態(tài)態(tài)總體體中隨隨機(jī)抽抽樣,,其樣樣本均均數(shù)服服從正正態(tài)分分布;;從任意意總體體中隨隨機(jī)抽抽樣,,當(dāng)樣樣本含含量足足夠大大時(shí),,其樣樣本均均數(shù)的的分布布逐漸漸逼近近正態(tài)態(tài)分布布;樣本均均數(shù)之之均數(shù)數(shù)的位位置始始終在在總體體均數(shù)數(shù)的附附近;;隨著樣樣本含含量的的增加加,樣樣本均均數(shù)的的離散散程度度越來來越小小,表表現(xiàn)為為樣本本均數(shù)數(shù)的分分布范范圍越越來越越窄,,其高高峰越越來越越尖。。中心極極限定定理從正態(tài)總體中隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù)x也服從正態(tài)分布,即使從偏態(tài)總體中抽樣,只要樣本例數(shù)足夠大,如n>50,樣本均數(shù)x也近似正態(tài)分布。從均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)總體中隨機(jī)抽取例數(shù)為n的樣本,樣本均數(shù)的總體均數(shù)為,標(biāo)準(zhǔn)差為x中心極極限定定理標(biāo)準(zhǔn)誤誤的定定義樣本統(tǒng)統(tǒng)計(jì)量量(如如均數(shù)數(shù))也也服從從一定定的分分布。。與描述述觀測(cè)測(cè)值離離散趨趨勢(shì)的的指標(biāo)標(biāo)類似似,樣樣本統(tǒng)統(tǒng)計(jì)量量的標(biāo)標(biāo)準(zhǔn)差差就反反映了了從某某個(gè)總總體中中隨機(jī)機(jī)抽樣樣所得得樣本本之均均數(shù)分分布的的離散散程度度。用樣本統(tǒng)統(tǒng)計(jì)量量的標(biāo)標(biāo)準(zhǔn)差差來反映映抽樣樣誤差差的大大小。。又稱稱標(biāo)準(zhǔn)誤誤(standarderror)。。x標(biāo)準(zhǔn)誤誤x=/nsx=s/n標(biāo)準(zhǔn)誤誤的意意義反映了了樣本本統(tǒng)計(jì)計(jì)量((樣本本均數(shù)數(shù),樣樣本率率)分分布的的離散散程度度,體體現(xiàn)了了抽樣樣誤差差的大大小。。標(biāo)準(zhǔn)誤誤越大大,說說明樣樣本統(tǒng)統(tǒng)計(jì)量量(樣樣本均均數(shù),,樣本本率))的離離散程程度越越大,,即用用樣本本統(tǒng)計(jì)計(jì)量來來直接接估計(jì)計(jì)總體體參數(shù)數(shù)越不不可靠靠。反反之亦亦然。。標(biāo)準(zhǔn)誤誤的大大小與與標(biāo)準(zhǔn)準(zhǔn)差有有關(guān),,在例例數(shù)n一定時(shí)時(shí),從從標(biāo)準(zhǔn)準(zhǔn)差大大的總總體中中抽樣樣,標(biāo)標(biāo)準(zhǔn)誤誤較大大;而而當(dāng)總總體一一定時(shí)時(shí),樣樣本例例數(shù)越越多,,標(biāo)準(zhǔn)準(zhǔn)誤越越小。。說明明我們們可以以通過過增加加樣本本含量量來減減少抽抽樣誤誤差的的大小小。用途途::(1)衡衡量量樣樣本本均均值值的的可可靠靠性性(2)估估計(jì)計(jì)總總體體均均值值的的可可信信區(qū)區(qū)間間(3)用用于于均均數(shù)數(shù)的的假假設(shè)設(shè)檢檢驗(yàn)驗(yàn)t分布布隨機(jī)機(jī)變變量量XN(m,s2)標(biāo)準(zhǔn)準(zhǔn)正正態(tài)態(tài)分分布布N(0,12)u變換換標(biāo)準(zhǔn)準(zhǔn)正正態(tài)態(tài)分分布布N(0,12)均數(shù)Studentt分布布自由由度度ν=n-1t變換換由W.S.Gosset提出出t=x-s/n對(duì)于于不不同同的的n,有有不不同同的的t分分布布曲曲線線。。(n-1))稱為為t分分布布的的自自由由度度

f(t)

=∞(標(biāo)準(zhǔn)正態(tài)曲線)

=5

=10.10.2-4-3-2-1012340.3自由由度度分分別別為為1、、5、、∞時(shí)時(shí)的的t分布布t分布布的的特特征征::①t分分布布為為一一簇簇單單峰峰分分布布曲曲線線。。②t分分布布以以0為為中中心心,,左左右右對(duì)對(duì)稱稱。。③t分分布布與與自自由由度度νν有有關(guān)關(guān),,自自由由度度越越小小,,t分分布布的的峰峰越越低低,,而而兩兩尾尾越越高高;;自自由由度度逐逐漸漸增增大大時(shí)時(shí),,t分分布布逐逐漸漸逼逼近近標(biāo)標(biāo)準(zhǔn)準(zhǔn)正正態(tài)態(tài)分分布布;;當(dāng)當(dāng)自自由由度度為為無無窮窮大大時(shí)時(shí),,t分分布布就就是是標(biāo)標(biāo)準(zhǔn)準(zhǔn)正正態(tài)態(tài)分分布布。。t分布布曲曲線線下下面面積積規(guī)規(guī)律律t分布布曲曲線線下下總總面面積積仍仍為為1或或100%t分布布曲曲線線下下面面積積以以0為為中中心心左左右右對(duì)對(duì)稱稱由于于t分布布是是一一簇簇曲曲線線,,故故t分布布曲曲線線下下面面積積固固定定面面積積(如如95%或或99%)的的界界值值不不是是一一個(gè)個(gè)常常量量,,而而是是隨隨自自由由度度的的大大小小而而變變化化其通通式式為為單側(cè)側(cè)::P(t≤≤-t,)=或P(t≥≥t,)=雙側(cè)側(cè)::P(t≤≤-t/2,)+P(t≥≥t/2,)=圖中中非非陰陰影影部部分分面面積積的的概概率率為為,,P(-t/2,<t<t/2,)=1-t分布布的的界界值值t,檢驗(yàn)驗(yàn)水水準(zhǔn)準(zhǔn)(尾尾端端概概率率)自由由度度在t檢驗(yàn)中很重要t界界值值表表橫標(biāo)標(biāo)目目::自自由由度度,,υ縱標(biāo)標(biāo)目目::尾尾端端概概率率,,p,即即曲曲線線下下陰陰影影部部分分的的面面積積;表中中的的數(shù)數(shù)字字::相相應(yīng)應(yīng)的的|t|界界值值。。附表表2,,t分布布表表的的特特點(diǎn)點(diǎn)附表表2的的橫橫標(biāo)標(biāo)目目為為自自由由度度,縱縱標(biāo)標(biāo)目目為為概概率率P,表表中中數(shù)數(shù)值值為為其其相相應(yīng)應(yīng)的的t界值值,,記記作作t,。附表表2只只列列出出正正值值,,若若計(jì)計(jì)算算的的t值為為負(fù)負(fù)值值時(shí)時(shí),,可可用用其其絕絕對(duì)對(duì)值值查查表表。。附表表2右右上上附附圖圖的的陰陰影影部部分分表表示示t,以外外尾尾部部面面積積的的概概率率。。單側(cè)側(cè)t0.05,30=1.697,表示示νν=30時(shí)時(shí),,t≥≥1.697的的概概率率或或t≤≤-1.697的的概概率率為為0.05,,記記作作P(t≤≤-1.697)=0.05或或P(t≥≥1.697)=0.05;;雙側(cè)側(cè)t0.05,30=2.042,表示示νν=30時(shí)時(shí),,t≥≥2.042的的概概率率和和t≤≤-2.042的的概概率率之之和和為為0.05,,記記作作P(t≤≤-2.042)+P(t≥≥2.042)=0.05圖中中非非陰陰影影部部分分面面積積的的概概率率為為::P(-α/2,νν<t<tα/2,νν)=1-αα從附表表2中中還可可以看看出,,雙側(cè)側(cè)概率率P為為單側(cè)側(cè)概率率的兩兩倍,,如

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論