抽樣誤差與抽樣分布_第1頁(yè)
抽樣誤差與抽樣分布_第2頁(yè)
抽樣誤差與抽樣分布_第3頁(yè)
抽樣誤差與抽樣分布_第4頁(yè)
抽樣誤差與抽樣分布_第5頁(yè)
已閱讀5頁(yè),還剩40頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣誤差與抽樣分布1第1頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣誤差從脈搏總體均數(shù)為72.5次,標(biāo)準(zhǔn)差為6.3次的正態(tài)分布總體中隨機(jī)抽樣。樣本個(gè)數(shù)為10,樣本量為9.n=10…

….2第2頁(yè),共45頁(yè),2023年,2月20日,星期五例4-1樣本量為9,從N(72.5,6.32)中共隨機(jī)抽取10個(gè)樣本3第3頁(yè),共45頁(yè),2023年,2月20日,星期五計(jì)算樣本均數(shù)的均數(shù):計(jì)算樣本均數(shù)的標(biāo)準(zhǔn)差:4第4頁(yè),共45頁(yè),2023年,2月20日,星期五例4-2P51隨機(jī)重復(fù)抽樣共抽10個(gè)樣本,樣本量為25。計(jì)算樣本均數(shù)的均數(shù)和標(biāo)準(zhǔn)差.5第5頁(yè),共45頁(yè),2023年,2月20日,星期五表4-2樣本量為25從N(72.5,6.32)共隨機(jī)抽取10個(gè)樣本6第6頁(yè),共45頁(yè),2023年,2月20日,星期五7第7頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣誤差結(jié)果:各樣本均數(shù)不一定等于總體均數(shù)樣本均數(shù)間存在差異樣本均數(shù)的分布規(guī)律:圍繞總體均數(shù)上下波動(dòng)樣本均數(shù)的變異:由樣本均數(shù)的標(biāo)準(zhǔn)差描述,樣本均數(shù)的波動(dòng)幅度遠(yuǎn)小于原始資料的波動(dòng)幅度抽樣誤差基本上在0附近近似對(duì)稱地隨機(jī)波動(dòng)在同一總體進(jìn)行隨機(jī)抽樣,隨著樣本例數(shù)的增加,樣本均數(shù)的波動(dòng)幅度在減小。8第8頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣誤差抽樣誤差Samplingerror由抽樣引起的樣本統(tǒng)計(jì)量與總體參數(shù)間的差異來(lái)源:個(gè)體變異抽樣表現(xiàn)樣本統(tǒng)計(jì)量與總體參數(shù)間的差異樣本統(tǒng)計(jì)量間的差異9第9頁(yè),共45頁(yè),2023年,2月20日,星期五樣本均數(shù)的規(guī)律性隨機(jī)的在概率意義下是有規(guī)律的---抽樣分布通過(guò)大量重復(fù)抽樣,借助頻數(shù)表描述樣本均數(shù)的變異規(guī)律(抽樣分布)與個(gè)體觀察值變異規(guī)律有關(guān)即使只有一個(gè)樣本資料,也可由樣本資料的個(gè)體觀察值的變異規(guī)律間接得到樣本均數(shù)的變異規(guī)律抽樣分布10第10頁(yè),共45頁(yè),2023年,2月20日,星期五正態(tài)總體樣本均數(shù)的分布例4-3按樣本量為9和樣本量為25在上述總體中N(72.5,6.3)進(jìn)行隨機(jī)抽樣每次抽取10000個(gè)樣本并計(jì)算各自的樣本均數(shù)以10000個(gè)樣本均數(shù)作為一個(gè)新的樣本制作頻率密度分布圖11第11頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣1樣本含量n=9

的平均數(shù)=72.54

的標(biāo)準(zhǔn)差=2.14樣本均數(shù)的分布原始資料的分布理論值12第12頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣2樣本含量n=25

的平均數(shù)=72.50

的標(biāo)準(zhǔn)差=1.27理論值13第13頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣3樣本含量n=36

的平均數(shù)=72.50

的標(biāo)準(zhǔn)差=1.06

理論值14第14頁(yè),共45頁(yè),2023年,2月20日,星期五從正態(tài)分布的總體中隨機(jī)抽取樣本含量為n的樣本X1,X2,…,Xn,其樣本均數(shù)服從正態(tài)分布,總體均數(shù)為;樣本均數(shù)的總體標(biāo)準(zhǔn)差若,則其中任意一個(gè)隨機(jī)樣本Xn的均數(shù)正態(tài)總體樣本均數(shù)的分布15第15頁(yè),共45頁(yè),2023年,2月20日,星期五樣本均數(shù)的標(biāo)準(zhǔn)差,稱為樣本均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SE),簡(jiǎn)稱均數(shù)標(biāo)準(zhǔn)誤它反映樣本均數(shù)之間的離散程度,也反映樣本均數(shù)抽樣誤差的大小。誤差大小,實(shí)質(zhì)是要估計(jì)的分布特征正態(tài)總體樣本均數(shù)的分布16第16頁(yè),共45頁(yè),2023年,2月20日,星期五由于實(shí)際往往未知,需要用樣本來(lái)估計(jì),樣本均數(shù)標(biāo)準(zhǔn)誤的估計(jì)式為注意區(qū)別:證明:正態(tài)總體樣本均數(shù)的分布17第17頁(yè),共45頁(yè),2023年,2月20日,星期五非正態(tài)總體樣本均數(shù)的分布例4-4從總體均數(shù)為1,總體方差為2的卡方分布中抽樣,樣本大小分別為4,9,200。每次抽10000個(gè)樣本制作頻率密度分布圖18第18頁(yè),共45頁(yè),2023年,2月20日,星期五19第19頁(yè),共45頁(yè),2023年,2月20日,星期五樣本含量n=4

的平均數(shù)=

1.0111

的標(biāo)準(zhǔn)差=0.7084

的中位數(shù)=0.853120第20頁(yè),共45頁(yè),2023年,2月20日,星期五樣本含量n=9

的平均數(shù)=1.0078

的標(biāo)準(zhǔn)差=0.4771

的中位數(shù)=0.928021第21頁(yè),共45頁(yè),2023年,2月20日,星期五樣本含量n=200

的平均數(shù)=1.0078

的標(biāo)準(zhǔn)差=0.1004

的中位數(shù)=0.997322第22頁(yè),共45頁(yè),2023年,2月20日,星期五從非正態(tài)卡方分布總體中隨機(jī)抽樣所得樣本均數(shù):在樣本含量較小時(shí)呈偏態(tài)樣本含量較大時(shí)接近正態(tài)分布均數(shù)始終在總體均數(shù)附近均數(shù)的標(biāo)準(zhǔn)差非正態(tài)總體樣本均數(shù)的分布23第23頁(yè),共45頁(yè),2023年,2月20日,星期五中心極限定理及其應(yīng)用樣本均數(shù)總體標(biāo)準(zhǔn)差是個(gè)體資料X的總體標(biāo)準(zhǔn)差的;即理論標(biāo)準(zhǔn)誤理論標(biāo)準(zhǔn)誤的樣本估計(jì)值為樣本均數(shù)與個(gè)體資料X的集中位置相同,即樣本均數(shù)的總體均數(shù)與個(gè)體資料X的總體均數(shù)相同24第24頁(yè),共45頁(yè),2023年,2月20日,星期五中心極限定理及其應(yīng)用若個(gè)體資料X服從正態(tài)總體,則樣本均數(shù)也服從正態(tài)分布;個(gè)體資料X服從偏態(tài)分布,當(dāng)樣本量n較大時(shí),樣本均數(shù)近似服從正態(tài)分布25第25頁(yè),共45頁(yè),2023年,2月20日,星期五

例4-5大規(guī)模普查得某地健康成年男子血紅蛋白總體均數(shù)為.隨機(jī)抽樣,樣本量為100,,理論標(biāo)準(zhǔn)誤和樣本均數(shù)的估計(jì)標(biāo)準(zhǔn)誤。26第26頁(yè),共45頁(yè),2023年,2月20日,星期五二、率的抽樣誤差和抽樣分布總體率由樣本率估計(jì)例如,設(shè)樣本的個(gè)體數(shù)(即樣本含量)為n,若x為樣本的某指標(biāo)陽(yáng)性個(gè)體數(shù),則可用樣本陽(yáng)性率估計(jì)研究人群的陽(yáng)性率(總體陽(yáng)性率);由于個(gè)體差異和偶然性的影響,樣本率也存在抽樣誤差---由抽樣造成樣本率與總體率(研究人群的率)的差異樣本率是隨機(jī)的,但在概率意義下也是有規(guī)律的---樣本率的分布。27第27頁(yè),共45頁(yè),2023年,2月20日,星期五隨機(jī)抽樣試驗(yàn),分別在總體率=0.25,0.5,的總體中隨機(jī)抽樣,其總體率和樣本含量n每種情況分別隨機(jī)抽10000個(gè)樣本,每個(gè)樣本計(jì)算其樣本率,把同一種情況的10000個(gè)樣本率視為一個(gè)新的樣本資料作頻率圖樣本率的分布28第28頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣129第29頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣130第30頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣331第31頁(yè),共45頁(yè),2023年,2月20日,星期五抽樣432第32頁(yè),共45頁(yè),2023年,2月20日,星期五33第33頁(yè),共45頁(yè),2023年,2月20日,星期五34第34頁(yè),共45頁(yè),2023年,2月20日,星期五結(jié)果總體率相同時(shí),樣本含量越大,樣本率的分布越趨向?qū)ΨQ。樣本含量n相同時(shí),越偏離0.5,樣本率的分布越偏態(tài)分布??傮w率=0.5時(shí),任意樣本含量的樣本率都呈對(duì)稱分布。樣本率p的樣本標(biāo)準(zhǔn)差。樣本率的分布35第35頁(yè),共45頁(yè),2023年,2月20日,星期五中心極限定理及其推論若樣本中的個(gè)體個(gè)數(shù)(即樣本含量)為n,總體率為,樣本率為p,則樣本率的總體均數(shù)等于總體率樣本率的總體標(biāo)準(zhǔn)差(即率的標(biāo)準(zhǔn)誤)

由于總體率通常是未知的,因而用樣本率p來(lái)估計(jì),故率的標(biāo)準(zhǔn)誤的估計(jì)值常表示為36第36頁(yè),共45頁(yè),2023年,2月20日,星期五對(duì)于大量重復(fù)隨機(jī)抽樣而言,樣本率p圍繞著總體率波動(dòng)樣本含量n越大,這種波動(dòng)越小。當(dāng)n的值充分大時(shí),p的分布就近似于均數(shù)為,標(biāo)準(zhǔn)差為的正態(tài)分布。這里樣本含量n“充分大”指、且n>40。當(dāng)總體率=0.5時(shí),則樣本率p的分布為對(duì)稱分布當(dāng)樣本含量n為定值時(shí),總體率越接近0.5,樣本率p近似正態(tài)分布的程度就越好中心極限定理及其推論37第37頁(yè),共45頁(yè),2023年,2月20日,星期五STATA命令模擬各種分布模擬正態(tài)分布的樣本均數(shù)分布

Simumean樣本量均數(shù)標(biāo)準(zhǔn)差模擬類似卡方分布的均數(shù)分布

Simuchis樣本量均數(shù)模擬指數(shù)分布的均數(shù)分布

Simuexp樣本量均數(shù)38第38頁(yè),共45頁(yè),2023年,2月20日,星期五t分布,標(biāo)準(zhǔn)正態(tài)分布與t統(tǒng)計(jì)量實(shí)際研究中未知,用樣本的標(biāo)準(zhǔn)差S作為的一個(gè)近似值(估計(jì)值)代替,得到變換后的統(tǒng)計(jì)量并記為39第39頁(yè),共45頁(yè),2023年,2月20日,星期五如在正態(tài)總體N(168.18,62)中隨機(jī)抽樣,樣本量分別取n=5,n=100,均抽10000個(gè)樣本,分別計(jì)算t值和U值并作相應(yīng)t的頻數(shù)圖t分布40第40頁(yè),共45頁(yè),2023年,2月20日,星期五t分布樣本含量n=5樣本含量n=100t統(tǒng)計(jì)量的頻率密度圖

41第41頁(yè),共45頁(yè),2023年,2月20日,星期五結(jié)果小樣本時(shí),t統(tǒng)計(jì)量和U統(tǒng)計(jì)量的分布有明顯差別大樣本時(shí),t統(tǒng)計(jì)量和U統(tǒng)計(jì)量的分布非常接近。頻率密度圖當(dāng)樣本量較大時(shí),統(tǒng)計(jì)量t的頻率密度圖與標(biāo)準(zhǔn)正態(tài)分布曲線非常接近樣本含量較小時(shí),t統(tǒng)計(jì)量的峰值比標(biāo)準(zhǔn)正態(tài)分布的峰值略小,雙側(cè)尾部的值則較標(biāo)準(zhǔn)正態(tài)分布略大t分布42第42頁(yè),共45頁(yè),2023年,2月20日,星期五英國(guó)統(tǒng)計(jì)學(xué)家W.S.Gosset(1908)設(shè)并給出了統(tǒng)計(jì)量t的分布規(guī)律,并稱統(tǒng)計(jì)量t的分布規(guī)律為t分布,自由度為v,記為t(v)分布。每個(gè)自由度v對(duì)應(yīng)一個(gè)分布,因此t分布是

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論