均數(shù)抽樣誤差與參數(shù)估計詳解演示文稿_第1頁
均數(shù)抽樣誤差與參數(shù)估計詳解演示文稿_第2頁
均數(shù)抽樣誤差與參數(shù)估計詳解演示文稿_第3頁
均數(shù)抽樣誤差與參數(shù)估計詳解演示文稿_第4頁
均數(shù)抽樣誤差與參數(shù)估計詳解演示文稿_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

均數(shù)抽樣誤差與參數(shù)估計詳解演示文稿當(dāng)前1頁,總共58頁。優(yōu)選均數(shù)抽樣誤差與參數(shù)估計當(dāng)前2頁,總共58頁?;靖拍睿◤?fù)習(xí))概率:描述隨機事件發(fā)生可能性大小的一個度量。正態(tài)分布

;標(biāo)準(zhǔn)正態(tài)分布抽樣研究(samplingstudy):用樣本信息推斷總體特征的研究方法。統(tǒng)計推斷(statisticalinference):即如何抽樣以及如何用樣本信息推斷總體特征。包括總體參數(shù)估計和假設(shè)檢驗。3當(dāng)前3頁,總共58頁。抽樣研究:樣本信息總體特征統(tǒng)計推斷:總體參數(shù)的估計假設(shè)檢驗4當(dāng)前4頁,總共58頁。抽樣誤差(samplingerror):由于個體變異的存在,抽樣研究所造成的樣本統(tǒng)計量與總體參數(shù)之間的差異或各樣本統(tǒng)計量之間的差異,稱為抽樣誤差。抽樣誤差產(chǎn)生的兩個前提條件:

①個體變異;②抽樣研究抽樣誤差的大小與兩個因素有關(guān):①總體中個體變異的程度;②抽樣時的樣本含量大小抽樣誤差在抽樣研究中是不可避免的,但只要嚴(yán)格遵循隨機化抽樣的原則,就能估計抽樣誤差的大小。5當(dāng)前5頁,總共58頁。由于變異的存在,抽樣研究所造成的樣本均數(shù)與總體均數(shù)的差異,以及各樣本均數(shù)間的差異稱為均數(shù)的抽樣誤差。抽樣誤差在抽樣研究中是不可避免的,但只要嚴(yán)格遵循隨機化抽樣的原則,就能估計抽樣誤差的大小。第一節(jié)均數(shù)的抽樣誤差和總體均數(shù)的估計6當(dāng)前6頁,總共58頁。抽樣實驗假設(shè)某市16歲女中學(xué)生的身高值分布服從均數(shù)=155.4cm,標(biāo)準(zhǔn)差=5.3cm的正態(tài)分布,即x~N(155.4,5.32)。

從該總體中以樣本含量n反復(fù)進行抽樣(如抽10000個樣本),分別計算樣本均數(shù),編制頻數(shù)表,繪制直方圖,觀察樣本均數(shù)的分布。7當(dāng)前7頁,總共58頁。從正態(tài)總體N(155.4,5.32)中以樣本量n=10抽樣10000次

8當(dāng)前8頁,總共58頁。從正態(tài)總體N(155.4,5.32)中以樣本量n=20抽樣10000次9當(dāng)前9頁,總共58頁。從正態(tài)總體N(155.4,5.32)中以樣本量n=30抽樣10000次10當(dāng)前10頁,總共58頁。從正態(tài)總體N(155.4,5.32)中以樣本量n=50抽樣10000次11當(dāng)前11頁,總共58頁。從正態(tài)總體N(155.4,5.32)中以樣本量n=100抽樣10000次12當(dāng)前12頁,總共58頁。抽樣實驗結(jié)果——樣本量不同時,樣本均數(shù)的分布13當(dāng)前13頁,總共58頁。抽樣實驗結(jié)果——樣本量不同時,樣本均數(shù)的標(biāo)準(zhǔn)差14當(dāng)前14頁,總共58頁。抽樣實驗結(jié)果——

總體標(biāo)準(zhǔn)差不同時,樣本均數(shù)的分布15當(dāng)前15頁,總共58頁。抽樣實驗結(jié)果——總體標(biāo)準(zhǔn)差不同時,樣本均數(shù)的標(biāo)準(zhǔn)差16當(dāng)前16頁,總共58頁。樣本均數(shù)的抽樣分布(samplingdistribution)具有如下特點::17①各樣本均數(shù)未必等于總體均數(shù);②各樣本均數(shù)間存在差異;③樣本均數(shù)的分布圍繞著總體均數(shù),中間多兩邊少,左右基本對稱,近似服從正態(tài)分布;④樣本均數(shù)的變異范圍較之原變量的變異范圍小;⑤隨著樣本含量的增大,樣本均數(shù)的變異范圍逐漸縮小。當(dāng)前17頁,總共58頁。理論上可以證明,從正態(tài)分布總體中以固定n抽樣時,樣本均數(shù)的分布仍服從正態(tài)分布。

當(dāng)樣本含量n足夠大時,即使從偏態(tài)分布總體中以固定n抽樣,其樣本均數(shù)的分布也近似服從正態(tài)分布。18當(dāng)前18頁,總共58頁。非正態(tài)總體(正偏態(tài))抽樣樣本均數(shù)的分布19當(dāng)前19頁,總共58頁。非正態(tài)總體(正偏態(tài))抽樣樣本均數(shù)的分布20當(dāng)前20頁,總共58頁。均數(shù)的標(biāo)準(zhǔn)誤樣本均數(shù)的標(biāo)準(zhǔn)差(記為),反映的是樣本均數(shù)與其總體均數(shù)之間的離散程度,即的大小,所以可將其作為描述均數(shù)抽樣誤差大小的指標(biāo)。計算如下:(理論值)(估計值)21通常,將樣本統(tǒng)計量的標(biāo)準(zhǔn)差稱為標(biāo)準(zhǔn)誤(standarderror,SE)。樣本均數(shù)的標(biāo)準(zhǔn)差也稱均數(shù)的標(biāo)準(zhǔn)誤(standarderrorofmean,SEM)

。當(dāng)前21頁,總共58頁。標(biāo)準(zhǔn)誤小,表示抽樣誤差小,樣本均數(shù)的代表性好;反之,標(biāo)準(zhǔn)誤大,表示抽樣誤差大,樣本均數(shù)的代表性差。在實際工作中,可通過適當(dāng)增加樣本含量和減少觀察值的離散程度(選擇同質(zhì)性較好的樣本)來減少抽樣誤差。標(biāo)準(zhǔn)誤的意義:22當(dāng)前22頁,總共58頁。23當(dāng)前23頁,總共58頁。0t分布一簇曲線0N(0,1)n足夠大時,(1)(2)(3)以固定n隨機抽樣24英國統(tǒng)計學(xué)家Gosset當(dāng)前24頁,總共58頁。均數(shù)的抽樣分布——t分布25當(dāng)前25頁,總共58頁。t分布是一種連續(xù)性分布,主要用于t檢驗和總體均數(shù)估計等問題。26當(dāng)前26頁,總共58頁。=3t分布曲線27當(dāng)前27頁,總共58頁。t-distributionstandardnormaldistributiont分布的特征為:1.以0為中心,左右對稱的單峰分布。2.t分布曲線形態(tài)變化與自由度的大小有關(guān)。自由度越小,t值越分散,曲線越低平;自由度逐漸增大時,則分布逐漸逼近正態(tài)分布(標(biāo)準(zhǔn)正態(tài)分布)。當(dāng)自由度趨于無窮大時,t分布即為u分布。28當(dāng)前28頁,總共58頁。t分布與標(biāo)準(zhǔn)正態(tài)分布29當(dāng)前29頁,總共58頁。t分布與標(biāo)準(zhǔn)正態(tài)分布30當(dāng)前30頁,總共58頁。t分布與標(biāo)準(zhǔn)正態(tài)分布31當(dāng)前31頁,總共58頁。t分布與標(biāo)準(zhǔn)正態(tài)分布32當(dāng)前32頁,總共58頁。t分布與標(biāo)準(zhǔn)正態(tài)分布33當(dāng)前33頁,總共58頁。t分布與標(biāo)準(zhǔn)正態(tài)分布34當(dāng)前34頁,總共58頁。t分布與標(biāo)準(zhǔn)正態(tài)分布35當(dāng)前35頁,總共58頁。36當(dāng)前36頁,總共58頁。t分布的分位數(shù)(雙側(cè)t界值)/2/21-t/2,-t/2,37當(dāng)前37頁,總共58頁。1-t,t分布的分位數(shù)(單側(cè)t界值)38當(dāng)前38頁,總共58頁。-tt039當(dāng)前39頁,總共58頁。三、總體均數(shù)的估計(一)點估計(pointestimation)(二)區(qū)間估計(intervalestimation)

按照一定的概率估計總體參數(shù)可能所在的一個范圍,稱為區(qū)間估計。概率——可信度,通常取95%或99%。所估計的總體參數(shù)的范圍——可信區(qū)間(confidenceinterval)40當(dāng)前40頁,總共58頁。總體均數(shù)的區(qū)間估計1、當(dāng)未知且n較小時,由于服從t分布,可按t分布原理估計總體均數(shù)的可信區(qū)間。由于即故總體均數(shù)(1-)100%的可信區(qū)間為41當(dāng)前41頁,總共58頁??傮w均數(shù)的區(qū)間估計2、當(dāng)未知但n足夠大時(n>100),t分布近似u分布,可以u界值代替t界值,估計總體均數(shù)的可信區(qū)間。3、當(dāng)已知時,可按正態(tài)分布的原理,估計總體均數(shù)的可信區(qū)間。42當(dāng)前42頁,總共58頁。例3

某地抽取正常成年人200名,測得其血清膽固醇的均數(shù)為3.64

mmol/L,標(biāo)準(zhǔn)差為1.20mmol/L,估計該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間。

故該地正常成年人血清膽固醇均數(shù)的95%可信區(qū)間為(3.47,3.81)mmolL。43當(dāng)前43頁,總共58頁。四、可信區(qū)間的確切涵義44當(dāng)前44頁,總共58頁。

1.95%的可信區(qū)間的理解:(1)我們所估計的可信區(qū)間有95%的可能包含所要估計的總體參數(shù)。(2)從正態(tài)總體中隨機抽取100個樣本,可算得100個樣本均數(shù)和標(biāo)準(zhǔn)差,也可算得100個均數(shù)的可信區(qū)間,平均約有95個可信區(qū)間包含了總體均數(shù)。(3)但在實際工作中,只能根據(jù)一次試驗結(jié)果估計可信區(qū)間,我們就認(rèn)為該區(qū)間包含了總體均數(shù)。

45當(dāng)前45頁,總共58頁。

2.可信區(qū)間的兩個要素(1)準(zhǔn)確度:用可信度(1)表示:即區(qū)間包含總體均數(shù)的理論概率大小。當(dāng)然它愈接近1愈好,如99%的可信區(qū)間比95%的可信區(qū)間要好。(2)精確度:反映在區(qū)間的寬度上。區(qū)間愈窄愈好,如95%的可信區(qū)間比99%的可信區(qū)間要好。46當(dāng)前46頁,總共58頁。

當(dāng)n確定時,上述兩者互相矛盾。提高準(zhǔn)確度(可信度),則精確度降低(可信區(qū)間會變寬),勢必降低可信區(qū)間的實際應(yīng)用價值,故不能籠統(tǒng)認(rèn)為99%可信區(qū)間比95%可信區(qū)間要好。相反,在實際應(yīng)用中,95%可信區(qū)間更為常用。在可信度確定的情況下,增加樣本含量可減小區(qū)間寬度,提高精確度。47當(dāng)前47頁,總共58頁。從正態(tài)總體N(155.4,5.32)中抽樣n=10,=0.0548當(dāng)前48頁,總共58頁。從正態(tài)總體N(155.4,5.32)中抽樣n=10,=0.0549當(dāng)前49頁,總共58頁。從正態(tài)總體N(155.4,5.32)中抽樣n=10,=0.1050當(dāng)前50頁,總共58頁。從正態(tài)總體N(155.4,5.32)中抽樣n=10,=0.1051當(dāng)前51頁,總共58頁。從正態(tài)總體N(155.4,5.32)中抽樣n=10,=0.0152當(dāng)前52頁,總共58頁。從正態(tài)總體N(155.4,5.32)中抽樣n=10,=0.0153當(dāng)前53頁,總共58頁。n=10=0.05=0.10=0.0154準(zhǔn)確度(可信度)逐漸降低,精確度逐漸升高;當(dāng)前54頁,總共58頁。從正態(tài)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論