版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
《統(tǒng)計(jì)學(xué)》課件作者:云南財(cái)經(jīng)大學(xué)統(tǒng)計(jì)與數(shù)學(xué)學(xué)院楊文雪PowerPoint統(tǒng)計(jì)學(xué)第3章參數(shù)估計(jì)3.1參數(shù)估計(jì)的基本原理3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)3.3兩個(gè)總體參數(shù)的區(qū)間估計(jì)3.4樣本容量的確定3.1參數(shù)估計(jì)的基本原理3.1.1抽樣估計(jì)的含義及其種類3.1.2
估計(jì)量與估計(jì)值3.1.3參數(shù)估計(jì)的方法
3.1.4評(píng)價(jià)估計(jì)量的標(biāo)準(zhǔn)3.1.1抽樣估計(jì)的含義及其種類一、抽樣估計(jì)的含義二、抽樣估計(jì)的種類一、抽樣估計(jì)的含義抽樣估計(jì):是指用樣本提供的信息對(duì)總體的某些特征所進(jìn)行的估計(jì)或推斷。通常:(1)用來(lái)估計(jì)總體特征的樣本指標(biāo),也稱之為樣本統(tǒng)計(jì)量或樣本估計(jì)量。包括:樣本均值、樣本方差或樣本標(biāo)準(zhǔn)差、樣本比例等。(2)待估計(jì)的總體指標(biāo),稱為總體參數(shù)。包括:總體均值、總體方差或總體標(biāo)準(zhǔn)差、總體比例等。二、抽樣估計(jì)的種類從數(shù)理統(tǒng)計(jì)的理論來(lái)看,抽樣估計(jì)包括:抽樣估計(jì)參數(shù)估計(jì)非參數(shù)估計(jì)(一)參數(shù)估計(jì)參數(shù)估計(jì)是指已知總體分布類型而對(duì)總體的數(shù)字特征(總體參數(shù))進(jìn)行的估計(jì)。亦即:用樣本統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行的估計(jì)。例如:用樣本均值()估計(jì)總體均值();用樣本比率()估計(jì)總體比率();用樣本方差()估計(jì)總體方差()等。參數(shù)估計(jì)包括:點(diǎn)估計(jì)和區(qū)間估計(jì)。(二)非參數(shù)估計(jì)非參數(shù)估計(jì)是指對(duì)總體的分布形式一無(wú)所知、要對(duì)“總體的分布類型”和總體參數(shù)作出估計(jì)。顯然,非參數(shù)估計(jì)比參數(shù)估計(jì)要復(fù)雜得多。本章僅僅介紹參數(shù)估計(jì)的基本理論和方法。3.1.2估計(jì)量與估計(jì)值一、引言二、估計(jì)量的含義三、估計(jì)值的含義附:總體參數(shù)、樣本估計(jì)量與樣本估計(jì)值三者關(guān)系舉例一、引言如果掌握了所研究的總體的全部數(shù)據(jù),那么只需做一些簡(jiǎn)單的統(tǒng)計(jì)描述,就可以得到有關(guān)總體的數(shù)量特征,如總體均值、方差、比率等。但現(xiàn)實(shí)情況則比較復(fù)雜,有的現(xiàn)象范圍比較廣,不可能對(duì)總體中的每一個(gè)單位都進(jìn)行測(cè)定?;蛘哂行┛傮w的單位數(shù)很多,不可能也沒(méi)有必要進(jìn)行一一測(cè)定。這就需要從總體中抽取一部分單位進(jìn)行調(diào)查,進(jìn)而利用樣本提供的信息來(lái)推斷總體的數(shù)量特征。二、估計(jì)量的含義估計(jì)量(estimator):又稱為樣本統(tǒng)計(jì)量或樣本指標(biāo)。它是根據(jù)樣本資料計(jì)算的、用以估計(jì)和推斷相應(yīng)總體參數(shù)的綜合指標(biāo)?;蛘哒f(shuō),它是用來(lái)估計(jì)總體參數(shù)的統(tǒng)計(jì)量的名稱。通過(guò)試驗(yàn)和觀察取得的樣本的具體數(shù)值本身只是一些雜亂無(wú)章的數(shù)據(jù),不能直接用樣本值去推斷未知總體參數(shù),此時(shí)只能利用它們整理計(jì)算出來(lái)的一些“量”來(lái)進(jìn)行推斷。統(tǒng)計(jì)學(xué)中,將由樣本構(gòu)造出的量,稱為估計(jì)量。估計(jì)量是樣本的函數(shù)。樣本估計(jì)量是總體參數(shù)的估計(jì)式,它指的是樣本中隨機(jī)變量(x1、x2、….、xn)的函數(shù)表達(dá)式,在抽樣之前就定義好。常見(jiàn)的有:樣本均值、樣本成數(shù)、樣本方差、樣本標(biāo)準(zhǔn)差、樣本協(xié)方差等。三、樣本估計(jì)值的含義樣本估計(jì)值是用來(lái)估計(jì)總體參數(shù)時(shí)計(jì)算出來(lái)的樣本統(tǒng)計(jì)量的具體數(shù)值。它是樣本估計(jì)量的某一具體取值,只能在抽樣之后由樣本中的隨機(jī)變量的值x1、x2、…xn來(lái)決定。樣本估計(jì)量不含未知參數(shù),它是隨樣本不同而不同的隨機(jī)變量。故:抽取的樣本不同,得到的樣本估計(jì)量的具體數(shù)值也不同。附:總體參數(shù)、樣本估計(jì)量與樣本估計(jì)值三者關(guān)系舉例總體參數(shù)
樣本估計(jì)量樣本估計(jì)值全部燈泡的平均使用壽命隨機(jī)樣本的平均使用壽命隨機(jī)樣本計(jì)算出來(lái)的平均使用壽命為1800小時(shí)全班統(tǒng)計(jì)學(xué)考試成績(jī)的平均分隨機(jī)樣本的平均分隨機(jī)樣本計(jì)算出來(lái)的平均分為78分云南財(cái)經(jīng)大學(xué)在校學(xué)生的月平均生活費(fèi)用隨機(jī)樣本的月平均生活費(fèi)用隨機(jī)樣本計(jì)算出來(lái)的月平均生活費(fèi)用為450元3.1.3參數(shù)估計(jì)的方法矩估計(jì)法最小二乘法最大似然法順序統(tǒng)計(jì)量法估計(jì)方法點(diǎn)估計(jì)區(qū)間估計(jì)一、點(diǎn)估計(jì)(一)點(diǎn)估計(jì)的含義(二)常用的點(diǎn)估計(jì)方法(一)點(diǎn)估計(jì)的含義點(diǎn)估計(jì):又稱為“定值估計(jì)”,就是指直接用“一個(gè)樣本統(tǒng)計(jì)量(指標(biāo))”來(lái)估計(jì)“總體參數(shù)(指標(biāo))”的“一個(gè)數(shù)值點(diǎn)”。當(dāng)已知一個(gè)樣本的“觀察值”則便可得到“總體參數(shù)”的“一個(gè)估計(jì)值”。簡(jiǎn)言之,點(diǎn)估計(jì)就是指將“樣本估計(jì)量的一個(gè)取值”直接作為“總體參數(shù)的一個(gè)估計(jì)值”。例如:用樣本均值直接作為總體均值的估計(jì)例如:用兩個(gè)樣本均值之差直接作為總體均值之差的估計(jì)(二)常用的點(diǎn)估計(jì)方法點(diǎn)估計(jì)矩估計(jì)法極大似然估計(jì)法提示性講解兩種點(diǎn)估計(jì)方法二、區(qū)間估計(jì)(intervalestimation)(一)區(qū)間估計(jì)的含義(二)區(qū)間估計(jì)的數(shù)學(xué)定義(三)區(qū)間估計(jì)的統(tǒng)計(jì)直觀意義(四)區(qū)間估計(jì)中的若干經(jīng)驗(yàn)數(shù)據(jù)(五)區(qū)間估計(jì)示意圖(六)常用的置信水平(置信度)(七)對(duì)置信區(qū)間的理解必須注意的問(wèn)題(一)區(qū)間估計(jì)的含義區(qū)間估計(jì)(intervalestimation):顧名思義,就是用一個(gè)區(qū)間去估計(jì)未知總體參數(shù),把未知總體參數(shù)值界定在兩個(gè)數(shù)值之間范圍。亦即:根據(jù)樣本估計(jì)量,以一定的可靠程度(置信度)估計(jì)和推斷總體參數(shù)的區(qū)間范圍。(也可以定義為:區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上給出總體參數(shù)估計(jì)的一個(gè)范圍。)總體參數(shù)的估計(jì)區(qū)間,通常是由樣本統(tǒng)計(jì)量加減抽樣極限誤差而得到的。與點(diǎn)估計(jì)不同,進(jìn)行區(qū)間估計(jì)時(shí),根據(jù)樣本統(tǒng)計(jì)量的抽樣分布,我們能夠得到對(duì)樣本統(tǒng)計(jì)量與總體參數(shù)的接近程度給出一個(gè)概率度量。置信區(qū)間置信下限置信上限樣本統(tǒng)計(jì)量
(點(diǎn)估計(jì))比如:某班級(jí)平均分?jǐn)?shù)在75~85之間,置信水平是95%(二)區(qū)間估計(jì)的數(shù)學(xué)定義設(shè)總體X的分布密度函數(shù)F(x,θ)中含有一個(gè)未知參數(shù)θ,x1、x2、…、xn是來(lái)自X的一個(gè)樣本,對(duì)于給定的α(0<α<1),若能找到“兩個(gè)統(tǒng)計(jì)量”:θ1(x1、x2、…xn)
和θ2(x1、x2、…、xn),使得:P{θ1≤θ≤θ2}=1-α
則稱區(qū)間[θ1,θ2]為θ的置信度為1-α的“置信區(qū)間”。這里:α為顯著性水平;1-α為區(qū)間估計(jì)的置信度或置信水平或置信系數(shù)(是指構(gòu)造置信區(qū)間的步驟重復(fù)多次,在置信區(qū)間中包含總體參數(shù)真值的次數(shù)所占的比率。)(三)區(qū)間估計(jì)的統(tǒng)計(jì)直觀意義如果我們作多次同樣的抽樣,將會(huì)得到多個(gè)置信區(qū)間,那么其中:有的置信區(qū)間包含了總體參數(shù)的真值;而有的置信區(qū)間卻未包含總體參數(shù)的真值。例如:置信度1-α=95%表明如果我們抽取100個(gè)隨機(jī)樣本來(lái)估計(jì)總體的均值,那么由100個(gè)樣本所構(gòu)造的100個(gè)置信區(qū)間中,有95個(gè)置信區(qū)間包含了“總體參數(shù)的真值”,而另外5個(gè)置信區(qū)間則不包含“總體參數(shù)的真值”。(四)區(qū)間估計(jì)中的若干經(jīng)驗(yàn)數(shù)據(jù)由樣本均值的抽樣分布可知:在重復(fù)抽樣或總體無(wú)限的情況下,樣本均值的數(shù)學(xué)期望等于總體均值;樣本均值的標(biāo)準(zhǔn)差(或抽樣標(biāo)準(zhǔn)差或抽樣平均誤差)為:,由此可以知道:樣本均值落在范圍內(nèi)的概率為68.27%。樣本均值落在范圍內(nèi)的概率為95.45%%。樣本均值落在范圍內(nèi)的概率為99.73%%。樣本均值落在范圍內(nèi)的概率為90%。樣本均值落在范圍內(nèi)的概率為95%。樣本均值落在范圍內(nèi)的概率為99%。90%的樣本95%的樣本99%的樣本(五)常用的置信水平(置信度)
1.6451.962.58
0.050.0250.005
0.100.050.01
90%95%99%顯著性水平置信水平在構(gòu)造置信區(qū)間時(shí),我們可以用所希望的值作為置信水平。比較常用的置信水平及正態(tài)分布曲線下右側(cè)面積為
時(shí)的值如下表:(六)有關(guān)置信區(qū)間的概念用下圖表示置信下限點(diǎn)估計(jì)值置信上限置信區(qū)間當(dāng)時(shí),其余以此類推,但要特別注意:查P284-285標(biāo)準(zhǔn)正態(tài)分布表時(shí),由于
,故不直接查而是查,從表中先找到與最接近的數(shù)值,該數(shù)值對(duì)應(yīng)的的值,就是的值。從上面的表和圖可以看出:當(dāng)樣本容量(n)確定時(shí),置信區(qū)間的寬度隨著置信水平(1-α)的增大而增大。從直覺(jué)上說(shuō),置信區(qū)間比較寬時(shí),才會(huì)使這一區(qū)間有更大的可能性包含總體參數(shù)的真值。當(dāng)置信水平(1-α)固定時(shí),置信區(qū)間的寬度隨著樣本容量(n)的增大而變窄。亦即:置信水平不變時(shí),樣本容量(n)越大,抽樣誤差越小,估計(jì)的精度越高,則
置信區(qū)間就越窄。對(duì)置信區(qū)間的理解必須注意的問(wèn)題1、若用某種方法構(gòu)造的所有區(qū)間中,有95%的區(qū)間包含總體參數(shù)的真值,有5%的區(qū)間不包含總體參數(shù)的真值,則用該方法構(gòu)造的區(qū)間就稱之為“置信水平為95%的置信區(qū)間”。其他置信水平的區(qū)間也可以用類似的方式表述。之所以如此表述置信區(qū)間,其理由是:總體參數(shù)的真值是固定的、未知的,而用樣本構(gòu)造的區(qū)間則是不固定的、隨機(jī)的。隨著抽取的樣本不同,用同樣的方法構(gòu)造出的區(qū)間也必然不同。從這個(gè)意義上說(shuō),置信區(qū)間是一個(gè)“隨機(jī)區(qū)間”,它會(huì)因樣本的不同而不同,且不是所有的區(qū)間都包含總體參數(shù)的真值。2、置信水平(1-α
)這個(gè)概率,不能用來(lái)描述某個(gè)特定的區(qū)間包含總體參數(shù)真值的可能性大小。一個(gè)特定的區(qū)間總是包含或絕對(duì)不包含總體參數(shù)的真值,不存在可能包含或可能不包含的問(wèn)題。但是,利用1-α這個(gè)概率,可以知道在多次抽樣得到的區(qū)間中大概有多少個(gè)區(qū)間包含了總體參數(shù)的真值。例如:我們用99%的置信水平得到云南財(cái)經(jīng)大學(xué)全體在校學(xué)生月平均生活費(fèi)用在100元至500元之間。我們不能說(shuō):100—500這個(gè)區(qū)間以99%的概率包含云南財(cái)經(jīng)大學(xué)全體在校學(xué)生的月平均生活費(fèi)用的真值。我們只是知道:在多次抽樣中有99%的樣本得到的區(qū)間包含云南財(cái)經(jīng)大學(xué)全體在校學(xué)生的月平均生活費(fèi)用的真值,而有1%的樣本得到的區(qū)間不包含該真值。置信區(qū)間與置信水平均值的抽樣分布(1-a)%區(qū)間包含了
a%的區(qū)間未包含
1-aa/2a/2影響區(qū)間寬度的因素1.總體數(shù)據(jù)的離散程度,用來(lái)測(cè)度2.樣本容量3.置信水平(),影響
z的大小3.1.4評(píng)價(jià)估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)一、引言二、評(píng)價(jià)估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)一、引言前面介紹了參數(shù)估計(jì)的兩種常見(jiàn)的估計(jì)方法——矩估計(jì)法和極大似然估計(jì)法。對(duì)于同一個(gè)總體參數(shù),采用不同的方法估計(jì),可能會(huì)得到不同的估計(jì)量。究竟其中哪一個(gè)估計(jì)量是總體參數(shù)的最優(yōu)估計(jì)量呢?這就需要有一定的評(píng)價(jià)標(biāo)準(zhǔn)。二、評(píng)價(jià)估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn)評(píng)價(jià)估計(jì)量?jī)?yōu)劣的標(biāo)準(zhǔn),常常采用以下三條:(一)無(wú)偏性(二)有效性(三)一致性(一)無(wú)偏性(unbiasedness)無(wú)偏性:是指“樣本估計(jì)量
”的“均值(數(shù)學(xué)期望)”等于“被估總體參數(shù)的真實(shí)值θ”。即:
則:稱為θ的無(wú)偏估計(jì)量。無(wú)偏性實(shí)際上是指:不同的樣本,會(huì)有不同的估計(jì)值()。雖然從“某一個(gè)具體樣本”來(lái)看,估計(jì)值()有時(shí)會(huì)“大于θ”,有時(shí)會(huì)“小于θ”,有“誤差”。但從所有可能樣本的角度來(lái)看:估計(jì)值的平均水平=總體參數(shù)θ的真實(shí)值,即:平均說(shuō)來(lái),估計(jì)是無(wú)偏的。樣本均值()是總體均值(
)的無(wú)偏估計(jì)量證:因?yàn)閤1、x2、…、xn是n次觀察結(jié)果的n個(gè)獨(dú)立的隨機(jī)變量,且它們來(lái)自同一總體,有相同的分布律,故它們有相同的期望值和標(biāo)準(zhǔn)差。即:E(x1)=E(x2)=…=E(xn)=μ,D(x1)=D(x2)=…=D(xn)=σ2于是:樣本修正方差(
)是總體方差(
)的無(wú)偏估計(jì)量其他條件同上,證明過(guò)程如下(中間有省略)樣本方差()不是總體方差()的無(wú)偏估計(jì)量其他條件同上,證明過(guò)程如下(中間有省略)樣本比率()是總體比率()的無(wú)偏估計(jì)量證明:重復(fù)抽樣的條件下,當(dāng)從總體中抽取一個(gè)樣本容量為n的樣本時(shí),具有某種屬性的單位數(shù)()服從二項(xiàng)分布,記為:
,且有:,于是有:(二)有效性(efficiency)
——最小方差性無(wú)偏性僅僅考慮了樣本估計(jì)值的平均結(jié)果是否等于總體參數(shù)的真實(shí)值,而沒(méi)有考慮每一個(gè)樣本估計(jì)值
與待估總體參數(shù)真實(shí)值θ之間偏差的大小和離散程度。實(shí)際解決問(wèn)題時(shí),不僅希望估計(jì)是無(wú)偏的,更希望樣本估計(jì)值的偏差盡可能地小。有效性:又稱為最小方差性,是指在若干個(gè)無(wú)偏點(diǎn)估計(jì)量中,方差最小的那一個(gè)無(wú)偏估計(jì)量,就是有效的估計(jì)量??梢?jiàn),一個(gè)有效的估計(jì)量,首先必須是無(wú)偏的。(三)一致性(相合性)設(shè):
(x1、x2、…、xn)是待估參數(shù)θ的估計(jì)量,當(dāng)n→∞時(shí),對(duì)于任意小的正整數(shù)ε,有:一致性,它說(shuō)明當(dāng)樣本容量(n)趨近于無(wú)窮大∞時(shí),樣本估計(jì)量依概率收斂于總體參數(shù)的真實(shí)值θ。亦即:隨著樣本容量的增大,點(diǎn)估計(jì)量的值越來(lái)越接近被估計(jì)總體參數(shù)的真值。換言之,一個(gè)大樣本給出的估計(jì)量要比一個(gè)小樣本給出的估計(jì)量更接近總體參數(shù)的真值。幾個(gè)重要的結(jié)論(小結(jié))1.樣本均值()和樣本比例(p),分別是總體均值μ和總體比例P的無(wú)偏、有效和一致的優(yōu)良估計(jì)量。2.樣本修正方差(Sn-12)是總體方差(σ2)的無(wú)偏估計(jì)量。3.樣本方差(Sn2)不是總體方差(σ2)的無(wú)偏估計(jì)量,(不過(guò),它雖不具有無(wú)偏性,但它是“漸進(jìn)無(wú)偏的”。)它比總體方差多了一個(gè)(n-1)/n。正因?yàn)槿绱?,本教材直接把樣本修正方?/p>
Sn-12
直接定義為樣本方差。3.2一個(gè)總體參數(shù)的區(qū)間估計(jì)3.2.1總體均值的區(qū)間估計(jì)3.2.2總體比率的區(qū)間估計(jì)3.2.3總體方差的區(qū)間估計(jì)3.2.1總體均值的區(qū)間估計(jì)一、正態(tài)總體且總體方差已知時(shí)的估計(jì)方法(定理1)二、總體分布未知或非正態(tài)總體且大樣本時(shí)的估計(jì)方法(定理2)三、正態(tài)總體、總體方差未知且小樣本時(shí)的估計(jì)方法(定理3)一、正態(tài)總體且總體方差已知時(shí)的估計(jì)方法(以重復(fù)抽樣為例)當(dāng)總體X→N(μ,σ2),則抽自其中的簡(jiǎn)單隨機(jī)樣本的均值也服從正態(tài)分布。即:正態(tài)總體且總體方差σ2已知時(shí),不論是大樣本還是小樣本,建立置信區(qū)間所用的統(tǒng)計(jì)量都是——標(biāo)準(zhǔn)正態(tài)統(tǒng)計(jì)量(Z)。即:對(duì)于給定的置信水平(1-α),可查標(biāo)準(zhǔn)正態(tài)分布表P350得出臨界值Zα/2使得:上式表明:在給定的顯著性水平α下,總體均值μ在1–α的置信水平下的置信區(qū)間為:抽樣平均誤差(樣本均值的標(biāo)準(zhǔn)差或樣本均值抽樣分布的標(biāo)準(zhǔn)差)的計(jì)算公式為:抽樣極限誤差(允許誤差
)
=臨界值×抽樣平均誤差于是,置信區(qū)間可以簡(jiǎn)寫(xiě)成:同理,不重復(fù)抽樣的情況下抽樣平均誤差的計(jì)算公式為抽樣極限誤差的計(jì)算公式為置信區(qū)間的計(jì)算公式仍然為區(qū)間估計(jì)例1:(正態(tài)總體-方差已知)某種零件的長(zhǎng)度服從正態(tài)分布,現(xiàn)從該產(chǎn)品中隨機(jī)抽取9件,測(cè)得其平均長(zhǎng)度為21.4厘米。根據(jù)以往的經(jīng)驗(yàn),該批產(chǎn)品的總體標(biāo)準(zhǔn)差σ=0.15厘米。要求以95%的置信度估計(jì)該種零件平均長(zhǎng)度的置信區(qū)間。解:依題意得:零件長(zhǎng)度X→N(μ,0.152)
n=9,,σ=0.15,1-α=0.95,α=0.05,查P350的標(biāo)準(zhǔn)正態(tài)分布表得出臨界值為:Zα/2=Z0.05/2=Z0.025=Z1-α/2=Z1-0.025=Z0.975=1.96抽樣平均誤差:抽樣極限誤差:計(jì)算結(jié)果表明:在95%的置信水平下該種零件的平均長(zhǎng)度在21.302厘米至21.498厘米之間。所以在95%的置信水平下該種零件的平均長(zhǎng)度的置信區(qū)間為:二、總體分布未知或非正態(tài)總體且大樣本時(shí)的估計(jì)方法(以重復(fù)抽樣為例)當(dāng)樣本容量(n)足夠大(n≥30)時(shí),即使總體分布形式未知或者總體為非正態(tài)分布,根據(jù)中心極限定理可知:樣本均值()近似服從正態(tài)分布,因此,估計(jì)總體均值(μ)的方法和公式與正態(tài)總體且總體方差已知的情形相同,置信區(qū)間仍然是:在大樣本的情況下,當(dāng)總體方差(σ2)未知而用樣本方差(Sn-12)代替時(shí),由于t分布可用正態(tài)分布近似,其他方法同前,只是此時(shí)的置信區(qū)間公式為:想一想,不重復(fù)抽樣的置信區(qū)間公式如何寫(xiě)?區(qū)間估計(jì)例2:(總體分布未知或非正態(tài)總體且大樣本、總體方差已知)某財(cái)經(jīng)大學(xué)從該校學(xué)生中隨機(jī)抽取100人,調(diào)查得到他們平均每天參加體育鍛煉的時(shí)間為26分鐘。又知總體方差為36(分鐘)2,試以95%的置信水平估計(jì)該財(cái)經(jīng)大學(xué)全體學(xué)生每天平均參加體育鍛煉時(shí)間的置信區(qū)間。解:由于總體的分布形式未知,且總體方差σ2=36(分鐘)2已知,且樣本容量n=100>30為“大樣本”,故可以近似地認(rèn)為:樣本均值服從N(μ,σ2/n),依題意知道:查表得到:,于是:抽樣平均誤差:抽樣極限誤差:所以,在95%的置信水平下全校學(xué)生平均每天參加體育鍛煉時(shí)間μ的置信區(qū)間為:計(jì)算結(jié)果表明:在95%的置信水平下該財(cái)經(jīng)大學(xué)全校學(xué)生平均每天參加體育鍛煉的時(shí)間在24.824分鐘至27.176分鐘之間。區(qū)間估計(jì)例3:(總體分布未知或非正態(tài)總體且大樣本、總體方差未知)在大興安嶺林區(qū),隨機(jī)抽取了120塊面積為1公頃的樣地,根據(jù)調(diào)查測(cè)量求得每公頃林地平均出材量為88(m3),標(biāo)準(zhǔn)差為10(m3),試在99%的置信水平下估計(jì)大興安嶺林區(qū)每公頃地平均出材量的置信區(qū)間。解:總體分布形式和總體方差σ2均未知,但由于n=120>30,屬于大樣本,故可近似地采用正態(tài)分布處理,并用樣本方差代替總體方差。依題意又知:
,查標(biāo)準(zhǔn)正態(tài)分布表得:
于是:抽樣平均誤差:抽樣極限誤(允許誤差)所以,在99%的置信水平下大興安嶺林區(qū)每公頃地平均出材量的置信區(qū)間為:計(jì)算結(jié)果表明:在99%的置信水平下大興安嶺林區(qū)每公頃地平均出材量在85.645m3至90.355m3之間。區(qū)間估計(jì)例4:若例3中:1-α=0.95,其他條件不變此時(shí),Zα/2=Z0.05/2=1.96
前題已計(jì)算出:抽樣平均誤差
σ(xˉ)=0.9129
于是:抽樣極限誤差E=Zα/2·σ(xˉ)=1.96×0.9129=1.789則置信區(qū)間為:88-1.789≤μ≤88+1.789即:
86.211≤μ≤89.789顯然,95%下的置信區(qū)間比99%下的置信區(qū)間縮小了。由此可見(jiàn):置信度(1-α)越大,抽樣極限誤差(E)越大,置信區(qū)間就越大。反之置信度(1-α)越小,抽樣極限誤差(E)越小,置信區(qū)間就越小。三、正態(tài)總體、總體方差未知且小樣本時(shí)的估計(jì)方法(以重復(fù)抽樣為例)根據(jù)小樣本分布定理可知,在小樣本條件下,如果總體是正態(tài)分布、總體方差未知,而需用樣本方差代替,那么隨機(jī)變量:此時(shí)則需要采用t分布來(lái)建立總體均值的置信區(qū)間。t分布
t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的t分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,t分布也逐漸趨于正態(tài)分布Xt分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)對(duì)于給定的置信度(1-α),可用P352的t分布表,查出臨界值tα/2(n-1),使得:上式表明:在給定的顯著性水平α下,總體均值μ在1-α的置信度下的置信區(qū)間為:置信區(qū)間中的抽樣平均誤差和抽樣極限誤差公式抽樣平均誤差:(重復(fù)抽樣)抽樣極限誤差:同理,不重復(fù)抽樣的情況下抽樣平均誤差的計(jì)算公式為抽樣極限誤差的計(jì)算公式為置信區(qū)間的計(jì)算公式仍然為區(qū)間估計(jì)例5
(正態(tài)總體、總體方差未知且小樣本)設(shè)某上市公司的股票價(jià)格服從正態(tài)分布,為了掌握該上市公司股票的平均價(jià)格情況,現(xiàn)隨機(jī)抽取了26天的交易價(jià)格進(jìn)行調(diào)查,測(cè)得平均價(jià)格為35元,方差為4(元2),試以98%的置信度估計(jì)該上市公司股票平均交易價(jià)格的置信區(qū)間。解:因?yàn)榭傮w服從正態(tài)分布,但n=26<30屬于小樣本,總體方差σ2未知,此時(shí)可以用樣本方差S2近似代替。1-α=0.98α=0.02查t分布表得出:又知:于是:抽樣平均誤差抽樣極限誤差所以在98%的置信水平下該公司股票交易價(jià)格μ的置信區(qū)間為:計(jì)算結(jié)果表明:在98%的置信度下該上市公司股票交易的平均價(jià)格在34.04元至35.96元之間??傮w均值的區(qū)間估計(jì)小結(jié)
小樣本未知大樣本已知總體分布未知或非正態(tài)總體
大樣本未知小樣本大樣本已知
正態(tài)總體
不重復(fù)抽樣重復(fù)抽樣3.2.2總體比率的區(qū)間估計(jì)
(以重復(fù)抽樣為例)根據(jù)上面的樣本比例的抽樣分布定理可知:在大樣本和條件下,樣本比率服從正態(tài)分布。將樣本比率標(biāo)準(zhǔn)化后,它服從標(biāo)準(zhǔn)正態(tài)分布。右下??傮w比率區(qū)間估計(jì)的抽樣平均誤差和抽樣極限誤差對(duì)于給定的置信度(1-α),查標(biāo)準(zhǔn)正態(tài)分布表的Zα/2,于是:抽樣平均誤差:抽樣極限誤差:總體比率的置信區(qū)間公式總體比率P在1-α的置信水平下的置信區(qū)間為:同理,若已知“總體容量N”,則“總體中某一部分單位總數(shù)NP”的置信區(qū)間為:同理,不重復(fù)抽樣的情況下抽樣平均誤差的計(jì)算公式為抽樣極限誤差的計(jì)算公式為置信區(qū)間的計(jì)算公式仍然為區(qū)間估計(jì)例5
(總體比率的區(qū)間估計(jì))某城市想要估計(jì)下崗職工中女性所占的比例,隨機(jī)抽取了100個(gè)下崗職工,其中65人為女性職工。試以95%的置信水平估計(jì)該城市下崗職工中女性比例的置信區(qū)間。例6解:依題意:
n=100,p=65%,1-=95%,Z/2=1.96
樣本比率的抽樣平均誤差:樣本比率的抽樣極限誤差例6解(續(xù)前)所以在95%置信度下該城市下崗職工中女性比例P的置信區(qū)間為:計(jì)算結(jié)果表明:在95的置信度下該城市下崗職工中女性比例的大致在為55.65%~74.35%之間。需要說(shuō)明的問(wèn)題(教材P141)雖然,樣本比率p隨著樣本容量n的增大而近似服從“正態(tài)分布”,但究竟樣本容量n應(yīng)該多大才能使樣本比率p近似服從正態(tài)分布呢?這與“樣本比率p的大小”有關(guān)。當(dāng)樣本比率p接近于0.5時(shí),用較小的樣本就可以使p的分布趨于正態(tài)分布。但當(dāng)樣本比率p接近于0和1時(shí),就需要用很大的樣本才能使p的分布趨于正態(tài)分布。統(tǒng)計(jì)學(xué)家W.G.Kochran(柯克蘭)為此提出了一個(gè)標(biāo)準(zhǔn)可供參考。(續(xù)前)柯克蘭標(biāo)準(zhǔn)樣本比率p近似正態(tài)分布要求的樣本容量n
0.50.4—0.60.3—0.70.2—0.80.1—0.93050802006003.2.3總體方差的區(qū)間估計(jì)在研究生產(chǎn)過(guò)程和產(chǎn)品質(zhì)量的穩(wěn)定性、儀器和測(cè)量的精度等實(shí)際問(wèn)題時(shí),往往要求進(jìn)行總體方差的區(qū)間估計(jì)。在非正態(tài)總體或者總體分布形式未知的情況下,要進(jìn)行總體方差的區(qū)間估計(jì),這是一件比較麻煩的事情。而在正態(tài)總體條件下進(jìn)行,則相對(duì)容易一些。下面我們僅討論正態(tài)總體的情形。設(shè):x1、x2、…、xn來(lái)自N(μ,σ2)的正態(tài)總體,其中μ、σ2未知,則:σ2的估計(jì)量為s2且構(gòu)造統(tǒng)計(jì)量:從而對(duì)于給定的置信度1-α,查分布表
確定兩個(gè)臨界點(diǎn):
:表示自由度(n-1)的
的
分位數(shù);:表示自由度(n-1)的的分位數(shù);(續(xù)前)(總體方差置信區(qū)間示意圖)0總體方差在的置信區(qū)(續(xù)前)于是對(duì)于給定的顯著性水平,使得:(續(xù)前)上式表明對(duì)于給定的置信度1-α總體方差的置信區(qū)間為:總體標(biāo)準(zhǔn)差的置信區(qū)間為:區(qū)間估計(jì)例8(總體方差區(qū)間估計(jì))某自動(dòng)車床加工的某種零件長(zhǎng)度X,X→N(μ,σ2),現(xiàn)隨機(jī)抽查16個(gè)零件,測(cè)得其方差為0.00244(mm)2,試以95%的置信度估計(jì)該種零件方差的置信區(qū)間。解:S2=0.002441-α=0.95,α=0.05,α/2=0.025查“χ2分布表”得:
χ20.025(16-1)=χ20.025(15)=27.488χ21-0.025(16-1)=χ20.975(15)=6.262例8解(續(xù)前):在95%的置信度下總體方差的置信區(qū)間為:計(jì)算結(jié)果表明:該自動(dòng)車床加工的零件長(zhǎng)度方差在0.00133毫米至0.00584毫米之間。3.3兩個(gè)總體參數(shù)的區(qū)間估計(jì)3.3.1兩個(gè)總體均值之差的區(qū)間估計(jì)3.3.2兩個(gè)總體比率之差的區(qū)間估計(jì)3.3.3兩個(gè)總體方差比的區(qū)間估計(jì)3.3.1兩個(gè)總體均值之差的區(qū)間估計(jì)一、引言二、兩個(gè)總體均值之差的估計(jì):獨(dú)立樣本三、兩個(gè)總體均值之差的估計(jì):匹配樣本一、引
言設(shè)兩個(gè)總體的均值分別為、,從兩個(gè)總體中分別抽去樣本容量為和的兩個(gè)隨機(jī)樣本,其樣本均值分別為和。估計(jì)兩個(gè)總體之差()的樣本估計(jì)量顯然是兩個(gè)隨機(jī)樣本的均值之差()。對(duì)于兩個(gè)總體均值之差的估計(jì),必須考慮兩個(gè)樣本是獨(dú)立樣本還是匹配樣本,以及兩個(gè)隨機(jī)樣本均值之差的抽樣分布。二、兩個(gè)總體均值之差的估計(jì):
——獨(dú)立樣本(一)兩個(gè)正態(tài)總體、兩個(gè)總體方差均已知的情形(定理1)(二)兩個(gè)總體分布未知或?yàn)榉钦龖B(tài)分布且大樣本的情形(定理2)(三)兩個(gè)正態(tài)總體、兩個(gè)總體方差均未知且兩個(gè)樣本均為小樣本的情形(定理3)(一)兩個(gè)正態(tài)總體、兩個(gè)總體方差均已知的情形(定理1)若兩個(gè)獨(dú)立隨機(jī)樣本(x11、x12、…、x1n1)和(x21、x22、…、x2n2)抽自于兩個(gè)正態(tài)總體和,且兩個(gè)正態(tài)總體的方差和已知,則不論兩個(gè)樣本的樣本容量和的大小如何,兩個(gè)樣本均值之差服從正態(tài)分布。即:∽(續(xù)前)而兩個(gè)樣本均值之差經(jīng)標(biāo)準(zhǔn)化后則服從標(biāo)準(zhǔn)正態(tài)分布。即:此時(shí),兩個(gè)總體均值之差()在1-α置信水平下的置信區(qū)間為:例題(略)(二)兩個(gè)總體分布未知或?yàn)榉钦龖B(tài)分布且大樣本的情形(定理2)若兩個(gè)獨(dú)立隨機(jī)樣本(x11、x12、…、x1n1)和(x21、x22、…、x2n2)抽自于兩個(gè)總體分布未知或?yàn)榉钦龖B(tài)分布,且樣本容量和,則兩個(gè)樣本均值之差近似服從正態(tài)分布。即:∽(續(xù)前)而兩個(gè)樣本均值之差經(jīng)標(biāo)準(zhǔn)化后則服從標(biāo)準(zhǔn)正態(tài)分布。即:1、當(dāng)兩個(gè)總體方差和都已知時(shí),兩個(gè)總體均值之差()在1-α置信水平下的置信區(qū)間為:(續(xù)前)2、當(dāng)兩個(gè)總體方差和都未知時(shí),可用兩個(gè)樣本方差和來(lái)代替,兩個(gè)總體均值之差()在1-α置信水平下的置信區(qū)間為:區(qū)間估計(jì)例9
(兩個(gè)總體均值之差的區(qū)間估計(jì))某鄉(xiāng)為了估計(jì)兩個(gè)村小麥平均畝產(chǎn)之差,在這兩個(gè)村種植小麥的地塊中獨(dú)立地抽取兩個(gè)隨機(jī)樣本,得到有關(guān)數(shù)據(jù)如下:甲村的樣本容量為40,平均畝產(chǎn)為520千克,標(biāo)準(zhǔn)差25千克;乙村樣本容量為45,平均畝產(chǎn)為460千克,標(biāo)準(zhǔn)差為28千克。
試以95%的置信水平估計(jì)兩個(gè)村平均畝產(chǎn)之差的置信區(qū)間。例9解:依題意可知:,屬于大樣本,且,,屬于大樣本,且,查表得:,于是在95%的置信水平下兩個(gè)村小麥平均畝產(chǎn)量的置信區(qū)間為:即:(54.25,65.75),表明在95%的置信水平下兩個(gè)村小麥平均畝產(chǎn)之差在54.25千克至65.75千克之間。若兩個(gè)獨(dú)立隨機(jī)樣本(x11、x12、…、x1n1)和(x21、x22、…、x2n2)抽自于兩個(gè)正態(tài)總體和,且兩個(gè)正態(tài)總體的方差和未知,且樣本容量n1<30和n2<30,兩個(gè)樣本均值之差服從t分布.分兩種情況:1、若兩個(gè)總體方差相等(方差具有齊性),即,此時(shí),則需要用兩個(gè)樣本方差和來(lái)估計(jì),必須將兩個(gè)樣本的數(shù)據(jù)組合在一起,以給出總體方差的共同樣本方差
,計(jì)算公式為:(三)兩個(gè)正態(tài)總體、兩個(gè)總體方差均未知且兩個(gè)樣本均為小樣本的情形(定理3)(續(xù)前)這時(shí),兩個(gè)樣本均值之差經(jīng)過(guò)標(biāo)準(zhǔn)化以后服從自由度為的t分布,即:此時(shí),兩個(gè)總體均值之差()在1-α置信水平下的置信區(qū)間為:2、當(dāng)兩個(gè)總體的方差不相等(即方差不具有齊性)即、而且兩個(gè)樣本的容量也不相等(即)時(shí),兩個(gè)樣本均值之差經(jīng)標(biāo)準(zhǔn)化后不再服從自由度為的t分布,而是近似服從自由度為v的t分布,自由度v的計(jì)算公式為:此時(shí),兩個(gè)總體均值之差在1-α置信水平下的置信區(qū)間為:例從甲乙兩種機(jī)床加工的零件中隨機(jī)抽取容量分別為8件和7件的樣本測(cè)得直徑數(shù)據(jù)如下:20.519.819.720.420.120.019.019.920.719.819.520.820.419.620.2甲乙要求:在95%的置信度下估計(jì)兩種零件平均直徑之差的置信區(qū)間。(手工計(jì)算不要求,關(guān)鍵是能看懂SPSS輸出結(jié)果)。SPSS輸出結(jié)果如下:樣本容量樣本均值樣本標(biāo)準(zhǔn)差樣本均值的抽樣分布的標(biāo)準(zhǔn)差樣本均值之差樣本均值之差的抽樣分布標(biāo)準(zhǔn)差方差齊性檢驗(yàn)總體均值之差的在95%置信度下的置信區(qū)間解因?yàn)镕統(tǒng)計(jì)量的P值sig,=0.444>α=0.05,所以不拒絕的原假設(shè),因此兩個(gè)總體均值之差在95%的置信度下的置信區(qū)間為【-0.7684,0.3327】。若方差不等則選擇【-0.7768,0.3411】方差相等方差不相等三、兩個(gè)總體均值之差的估計(jì)
——匹配樣本匹配樣本(matchedsample)是指一個(gè)樣本中的數(shù)據(jù)與另一個(gè)樣本中的數(shù)據(jù)相對(duì)應(yīng)。例如:為了考察用兩種方法組裝產(chǎn)品所需要的時(shí)間,我們先隨機(jī)安排12個(gè)工人用第一種方法組裝產(chǎn)品考察其所需時(shí)間,然后再安排這12個(gè)工人用第二種方法組裝產(chǎn)品考察其所需時(shí)間,這樣得到的兩組組裝產(chǎn)品所需時(shí)間的數(shù)據(jù),就是“匹配數(shù)據(jù)”。匹配樣本,可以消除由于樣本安排的不公平造成的兩種方法在組裝時(shí)間上的差異。1、在匹配樣本且大樣本的條件下,兩個(gè)總體均值之差在(1-α)的置信水平下的置信區(qū)間為:設(shè):()和()為一對(duì)匹配數(shù)據(jù),其對(duì)應(yīng)數(shù)據(jù)的差值分別為則各差值的均值各差值的標(biāo)準(zhǔn)差當(dāng)總體差值的標(biāo)準(zhǔn)差σd未知時(shí),可用樣本差值的標(biāo)準(zhǔn)差sd來(lái)代替。2、在匹配樣本且大樣本的條件下,兩個(gè)總體均值之差在(1-α)的置信水平下的置信區(qū)間為:總體樣本例從新舊兩款飲料中隨機(jī)抽取容量8家商店的樣本測(cè)得銷售量數(shù)據(jù)如下(百瓶)新款要求:在95%的置信度下估計(jì)新舊兩款飲料平均銷售量之差的置信區(qū)間。(手工計(jì)算不要求,關(guān)鍵是能看懂SPSS輸出結(jié)果)。
5.0 6.04.0 6.07.0 7.03.0 4.05.0 3.08.0 9.05.0 7.06.0 6.0舊款3.3.2兩個(gè)總體比率之差的區(qū)間估計(jì)根據(jù)抽樣分布的原理可知:從兩個(gè)二項(xiàng)分布總體中抽出兩個(gè)獨(dú)立的樣本,在大樣本的情況下,則兩個(gè)樣本比率之差的抽樣分布近似服從正態(tài)分布。同樣,將兩個(gè)樣本比率之差經(jīng)過(guò)標(biāo)準(zhǔn)化后則服從標(biāo)準(zhǔn)正態(tài)分布。即:(續(xù)前)由于兩個(gè)總體比率和通常是未知的,可用樣本比率和來(lái)代替。因此,根據(jù)正態(tài)分布建立的兩個(gè)總體比率之差()在1-α得置信水平下的置信區(qū)間為:例題(略)。3.3.3兩個(gè)總體方差比的區(qū)間估計(jì)由于兩個(gè)樣本方差比的抽樣分布服從
分布,因此我們用F分布來(lái)構(gòu)造兩個(gè)總體方差比的置信區(qū)間。用F分布構(gòu)造的兩個(gè)總體的置信區(qū)間如下圖所示:0F總體方差比在(1-α)的置信區(qū)間(續(xù)前)建立兩個(gè)總體方差比的置信區(qū)間,就是要找到F值,使其滿足。根據(jù)抽樣分布知識(shí),可以得到兩個(gè)總體方差比在(1-α)置信水平下的置信區(qū)間為:例題(略)。3.4樣本容量的確定3.4.1確定樣本容量的必要性3.4.2確定抽樣容量的關(guān)鍵問(wèn)題3.4.3估計(jì)總體均值時(shí)樣本容量的確定3.4.4估計(jì)總體比率時(shí)樣本容量的確定3.4.1確定樣本容量的必要性樣本容量(n),它是指一個(gè)樣本中所包含的總體單位個(gè)數(shù)。一般地,抽取的數(shù)目n≥30,稱為大樣本;抽取的數(shù)目n<30,稱為小樣本。對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象的抽樣調(diào)查,一般采用大樣本。前面的討論是假設(shè)樣本容量(n)是已知的,但在實(shí)際問(wèn)題中,需要自己設(shè)計(jì)抽樣調(diào)查方案,此時(shí),如何確定樣本容量(n),就大有學(xué)問(wèn)。如果n確定得太大,雖然調(diào)查誤差很小,但調(diào)查
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 家居花藝培訓(xùn)管理制度
- 商業(yè)綜合體全員培訓(xùn)制度
- 幼兒園安全培訓(xùn)例會(huì)制度
- 浴場(chǎng)員工培訓(xùn)制度及流程
- 安全管理人員培訓(xùn)制度
- 農(nóng)產(chǎn)品生產(chǎn)企業(yè)培訓(xùn)制度
- 入職培訓(xùn)假期管理制度
- 培訓(xùn)中心財(cái)產(chǎn)管理制度
- icu業(yè)務(wù)培訓(xùn)制度
- 應(yīng)急預(yù)案培訓(xùn)管理制度
- 培養(yǎng)小學(xué)生的實(shí)驗(yàn)操作能力
- 河南省洛陽(yáng)市2023-2024學(xué)年九年級(jí)第一學(xué)期期末質(zhì)量檢測(cè)數(shù)學(xué)試卷(人教版 含答案)
- Unit-3-Reading-and-thinking課文詳解課件-高中英語(yǔ)人教版必修第二冊(cè)
- 氣動(dòng)回路圖與氣動(dòng)元件課件
- 《念奴嬌 赤壁懷古》《永遇樂(lè) 京口北固亭懷古》《聲聲慢》默寫(xiě)練習(xí) 統(tǒng)編版高中語(yǔ)文必修上冊(cè)
- 婦產(chǎn)科病史采集臨床思維
- 眾辰變頻器z2400t-15gy-1說(shuō)明書(shū)
- DB63T 393-2002草地鼠蟲(chóng)害、毒草調(diào)查技術(shù)規(guī)程
- 船體振動(dòng)的衡準(zhǔn)及減振方法
- 復(fù)議訴訟證據(jù)清單通用版
- 水泥混凝土路面滑模攤鋪機(jī)施工工法
評(píng)論
0/150
提交評(píng)論