《概率論與數(shù)理統(tǒng)計(jì)(第三版)》課件 第5章 參數(shù)估計(jì)_第1頁
《概率論與數(shù)理統(tǒng)計(jì)(第三版)》課件 第5章 參數(shù)估計(jì)_第2頁
《概率論與數(shù)理統(tǒng)計(jì)(第三版)》課件 第5章 參數(shù)估計(jì)_第3頁
《概率論與數(shù)理統(tǒng)計(jì)(第三版)》課件 第5章 參數(shù)估計(jì)_第4頁
《概率論與數(shù)理統(tǒng)計(jì)(第三版)》課件 第5章 參數(shù)估計(jì)_第5頁
已閱讀5頁,還剩64頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

概率論與數(shù)理統(tǒng)計(jì)第1章隨機(jī)事件與概率第2章隨機(jī)變量的分布及其數(shù)字特征第3章多維隨機(jī)變量的分布及其數(shù)字特征第4章數(shù)理統(tǒng)計(jì)的基本概念第5章參數(shù)估計(jì)第6章假設(shè)檢驗(yàn)第7章方差分析第8章回歸分析

例如,常用指數(shù)分布

描述產(chǎn)品的壽命,但參數(shù)

卻往往未知,這樣我們就無法計(jì)算該產(chǎn)品的平均壽命和壽命超過1000小時(shí)的概率.要解決這些問題,就必須對(duì)參數(shù)

做出估計(jì).

數(shù)理統(tǒng)計(jì)中的參數(shù)估計(jì)涉及四種類型:(1)估計(jì)分布中所含的未知參數(shù);(2)估計(jì)含有未知參數(shù)的函數(shù),如總體X~N(m,1),參數(shù)m未知,要求估計(jì)概率P{X<a};(3)估計(jì)與參數(shù)有關(guān)的數(shù)字特征,如總體服從指數(shù)分布X~Exp(l),其中參數(shù)l未知,要求估計(jì)E(X);(4)在一定的可信度下估計(jì)參數(shù)的范圍.第5章參數(shù)估計(jì)第五章知識(shí)結(jié)構(gòu)第5章參數(shù)估計(jì)實(shí)際問題矩估計(jì)法應(yīng)用參數(shù)估計(jì)區(qū)間估計(jì)點(diǎn)估計(jì)Excel最大似然估計(jì)法

本章主要內(nèi)容有:

點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)、矩估計(jì)法和最大似然估計(jì)法、區(qū)間估計(jì)等.☆實(shí)際問題中,總體的參數(shù)往往未知,因此首先需要對(duì)參數(shù)進(jìn)行估計(jì).☆數(shù)理統(tǒng)計(jì)中參數(shù)估計(jì)的方法有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種類型.☆點(diǎn)估計(jì)的方法很多,矩估計(jì)法是建立在相合估計(jì)基礎(chǔ)上的,最大似然估計(jì)是根據(jù)最大似然原理,在分布形式已知情況下的一種參數(shù)估計(jì).☆區(qū)間估計(jì)是在點(diǎn)估計(jì)的基礎(chǔ)上,估計(jì)給定可信度的參數(shù)取值區(qū)間.☆常用的矩估量、最大似然估計(jì)量,區(qū)間估計(jì)量可以利用Excel進(jìn)行計(jì)算.第5章參數(shù)估計(jì)§5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)§5.2矩估計(jì)法§5.3最大似然估計(jì)法§5.4單總體參數(shù)的區(qū)間估計(jì)§5.5雙總體參數(shù)的區(qū)間估計(jì)第5章參數(shù)估計(jì)5.1.1點(diǎn)估計(jì)的概念5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1.1點(diǎn)估計(jì)的概念

實(shí)踐中經(jīng)常用統(tǒng)計(jì)量來估算未知總體的某些特征.例如,某人群的性別比率p未知,從該人群中隨機(jī)抽取100人,發(fā)現(xiàn)女性占62%,我們就說該人群的女性占比為62%,這就是用樣本成數(shù)去估計(jì)總體成數(shù).由于62%是一個(gè)數(shù),在數(shù)軸上是一個(gè)點(diǎn),所以相對(duì)于區(qū)間估計(jì)來講稱為點(diǎn)估計(jì).定義5.1.1設(shè)q是總體X的未知參數(shù),用統(tǒng)計(jì)量來估計(jì)q

,稱為q

的點(diǎn)估計(jì)量,對(duì)應(yīng)于樣本值,點(diǎn)估計(jì)量的值稱為q的點(diǎn)估計(jì)值.求參數(shù)的點(diǎn)估計(jì)量或點(diǎn)估計(jì)值稱作點(diǎn)估計(jì).例如,設(shè)x1,x2,…,xn是來自總體X~N(m,s2)的樣本,m未知,用樣本均值

來估計(jì)m,則

為m的點(diǎn)估計(jì)量,對(duì)應(yīng)于樣本值,

的值為m的點(diǎn)估計(jì)值.

5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)

例如,總體均值m未知,既可以用樣本均值來估計(jì),也可用x1來估計(jì).顯然兩種估計(jì)的效果是不一樣的.為了對(duì)同一參數(shù)的不同點(diǎn)估計(jì)進(jìn)行比較,就必須對(duì)點(diǎn)估計(jì)的好壞給出評(píng)價(jià)標(biāo)準(zhǔn).

數(shù)理統(tǒng)計(jì)中常用無偏性、有效性和相合性來評(píng)價(jià)一個(gè)估計(jì)量的好壞.由于樣本的隨機(jī)性,點(diǎn)估計(jì)值

與參數(shù)的真實(shí)值q

一般不相等,是由抽樣的隨機(jī)性引起的估計(jì)誤差,稱為抽樣誤差.如果抽樣誤差

的均值為0,就有可能用多次重復(fù)抽樣得到的點(diǎn)估計(jì)值的均值精確地估計(jì)參數(shù).5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)定義5.1.2設(shè)是總體參數(shù)q的點(diǎn)估計(jì)量.若

(5.1.1)則稱是參數(shù)q

的無偏估計(jì),也稱具有無偏性,否則稱為有偏估計(jì).若參數(shù)不存在無偏估計(jì)量,則稱該參數(shù)是不可估的.

樣本均值是總體均值的無偏估計(jì),樣本方差是總體方差的無偏估計(jì).無偏估量的函數(shù)不一定是無偏估計(jì)量.例如,設(shè)是參數(shù)q

的無偏估量,且

,則不是q2的無偏估計(jì)量.事實(shí)上,

5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)定義5.1.3設(shè)和都是總體參數(shù)q

的無偏估計(jì)量.若

(5.1.2)則稱比更有效,也稱具有有效性.

一般地,用整個(gè)樣本的均值比用樣本的部分個(gè)體的均值估計(jì)總體的均值更有效.5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)例5.1.1設(shè)總體X~N(m,s2),其中m和s2是未知參數(shù).x1,x2是來自總體的樣本,試比較m的點(diǎn)估計(jì)

的有效性.解都是無偏估計(jì).

5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)

正如一般地用整個(gè)樣本的均值比用樣本的部分個(gè)體的均值估計(jì)總體的均值更有效.我們完全可以要求點(diǎn)估計(jì)量隨著樣本容量的不斷增大而逼近參數(shù)的真實(shí)值,這就是相合估計(jì)的含義.定義5.1.4設(shè)是總體參數(shù)q

的點(diǎn)估計(jì)量.若n→+∞時(shí),依概率收斂于q,即對(duì)任意小的e>0,有

(5.1.3)則稱是總體參數(shù)q

的相合估計(jì)或一致估計(jì),也稱具有相合性或一致性.5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)

相合性要求可以適當(dāng)選取樣本容量使得估計(jì)達(dá)到指定的精度.例如要求估計(jì)的抽樣誤差落在(-0.001,0.001)內(nèi),只要

滿足相合性,由極限的含義,就可以適當(dāng)選取足夠大樣本容量n使得抽樣誤差幾乎處處落于(-0.001,0.001)內(nèi).所以相合性被認(rèn)為是對(duì)估計(jì)的一個(gè)基本要求,不滿足相合性要求的估計(jì)通常不予考慮.5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)

例5.1.2設(shè)x1,x2,…,是來自總體X的樣本,其k階原點(diǎn)矩E(Xk)存在且未知,則樣本的k

階原點(diǎn)矩ak是總體的k階原點(diǎn)矩E(Xk)的相合估計(jì).

證明

因?yàn)閤1,x2,…,是來自總體X的樣本,所以{xi}(i=1,2,…)是獨(dú)立同分布隨機(jī)序列.由于個(gè)體與總體服從相同的分布且E(Xk)存在,所以E(xik)=E(Xk).由辛欽大數(shù)定律知,對(duì)任意小的e>0,所以樣本的k

階原點(diǎn)矩ak是總體的k階原點(diǎn)矩E(Xk)的相合估計(jì).5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)5.1.2點(diǎn)估計(jì)的評(píng)價(jià)標(biāo)準(zhǔn)

定理5.1.1若

分別是q1,q2,…,qk的相合估計(jì),h=g(q1,q2,…,qk)是q1,q2,…,qk的連續(xù)函數(shù),則

是h=g(q1,q2,…,qk)的相合估計(jì).

例如,樣本均值是總體均值的相合估計(jì),樣本方差是總體方差的相合估計(jì).變異系數(shù)是均值和方差的連續(xù)函數(shù),所以樣本變異系數(shù)是總體變異系數(shù)的相合估計(jì).

若總體的各階矩存在,因高階矩都可以用低階矩的函數(shù)表示,由大數(shù)定律及定理5.1.1可知,樣本矩都是總體矩的相合估計(jì).5.1點(diǎn)估計(jì)及其評(píng)價(jià)標(biāo)準(zhǔn)

求點(diǎn)估計(jì)的常用方法是矩估計(jì)法和最大似然估計(jì)法.

矩估計(jì)法(簡(jiǎn)稱ME)是英國(guó)統(tǒng)計(jì)學(xué)家皮爾遜(KarlPearson,1857-1936)1900年提出的參數(shù)估計(jì)方法,其理論依據(jù)是樣本矩是總體矩的相合估計(jì).皮爾遜致力于大樣本理論的研究,他發(fā)現(xiàn)不少生物方面的數(shù)據(jù)有顯著性的偏態(tài),不適合用正態(tài)分布去刻畫,為此他提出了后來以他的名字命名的分布族,為估計(jì)這個(gè)分布族中的參數(shù),他提出了“矩估計(jì)法”.

5.2

矩估計(jì)法

由定理5.1.1及樣本矩都是總體矩的相合估計(jì)知,當(dāng)總體矩存在且樣本容量充分大時(shí),樣本的k階原點(diǎn)矩幾乎等于總體的k階原點(diǎn)矩,樣本的k階中心矩幾乎等于總體的

k階中心矩矩;樣本變異系數(shù)(其中樣本標(biāo)準(zhǔn)差采用樣本二階中心矩的算術(shù)平方根)幾乎等于總體變異系數(shù),樣本分位數(shù)幾乎等于總體分位數(shù),樣本中事件A出現(xiàn)的頻率幾乎等于總體中事件A出現(xiàn)的概率等.矩估計(jì)法是當(dāng)總體矩存在且樣本容量充分大時(shí),用樣本矩作為總體的同階同類型矩的估計(jì)而列出關(guān)于未知參數(shù)的方程(組),然后通過解方程(組)來估計(jì)參數(shù),得到的估計(jì)量稱為矩估計(jì)量.5.2

矩估計(jì)法例5.2.1設(shè)總體X~Exp(l),其中l(wèi)是未知參數(shù).x1,x2,…,xn是來自總體的樣本,試求

l的矩估計(jì)量.解由于只有一個(gè)未知參數(shù),所以采用樣本的一階原點(diǎn)矩估計(jì)總體的一階原點(diǎn)矩.總體一階原點(diǎn)矩為

E(X)=1/l,

樣本的一階原點(diǎn)矩為

a1=令E(X)

=a1得

另外,由于總體的二階中心矩為D(X)=1/l2,樣本的二階中心矩為b2,令

1/l2=b2得

參數(shù)的矩估計(jì)量可能不唯一.實(shí)踐中通常應(yīng)盡量使用低階矩來估計(jì)參數(shù).

5.2

矩估計(jì)法例5.2.2設(shè)總體X的均值m和方差s2是未知參數(shù).x1,x2,…,xn是來自的樣本,試求m和s2的矩估計(jì).解要估計(jì)兩個(gè)參數(shù),通常需要構(gòu)造兩個(gè)方程,從中解出參數(shù)的估計(jì).

總體的一階原點(diǎn)矩和二階中心矩分別為E(X)和D(X).

樣本的一階原點(diǎn)矩和二階中心矩分別為

令樣本矩等于總體矩,即可得

(5.2.1)5.2

矩估計(jì)法例5.2.3設(shè)總體X~N(m,s2)的均值m和方差s2是未知參數(shù).x1,x2,…,xn是來自的樣本,測(cè)得樣本值如下:

試求:(1)m和s2的矩估計(jì)值;(2)估算概率P{100<X<130}.

解(1)由例5.2.2知,將樣本值代入計(jì)算得

(2)5.2

矩估計(jì)法11510499108989998109115106例5.2.4設(shè)總體X~N(m,1),其中m是未知參數(shù).對(duì)X觀測(cè)100次,發(fā)現(xiàn)有61次觀測(cè)值大于0,試求m的矩估計(jì)值.解P{X>0}=1-P{X≤0}=1-F0(-m),100次觀測(cè)中X

大于0的頻率為61/100=0.61,用頻率估計(jì)概率,即令1-F0(-m)=0.61,F0(m)=0.61,查表得值得強(qiáng)調(diào)的是,矩估計(jì)利用的是樣本矩對(duì)總體矩的相合性,因此采用矩估計(jì)時(shí)通常要求樣本容量充分大,否則矩估計(jì)可能不合理.例如,設(shè)x1,x2,x3,x4

是來自總體X~U(0,q)的樣本,其樣本值為1,2,3,7,則樣本均值為3.25,令總體均值等于樣本均值,得q的矩估計(jì)值為6.5.顯然此時(shí)矩估計(jì)就不合理,因?yàn)閰^(qū)間(0,6.5)不包含樣本值7.5.2

矩估計(jì)法

最大似然估計(jì)法(簡(jiǎn)稱MLE)是在總體分布形式已知條件下使用的一種參數(shù)估計(jì)方法,由德國(guó)數(shù)學(xué)家高斯在1821年提出.費(fèi)歇爾(R.A.Fisher,1890-1962)在1912年重新發(fā)現(xiàn)了這一方法,并研究了這種方法的一些性質(zhì).為了理解最大似然估計(jì)原理,先看一個(gè)例子.例5.3.1設(shè)有一大批產(chǎn)品,其廢品率p未知,現(xiàn)從中隨機(jī)抽取出100件進(jìn)行檢驗(yàn),發(fā)現(xiàn)其中有5件廢品,試估計(jì)廢品率p.解由于估計(jì)的是廢品率,所以發(fā)現(xiàn)廢品計(jì)作1,合格品計(jì)作0,總體X服從參數(shù)為p

的0–1分布,即

p(x)=px(1-p)1-x,x=0,1.將這批產(chǎn)品視作一個(gè)總體X,抽出的100件視作樣本,記作x1,x2,…,x100.xi服從參數(shù)為p的0–1分布且相互獨(dú)立,即

5.3

最大似然估計(jì)法所以樣本的聯(lián)合分布為

100件產(chǎn)品中發(fā)現(xiàn)5件廢品,所以∑xi=5,進(jìn)而p(x1,x2,…,x100)=p5(1-p)95,此概率只和參數(shù)p有關(guān),將其表示為

L(p)=p5(1-p)95,經(jīng)驗(yàn)告訴我們,“抽到的這個(gè)樣本的概率似乎是最大的,否則為什么一抽就抽到它呢?”為此求L(p)的最大值點(diǎn).令

dL(p)/dp=5p4(1-p)95-95p5(1-p)94=0,解得p=0.05.5.3

最大似然估計(jì)法

由于只有一個(gè)極值點(diǎn),所以p=0.05就是最大值點(diǎn).我們用0.05作為p的估計(jì)值,這一結(jié)果與矩估計(jì)的結(jié)果是一致的.“抽到的樣本的概率似乎是最大的”這種想法常稱作“最大似然原理”.用最大似然原理得到的參數(shù)估計(jì)量就是最大似然估計(jì)量,得到的參數(shù)估計(jì)值就是最大似然估計(jì)值.最大似然估計(jì)法的步驟是:步驟1根據(jù)總體的分布求樣本的聯(lián)合概率函數(shù),稱為似然函數(shù).這里的似然函數(shù)可以是聯(lián)合密度函數(shù),也可以是聯(lián)合概率.步驟2求似然函數(shù)的最大值,為了簡(jiǎn)化計(jì)算,常常先求似然函數(shù)的對(duì)數(shù),稱為對(duì)數(shù)似然函數(shù),然后利用導(dǎo)數(shù)求(對(duì)數(shù))似然函數(shù)的最大值.步驟3得到參數(shù)的最大似然估計(jì).5.3

最大似然估計(jì)法例5.3.2設(shè)總體X~N(m,s2),其中m和s2是未知參數(shù).x1,x2,…,xn是來自總體的樣本,試求m和s2的最大似然估計(jì).解總體X~N(m,s2),所以樣本中個(gè)體xi~N(m,s2)(i=1,2,…,n)的密度函數(shù)為

取樣本的聯(lián)合概率密度函數(shù)作為似然函數(shù),即對(duì)似然函數(shù)取對(duì)數(shù)得對(duì)數(shù)似然函數(shù):5.3

最大似然估計(jì)法

將lnL(m,s2)分別對(duì)m和s2

求偏導(dǎo)數(shù)并令其為0得方程組

解方程組得m和s2的最大似然估計(jì)分別為5.3

最大似然估計(jì)法需要指出的是,利用求導(dǎo)數(shù)的方法求最大似然估計(jì)并不是總有效,看下面的例子.例5.3.3設(shè)總體X~U(0,q),其中q是未知參數(shù).x1,x2,…,xn是來自總體的樣本,試求

q的最大似然估計(jì).解總體X~U(0,q),所以樣本中個(gè)體xi~U(0,q).xi

的密度函數(shù)為

取樣本的聯(lián)合概率密度函數(shù)作為似然函數(shù),即

此時(shí),似然函數(shù)與樣本無關(guān),顯然L(q)關(guān)于q單調(diào)遞減,q越小L(q)越大.但是0<x1,x2,…,xn<q,要使樣本中的每一個(gè)xi都落在區(qū)間(0,q)內(nèi),合理的最大似然估計(jì)是5.3

最大似然估計(jì)法最大似然估計(jì)有一個(gè)簡(jiǎn)單而有用的性質(zhì):如果

是q的最大似然估計(jì),則對(duì)任一函數(shù)連續(xù)g(q),其最大似然估計(jì)為.該性質(zhì)稱為最大似然估計(jì)的不變性,從而使一些復(fù)雜結(jié)構(gòu)的參數(shù)的最大似然估計(jì)的獲得變得容易了.

例5.3.4設(shè)總體X~N(m,s2),其中m和s2是未知參數(shù).來自總體的一個(gè)容量為10的樣本值為試求:(1)標(biāo)準(zhǔn)差s的最大似然估計(jì);(2)概率P{X<2}的最大似然估計(jì);(3)總體左尾0.90分位數(shù)x0.90的最大似然估計(jì).5.3

最大似然估計(jì)法0.71.40.51.41.41.70.90.61.21.5

例5.3.4解

(1)由例5.3.2知,m

和s2

的最大似然估計(jì)分別為將樣本值代入計(jì)算得

由最大似然估計(jì)的不變性,標(biāo)準(zhǔn)差s的最大似然估計(jì)是(2)由最大似然估計(jì)的不變性,5.3

最大似然估計(jì)法

例5.3.4解(3)X~N(m,s2),由分位數(shù)的定義知P{X≤x0.90}=0.90,其中z0.90為標(biāo)準(zhǔn)正態(tài)分布的左尾0.90分位數(shù).

由最大似然估計(jì)的不變性

總結(jié)常用分布參數(shù)的矩估計(jì)量和最大似然估計(jì)量見表5.3.1.5.3

最大似然估計(jì)法5.4.1區(qū)間估計(jì)的概念5.4.2正態(tài)總體均值的區(qū)間估計(jì)5.4.3未知分布總體或非正態(tài)總體的均值區(qū)間估計(jì)5.4.4正態(tài)總體方差的區(qū)間估計(jì)5.4.5總體成數(shù)的區(qū)間估計(jì)5.4

單總體參數(shù)的區(qū)間估計(jì)

用統(tǒng)計(jì)量對(duì)總體參數(shù)進(jìn)行點(diǎn)估計(jì),要達(dá)到100%的準(zhǔn)確而沒有任何誤差,幾乎是不可能的,所以在估計(jì)總體參數(shù)時(shí)就必須同時(shí)考慮估計(jì)誤差的大小.對(duì)于未知參數(shù),除了求得其點(diǎn)估計(jì)外,我們還希望估計(jì)出參數(shù)的范圍,并使這個(gè)范圍達(dá)到一定的可信度,這個(gè)范圍稱之為置信區(qū)間.求參數(shù)的置信區(qū)間就是區(qū)間估計(jì)起了重大作用.5.4

單總體參數(shù)的區(qū)間估計(jì)5.4

單總體參數(shù)的區(qū)間估計(jì)

區(qū)間估計(jì)理論的完善經(jīng)歷了一個(gè)相當(dāng)長(zhǎng)的過程.

早在奈曼(J.Neyman,1894-1984)的工作之前,區(qū)間估計(jì)就已是一種常用的參數(shù)估計(jì)形式.奈曼和皮爾遜(E.Pearson)創(chuàng)立了系統(tǒng)的區(qū)間估計(jì)理論.奈曼把區(qū)間估計(jì)理論置于柯爾莫哥洛夫概率論公理體系的基礎(chǔ)之上,因而奠定了嚴(yán)格的理論基礎(chǔ).奈曼還把求區(qū)間估計(jì)的問題表達(dá)為一種數(shù)學(xué)上的最優(yōu)解問題,這個(gè)理論與奈曼-皮爾遜假設(shè)檢驗(yàn)理論,對(duì)數(shù)理統(tǒng)計(jì)成為一門嚴(yán)格的數(shù)學(xué)分支學(xué)科起了重大作用.5.4.1區(qū)間估計(jì)的概念例如某種電壓計(jì)測(cè)量電壓的誤差(單位:伏特)服從N(m,1),現(xiàn)對(duì)該電壓計(jì)觀測(cè)了9次,發(fā)現(xiàn)誤差分別為:?jiǎn)栴}是在95%的把握下m會(huì)落在什么范圍內(nèi)呢?問題可以描述為,尋找兩個(gè)數(shù)使

我們借助于隨機(jī)變量的分布來尋找數(shù).由于

是m的無偏估計(jì)和相合估計(jì),且

從而.5.4

單總體參數(shù)的區(qū)間估計(jì)-0.10.5-0.30.6-0.50.5-0.40.8-0.25.4.1區(qū)間估計(jì)的概念

注意到Z是樣本與參數(shù)m的函數(shù),但其分布為標(biāo)準(zhǔn)正態(tài)分布,不依賴于參數(shù)m.如圖5.4.1所示,由標(biāo)準(zhǔn)正態(tài)分布的性質(zhì)可知,

其中z0.025=1.96為N(0,1)的右尾0.025分位數(shù).進(jìn)一步有

將=0.1代入得P{-0.55≤m≤0.75}≈0.95,即在95%的把握下m

會(huì)落入[-0.55,0.75].

5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.1區(qū)間估計(jì)的概念定義5.4.1設(shè)q

是總體的一個(gè)待估參數(shù),x1,x2,…,xn是來自總體X的一個(gè)樣本.若對(duì)給定的a(0<a<1),由樣本確定的兩個(gè)統(tǒng)計(jì)量,

滿足

(5.4.1)如圖5.4.2所示,則稱區(qū)間是q的置信水平為1-a的置信區(qū)間,簡(jiǎn)稱1-a置信區(qū)間,求參數(shù)的置信區(qū)間就是區(qū)間估計(jì).

這里置信水平1-a的含義是指在大量重復(fù)使用置信區(qū)間時(shí),真實(shí)參數(shù)m落在置信區(qū)間的可信度至少有100(1-a)%.5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.1區(qū)間估計(jì)的概念上述尋找置信區(qū)間的方法稱為樞軸量法,其步驟如下:步驟1設(shè)法構(gòu)造一個(gè)樣本和未知參數(shù)的函數(shù)G,使得G的分布已知且不依賴于未知參數(shù),G稱為樞軸量.步驟2適當(dāng)?shù)剡x擇兩個(gè)常數(shù)c和d使對(duì)給定的a(0<a<1),有P{c≤G≤d}=1-a.步驟3將c≤G≤d進(jìn)行不等式變形化為,則就是q的一個(gè)1-a置信區(qū)間.

顯然置信區(qū)間的長(zhǎng)度越小估計(jì)越精確,但實(shí)際中選取區(qū)間長(zhǎng)度最短的c和d很難實(shí)現(xiàn).因此常選擇等尾概率的置信區(qū)間,即選取c和d使

P{G<c}=P{G>d}=a/2.

除特殊說明外,本章求置信區(qū)間時(shí)所用的分位數(shù)都是隨機(jī)變量的右尾分位數(shù).

5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.2正態(tài)總體均值的區(qū)間估計(jì)設(shè)x1,x2,…,xn是來自總體X~N(m,s2)的樣本,

與s2分別為樣本均值與方差.m未知,現(xiàn)對(duì)m進(jìn)行區(qū)間估計(jì).1)總體方差已知時(shí)總體均值的區(qū)間估計(jì)用作為m的點(diǎn)估計(jì),選取樞軸量如圖5.4.3所示,由于故m的1-a置信區(qū)間為

(5.4.2)其中,稱為估計(jì)誤差,稱為標(biāo)準(zhǔn)誤差.(定理4.3.2的結(jié)論)

5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.2正態(tài)總體均值的區(qū)間估計(jì)例5.4.1一種袋裝食品的重量(單位:千克)服從方差為25的正態(tài)分布,平均重量未知.現(xiàn)隨機(jī)抽取9袋,測(cè)得其平均重量為248千克,試求該種袋裝食品平均重量的95%置信區(qū)間.解本例是總體方差已知時(shí)正態(tài)總體均值的區(qū)間估計(jì).=248,a=0.05,za/2=z0.025≈1.96,s=5,n=9代入(5.4.1)得從而該種袋裝食品平均重量的95%置信區(qū)間為[244.73,251.27].5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.2正態(tài)總體均值的區(qū)間估計(jì)例5.4.2某總體服從標(biāo)準(zhǔn)差為200的正態(tài)分布,總體均值未知.現(xiàn)欲隨機(jī)抽取一個(gè)樣本估計(jì)總體均值的95%置信區(qū)間,希望估計(jì)誤差不超過40,應(yīng)抽取容量多大的樣本?解本例涉及總體方差已知時(shí)正態(tài)總體均值的區(qū)間估計(jì).

s=200,a=0.05,za/2=z0.025=1.96,估計(jì)誤差,所以

故應(yīng)至少抽取容量為97的樣本.5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.2正態(tài)總體均值的區(qū)間估計(jì)2)總體方差未知時(shí)總體均值的區(qū)間估計(jì)用作為m的點(diǎn)估計(jì),選取樞軸量

如圖5.4.4所示,由于,,故m的1-a置信區(qū)間為

(5.4.3)其中,稱為估計(jì)誤差,稱為標(biāo)準(zhǔn)誤差.

(定理4.3.4的結(jié)論)

5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.2正態(tài)總體均值的區(qū)間估計(jì)例5.4.3已知某種燈泡的壽命(單位:小時(shí))服從正態(tài)分布,其均值和方差都未知.現(xiàn)從一批燈泡中隨機(jī)抽取9個(gè),測(cè)得其平均壽命為1299.67,標(biāo)準(zhǔn)差為10,試求該批燈泡平均使用壽命的95%置信區(qū)間.解

本例是總體方差未知時(shí)正態(tài)總體均值的區(qū)間估計(jì).=1291.79,s=10,n=9,a=0.05,ta/2(n-1)=t0.025(8)≈2.31,代入式(5.4.3)得

從而該批燈泡平均使用壽命的95%置信區(qū)間為[1291.79,1307.37]5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.3未知分布總體或非正態(tài)總體的均值區(qū)間估計(jì)

設(shè)總體X的分布未知或服從非正態(tài)分布,且均值m未知.x1,x2,…,xn是來自總體的樣本,樣本均值與方差分別為

與s2.現(xiàn)對(duì)m進(jìn)行區(qū)間估計(jì).

作為m的點(diǎn)估計(jì),當(dāng)樣本容量n充分大時(shí),漸近服從正態(tài)分布(定理4.3.2的結(jié)論),即

若總體方差s2已知,選取樞軸量,此時(shí)m的1-a

置信區(qū)間為

(5.4.4)5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.3未知分布總體或非正態(tài)總體的均值區(qū)間估計(jì)

若總體方差s2已知,選取樞軸量此時(shí)m的1-a

置信區(qū)間為

(5.4.5)

例5.4.4某人壽保險(xiǎn)公司承保了49位投保人,這49位投保人的平均年齡為55歲,年齡的方差為81.試求該類投保人平均年齡的95%置信區(qū)間.

本例是總體分布未知,且總體方差也未知時(shí),總體均值區(qū)間估計(jì).將49位投保人視作一個(gè)樣本.=55,s2=81,n=49,a=0.05,za/2=z0.025=1.96,代入(5.4.5)得該類投保人平均年齡的95%置信區(qū)間為[52.48,57.52]5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.4正態(tài)總體方差的區(qū)間估計(jì)設(shè)x1,x2,…,xn是來自總體X~N(m,s2)的樣本,s2為樣本方差.s2未知,現(xiàn)對(duì)s2進(jìn)行區(qū)間估計(jì).用樣本方差s2作為總體方差s2的點(diǎn)估計(jì),

選取樞軸量如圖5.4.5所示,由于,

故m的1-a置信區(qū)間為

(5.4.6)(定理4.3.3的結(jié)論).

5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.4正態(tài)總體方差的區(qū)間估計(jì)例5.4.5一種袋裝食品的重量(單位:千克)服從正態(tài)分布且方差未知.現(xiàn)隨機(jī)抽取40袋,測(cè)得樣本方差為25.試求該種袋裝食品重量方差的95%置信區(qū)間.解本例是正態(tài)總體方差的區(qū)間估計(jì).

s2=25,n=40,a=0.05,c21-a/2(n-1)=c20.975(39)≈23.65,c2a/2(n-1)=c20.025(39)≈58.12,代入式(5.4.6)得

故s2的95%置信區(qū)間為[16.78,41.23].5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.5總體成數(shù)的區(qū)間估計(jì)設(shè)x1,x2,…,xn是來自總體X~B(1,p)的樣本.顯然,樣本均值

就是樣本成數(shù)P.總體成數(shù)p未知,現(xiàn)對(duì)p進(jìn)行區(qū)間估計(jì).在大樣本下,

,

,故選取樞軸量

從而5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.5總體成數(shù)的區(qū)間估計(jì)

由于p未知,當(dāng)n充分大時(shí),P是p的一致估計(jì),我們用P代替p,得p

的1-a置信區(qū)間為

(5.4.7)其中,稱為估計(jì)誤差,稱為標(biāo)準(zhǔn)誤差.5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.5總體成數(shù)的區(qū)間估計(jì)例5.4.6某地想估計(jì)某種流行性傳染病患者所占的比例,隨機(jī)抽取2500人,其中10人患有該種疾病.試估計(jì)該地患某種流行性傳染病患者比例的95%置信區(qū)間(保留4位小數(shù)).解本例是總體成數(shù)的區(qū)間估計(jì).

P=10/2500=0.004,n=2500,a=0.05,za/2=z0.025=1.96,代入式(5.4.7)得

從而該地患某種流行性傳染病患者的比例的95%置信區(qū)間為[0.0015,0.0065]5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.5總體成數(shù)的區(qū)間估計(jì)例5.4.7某總體的成數(shù)未知,現(xiàn)要通過問卷調(diào)查估計(jì)該總體的成數(shù).在大樣本下,為使估計(jì)誤差不超過Δ.(1)試問應(yīng)怎樣確定樣本量?若問卷回答率為r,應(yīng)怎樣確定樣本量?(2)若Δ=0.05,a=0.05,以往的問卷回答率為80%,則樣本量至少需要多大?解(1)在大樣本下,總體成數(shù)p

的1-a

置信區(qū)間為

式中P為樣本成數(shù),為估計(jì)誤差.若要求,則(5.4.8)5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.5總體成數(shù)的區(qū)間估計(jì)

由式5.4.8)可知,要確定樣本量n,需要調(diào)查者事先主觀確定允許的估計(jì)誤差Δ和置信水平1-a,還得知道樣本成數(shù)P.顯然P=0.5時(shí),估計(jì)誤差最大.因此,在無法得到P值時(shí),可用P=0.5計(jì)算.這樣得到的樣本量可能比實(shí)際需要的樣本量大,但可以充分保證有足夠高的置信度和盡可能小的置信區(qū)間.因此樣本量(5.4.9)若問卷回答率為r,則是式(5.4.9)調(diào)整為(5.4.10)5.4

單總體參數(shù)的區(qū)間估計(jì)5.4.5總體成數(shù)的區(qū)間估計(jì)(2)若Δ=0.05,a=0.05,r=80%,則樣本量所以樣本量至少需要481.5.4

單總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)5.5.2雙總體方差之比的區(qū)間估計(jì)5.5.3雙總體成數(shù)之差的區(qū)間估計(jì)5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)設(shè)x1,x2,…,xm和y1,y2,…,yn是分別來自總體X~N(m1,s12)和Y~N(m2,s22)的樣本,且相互獨(dú)立.樣本均值與方差分別是.m1和m2皆未知,現(xiàn)對(duì)m1-m2進(jìn)行區(qū)間估計(jì).1)總體方差已知時(shí)m1-m2的區(qū)間估計(jì)用

分別作為m1和m2的點(diǎn)估計(jì)量,選取樞軸量由于,故m1-m2的1-a置信區(qū)間端點(diǎn)為

(5.5.1)

(定理4.3.6的結(jié)論).

5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)例5.5.1某中學(xué)想估計(jì)實(shí)驗(yàn)班與普通班的數(shù)學(xué)平均成績(jī)之差,為此從實(shí)驗(yàn)班的學(xué)生中隨機(jī)抽取了8名學(xué)生,測(cè)得數(shù)學(xué)平均成績(jī)?yōu)?7分,從普通班的學(xué)生中隨機(jī)抽取了10名學(xué)生,測(cè)得數(shù)學(xué)平均成績(jī)?yōu)?2分,已知實(shí)驗(yàn)班與普通班的數(shù)學(xué)成績(jī)的方差分別為3和7.假設(shè)兩個(gè)班的成績(jī)均服從正態(tài)分布,試求兩個(gè)班數(shù)學(xué)平均成績(jī)之差的95%置信區(qū)間.解設(shè)實(shí)驗(yàn)班與普通班的數(shù)學(xué)成績(jī)分別X~N(m1,s12)和Y~N(m2,s22),本例是總體方差已知時(shí)的m1-m2

區(qū)間估計(jì).

代入式(5.5.1)得,

從而兩個(gè)班數(shù)學(xué)平均成績(jī)之差的95%置信區(qū)間為[2.97,7.03].5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)2)總體方差未知但相等時(shí)m1-m2的區(qū)間估計(jì)選取樞軸量

其中,

(5.5.2)由于,故m1-m2的1-a置信區(qū)間端點(diǎn)為(5.5.3)(定理4.3.7的結(jié)論)

5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)例5.5.2在對(duì)某種化妝品的滿意度調(diào)查中,隨機(jī)調(diào)查了8名男士,他們對(duì)該種化妝品的平均評(píng)分為75,方差約為186;隨機(jī)調(diào)查了8名女士,她們對(duì)該種化妝品的平均評(píng)分為67,方差約為182.假設(shè)男士和女士對(duì)該化妝品的滿意度評(píng)分都服從正態(tài)分布,且方差相等.試求男士和女士的滿意度平均評(píng)分之差的95%置信區(qū)間.解設(shè)男士和女士的滿意度評(píng)分分別X~N(m1,s12)和Y~N(m2,s22),本例是總體方差未知但相等時(shí)的m1-m2

區(qū)間估計(jì).

代入(5.5.2)得

,代入式(5.5.3)得,從而評(píng)分之差的95%置信區(qū)間約為[-6.51,22.51].5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)3)總體方差未知且不相等時(shí)m1-m2的區(qū)間估計(jì)

在小樣本下,兩總體均值之差的抽樣分布不再服從自由度m+n-2的t分布,而是近似地服從自由度為l的t分布,即

(5.5.4)其中,

(5.5.5)實(shí)際中l(wèi)一般不為整數(shù),可以取l最接近的整數(shù).5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)

小樣本下,選取(5.5.4)作為樞軸量,由此得m1-m2的1-a近似置信區(qū)間端點(diǎn)為

(5.5.6)在大樣本下,由中心極限定理知,大樣本下,選取(5.5.6)作為樞軸量,由此得

m1-m2的1-a近似置信區(qū)間端點(diǎn)為

(5.5.7)5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)例5.5.3若在例5.5.2中,假設(shè)男士和女士對(duì)該化妝品的滿意度評(píng)分都服從正態(tài)分布,方差未知且不相等,試求男士和女士的滿意度平均評(píng)分之差的95%置信區(qū)間.解設(shè)男士和女士的滿意度評(píng)分分別為X~N(m1,s12)和Y~N(m2,s22),本例是小樣本下總體方差未知且不相等時(shí)的m1-m2

區(qū)間估計(jì).

代入(5.5.5)得代入式(5.5.6)得,從而男士和女士的滿意度平均評(píng)分之差的95%置信區(qū)間約為[-6.51,22.51].5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)4)匹配樣本的m1-m2的區(qū)間估計(jì)

匹配樣本是指一個(gè)樣本中的數(shù)據(jù)與另一個(gè)樣本中的數(shù)據(jù)對(duì)應(yīng).比如先指定12個(gè)工人用第一種方法組裝一批零件,再讓這12個(gè)工人用第二種方法組裝同一批零件,這樣得到的樣本數(shù)據(jù)即為匹配樣本數(shù)據(jù).

在正態(tài)假定下X-Y~N(m1-m2,sd2).這樣兩總體區(qū)間估計(jì)問題就轉(zhuǎn)化成單總體區(qū)間估計(jì)問題.當(dāng)sd2已知時(shí),選取樞軸量m1-m2的1-a置信區(qū)間端點(diǎn)為

(5.5.8)5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的區(qū)間估計(jì)

當(dāng)sd2未知時(shí),選取樞軸量m1-m2的1-a置信區(qū)間端點(diǎn)為

(5.5.9)5.5

雙總體參數(shù)的區(qū)間估計(jì)5.5.1雙總體均值之差的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論