《統(tǒng)計(jì)學(xué)原理與應(yīng)用》課件第06章抽樣推斷_第1頁(yè)
《統(tǒng)計(jì)學(xué)原理與應(yīng)用》課件第06章抽樣推斷_第2頁(yè)
《統(tǒng)計(jì)學(xué)原理與應(yīng)用》課件第06章抽樣推斷_第3頁(yè)
《統(tǒng)計(jì)學(xué)原理與應(yīng)用》課件第06章抽樣推斷_第4頁(yè)
《統(tǒng)計(jì)學(xué)原理與應(yīng)用》課件第06章抽樣推斷_第5頁(yè)
已閱讀5頁(yè),還剩64頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章抽樣推斷統(tǒng)計(jì)學(xué)原理與應(yīng)用

學(xué)習(xí)目的:①理解抽樣推斷的含義、特點(diǎn)與作用。②理解抽樣誤差的含義、影響因素。③掌握抽樣誤差的表現(xiàn)形式,及其計(jì)算方法。④掌握抽樣推斷的基本方法。⑤理解并區(qū)分幾種常用的抽樣調(diào)查組織方式。⑥掌握假設(shè)檢驗(yàn)的一般方法與程序。

一、抽樣推斷的概念、特點(diǎn)與意義

1、抽樣推斷的概念抽樣推斷是根據(jù)隨機(jī)原則,從調(diào)查總體中抽取部分單位組成樣本進(jìn)行調(diào)查,利用樣本的實(shí)際數(shù)據(jù)計(jì)算樣本指標(biāo),并據(jù)以推算總體相應(yīng)數(shù)量特征的一種統(tǒng)計(jì)分析方法。第一節(jié)抽樣推斷概述特點(diǎn)

它是一種由部分推斷整體的研究方法。

抽樣推斷建立在隨機(jī)抽樣的基礎(chǔ)上。

抽樣推斷運(yùn)用概率估計(jì)的方法。

抽樣推斷的誤差可以事先計(jì)算并加以控制。2、抽樣推斷的特點(diǎn)二、抽樣推斷的內(nèi)容

(一)參數(shù)估計(jì)

(二)假設(shè)檢驗(yàn)三、抽樣推斷的一些基本概念(一)總體和樣本總體:又稱全及總體。指所要認(rèn)識(shí)的研究對(duì)象全體。總體單位總數(shù)用“N”表示。樣本:又稱子樣。是從全及總體中隨機(jī)抽取出來(lái),作為代表這一總體的那部分單位組成的集合體。樣本單位總數(shù)用“n”表示。(二)變量總體和屬性總體變量總體:如果每一個(gè)總體單位就所研究的標(biāo)志可以取不同的量,此時(shí)的研究總體稱為變量總體。屬性總體:如果有些現(xiàn)象總體就所研究的標(biāo)志只表現(xiàn)為兩種性質(zhì)上的差異,此時(shí)的研究總體稱為屬性總體。(三)總體指標(biāo)和樣本指標(biāo)總體指標(biāo)是根據(jù)總體中各單位的標(biāo)志值或標(biāo)志屬性計(jì)算的,反映總體的某種屬性或特征的綜合指標(biāo),稱為全及指標(biāo),也稱為總體參數(shù)。

參數(shù)變量總體條件下總體平均數(shù)總體方差X=∑XNX=∑XF∑FΣ(X-X)

N2σ=2Σ(X-X)FΣF2σ=2屬性總體條件下總體成數(shù)方差σ2=P(1-P)P=

N1N樣本指標(biāo)是根據(jù)樣本各單位標(biāo)志值或標(biāo)志屬性計(jì)算的綜合指標(biāo)。也稱為樣本統(tǒng)計(jì)量。統(tǒng)計(jì)量變量總體條件下屬性總體條件下樣本平均數(shù)

樣本標(biāo)準(zhǔn)差樣本成數(shù)

標(biāo)準(zhǔn)差

(四)重復(fù)抽樣和不重復(fù)抽樣重復(fù)抽樣:又稱回置抽樣。不重復(fù)抽樣:又稱不回置抽樣??赡芙M成的樣本數(shù)目:N(N-1)(N-2)……(N-n+1)可能組成的樣本數(shù)目:nN從A、B、C、D四個(gè)單位中,抽出兩個(gè)單位構(gòu)成一個(gè)樣本,問(wèn)可能組成的樣本數(shù)目是多少?重復(fù)抽樣AAACADBABBBCBDABCACBCCCDDADBDCDDNn=42=16(個(gè)樣本)例如不重復(fù)抽樣N(N-1)(N-2)…….4×3=12(個(gè)樣本)第二節(jié)抽樣誤差一、抽樣誤差的概念抽樣誤差是指按照隨機(jī)原則抽樣,所得的樣本指標(biāo)和總體指標(biāo)之間的數(shù)量差別。

抽樣誤差的特點(diǎn):是抽樣調(diào)查所特有的,是不可避免的。抽樣誤差的特點(diǎn):是抽樣調(diào)查所特有的,是不可避免的。統(tǒng)計(jì)調(diào)查中存在的誤差(統(tǒng)計(jì)誤差):1.登記性誤差(調(diào)查誤差):它不是抽樣調(diào)查所特有的;是可以避免的。結(jié)論:它不是抽樣誤差2.代表性誤差——是由于樣本不足以代表總體而引起的誤差。第一,系統(tǒng)性誤差——是由于違反隨機(jī)原則而產(chǎn)生的誤差。它是不抽樣推斷所特有的,是能夠避免的,只要遵循隨機(jī)原則就可以避免系統(tǒng)性誤差。結(jié)論:它也不是抽樣誤差第二節(jié)抽樣誤差第二,隨機(jī)性誤差

(偶然性誤差)

——是指嚴(yán)格按照隨機(jī)原則,但由于樣本不能完全覆蓋總體單位而形成的誤差。它是執(zhí)行隨機(jī)原則產(chǎn)生的,是不能夠避免的,而必然存在,只要抽樣調(diào)查就會(huì)有隨機(jī)性誤差。結(jié)論:它是抽樣誤差

系統(tǒng)性誤差隨機(jī)(性)誤差(偶然(性)誤差)統(tǒng)計(jì)誤差:1.登記性誤差(調(diào)查誤差):2.代表性誤差:二、抽樣誤差的表現(xiàn)形式(一)抽樣實(shí)際誤差

抽樣實(shí)際誤差,是指在某一次具體的抽樣調(diào)查中,由隨機(jī)因素引起的樣本指標(biāo)與總體指標(biāo)之間的離差。在多數(shù)情況下,它可能是無(wú)法計(jì)算與測(cè)定的。(二)抽樣平均誤差

抽樣平均誤差,是抽樣平均數(shù)或抽樣成數(shù)的標(biāo)準(zhǔn)差,反映了抽樣指標(biāo)與總體指標(biāo)的平均誤差程度。

抽樣平均誤差的計(jì)算公式抽樣平均數(shù)的平均誤差抽樣成數(shù)的平均誤差實(shí)際上,利用上述兩個(gè)公式是計(jì)算不出抽樣平均誤差的。想一想,為什么?1.抽樣平均數(shù)的抽樣平均誤差采用重復(fù)抽樣:公式6.171.分子(總體標(biāo)準(zhǔn)差)和抽樣誤差的關(guān)系2.分母(樣本容量)和抽樣誤差的關(guān)系采用不重復(fù)抽樣:公式6.18當(dāng)N值較大(一般指大于100)時(shí),式中的修正因子分母的1將可不予考慮,于是:公式6.19

隨機(jī)抽選某校學(xué)生100人,調(diào)查他們的體重。得到他們的平均體重為58公斤,標(biāo)準(zhǔn)差為10公斤。問(wèn)抽樣推斷的平均誤差是多少?已知:n=100例題1σ=10則:即:當(dāng)根據(jù)樣本學(xué)生的平均體重估計(jì)全部學(xué)生的平均體重時(shí),抽樣平均誤差為1公斤。已知:N=2000n=400

某廠生產(chǎn)一種新型燈泡共2000只,隨機(jī)抽出400只作耐用時(shí)間試驗(yàn),測(cè)試結(jié)果平均使用壽命為4800小時(shí),樣本標(biāo)準(zhǔn)差為300小時(shí),求抽樣推斷的平均誤差?例題2σ=300則:2.抽樣成數(shù)的抽樣平均誤差采用重復(fù)抽樣:采用不重復(fù)抽樣:公式6.21公式6.22

某校隨機(jī)抽選400名學(xué)生,發(fā)現(xiàn)戴眼鏡的學(xué)生有80人。根據(jù)樣本資料推斷全部學(xué)生中戴眼鏡的學(xué)生所占比重時(shí),抽樣誤差為多大?已知:則:樣本成數(shù)例題3抽樣平均誤差:

一批食品罐頭共60000桶,隨機(jī)抽查300桶,發(fā)現(xiàn)有6桶不合格,求合格品率的抽樣平均誤差?已知:例題4則:樣本合格率

抽樣極限誤差,指在進(jìn)行抽樣估計(jì)時(shí),根據(jù)研究對(duì)象的變異程度和分析任務(wù)的要求所確定的,樣本指標(biāo)與總體指標(biāo)之間可允許的誤差范圍。(三)抽樣極限誤差及其可靠程度1、抽樣極限誤差的概念抽樣平均數(shù)的極限誤差:抽樣成數(shù)的極限誤差:≤≤≥=Δp│p-P│≥p-Δ≤P≤p+Δpp可以變形為:

區(qū)間(,)稱為平均數(shù)的估計(jì)區(qū)間或置信區(qū)間區(qū)間長(zhǎng)度為2△x區(qū)間(p-△p,p+△p)稱為成數(shù)的估計(jì)區(qū)間或置信區(qū)間,區(qū)間長(zhǎng)度為2△p

【例6-4】要估計(jì)某鄉(xiāng)糧食畝產(chǎn)量和總產(chǎn)量水平,從8000畝糧食作物中,用不重復(fù)抽樣方法抽取400畝,求得平均畝產(chǎn)為450千克。如果確定抽樣極限誤差為5千克,這就要求某鄉(xiāng)糧食畝產(chǎn)為450±5千克,即在445千克至455千克之間,而糧食總產(chǎn)量為8000×(450±5)千克,即在3560噸至3640噸之間?!纠?-5】要估計(jì)某農(nóng)作物秧苗的成活率,從播種這一品種的秧苗地塊隨機(jī)抽取秧苗1000棵,其中死苗80棵,則樣本秧苗成活率p=(1000-80)/1000=92%。如果確定抽樣極限誤差△p為2%,這就要求該種秧苗的成活率P為92%±2%,即在90%至94%之間。

2、抽樣估計(jì)的概率度——t抽樣估計(jì)的概率度是測(cè)量抽樣估計(jì)可靠程度的一個(gè)參數(shù)。用符號(hào)“t”表示,表示誤差范圍(極限誤差)是平均誤差的若干倍。抽樣平均數(shù)、成數(shù)的極限誤差抽樣極限誤差與概率度(可靠性)成正比。tt如【例6-4】已知某鄉(xiāng)糧食畝產(chǎn)的標(biāo)準(zhǔn)差為82千克,總體單位數(shù)N=8000畝,樣本單位數(shù)n=400畝,則可求得抽樣平均誤差為:此時(shí),如果我們用概率度t=1.25來(lái)表示極限誤差的范圍,即1.25u來(lái)規(guī)定誤差范圍的大小,這就要求某鄉(xiāng)的糧食平均畝產(chǎn)為450±1.25u公斤

3、抽樣估計(jì)的置信度---F(t)抽樣估計(jì)的置信度,就是表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過(guò)一定范圍的概率保證程度?!纠?-6】設(shè)樣本糧食平均畝產(chǎn)量

為350千克,又知抽樣平均誤差=6.25千克,求總體糧食平均畝產(chǎn)量在345~355千克之間的估計(jì)置信度。如果允許誤差范圍擴(kuò)大至10千克,即總體平均畝產(chǎn)在340~360千克之間,則概率度t為:

在一定的抽樣平均誤差條件下,概率度t越大,則極限誤差△越大,區(qū)間(,)或(p-△p,p+△p)范圍越寬,總體指標(biāo)落在該區(qū)間內(nèi)的概率(可能性)越大,抽樣估計(jì)的可靠程度越高。,

三、影響抽樣誤差大小的因素1、總體各單位標(biāo)志值的差異程度2、樣本容量即樣本單位數(shù)3、抽樣調(diào)查的組織方式和抽樣方法一、點(diǎn)估計(jì)點(diǎn)估計(jì)的含義點(diǎn)估計(jì)也叫定值估計(jì),就是用樣本指標(biāo)直接代表總體指標(biāo)的估計(jì)方法,即以樣本指標(biāo)的實(shí)際值作為相應(yīng)總體指標(biāo)的估計(jì)值。

第三節(jié)抽樣估計(jì)一、點(diǎn)估計(jì)抽樣估計(jì)的優(yōu)良估計(jì)標(biāo)準(zhǔn)無(wú)偏性一致性第三節(jié)抽樣估計(jì)有效性二、區(qū)間估計(jì)區(qū)間估計(jì)三要素估計(jì)值1、區(qū)間估計(jì)的概念:抽樣極限誤差范圍概率保證程度(1)在給定誤差范圍條件下的區(qū)間估計(jì)模式1.抽取樣本,計(jì)算抽樣指標(biāo)。2.根據(jù)給定的極限誤差范圍,估計(jì)算總體指標(biāo)的上限和下限。3.計(jì)算概率度,查表求出概率F(t),并對(duì)總體參數(shù)作出區(qū)間估計(jì)?!纠?-8】【例6-9】

2、區(qū)間估計(jì)的模式2、區(qū)間估計(jì)的模式(2)在給定概率保證程度下的區(qū)間估計(jì)模式

1.抽取樣本,計(jì)算樣本指標(biāo)。

2.根據(jù)給定的F(t)查表求得概率度t。3.根據(jù)概率度和抽樣平均誤差計(jì)算極限誤差,計(jì)算被估計(jì)值的上、下限,對(duì)總體參數(shù)作出區(qū)間估計(jì)?!纠?-10】【例6-11】

例如某城鎮(zhèn)居民電力消費(fèi)量的有關(guān)資料如下

電力消費(fèi)量(度)家庭戶數(shù)45-5555-6565-7575-8585-9525963合計(jì)25請(qǐng)?jiān)?5%的概率保證程度下,計(jì)算該城鎮(zhèn)家庭用戶用電平均消費(fèi)量的置信區(qū)間。解:第一步,計(jì)算25個(gè)家庭的平均用電量電力消費(fèi)量戶數(shù)f組中值

x

xf45-5555-6565-7575-8585-9525963

合計(jì)255060708090-1003006304802701780解:第二步,計(jì)算家庭平均用電量的標(biāo)準(zhǔn)差電力消費(fèi)量戶數(shù)f組中值x

45-5555-6565-7575-8585-95259635060708090

合計(jì)25—

離差離差平方離差平方和-21.2449.44898.88-11.2125.44627.20-1.21.4412.968.877.44464.6418.8353.441060.32——3064.00第三步,計(jì)算25個(gè)家庭的平均用電量的抽樣平均誤差第四步,計(jì)算25個(gè)家庭的平均用電量的抽樣極限誤差Δ=tμ=1.96×2.214=4.34度下限:上限:第五步,計(jì)算25個(gè)家庭的平均用電量的置信區(qū)間答:以95%的把握程度估計(jì)該城鎮(zhèn)家庭用戶平均用電量的消費(fèi)區(qū)間是66.86度~75.54度。三、對(duì)總體總量指標(biāo)的推斷樣本指標(biāo)值乘以總體單位數(shù),即N、pN是總體總量指標(biāo)的點(diǎn)估計(jì)值??傮w指標(biāo)的區(qū)間估計(jì)值乘以總體單位數(shù),即()N,()N、(p-△p)N,(p+△p)N是總體總量指標(biāo)的區(qū)間估計(jì)值。第四節(jié)樣本容量的確定一、確定樣本容量應(yīng)考慮的因素

(一)確定必要的樣本容量的意義和原則樣本容量n的大小直接關(guān)系到抽樣推斷的準(zhǔn)確性的抽樣過(guò)程所產(chǎn)生的費(fèi)用高低。它是抽樣推斷中必須要首先確定的一個(gè)重要問(wèn)題。(二)影響必要的樣本容量的影響因素1.總體各單位的標(biāo)志變動(dòng)度的大小;2.抽樣極限誤差的大??;3.調(diào)查結(jié)果的概率保證程度;4.抽取樣本單位的方法:是重復(fù)還是不重復(fù)抽樣5.抽樣的組織形式:是簡(jiǎn)單重復(fù)抽樣、機(jī)械抽樣、類(lèi)型抽樣還是整群抽樣等。二、樣本容量的確定(一)變量總體條件下的計(jì)算公式1.重復(fù)抽樣條件下公式6.292.不重復(fù)抽樣條件下公式6.30(二)屬性總體條件下的計(jì)算公式1.重復(fù)抽樣條件下公式6.312.不重復(fù)抽樣條件下公式6.32重復(fù)抽樣:不重復(fù)抽樣:抽樣平均數(shù)抽樣成數(shù)第五節(jié)抽樣調(diào)查的組織方式一、簡(jiǎn)單隨機(jī)抽樣(一)直接抽選法(二)抽簽法(三)隨機(jī)號(hào)碼表法二、分層抽樣

分層抽樣又叫類(lèi)型抽樣、分類(lèi)抽樣。它是先對(duì)總體各單位按主要標(biāo)志加以分組,其后再?gòu)母鹘M中按隨機(jī)原則抽取一定樣本單位構(gòu)成樣本的抽樣方式。特點(diǎn)是由于通過(guò)劃類(lèi)分層,增大了各類(lèi)型中單位間的共同性,容易抽出具有代表性的調(diào)查樣本。三、等距抽樣

等距抽樣又稱機(jī)械抽樣或系統(tǒng)抽樣。它是事先把總體的全部單位按某一標(biāo)志排列,然后按固定順序和間隔來(lái)抽取調(diào)查單位的一種抽樣方式。按等距抽樣方式來(lái)抽取調(diào)查單位,能夠使抽出的調(diào)查單位更均勻地分布在總體中。四、整群抽樣

整群抽樣又稱聚類(lèi)抽樣,是將總體中各單位劃分成若干個(gè)互不交叉、互不重復(fù)的集合,稱之為群,然后以群為單位,從中隨機(jī)抽取部分群,對(duì)中選群的所有單位進(jìn)行全面調(diào)查的一種抽樣方式。

簡(jiǎn)單隨機(jī)抽樣、分層抽樣、等距抽樣所抽取的樣本單位都是個(gè)體,而整群抽樣所抽取的樣本,是由若干個(gè)體組成的群。第六節(jié)

假設(shè)檢驗(yàn)一、假設(shè)檢驗(yàn)的概念

假設(shè)檢驗(yàn)是根據(jù)一定假設(shè)條件由樣本推斷總體的一種方法,它是根據(jù)問(wèn)題的需要對(duì)所研究的總體參數(shù)作某種假設(shè),然后抽取樣本,構(gòu)造適當(dāng)?shù)慕y(tǒng)計(jì)量,對(duì)假設(shè)的正確性進(jìn)行判斷,作出拒絕或接受假設(shè)的判斷。二、假設(shè)檢驗(yàn)的一般方法(一)原假設(shè)和備擇假設(shè)原假設(shè)是要根據(jù)檢驗(yàn)結(jié)果予以拒絕或接受的假設(shè),以H0表示。備擇假設(shè)是原假設(shè)被否定之后應(yīng)選擇的、與原假設(shè)不相容(即對(duì)立)的假設(shè),以H1表示。(二)顯著性水平α

在進(jìn)行假設(shè)檢驗(yàn)時(shí),事先確定一個(gè)可允許的作為判斷界限的小概率標(biāo)準(zhǔn)非常重要。這個(gè)小概率標(biāo)準(zhǔn)就是顯著性水平。

顯著性水平數(shù)值越大,則原假設(shè)被拒絕的可能性越大,原假設(shè)為真而被否定的風(fēng)險(xiǎn)也越大。一般而言,顯著性水平α采用0.01、0.05和0.10等數(shù)值。(三)雙邊檢驗(yàn)和單邊檢驗(yàn)1、雙邊檢驗(yàn),是指當(dāng)我們所關(guān)心的問(wèn)題是要檢驗(yàn)樣本平均數(shù)和總體平均數(shù)有沒(méi)有顯著性差異,而不是差異的方向是正差異還是負(fù)差異時(shí),所采用的一種統(tǒng)計(jì)檢查方法。2、單邊檢驗(yàn),是指當(dāng)所要檢驗(yàn)的是樣本所取自的總體的參數(shù)值是偏高(大于)或是偏低(小于)于某個(gè)特定值時(shí),所采用的一種單方向的檢查方法。(四)假設(shè)檢驗(yàn)中的兩類(lèi)錯(cuò)誤第一類(lèi)錯(cuò)誤就是棄真錯(cuò)誤。當(dāng)原假設(shè)H0成立時(shí)拒絕了H0,即當(dāng)應(yīng)該接受原假設(shè)H0而拒絕這個(gè)假設(shè)時(shí)所犯的錯(cuò)誤。第二類(lèi)錯(cuò)誤就是取偽錯(cuò)誤。當(dāng)原假設(shè)H0不成立時(shí)接受了

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論