統(tǒng)計學之抽樣估計_第1頁
統(tǒng)計學之抽樣估計_第2頁
統(tǒng)計學之抽樣估計_第3頁
統(tǒng)計學之抽樣估計_第4頁
統(tǒng)計學之抽樣估計_第5頁
已閱讀5頁,還剩118頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

本資料來源第四章抽抽樣樣估計是以概率抽抽樣的樣樣本觀測測結(jié)果去去估計未未知的總總體數(shù)量量特征本章要求求學生:明確抽樣樣推斷的的含義、、特點和和作用。。了解有有關(guān)的基基本概念念,重點點掌握抽抽樣誤差差的含義義、影響響因素及及其計算算。了解抽樣樣估計的的基本方方法和步步驟;抽抽樣方案案設(shè)計的的基本原原則。全全面掌握握簡單隨隨機抽樣樣的平均均誤差計計算方法法和樣本本容量確確定方式式,了解解其它各各種抽樣樣組織方方式的含含義及平平均誤差差的計算算。第一節(jié)抽抽樣樣分布(一)總總體分布布及其特特征總體分布布:是指總體體中所有有個體關(guān)關(guān)于某個個變量((標志))的取值值所形成成的分布布??傮w參數(shù)數(shù):反映總體體分布特特征的指指標一、抽樣樣分布的的基本問問題2007年4月23日,上證綜合合指數(shù)再再創(chuàng)歷史史新高,達到3710.89點,在上證A股上市的的836家企業(yè)中中,789家上漲,47家下跌。??傮w:836家上市公公司總體分布布:836家上市公公司當天天的漲幅幅xii=1……..836總體參數(shù)數(shù):總統(tǒng)參數(shù)數(shù)的值應應由總體體全部單單位的標標志值計計算而來來:對于特定定的總體體,總體體參數(shù)值值是唯一的。對于無限限總體和和非全面面調(diào)查的的有限總總體,總總體參數(shù)數(shù)的值通通常未知,只能通通過樣本本來估計計。常用的總總體參數(shù)數(shù)有兩個個:總體均值值(包括是是非變量量的均值值);總體方差差或標準準差(包括是是非變量量的方差差或標準準差)。。⒈總體均均值(總總體平均均數(shù))::設(shè)有限總體體容量為N,各單位位某項標標志的值值分別為;;若若為是非非標志則則設(shè)具有有某種屬屬性的有個個單位,,不具有有某種屬屬性的有有個個單單位,則則2、總體體方差::3、總體體成數(shù)((總體比比例)5、總體體是非標標志的方方差4、總體體是非標標志的均均值(二)樣樣本分布布及其特特征樣本分布布:樣本中所所有個體體關(guān)于某某個變量量(標志志)的取取值所形形成的分分布。當樣本容容量很大大,或者者是當逐逐漸增大大時,樣樣本分布布會接近近總體分分布。如果樣本本容量很很小,樣樣本分布布就有可可能與總總體分布布相差很很大,抽抽樣估計計的結(jié)果果就會很很差。樣本統(tǒng)計計量:反映樣本本分特征征的指標標,T樣本統(tǒng)計計量是隨隨機變量量,它的的取值隨隨樣本的的不同而而發(fā)生變變化。樣本統(tǒng)計計值:是樣本統(tǒng)統(tǒng)計量的的值,由由樣本單單位的標志值值計算而而來,用用來估計計總體參參數(shù)。例:我們們選擇奧奧運板塊塊的個股股作為樣樣本。則則樣本分分布為該該板塊60只股票在在4月23日的漲跌跌情況樣本統(tǒng)計計量xii=1………60樣本是隨隨機產(chǎn)生生的,為為了提高高樣本的的代表性性,可以以選擇合合適的抽抽樣組織織方式來來產(chǎn)生樣樣本抽樣估計計就是以以可知但但非唯一一的樣本本統(tǒng)計量量的值來估計未未知但唯唯一的總總體參數(shù)數(shù)的值。。與總體參參數(shù)相對對應,常常用的樣樣本統(tǒng)計計量有樣本均值值(或樣樣本成數(shù)數(shù))、樣本方差差(或樣樣本標準準差))。⒈樣本本均值::設(shè)樣本中中n個樣本單單位某項項標志的的標志值值分別為為,,若若為是非非標志則則設(shè)具有有和不具具有某種種屬性的的樣本單單位數(shù)目目分別為為和和個個,,則2.樣本方差差:3.樣本成數(shù)數(shù)(樣本本比例)):4.樣本是非非標志的的均值::5.樣本是非非標志的的方差::(三)抽抽樣分布布及其特特征1、抽樣分分布的概概念抽樣分布布,是樣本本統(tǒng)計量量的概率率分布,,由樣本本統(tǒng)計量量的所有有可能取取值和與與之相應應的概率率組成。。假設(shè)從容容量為N的總體中中抽取容容量為n的樣本最最多可抽抽取m套不同的的樣本,,則m個樣本統(tǒng)統(tǒng)計值的的頻率分分布,即即為抽樣樣分布。。實際的抽抽樣分布布形成取取決于以以下五個個因素::總體分布布(越集中中,抽樣樣分布越越集中))樣本容量量(最關(guān)鍵鍵因素,,容量越越大抽樣樣分布越越集中))抽樣方法法(采用重重復或不不重復方方法,抽抽樣分布布不同))抽樣組織織形式(不同形形式下的的樣本個個數(shù)及結(jié)結(jié)構(gòu)不同同,抽樣樣分布也也不同))估計量構(gòu)構(gòu)造(樣本估估計量不不同,抽抽樣分布布不同))大樣本小樣本返回最基本的的抽樣分分布:樣本均值值的抽樣樣分布,,樣本成成數(shù)的抽抽樣分布布2、抽樣分分布形式式設(shè)從容量量為N的有限總總體中抽抽取容量量為n的樣本,,最多可可抽取m套不同樣樣本,計計算得m個樣本統(tǒng)統(tǒng)計值設(shè)m個樣本統(tǒng)統(tǒng)計值經(jīng)經(jīng)單項式式分組可可分為k組,則抽抽樣分布布的表現(xiàn)現(xiàn)形式為為:樣本均值值的抽樣樣分布形形式樣本成數(shù)數(shù)的抽樣樣分布形形式例:某車車間班組組5個工人日日工資為為34,38,42,46,50元,則總總體日平平均工資資總體日工工資方差差不同抽樣樣方法下下樣本平平均數(shù)的的抽樣分分布(1)用重復復抽樣方方法(考考慮順序序)從5個工人((日工資資為34,38,42,46,50元)中隨隨機抽取取2人構(gòu)成樣樣本,共共52=25個樣本所有可能能樣本及及其平均均數(shù):樣本變量3438424650343842465034363840423638404244384042444640424446484244464850第一單位位第二單位位樣本均值值整理出樣樣本平均均數(shù)的頻頻率分布布如下:頻率343638404244464850合計4%8%12%16%20%16%12%8%4%100%樣本均值值的抽樣樣分布樣本均值值的抽樣樣分布圖圖(2)用不重重復抽樣樣方法從5個工人((日工資資為34,38,42,46,50元)中隨機抽取取2人構(gòu)成樣樣本(考考慮順序序),共共5×4=20個樣本。。所有可可能樣本本及其平平均數(shù):樣本變量3438424650343842465034363840423638404244384042444640424446484244464850第一單位第二單位樣本均值整理出樣樣本平均均數(shù)的頻頻率分布布如下:頻率36384042444648合計10%10%20%20%20%10%10%100%樣本均值值的抽樣樣分布圖圖樣本均值值的抽樣樣分布設(shè)某總體體由10個球組成成,其中中紅球6個,現(xiàn)從從總體中中隨機抽抽取4個球,那那么在重重復抽樣樣和不重重復抽樣樣下紅球球比重((樣本成成數(shù))的的抽樣分分布分別別如何??重復抽樣樣下紅球球比重的的抽樣分分布00.250.50.7510.02560.15360.34560.34560.1296總體成數(shù)為總體方差為在重復抽樣下,樣本中紅球的比重服從二項分布

00.250.50.751不重復抽抽樣下紅紅球比重重的抽樣樣分布3、抽樣分分布特征征指樣本統(tǒng)統(tǒng)計量的的數(shù)學期期望和方方差。樣本統(tǒng)計計量的數(shù)學期望望:即所有樣樣本統(tǒng)計計值的平平均數(shù)樣本統(tǒng)計計量的方差:即所有樣樣本統(tǒng)計計值關(guān)于于數(shù)學期期望的方方差在前面的的例題中中,重復抽樣樣的抽樣分分布如下下:頻率343638404244464850合計4%8%12%16%20%16%12%8%4%100%樣本平均均數(shù)的期望與與方差::不重復抽抽樣的抽抽樣分布布如下:頻率36384042444648合計10%10%20%20%20%10%10%100%樣本平均均數(shù)的均值與與方差::結(jié)論:(1)樣本均均值抽樣樣分布的的期望值值(均值值):在重復或或不重復復抽樣下下都等于于總體均均值(2)樣本均均值抽樣樣分布的的方差::重復抽樣樣方差大大于不重重復抽樣樣,顯然不重重復抽樣樣的抽樣樣分布較較為集中中。樣本成數(shù)數(shù)的抽樣樣分布::(1)樣本成成數(shù)的期期望值::在重復或或不重復復抽樣下下,樣本本成數(shù)的的均值都都等于總總體成數(shù)數(shù)(2)樣本成成數(shù)抽樣樣分布的的方差::重復抽樣樣方差大大于不重重復抽樣樣,顯然不重重復抽樣樣下樣本本成數(shù)的的抽樣分分布較為為集中在各種抽抽樣方法法和抽樣樣組織方方式下,,樣本統(tǒng)計計量的數(shù)數(shù)學期望望(均值值)都等等于總體體參數(shù)。。抽樣分布布的特征征主要通通過方差差來體現(xiàn)現(xiàn)。抽樣分布布越集中中、樣本本統(tǒng)計量量的方差差越小,,則樣本本統(tǒng)計值值越可能能接近總總體參數(shù)數(shù)真值,,抽樣估估計的誤誤差越小小、估計計結(jié)果就就越精確確。實際調(diào)查查只抽取取一個樣樣本,因因此上述述抽樣分分布形式式難以列列出。結(jié)論:二、抽樣樣分布定定理(一)樣樣本均值值的抽樣樣分布定定理1、正態(tài)分分布的再再生定理理若總體服服從正態(tài)態(tài)分布則樣本均均值也也服從從正態(tài)分分布n=4n=16抽樣分布(重復抽樣)任一總體體(不要要求正態(tài)態(tài)),期期望值,,方差,,當n足夠大((當n>30,大樣本本),趨趨于于正態(tài)分分布2、中心極極限定理理當樣本容容量足夠夠大時((大樣本本),抽樣分分布趨于于正態(tài)分分布小樣本從任意分布的總體中抽樣大樣本若正態(tài)總總體方差差未知且且n較小,則則服服從于自自由度為為n-1的t分布任一總體體但n較小,服服從于于自由度度為n-1的t分布3、t分布定理理(二)樣樣本成數(shù)數(shù)的抽樣樣分布定定理1、二項分分布定理理從一個數(shù)數(shù)學期望望為p、方差為為的的是是非變量(0-1分布)總總體中隨隨機重復復地抽取取容量為為n的樣本,,那么樣樣本中含含有個個某某類變量量值的概概率為::2.超幾何分分布定理理從一個數(shù)數(shù)學期望望為p、方差為為的的是非變變量(0-1分布)總總體中隨隨機不重重復地抽抽取容量量為n的樣本,,那么當當同同時時時時,,樣本中中含有個某類變變量值的的概率為為:從一個數(shù)數(shù)學期望望為p、方差為為的的是非非變量((0-1分布)總總體中隨隨機抽取取容量為為n的樣本,,當n足夠大(nP>5,n(1-P))>5),樣本本成數(shù)p趨于正態(tài)態(tài)分布或E(p))=P3.中心極限限定理正態(tài)分布布是最重重要、最最常用的的抽樣分分布,由由于抽樣樣一般都都是大樣樣本,因因此可以根據(jù)據(jù)正態(tài)分分布理論論,根據(jù)據(jù)樣本統(tǒng)統(tǒng)計值來來推斷總總體參數(shù)數(shù)。第二節(jié)抽抽樣誤誤差一、抽樣樣中的誤誤差構(gòu)成成抽樣中的的總誤差差可以簡簡單地分分為兩類類,一類是抽抽樣誤差差,一類類非抽樣樣誤差。。抽樣誤差差——偶然性代代表性誤誤差非抽樣誤誤差——系統(tǒng)性代代表性誤誤差觀測性誤誤差抽樣誤差差:是由于抽抽樣的非非全面性性和隨機機性所引引起的偶偶然性誤誤差,即因抽樣樣估計值值隨樣本本不同所所造成的的誤差。。特點:隨隨著樣本本容量的的增大而而趨向于于0,不可避避免但可可以加以以控制由隨機抽抽樣的偶偶然性因因素以外外的原因因所引起起的誤差差。超過一定定程度就就會使抽抽樣估計計失去意意義,減減少和控控制它十十分重要要。非抽樣誤誤差:總誤差抽樣誤差差非抽樣誤誤差二、抽樣樣誤差的的表現(xiàn)形形式指樣本估估計量與與總體參參數(shù)之間間數(shù)量上上的差異異,僅指由于隨機機抽樣的的偶然性性因素使使樣本不不足以代代表總體體而引起起樣本指指標與總總體指標標間的差差異(即即偶然性性誤差))抽樣誤差差有三種種形式::實際抽樣樣誤差抽樣標準準誤差((抽樣平平均誤差差)抽樣極限限誤差(一)抽抽樣實際際誤差是抽樣估估計值與與總體參參數(shù)真值值之間的的絕對離離差,表表示為由于隨機機抽樣的的偶然性性,使樣樣本結(jié)構(gòu)構(gòu)不能與與總體結(jié)結(jié)構(gòu)完全全一致,,從而產(chǎn)產(chǎn)生估計計誤差成數(shù)估計計的實際際抽樣誤誤差是隨機變變量,不不同的樣樣本有不不同的抽抽樣實際際誤差;;對于任何何一個樣樣本,其其抽樣實實際誤差差都不可可能測量量出來均值估計計的實際際抽樣誤誤差(二)抽抽樣標準準誤差(抽樣平平均誤差差)是反映抽抽樣誤差差一般水平平的指標,,實質(zhì)含含義是指樣本統(tǒng)統(tǒng)計量抽抽樣分布布的標準準差它能夠反反映樣本本指標與與總體指指標的平均離散散程度,也能夠夠說明樣本指標標代表性性的大小。。抽樣標準準誤越大大(?。?,抽樣樣分布越越離散((集中)),樣本指標標對總體體指標的的代表性性越差((好),,抽樣估估計的誤誤差平均均來講就就越大。。對于固定定的總體體和樣本本容量n,在相同同的抽樣樣方法和和抽樣組組織形式式下,抽抽樣標準準誤是一一個唯一一確定的的值?!^“抽抽樣誤差差能夠加加以計算算并控制制”前例中,,重復抽抽樣下前例中,,不重復復抽樣下下說明不重重復抽樣樣的樣本本均值分分布比重重復抽樣樣更為集集中,其其樣本均均值的代代表性更更好,不重復抽抽樣的抽抽樣誤差差小于重重復抽樣樣。所以實實踐中常常用不重重復抽樣樣方法。。上述公式式在實際際應用時時有兩個個困難::實際中無無法根據(jù)據(jù)該公式式計算出出標準誤誤,只能能根據(jù)一一套樣本本來計算算其估計計值,,因此抽樣樣標準誤誤是是隨隨機變量量需計算所所有可能能樣本統(tǒng)統(tǒng)計量的的值;需要知道道總體參參數(shù)(三)抽抽樣極限限誤差是指以樣樣本估計計量估計計總體參參數(shù)時所允許的的最大誤誤差范圍圍通常用表表示示抽樣極限誤差的實際意義:實際上就是對總體參數(shù)可允許取的最高值或最低值進行了限制。即希望總體參數(shù)落在樣本估計量的范圍內(nèi)抽樣極限限誤差越越大,抽抽樣估計計的精確確度越低低抽樣極限限誤差取取決于兩兩個因素素:1、抽樣標標準誤,,即抽樣樣分布本本身具有有多大的的標準差差。當抽樣方方法和樣樣本容量量固定時時,抽樣樣標準誤誤差是一一個定值值,反映映抽樣誤誤差的一般水平平。因此,,抽樣極限限誤差通通??梢砸砸猿闃訕訕藴收`誤差為標標準單位位來衡量量,表示示為抽樣樣標準誤誤差的多多少倍。抽樣標準準誤差越越大(小小),抽抽樣極限限誤差就就越大((?。?、抽樣估估計的概概率保證證程度((置信水水平)是指抽樣樣估計結(jié)結(jié)果的可靠程度度,即抽樣樣估計結(jié)結(jié)果是準準確的概概率(可可靠程度度)有多多大。通通常表示示為,,其中中稱稱為為顯著性水水平。

指的是總體參數(shù)處于區(qū)間內(nèi)的概率。即總體參數(shù)不在區(qū)間內(nèi)的概率。要求估計結(jié)果的可靠程度越高,則越大。抽樣極限限誤差、、抽樣標標準誤差差與抽樣樣概率保保證程度度三者的的關(guān)系可可以這樣樣表示:其中,稱為抽樣概率率度。可見,抽樣極限誤差分別與概率度和抽樣標準誤差成正比。越高,抽樣估計的可靠程度越高,但也越大,估計的精確度降低。正是當顯顯著性水水平為時時的標標準正態(tài)態(tài)分布的的雙側(cè)臨臨界值,,概率保保證程度度與與的的值值是一一一對應的的68.27%95.45%99.73%常用的::1-α=68..27%%,90%,,95%%,,95..45%%,99.73%=1,1..64,,1.96,2,3第三節(jié)參參數(shù)估計計方法一、估計計量的評評價標準準所謂估計量,就是用用以估計計總體參參數(shù)的量量,或者者說是根根據(jù)樣本本結(jié)果來來估計總總體參數(shù)數(shù)的規(guī)則則或形式式。估計量一一般情況況下就是是樣本統(tǒng)計計量。估計量的的某一具具體的值值,就稱稱為估計值。評價估計計量好壞壞的標準準有四個個:無偏性、、有效性性、一致致性和充充分性符合標準準的稱為為優(yōu)良估計計量當有兩個個以上個個統(tǒng)計量量可以估估計某個個總體參參數(shù)時,,應該如如何選擇擇?指估計量的抽樣分布的均值應等于被估計的總體參數(shù)的真值無偏性若,,則稱稱為的的無偏偏估計量量。xCA無偏有偏優(yōu)良估計量的抽樣分布方差小于其他估計量的方差有效性若則稱為為比更更有效的的估計量量ABx

指隨著樣樣本單位位數(shù)n的增大,,樣本估估計量的的取值趨趨近于總總體參數(shù)數(shù)真值一致性較小的樣本容量較大的樣本容量x若估計量量提取了了樣本中中包含的的有關(guān)總總體參數(shù)數(shù)的全部部信息,,則為充充分估計計量。例例如:充分性為、、s2n-1為S2、p為P的無偏、、有效、、一致、、充分估估計量。。數(shù)理統(tǒng)計計證明::同時滿足足上述四四個標準準,則為為優(yōu)良估計計量參數(shù)估計計方法有有兩種::點估計區(qū)間估計計二、參數(shù)數(shù)估計方方法(一)點點估計點估計::也稱定定值估計計,就是以以樣本統(tǒng)統(tǒng)計量的的值作為為總體參參數(shù)的估估計值。。關(guān)鍵問題題是估計計量的選選擇簡單,具體明確優(yōu)點缺點不知道估計的可靠程度,僅適用于對推斷的準確程度與可靠程度要求不高的情況點估計的的優(yōu)缺點點(二)區(qū)區(qū)間估計計是指用一一個具有有一定可靠程度度的區(qū)間間范圍來估計總總體參數(shù)數(shù)。即在給定定的概率保證證程度(可靠程程度)1-α下,找到兩兩個數(shù)值值θ1和θ2,構(gòu)成總總體參數(shù)數(shù)θ取值的區(qū)區(qū)間范圍圍[θ1,θ2]。該區(qū)間稱稱為估計區(qū)間間,θ1稱為估計計下限,,θ2稱為估計計上限若已知抽抽樣極限限誤差,,則總總體參數(shù)數(shù)處在樣樣本估計計量的范范圍圍內(nèi),那么總體體參數(shù)的的區(qū)間范范圍為:在一定的概率保證程度下,找到相應的抽樣極限誤差的值,則可以確定估計區(qū)間的上下限估計區(qū)間可表示為為:

的估計區(qū)間:P的估計區(qū)區(qū)間:區(qū)間估計計的兩個個基本要要求:置信度1-α精確度估計區(qū)間間長度一般在給給定的概概率保證證程度下下,盡可可能提高高估計的的精度(通過降低低抽樣標標準誤))。置信度1-α越大,越大,估計的精確程度越低。反之,置信度1-α越小,越小,估計的精確度越高。

希望置信信度盡可可能大((可靠程程度高)),同時時精確度度盡可能能高(估估計區(qū)間間的長度度短)。。但在樣本本容量n一定時,,兩者矛矛盾。區(qū)間估計計的特點點:不指出參參數(shù)的確確定數(shù)值值,而是是在一定定的概率率保證程程度下指指出參數(shù)數(shù)的可能能范圍。。估計結(jié)果果的可靠靠程度可可知,即即為概率率保證程程度第三節(jié)各各種抽樣樣組織形形式下的的抽樣估估計抽樣組織織形式::簡單隨機機抽樣等距抽樣樣分層抽樣樣整群抽樣樣多階段抽抽樣——事先未對對總體進進行分組組或組合合,直接接從總體體全部單單位中按按隨機原原則抽取取樣本。。一、簡簡單隨機機抽樣((純隨機機抽樣))1、計算估估計量2、抽樣標標準誤(1)當總體體方差已已知(一)總總體均值值的的估計計f=n//N,稱為抽樣比當f<5%,有限總總體校正正系數(shù)1-f可以忽略略不計【例3.1】】對某天生生產(chǎn)的2000件電子元元件的耐耐用時間間進行全全面檢測測,然后后又抽取取5%進行抽樣樣復檢,,樣本資資料如下下。計算算平均耐耐用時間間的抽樣樣標準誤誤差(重重復和不不重復))耐用時間(小時)全面檢測(支)抽樣復檢(支)3000以下3000-40004000-50005000以上合計5060099036020002305018100(2)當總體體方差未未知時,,用樣本本方差s2代替【例3.2】】上例中,,若總體體方差未未知,即即只進行行抽樣檢檢測,計計算抽樣樣平均誤誤差耐用時間(小時)抽樣復檢(支)3000以下3000-40004000-50005000以上合計23050181003、區(qū)間估估計(1)給定1-α,查表得得

(2)根據(jù),,可可求出(3)確定總總體均值值的的估計區(qū)區(qū)間【例3.3】】對某縣進進行人均均月收入入抽樣調(diào)調(diào)查,n=500戶,已知知樣本平平均月收收入為600元,方差差為187620元,要求求概率保保證程度度為95%,估計計該縣人人均月收收入?!纠?.4】】從某市400戶個體戶戶飲食店店中抽取取10%進行月月營業(yè)額額調(diào)查,,樣本資資料如下下:月均營業(yè)額(萬元)戶數(shù)10以下10-2020-3030-4040-5050以上合計2410166240要求在95%的概率率保證下下,估計計全體飲飲食店月均營業(yè)業(yè)額以及及月營業(yè)業(yè)總額。(二)總總體成數(shù)數(shù)P的估計1、計算估估計量2、抽樣標標準誤(1)當總總體成數(shù)數(shù)已知((總體方方差已已知)(2)總體方差差未知,,用樣本本方差代代替【例3.5】】對某天生生產(chǎn)的2000件電子元元件抽取取5%進行耐耐用時間間檢測,,耐用時時間在3000小時以下下為不合合格,求求合格率率的抽樣樣標準誤誤。(重重復和不不重復))耐用時間(小時)抽樣復檢(支)3000以下3000-40004000-50005000以上合計23050181003、總體成成數(shù)的區(qū)區(qū)間估計計(1)給定1-α,查表得得(2)計算抽樣樣極限誤誤差:(3)確定總體體成數(shù)的的估計區(qū)區(qū)間:【例3.6】】對某高校校學生消消費現(xiàn)狀狀和消費費觀念進進行調(diào)查查,隨機機調(diào)查了了100名學生,,其中有有98名認為““大學生生在食堂堂就餐時時浪費情情況比較較嚴重””?,F(xiàn)要要求在95%的概率率保證程程度下,,估計全全校學生生中持有有相同觀觀點的學學生所占占比重。?!纠?.7】】2007年4月杭州商商學院注注會05甲班對本本專業(yè)400名學生的的手機消消費情況況進行了了抽樣調(diào)調(diào)查,調(diào)調(diào)查了50名學生,,所得資資料如下下:月消費額(元)人數(shù)30以下30-5050-8080-100100以上合計2141610850要求在95.45%的概率率保證下下,估計計該專業(yè)業(yè)學生中中月消費費額在80元以上的的學生比重重以及消費費額在80元以上的的學生人數(shù)數(shù)?!揪毩暋磕硨W校進進行一次次英語測測驗,為為了解學學生的考考試情況況,隨機機抽選部部分學生生進行調(diào)調(diào)查,所所得資料料如下::試以95.45%的可靠性性估計該該校學生生英語考考試的平平均成績績及該校校學生成成績在80分以上的的學生所所占的比比重??荚嚦煽?0以下60-7070-8080-9090-100學生人數(shù)102022408(三)樣樣本容量量的確定定1、影響因因素總體內(nèi)在在差異程程度、抽抽樣精度度和可靠靠程度的的要求、、抽樣方方法、調(diào)調(diào)查經(jīng)費費2、不考慮慮調(diào)查經(jīng)經(jīng)費時樣樣本容量量的確定定:⑴重復復抽樣方方法下::(2)不重重復抽樣樣方法下下:不重復抽抽樣下估估計均值值和成數(shù)數(shù)都可以以直接采采用總體方差差通常未未知,一一般按以以下方法法確定其其估計值值:①過去的的數(shù)據(jù)或或經(jīng)驗判判斷;②小規(guī)模模試抽樣樣的樣本本方差。?!纠?.8】】某市擬對對全市居居民家庭庭生活收收支情況況進行調(diào)調(diào)查,要要求保證證95.45%的可靠程程度,允允許誤差差不超過過0.2萬元,據(jù)據(jù)去年的的調(diào)查,,戶年收收入方差差為1.6,至少應應抽多少少戶?若允許誤誤差不超超過0.1萬元,應應抽多少少戶?【例3.9】某企業(yè)對對一批總總數(shù)為5000件的產(chǎn)品品進行質(zhì)質(zhì)量檢查查,過去去幾次同同類調(diào)查查所得的的產(chǎn)品合合格率分分別為98﹪、95﹪、96﹪。為了使使合格率率的允許許誤差不不超過2﹪,在95﹪的概率保保證程度度下,應應抽查多多少件產(chǎn)產(chǎn)品?【分析】因為共有有三個過過去的合合格率的的資料,,為保證證推斷的的可靠程程度,保保守的做做法是選選其中方方差最大大者,或或最接近近0.5的那個P值,即取取P=95﹪?!纠?.10】某企業(yè)有有12000名職工,,現(xiàn)從中中抽取部部分職工工進行民民意測驗驗。要求求在95.45%可靠程度度下,估估計“對對企業(yè)領(lǐng)領(lǐng)導滿意意”的比比率時誤誤差不超超過1%,估計計對領(lǐng)導導能力的的平均評評分時誤誤差不超超過2分(百分分制),,至少應應抽取多多少職工工?(由于總總體方差差未知,,先進行行了小規(guī)規(guī)模試抽抽樣。對對10名職工試試抽樣結(jié)結(jié)果:滿滿意比率率為40%,能力力評分的的方差為為100)通過抽樣樣調(diào)查,,既要了了解總體體比率,,又要了了解總體體均值時時,若所所需的樣樣本容量量不同,,則取大者——多主題抽抽樣二、分分層抽樣樣——按一定標標志將總總體全部部單位分分類(層層),然然后從各各類(層層)中按按照隨機機原則分分別抽取取若干單單位組成成樣本。。(統(tǒng)計分組組在抽樣樣估計中中的應用用)設(shè)總體的的N個個體分分為H層,為為第i層個體數(shù)數(shù),為第i層的層權(quán)權(quán),為為第第i層抽取的的個體數(shù)數(shù),為第i層的抽樣樣比,為為第i層第j個個體的的變量值值第i層的層均均值的的估計計量為::(一)總總體平均均數(shù)的估估計總體平均均數(shù)的估估計其中為為第i層的方差差,未知知時要用用層內(nèi)樣樣本方差來來估計計??傮w均值值的估計計量為::與該估計計量相對對應的抽抽樣標準準誤為::(重復抽抽樣時))(不重復復抽樣時時)【例3.11】為了解某某省居民民戶均收收入水平平,省統(tǒng)統(tǒng)計局對對城鎮(zhèn)和和農(nóng)村居居民分別別進行了了抽樣調(diào)調(diào)查,資資料如下下。總戶數(shù)(萬戶)樣本戶數(shù)(戶)平均收入(萬元)樣本方差城鎮(zhèn)1201003.54農(nóng)村8805002.84.5合計1000600要求計算算估計全全省戶均均收入的的估計量量和抽樣樣標準誤誤差(分分重復和和不重復復兩種方方法)。?!纠?.12】調(diào)查某地地區(qū)的居居民年訂訂購書報報費,以以居民戶戶為抽樣樣單元,,根據(jù)經(jīng)經(jīng)濟及收收入水平平將居民民戶劃分分為4層,每層層按純隨隨機抽樣樣抽取10戶,獲得得如下數(shù)數(shù)據(jù)(單位:元元)。試以95%的概率估估計該地地區(qū)居民民平均年年訂購書書報費的的區(qū)間。。層居民戶總數(shù)樣本戶年訂購書報費(元)1234567891012001040011015104080900240050130608010055160851601703750180260110014060200180300220415005035150203025103025設(shè)為為第層層的某類類變量值值的個數(shù)數(shù),為為第i層樣本中中某類變變量值的的個數(shù),,那么第第i層成數(shù)的的估計量為為:(二)總體成數(shù)數(shù)p的估計總體成數(shù)數(shù)的估計計量為::與該估計計量相對對應的抽抽樣標準準誤為::

層方差未未知時時要以層層內(nèi)樣本本方差來估計。。(重復抽抽樣)(不重復復抽樣))1.比例分配配法這是分層層抽樣最最常用的的分配法法,即根根據(jù)的的關(guān)系來來確定,,也也即:分層抽樣樣的抽樣樣標準誤誤公式可可簡化為為(以總體體均值估估計為例例):其中=(三)各各層樣本本容量的的確定定2.最優(yōu)分配配法(Neyman分配法))該法除了了考慮各各層容量量大大小這一一因素外外,還考考慮各層層內(nèi)在差差異程度度不不同這一一因素,,即分層抽樣樣的抽樣樣標準誤誤公式可可改為:

該法除了了考慮和和這這兩兩個因素素外,還還考慮各各層個體調(diào)查費費用高低低這這一因因素,即即:這時,分分層抽樣樣的抽樣樣標準誤誤公式可可改為::

3.經(jīng)濟分配配法【例3.13】在例3.12調(diào)查中,,同時調(diào)調(diào)查了居居民擁有有筆記本本電腦情情況,獲獲得如下下數(shù)據(jù)(單位:臺臺)。試以95%的概率估估計該地地區(qū)居民民擁有筆筆記本電電腦比重重的區(qū)間間。層居民戶總數(shù)樣本戶擁有筆記本電腦12345678910120000010001002400010000001037501100001010415001000000000三、等等距抽樣樣(系統(tǒng)統(tǒng)抽樣))——將總體單單位按某某一標志志排序,,而后按按一定的的間隔抽抽取樣本本單位。??傮w參數(shù)數(shù)估計可可按如下下方法近近似估算算:按無關(guān)標標志排隊隊的等距距抽樣,,可按不不重復抽抽

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論