統(tǒng)計學(xué)-第八章-抽樣調(diào)查_第1頁
統(tǒng)計學(xué)-第八章-抽樣調(diào)查_第2頁
統(tǒng)計學(xué)-第八章-抽樣調(diào)查_第3頁
統(tǒng)計學(xué)-第八章-抽樣調(diào)查_第4頁
統(tǒng)計學(xué)-第八章-抽樣調(diào)查_第5頁
已閱讀5頁,還剩103頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、1,第八章 抽樣調(diào)查,學(xué)習(xí)目的,第一節(jié) 抽樣調(diào)查的一般問題,第二節(jié) 抽樣分布,第三節(jié) 抽樣估計,第四節(jié) 抽樣組織形式,2,學(xué) 習(xí) 目 的,了解抽樣調(diào)查和抽樣分布的基本概念 掌握抽樣誤差的計算方法 掌握抽樣估計的基本原理和方法 了解抽樣調(diào)查的基本組織形式 掌握必要樣本容量的計算,3,第一節(jié) 抽樣調(diào)查的一般問題,4,一、什么是抽樣調(diào)查,抽樣調(diào)查:按隨機原則從總體中抽取一部分單位進行調(diào)查,根據(jù)樣本資料計算樣本的特征值,然后以樣本的特征值,對總體的特征值做出具有一定可靠性的估計和判斷,以反映總體的數(shù)量特征的一種統(tǒng)計方法。,隨機原則:即是在抽取樣本時,排除人們主觀意圖的作用,使得總體中的每個單位或每個樣

2、本有相等的入選機會。隨機原則又稱為等可能性原則。,5,二、抽樣調(diào)查的特點,調(diào)查單位的確定是按隨機原則從全部總體單位中抽取的。 用部分單位的指標數(shù)值去推斷和估計總體指標數(shù)值。 抽樣調(diào)查中的抽樣誤差是不可避免的,但在事先是可以計算并加以控制的。 抽樣推斷是運用概率估計的方法。,6,三、抽樣調(diào)查的作用,有些現(xiàn)象是無法進行全面調(diào)查的,為了測算全面資料,必須采用抽樣調(diào)查的方法。,從理論上講,有些現(xiàn)象雖然可以進行全面調(diào)查,但實際上沒有必要或很難辦到,也要采用抽樣調(diào)查。,抽樣調(diào)查的結(jié)果可以對全面調(diào)查的結(jié)果進行檢查和修正,抽樣調(diào)查可以用于工業(yè)生產(chǎn)過程的質(zhì)量控制。,利用抽樣調(diào)查原理,可以對某些總體的假設(shè)進行檢驗

3、,來判別這種假設(shè)的真?zhèn)?,以決定行動的取舍。,例如: 對無限總體不能采用全面調(diào)查。 另外,有些產(chǎn)品的質(zhì)量檢查具有破壞性,不可能進行全面調(diào)查,只能采用抽樣調(diào)查。,7,四、基本概念(概念要點),全及總體(Population):所要研究的事物的全體構(gòu)成的總體 樣本(Sample):從全及總體中所抽取的部分單位組成的總體,又稱抽樣總體; 總體參數(shù)(Population parameter):是在理論上可以從整個總體中計算出來的總體指標。 樣本統(tǒng)計量(Sample statistic):是根據(jù)樣本觀察值計算出來的樣本指標。 樣本容量(Sample size):是樣本中所含個體的數(shù)量,又稱樣本單位數(shù)。,8

4、,四、基本概念(常用的符號標記),總體成數(shù):P 總體標準差: 樣本統(tǒng)計量,樣本成數(shù):p 樣本標準差:S,總體參數(shù),9,四、基本概念(概念之間的關(guān)系),總體,樣本,隨機抽取,總體中有N個個體,樣本容量為:n,統(tǒng)計推斷,總體參數(shù)一般是未知的,樣本統(tǒng)計量的值是可知的,10,總體容量N=10000 樣本單位數(shù)n=100 樣本均值(平均耐用時間) x=1055小時,樣本成數(shù)(合格率) p=91% 依據(jù)樣本統(tǒng)計量可以對總體參數(shù)進行估計(估計方法將在第三節(jié)介紹)。,四、基本概念(舉例),【例8-1】對一批某種型號的電子元件10000只進行耐用時間檢查,隨機抽取100只,測試的平均耐用時間為1055小時,合格

5、率為91%。,11,五、樣本統(tǒng)計量的計算公式,樣本均值:,樣本成數(shù):,樣本標準差:,在樣本資料未分組的情況下:,在樣本資料分組的情況下:,在樣本資料未分組的情況下:,在樣本資料分組的情況下:,12,六、抽樣方法與樣本可能數(shù)目,抽樣方法: 重復(fù)(置)抽樣:是指從全及總體中抽取樣本時,隨機抽取一個樣本單位,記錄該單位有關(guān)標志表現(xiàn)以后,把它放回到總體中去,再從總體中隨機抽取第二個單位,記錄它有關(guān)標志表現(xiàn)以后,也把它放回全及總體中去,照此下去直到抽選n個樣本單位。 不重復(fù)(置)抽樣:不重復(fù)抽樣是從總體抽取第一個樣本單位,記錄該單位有關(guān)標志表現(xiàn)后,這個樣本單位不再放回總體中參加下一次抽選。然后,從總體N

6、-1個單位中隨機抽選第二個樣本單位,記錄了該單位有關(guān)標志表現(xiàn)以后,該單位也不再放回全及總體中去,照此下去直到抽選出n個樣本單位。,13,六、抽樣方法與樣本可能數(shù)目,樣本可能數(shù)目:是指從總體中可能抽取的樣本的最多數(shù)目,抽樣數(shù)目大小與抽樣方法有關(guān)。,重復(fù)抽樣時的樣本可能數(shù)目是一個可重復(fù)的排列數(shù):,例8-2:從0-9的10個數(shù)中隨機重復(fù)抽選6個數(shù)字組成電話號碼,共能組成多少個電話號碼?,14,不重復(fù)抽樣時的樣本可能數(shù)目可分為考慮順序和不考慮順序兩種情況。考慮順序時的樣本可能數(shù)目是不重復(fù)的排列數(shù):,六、抽樣方法與樣本可能數(shù)目,例8-3:從班級10位學(xué)生中抽選三人擔(dān)任不同的職務(wù),問共有幾種抽法?,15,

7、六、抽樣方法與樣本可能數(shù)目,不考慮順序時的樣本可能數(shù)目是不重復(fù)的組合數(shù):,例84:從小組10位學(xué)生中不重復(fù)隨機抽選3個組成樣本,考查其平均成績,可能的樣本數(shù)目為:,16,第二節(jié) 抽樣分布,17,第二節(jié) 抽樣分布,抽樣分布:樣本統(tǒng)計量的概率分布。 樣本統(tǒng)計量是隨機變量。 統(tǒng)計量的取值不但和樣本容量有關(guān),還和抽樣方法有關(guān)。下面我們討論簡單隨機樣本的抽樣分布。,18,一、重復(fù)(置)抽樣分布 (一)樣本平均數(shù)的分布 (二)抽樣成數(shù)的分布 二、不重復(fù)(置)抽樣分布 (一)樣本平均數(shù)的分布 (二)抽樣成數(shù)的分布 三、抽樣誤差的種類 四、關(guān)于正態(tài)分布的定理,第二節(jié) 抽樣分布,19,一、重復(fù)(置)抽樣分布,(

8、一)樣本平均數(shù)的分布 樣本平均數(shù)的分布由所有可能樣本的平均數(shù)取值和相應(yīng)的概率組成。 例8-5:某施工班組5個工人的日工資分別為:34、38、42、46、50元。則總體工人日工資平均數(shù)和方差分別為:,20,一、重復(fù)(置)抽樣分布,現(xiàn)用重復(fù)抽樣方法從5人中隨機抽取2人組成樣本,樣本可能數(shù)目為52 = 25個。各樣本的日平均工資計算結(jié)果如下:,25個樣本的日工資平均數(shù)計算表,21,一、重復(fù)(置)抽樣分布,根據(jù)上表數(shù)據(jù),可以整理出樣本平均數(shù)的分布如右表:,22,一、重復(fù)(置)抽樣分布,樣本日平均工資分布圖,23,一、重復(fù)(置)抽樣分布,根據(jù)樣本日工資平均數(shù)分布表,可以計算日工資平均數(shù)的數(shù)學(xué)期望和方差:

9、,24,一、重復(fù)(置)抽樣分布,1.重復(fù)抽樣的樣本平均數(shù)的數(shù)學(xué)期望等于總體平均數(shù),即:,2.抽樣平均數(shù)的標準差又稱為抽樣平均誤差或抽樣標準誤差,重復(fù)抽樣的抽樣平均誤差等于總體標準差除以樣本單位數(shù)的平方根。即:,25,樣本平均數(shù)的分布與總體分布的比較,總體分布,樣本平均數(shù)的分布,原來如此,26,一、重復(fù)(置)抽樣分布,從以上結(jié)論可知,(1)抽樣平均誤差比總體標準差小得多,僅為總體標準差的 。例如,一個縣的糧食畝產(chǎn)高低相差很大,畝產(chǎn)標準差為80公斤,如果隨機抽取100畝計算其平均畝產(chǎn),其平均誤差就顯著縮小,只有總體標準差的1/10。(2)抽樣平均誤差與總體標準差成正比,而和樣本單位數(shù)的方根成反比。

10、,27,一、重復(fù)(置)抽樣分布,(二)抽樣成數(shù)的分布 可以把是非標志作為(0,1)變量,其總體平均數(shù)就是總體成數(shù),總體方差也由成數(shù)確定。,28,一、重復(fù)(置)抽樣分布,現(xiàn)在從總體中用重復(fù)抽樣方法抽取n個單位組成樣本,計算樣本成數(shù)p,樣本成數(shù)的分布實質(zhì)上就是(0,1)變量的樣本平均數(shù)的分布:,29,一、重復(fù)(置)抽樣分布,例8-6:已知某批零件的優(yōu)等品率為80%,現(xiàn)用重復(fù)抽樣方法從中抽取100件,求樣本優(yōu)等品率的抽樣平均誤差。,30,二、不重復(fù)(置)抽樣分布,(一)樣本平均數(shù)的分布 1.不重復(fù)抽樣的樣本平均數(shù)的數(shù)學(xué)期望等于總體平均數(shù),即:,修正因子,2.不重復(fù)抽樣的抽樣平均誤差等于重復(fù)抽樣的抽樣

11、平均誤差乘以修正因子,即:,31,二、不重復(fù)(置)抽樣分布,(二)抽樣成數(shù)的分布,32,例8-7:要估計某地區(qū)10000名適齡兒童的入學(xué)率,用不重復(fù)抽樣的方法抽取400名兒童,檢查結(jié)果有320名入學(xué),計算樣本入學(xué)率的抽樣平均誤差。,由上可知,P=320/40080% 1、在重復(fù)抽樣下,入學(xué)率的抽樣平均誤差:,2、在不重復(fù)抽樣下,入學(xué)率的抽樣平均誤差:,33,抽樣平均誤差公式匯編,重復(fù)抽樣 不重復(fù)抽樣,樣本平均數(shù)的抽樣誤差,樣本成數(shù) 的抽樣誤差,34,三、抽樣誤差的種類,(一)統(tǒng)計誤差的種類 1、登記性誤差 2、代表性誤差 非偶然性代表性誤差(系統(tǒng)偏差) 偶然性代表性誤差(隨機誤差),35,(二

12、)抽樣實際誤差 1、抽樣實際誤差的含義 抽樣實際誤差是指在遵守隨機原則的前提下所產(chǎn)生的樣本指標值與相應(yīng)總體指標值之間的差異。,36,2、抽樣實際誤差的種類 平均數(shù)的抽樣實際誤差。 成數(shù)的抽樣實際誤差。,37,(三)抽樣平均誤差,1、平均數(shù)的抽樣平均誤差。 2、成數(shù)的抽樣平均誤差。,38,(四)抽樣極限誤差,(一)概念 抽樣極限誤差又稱允許誤差,是指在抽樣推斷中所允許出現(xiàn)的最大誤差。一般用符號 表示。 (二)計算公式,39,四、關(guān)于正態(tài)分布的定理,(一)正態(tài)分布再生定理 (二)中心極限定理,40,(一)正態(tài)分布再生定理,41,(二)中心極限定理,設(shè)從均值為 ,方差為 的一個任意總體中抽取容量為n

13、的樣本,當(dāng)n充分大時,樣本均值的抽樣分布近似服從均值為 ,方差為 的正態(tài)分布。,42,例8-8:有一批電子元件,設(shè)其耐用時數(shù)服從正態(tài)分布,其平均耐用時數(shù)為6000小時,標準差為500小時?,F(xiàn)從該總體中抽出一個容量為100的簡單隨機樣本,求該樣本平均數(shù)介于5900 6100之間的概率。 解:由于X N(6000,5002),n=100,所以有,43,例8-9:從一個平均年齡為30歲,標準差為3歲的婦女總體中隨即抽取36名婦女構(gòu)成簡單隨機樣本,求該36名婦女平均年齡小于31歲的概率為多少?,44,第三節(jié) 參數(shù)估計,有效的估計將是,45,一、樣本統(tǒng)計量的優(yōu)良標準,(一)無偏性 (二)一致性 (三)有

14、效性,46,(一)優(yōu)良標準之一:無偏性,無偏性:樣本統(tǒng)計量的期望值(均值)等于被估計的總體參數(shù)。,47,(一)優(yōu)良標準之一:無偏性,48,(二)優(yōu)良標準之二:一致性,一致性:即當(dāng)樣本容量n充分大的時,若樣本統(tǒng)計量充分地靠近被估計的總體參數(shù),則該樣本統(tǒng)計量是被估計的總體參數(shù)的一致估計量。,49,(三)優(yōu)良標準之三:有效性,有效性:如果一個樣本估計量的方差比其他估計量的方差小,則稱該樣本估計量是被估計的總體參數(shù)的有效估計量。,50,二、點估計(Point estimation),點估計:又稱定值估計,它是用實際樣本統(tǒng)計量數(shù)值代替總體參數(shù)值的一種統(tǒng)計估計方法。,點估計的優(yōu)點:能夠提供總體參數(shù)的具體估

15、計值。 點估計的缺點:并不能提供誤差大小的信息。,51,二、點估計(舉例),【例8-10】由于許多戰(zhàn)略上的理由,盟軍非常想知道二戰(zhàn)期間德軍總共制造了多少輛坦克。德國人在制造坦克時是墨守陳規(guī)的,他們把坦克從1開始進行了連續(xù)編號。在戰(zhàn)爭進行過程中,盟軍繳獲了一些敵軍坦克,并記錄了它們的編號。那么怎樣用這些號碼來估計坦克總數(shù)呢?,我們知道,制造出來的坦克數(shù)肯定大于記錄中的最大編號。因此,其中點估計的方法之一就是,計算出被繳獲坦克編號的平均值,并認為這個值是德軍全部坦克編號的中點,用樣本均值乘以2就是總數(shù)的一個估計。,注從戰(zhàn)后發(fā)現(xiàn)的德軍記錄來看,盟軍估計值非常接近所生產(chǎn)坦克的真實記錄。 統(tǒng)計學(xué)家做得比

16、間諜們更漂亮!,52,三、區(qū)間估計 (interval estimate),在點估計的基礎(chǔ)上,給出總體參數(shù)估計的一個區(qū)間范圍,該區(qū)間由樣本統(tǒng)計量加減估計誤差而得到 根據(jù)樣本統(tǒng)計量的抽樣分布能夠?qū)颖窘y(tǒng)計量與總體參數(shù)的接近程度給出一個概率度量 比如,某班級平均分數(shù)在7585之間,置信水平是95%,53,區(qū)間估計的圖示,54,將構(gòu)造置信區(qū)間的步驟重復(fù)很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平 表示為 (1 - 是總體參數(shù)不在置信區(qū)間的概率 常用的置信水平值有 99%, 95%, 90% 相應(yīng)的 為0.01,0.05,0.10,置信水平(confidence level),55,由

17、樣本統(tǒng)計量所構(gòu)造的總體參數(shù)的估計區(qū)間稱為置信區(qū)間 統(tǒng)計學(xué)家在某種程度上確信這個區(qū)間會包含真正的總體參數(shù),所以給它取名為置信區(qū)間 用一個具體的樣本所構(gòu)造的區(qū)間是一個特定的區(qū)間,我們無法知道這個樣本所產(chǎn)生的區(qū)間是否包含總體參數(shù)的真值 我們只能是希望這個區(qū)間是大量包含總體參數(shù)真值的區(qū)間中的一個,但它也可能是少數(shù)幾個不包含參數(shù)真值的區(qū)間中的一個 總體參數(shù)以一定的概率落在這一區(qū)間的表述是錯誤的,置信區(qū)間 (confidence interval),56,置信區(qū)間 (95%的置信區(qū)間),重復(fù)構(gòu)造出的20個置信區(qū)間,點估計值,57,置信區(qū)間與置信水平,58,總體均值的區(qū)間估計 (正態(tài)總體、方差已知,或非正態(tài)

18、總體、大樣本),59,總體均值的區(qū)間估計(大樣本),1.假定條件 總體服從正態(tài)分布,且方差() 已知 如果不是正態(tài)分布,可由正態(tài)分布來近似 (n 30) 使用正態(tài)分布統(tǒng)計量 z,總體均值 在1- 置信水平下的置信區(qū)間為,60,總體均值的區(qū)間估計(例題分析),【 例 】一家食品生產(chǎn)企業(yè)以生產(chǎn)袋裝食品為主,為對產(chǎn)量質(zhì)量進行監(jiān)測,企業(yè)質(zhì)檢部門經(jīng)常要進行抽檢,以分析每袋重量是否符合要求。現(xiàn)從某天生產(chǎn)的一批食品中隨機抽取了25袋,測得每袋重量(單位:g)如下表所示。已知產(chǎn)品重量的分布服從正態(tài)分布,且總體標準差為10g。試估計該批產(chǎn)品平均重量的置信區(qū)間,置信水平為95%,61,總體均值的區(qū)間估計(例題分析

19、),解:已知N(,102),n=25, 1- = 95%,z/2=1.96。根據(jù)樣本數(shù)據(jù)計算得: 。由于是正態(tài)總體,且方差已知。總體均值在1-置信水平下的置信區(qū)間為,該食品平均重量的置信區(qū)間為101.44g109.28g,統(tǒng)計函數(shù)CONFIDENCE,62,總體均值的區(qū)間估計(例題分析),【例】一家保險公司收集到由36投保個人組成的隨機樣本,得到每個投保人的年齡(單位:周歲)數(shù)據(jù)如下表。試建立投保人年齡90%的置信區(qū)間,63,總體均值的區(qū)間估計(例題分析),解:已知n=36, 1- = 90%,z/2=1.645。根據(jù)樣本數(shù)據(jù)計算得: , 總體均值在1- 置信水平下的置信區(qū)間為,投保人平均年齡

20、的置信區(qū)間為37.37歲41.63歲,統(tǒng)計函數(shù)CONFIDENCE,64,總體均值區(qū)間估計(已知),【例8-12】某車間生產(chǎn)滾珠,從長期實踐中得知,滾珠直徑X服從正態(tài)分布,現(xiàn)隨機抽取6個測得直徑分別為:14.6,15.1,14.9,14.8,15.2,15.1(單位:mm)。若已知總體方差為0.06,求平均直徑的置信區(qū)間。(取=0.05),解:,樣本均值的抽樣平均誤差為:,65,總體均值的區(qū)間估計 (小樣本),1.假定條件 總體服從正態(tài)分布,但方差() 未知 小樣本 (n 30) 使用 t 分布統(tǒng)計量,總體均值 在1-置信水平下的置信區(qū)間為,66,t 分布, t 分布是類似正態(tài)分布的一種對稱分

21、布,它通常要比正態(tài)分布平坦和分散。一個特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布,67,總體均值的區(qū)間估計(例題分析),【例】已知某種燈泡的壽命服從正態(tài)分布,現(xiàn)從一批燈泡中隨機抽取16只,測得其使用壽命(單位:h)如下。建立該批燈泡平均使用壽命95%的置信區(qū)間,68,總體均值的區(qū)間估計(例題分析),解:已知N(,2),n=16, 1- = 95%,t/2=2.131 根據(jù)樣本數(shù)據(jù)計算得: , 總體均值在1-置信水平下的置信區(qū)間為,該種燈泡平均使用壽命的置信區(qū)間為1476.8h1503.2h,69,總體成數(shù)的區(qū)間估計,總體成數(shù)是指總體中具有某種特征的單位數(shù)量占總

22、體全部單位數(shù)的比重,也稱為總體比例。,70,總體成數(shù)的區(qū)間估計,71,總體成數(shù)的區(qū)間估計(舉例),【例8-15】一所大學(xué)的保健醫(yī)生想了解戴眼鏡學(xué)生的比重,隨機地抽取100名學(xué)生,其中戴眼鏡者有31名。試對全校學(xué)生戴眼鏡人數(shù)比重進行區(qū)間估計 (=0.1) 。,解:,計算樣本成數(shù)的抽樣平均誤差:,計算總體成數(shù)P的置信區(qū)間:,即P的90%的置信區(qū)間為(23.4%,38.6%),計算樣本成數(shù):,72,總體比例的置信區(qū)間(實例),我們可以95的概率保證該企業(yè)職工由于同管理人員不能融洽相處而離開的比例在63.6%76.4%之間,【例】某企業(yè)在一項關(guān)于職工流動原因的研究中,從該企業(yè)前職工的總體中隨機選取了2

23、00人組成一個樣本。在對其進行訪問時,有140人說他們離開該企業(yè)是由于同管理人員不能融洽相處。試對由于這種原因而離開該企業(yè)的人員的真正比例構(gòu)造95%的置信區(qū)間。,73,一個總體參數(shù)的區(qū)間估計(小結(jié)),74,抽樣單位數(shù)目的計算,均值估計的抽樣單位數(shù)目計算 在重復(fù)抽樣的條件下,在不重復(fù)抽樣的條件下,75,成數(shù)估計的抽樣單位數(shù)目計算 在重復(fù)抽樣的條件下,在不重復(fù)抽樣的條件下,抽樣單位數(shù)目的計算,76,例8-16:某市開展職工家計調(diào)查,根據(jù)歷史資料該市職工家庭平均每人年收入的標準差為2400元,家庭消費總支出中食品消費支出比重(恩格爾系數(shù))為54%。現(xiàn)用重復(fù)抽樣方法,要求在95.45%的概率保證下,平

24、均收入的抽樣極限誤差不超過200元,恩格爾系數(shù)的抽樣極限誤差不超過4%,請確定樣本必要數(shù)目。 解:根據(jù)公式,在重復(fù)抽樣條件下:,樣本成數(shù)的樣本必要數(shù)目:,樣本平均數(shù)的樣本必要數(shù)目:,77,關(guān)于抽樣單位數(shù)目的幾點說明,同一總體往往同時需要估計總體平均數(shù)和總體成數(shù),對二者可以分別計算出各自抽樣單位數(shù)目,為了防止抽樣單位數(shù)目的不足,在實際工作中,往往根據(jù)抽樣單位數(shù)目比較大的一個數(shù)目進行抽樣,以滿足共同要求,78,關(guān)于抽樣單位數(shù)目的幾點說明,一個問題: 在重復(fù)抽樣情況下,如果其它條件保持不變,要使允許誤差范圍縮小為原來的1/2,則樣本單位數(shù)目需要擴大為原來的多少?反之,如果允許誤差范圍要求擴大為原來的

25、2倍,抽樣單位數(shù)目又要如何變化?,79,樣本容量的確定(實例),解:已知2=1800000,=0.05, Z/2=1.96,=500,應(yīng)抽取的樣本容量為,【例】一家廣告公想估計某類商店去年所花的平均廣告費用有多少。經(jīng)驗表明,總體方差約為1800000元。如置信度取95%,并要使估計處在總體平均值附近500元的范圍內(nèi),這家廣告公司應(yīng)抽多大的樣本?,80,1、某工廠有1500個工人,用簡單隨機重復(fù)抽樣的方法抽出50個工人為樣本進行調(diào)查,其工資水平如上表所示。求: (1)樣本平均數(shù)和抽樣平均誤差。 (2)以95.45%的可靠性估計該廠工人的月平均工資和工資總額的區(qū)間。,81,2.采用簡單隨即重復(fù)抽樣

26、的方法,在2000件產(chǎn)品中抽查200件,其中合格品190件,求: (1)合格率以及抽樣平均誤差。 (2)以95.45%的概率保證程度,對合格率 和合格品數(shù)量進行區(qū)間估計。 (3)如果極限誤差為2.31%,則其概率保證程度是多少?,82,3.某電子產(chǎn)品使用壽命在3000小時以下為不合格品,現(xiàn)在用簡單的隨機抽樣方法,從5000個產(chǎn)品中抽取100個對其使用壽命進行調(diào)查。其結(jié)果如表所示,根據(jù)以上資料,求: (1)在重復(fù)抽樣和不重復(fù)抽樣的情況下,該產(chǎn)品平均壽命的抽樣平均誤差。 (2)在重復(fù)抽樣和不重復(fù)抽樣的情況下,該產(chǎn)品合格率的抽樣平均誤差。 (3)根據(jù)重復(fù)抽樣計算的抽樣平均誤差,以68.24%的概率保

27、證程度,對該產(chǎn)品的平均使用壽命和合格率進行區(qū)間估計。,83,84,第四節(jié) 抽樣組織形式,85,五種基本抽樣組織形式,86,一、簡單隨機抽樣,簡單隨機抽樣的樣本個體在總體中的分布是無規(guī)律的。,總體中有N個個體,從總體中隨機抽取n個個體,87,簡單隨機抽樣的特點,簡單隨機抽樣是抽樣調(diào)查中最基本的組織形式,前面所講的估計方法都是以簡單隨機抽樣為基礎(chǔ)的; 簡單隨機抽樣是按隨機原則直接從總體N個單位中抽取個單位作為樣本,不論是重復(fù)抽樣還是不重復(fù)抽樣都要保證每個單位在抽選中有相等的中選機會;由于在抽樣中除了抽樣框的信息外,不需要其它信息,所以又稱為純隨機抽樣。 簡單隨機抽樣被用作評估其他抽樣策略的效率的基

28、準 ; 簡單隨機抽樣最原始的抽取方法是抽簽法,最常用的抽取方法是利用隨機數(shù)表 或計算機生產(chǎn)隨機數(shù)。,88,二、類型抽樣,總體中有N個個體,將總體分成若干個類型組,89,(二)類型抽樣的分類,1、等比例類型抽樣,2、不等比例類型抽樣,90,一個分組數(shù)列的總方差等于其各組組內(nèi)方差的平均數(shù)與組間方差的和。總方差:各單位標志值與總平均數(shù)計算的方差。組間方差:各組平均數(shù)與總平均數(shù)計算的方差。組內(nèi)方差:各組內(nèi)各單位標志值與本組平均數(shù)計算 的方差。,91,例 將1、2、3、4、5、6、7、8、9、10十個數(shù)分成以下兩組。A組:1、2、5、8 ; B組:3、4、6、7、9、10。,92,(三)等比例類型抽樣的

29、估計,1.總體平均數(shù)估計 第一步 計算各層抽樣平均數(shù),第三步 計算抽樣平均誤差 (1)計算各組內(nèi)方差:,第二步 計算樣本平均數(shù),93,(2)計算各組內(nèi)方差的平均數(shù):,(4)抽樣平均數(shù)的估計區(qū)間:,(三)等比例類型抽樣的估計,(3)樣本平均數(shù)的抽樣平均誤差:,重復(fù)抽樣:,不重復(fù)抽樣:,94,類型抽樣算例,例:某鄉(xiāng)糧食播種面積20000畝,現(xiàn)在按平原和山區(qū)面積比例抽取其中的2%,計算各組平均畝產(chǎn) 和各組畝產(chǎn)標準差i如下表,求樣本平均畝產(chǎn) 和抽樣平均誤差,95,不重復(fù)抽樣時:,重復(fù)抽樣時:,類型抽樣算例,96,2.總體成數(shù)估計,(二)計算抽樣成數(shù)的平均誤差,(一)計算樣本成數(shù) 估計總體成數(shù),其中:,

30、97,(四)類型抽樣的特點,類型抽樣的平均誤差與組間方差無關(guān),而決定于組內(nèi)方差的平均水平。由此可以推導(dǎo)出兩點結(jié)論: 1、根據(jù)總體方差等于組間方差與組內(nèi)方差之和定理,類型抽樣的平均誤差一般小于簡單隨機抽樣的平均誤差; 2、由于總體方差是確定的數(shù),因此,在類型抽樣分組時應(yīng)該盡可能擴大組間方差,縮小組內(nèi)方差,從而減少抽樣誤差,提高抽樣效果。,98,三、等距抽樣,總體中有N個個體,將總體中個體按某一標志排序,并均分成n個部分。,在第一部分中隨機地抽取一個,然后每隔相同的距離抽取一個,直到抽完n個為止。,99,(二)等距抽樣的分類,在等距抽樣中,由于排隊所依據(jù)的標志不同,等距抽樣分為按無關(guān)標志排隊和有關(guān)

31、標志排隊兩種。 按無關(guān)標志排序:是指排列的標志和所研究的標志值的大小無關(guān)或不起主要影響作用; 按有關(guān)標志排序:即用來排列的標志和所研究的標志值的大小保持密切關(guān)系。按有關(guān)標志排序?qū)嵸|(zhì)上一種特殊的類型抽樣,有利于提高樣本的代表性。,100,(三)等距抽樣的抽選方法,1、隨機起點等距抽樣 :設(shè)N個單位分成n個段,每段k單位,k就是抽樣間距。在第一段隨機抽取第i個,則其他的樣本單位就依次確定:i+k,i+2k,i+(n-1)k。 通常用于無關(guān)標志排隊時,其抽樣效果與簡單隨機抽樣相同。 2、半距起點等距抽樣:第一個單位取k/2,后面單位確定方式同上。 3、對稱等距抽樣:每兩段配成一對,在第一段隨機抽取第i個單位,在第二段則第2k-i個單位;第三段取第2k+i個單位,在第四段則取第4k-i個單位,后面以此類推。,101,(三)等距抽樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論