第十一章抽樣法.ppt_第1頁(yè)
第十一章抽樣法.ppt_第2頁(yè)
第十一章抽樣法.ppt_第3頁(yè)
第十一章抽樣法.ppt_第4頁(yè)
第十一章抽樣法.ppt_第5頁(yè)
已閱讀5頁(yè),還剩117頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十一章 抽樣法,第一節(jié) 抽樣法的意義和作用,一、抽樣法的特點(diǎn) 抽樣法在統(tǒng)計(jì)調(diào)查和統(tǒng)計(jì)分析中都有廣泛的應(yīng)用。 抽樣法是按照隨機(jī)原則從全部研究對(duì)象中抽取一部分單位進(jìn)行觀(guān)察,并依據(jù)所獲得的數(shù)據(jù)對(duì)全部研究對(duì)象的數(shù)量特征做出具有一定可靠性的估計(jì)判斷,從而達(dá)到對(duì)全部研究對(duì)象的認(rèn)識(shí)的一種統(tǒng)計(jì)方法。,抽樣法的基本特點(diǎn):,(1)根據(jù)部分實(shí)際資料對(duì)全部總體的數(shù)量特征作出估計(jì)。 通過(guò)抽樣調(diào)查,取得部分單位的實(shí)際材料,據(jù)以計(jì)算抽樣的綜合指標(biāo),然后對(duì)于總體的規(guī)模、水平、結(jié)構(gòu)指標(biāo)作出估計(jì)。,(2)按隨機(jī)的原則從全部總體中抽選樣本單位。 (3)抽樣推斷的抽樣誤差可以事先計(jì)算并反加以控制。 抽樣推斷是以部分資料推算全體,雖

2、然存在一定的抽樣誤差,但它可以事先通過(guò)一定資料加以計(jì)算,并且能夠采取一定的組織措施來(lái)控制這個(gè)誤差范圍,保證抽樣準(zhǔn)斷的結(jié)果達(dá)到一定的可靠程度。,二、抽樣法的作用,第一,對(duì)某些不可能進(jìn)行全面調(diào)查而又要了解其全面情況的社會(huì)經(jīng)濟(jì)現(xiàn)象,必須應(yīng)用抽樣法。 如,工業(yè)生產(chǎn)中檢驗(yàn)?zāi)承┊a(chǎn)品的質(zhì)量時(shí),常常具有破壞性。如輪胎的里程檢驗(yàn)、燈泡的壽命檢驗(yàn),紗布的強(qiáng)力檢驗(yàn)、炮彈的殺傷力檢驗(yàn)等。 有些現(xiàn)象的總體過(guò)大,單位過(guò)于分散,進(jìn)行全面調(diào)查實(shí)際上是不可能的,例如要檢驗(yàn)水庫(kù)的魚(yú)苗數(shù),森林的木材積蓄絲等。,第二,對(duì)某些社會(huì)經(jīng)濟(jì)現(xiàn)象雖然可以進(jìn)行全面調(diào)查但抽樣法仍然有其獨(dú)到的作用,例如: 抽樣調(diào)查可以節(jié)省人力、費(fèi)用,提高調(diào)查的經(jīng)濟(jì)

3、效果。 抽樣調(diào)查可以節(jié)省時(shí)間,提高調(diào)查的時(shí)效性。 抽樣調(diào)查由于調(diào)查單位少,調(diào)查隊(duì)伍經(jīng)過(guò)專(zhuān)門(mén)訓(xùn)練,可以增加調(diào)查項(xiàng)目,取得比較詳細(xì)的資料,并且提高資料的準(zhǔn)確性。,第三,抽樣調(diào)查和全面調(diào)查同時(shí)進(jìn)行,可以發(fā)揮相互補(bǔ)充和檢查質(zhì)量的作用。 第四,抽樣法可以用于工業(yè)生產(chǎn)過(guò)程的質(zhì)量控制。 第五,利用抽樣法原理,還可以對(duì)于某種總體的假設(shè)進(jìn)行檢驗(yàn),來(lái)判斷這種假設(shè)的真?zhèn)?,決定行動(dòng)的取舍。,三、抽樣法的理論基礎(chǔ),(一)大數(shù)法則 就數(shù)量關(guān)系來(lái)說(shuō),抽樣推斷是建立在概率論的大數(shù)法則基礎(chǔ)上,大數(shù)法則的一系列定理為抽樣推斷提供了數(shù)學(xué)依據(jù)。,大數(shù)法則即關(guān)于大量的隨機(jī)現(xiàn)象具有穩(wěn)定性質(zhì)的法則。它說(shuō)明如果被研究的總體是由大量的相互獨(dú)立

4、的隨機(jī)因素所構(gòu)成,而且每個(gè)因素對(duì)總體的影響都相對(duì)地小,那么對(duì)這些大量因素加以綜合平均的結(jié)果,因素的個(gè)別影響將相互抵消,而顯現(xiàn)出它們共同作用的傾向,使總體具有穩(wěn)定的性質(zhì)。,聯(lián)系到抽樣推斷來(lái)看,大數(shù)法則證明:如果隨機(jī)變量總體存在著有限的平均數(shù)和方差,則對(duì)于充分大的抽樣單位數(shù)n,可以幾乎趨近于l的概率,來(lái)期望抽樣平均數(shù)與總體平均數(shù)的絕對(duì)離差為任意小,即對(duì)于任意的正數(shù)。有:,(二)中心極限定理,大數(shù)法則論證了抽樣平均數(shù)趨近于總體平均數(shù)的趨勢(shì),這為抽樣推斷提供了重要的依據(jù)。但是,抽樣平均數(shù)和總體平均數(shù)的離差究竟有多大?離差不超過(guò)一定范圍的概率究競(jìng)有多少?這個(gè)離差的分市怎樣?大數(shù)法則并沒(méi)有在這方面給出什么

5、信息。 這個(gè)問(wèn)題要利用另一重要的定理,即中心極限定理來(lái)研究。中心極限定理證明:如果總體變量存在有限的平均數(shù)和方差,那么不論這個(gè)總體變量的分布如何,隨著抽樣單位數(shù)n的增加,抽樣平均數(shù)的分布便趨近于正態(tài)分布。,INTRODUCTION TO INFERENTIAL STATISTICS,Statistical inference is the process of making generalization about a population from a sample.,Since most of the characteristics of a population can be descr

6、ibed by parameters, inferential statistics primarily deals,with the estimation of an unknown population parameter from the corresponding sample statistic.,with the verification whether a belief or hypothesis about a parameter is supported by the sample evidence.,Estimation,Hypothesis testing,(E.g.:

7、We estimate probability measures from relative frequencies.),(E.g.: We believe that the probability of an event is 0.2 and using just a sample we want to find out whether this is a reasonable assumption.),Ex 1: Suppose we are interested in the following population: X = 1,2,3,4,5).,Since this is a ve

8、ry small population (Nx = 5), it is easy to observe the whole population, to illustrate it with a relative frequency histogram and to find the parameters, like the population mean and the population variance.,and,(Check the details.),The key concept behind these statistical procedures is the probabi

9、lity distribution, called sampling distribution, of a sample statistic.,A summary of all possible values of a statistic along with the corresponding probabilities.,Though these calculations were really simple, assume that, for some reason, we do not observe the whole population, but draw all possibl

10、e samples of size two (n = 2)with replacement.,There are 25 possible samples. They are shown in the first row and first column of the table below.,1st draw (x1),2nd draw (x2),1.0,Compute the sample mean from each of these samples. (E.g.: If x1 = 1 and x2 = 4, x-bar is 2.5.),2.5,3.5,2.0,2.5,3.0,1.5,2

11、.0,2.5,3.0,3.5,2.0,2.5,3.0,3.5,4.0,3.0,3.5,4.0,4.5,3.0,1.5,4.0,4.5,5.0,These sample mean values form a second population, X-bar1.,(Check the details.),Repeat part b assuming this time that sampling is without replacement.,1st draw (x1),2nd draw (x2),These sample mean values form a third population,

12、X-bar2.,(Since samples are drawn without replacement, the same number cannot turn up twice.),Compare the X, X-bar1 and X-bar2 populations to each other.,X-bar1 and X-bar2 are larger populations than X.,X, X-bar1 and X-bar2 have the same mean.,X has the biggest variance and X-bar2 has the smallest.,T

13、hese results suggest that,It is easier to guess X-bar2 than X-bar1 or X.,Apart from their means and variances, the X-bar1 and X-bar2 populations can also be characterized by their shapes.,Note however, that,and,(These relationships between the variances of X, X-bar1 and X-bar2 are valid in general.)

14、,These relative frequency histograms are graphical representations of the X-bar1 and X-bar2 sampling distributions.,Apparently, both sampling distributions are symmetrical around = 3. Nevertheless, they are different from each other, and both of them are different from the distribution of X.,How to

15、take a sample?,In this example the original population, X, is very small, so we could easily calculate the population mean, x. There was no real need to draw samples.,In practice, however, the target population is usually much larger.,The population about which we want to draw inferences.,Since it m

16、ight be impossible or impractical to observe the whole population, we draw a sample.,It is not necessarily the same than the sampled population, i.e. the population from which we actually take the sample.,The sample must be representative, i.e. it must have similar attributes than the population its

17、elf.,In order to obtain reliable information from a sample The target and sampled populations should be very similar, or the same if possible.,Even a small sample is likely to give us fairly accurate information about the population. (E.g. the sample mean can be expected to be close to the populatio

18、n mean.),If the sample items are selected randomly, the sample is like a scaled- down version of the population, unless we are very unlucky.,If the sample is not randomly selected, it is likely to produce misleading, biased results, even if the sample is relatively large.,(E.g. If we were attempting

19、 to estimate mean earnings, but we failed to sample people in more affluent suburbs, the sample mean would almost certainly underestimate the true population mean.),This example suggests that,If we intend to use a sample statistic for statistical inference, first we have to study its sampling distri

20、bution.,(Ex 1) We studied all possible samples of size 2 drawn with replacement. There were 25 different samples. If we select only one of them, but make sure that all these samples have the same chance of being selected, then sampling is assured to be simple random sampling.,If we draw just one sam

21、ple and it happens to be x1 = 1 and x2 = 3, x-bar is 2. Since the true mean of X is 3, the error is 1. This is a sampling error.,Sample statistics, like e.g. X-bar, are random variables since their actual values vary depending on which particular sample is selected.,The 25 possible samples of size 2

22、 had 9 different sample mean values: 1.0, 1.5, 2.0, 2.5, 3.0, 3.5, 4.0, 4.5 and 5.0.,SAMPLING DISTRIBUTIONS,The results from Ex 1 can be generalized as follows.,The sampling distribution of the sample means calculated from random samples of the same size have the following characteristics:,1),i.e. t

23、he expected value of the sample mean is the mean of the sampled population.,The sample mean from a random sample is our best guess of the true population mean.,2),granted that sampling is with replacement, or from a relatively large, maybe infinite, population. (The population is considered to be la

24、rge compared to the sample if n/N0.10, i.e. n is less than 10% of N.),Otherwise,Finite population correction factor.,Like probability distributions in general, a sampling distribution can be described by its three important properties: mean, standard deviation and shape.,As for the shape of the samp

25、ling distribution of the sample mean, it depends on the distribution of the sampled population and on the sample size.,The standard deviation of the sample mean (or any other statistic)is called standard error.,Since the mean of the sample mean is , the standard deviation of the sample mean measures

26、 the average distance between the sample mean and the population mean.,Namely: 3)If the population (X)is normally distributed, X-bar is also normally distributed, regardless of the sample size.,If the population (X)is not normally distributed, or we do not know whether it is normal, we can rely on t

27、he Central Limit Theorem (CLT):,If the sample size is large (say n 30), X-bar is approximately normally distributed, regardless of the shape of the population.,The more bell-shaped the population or/and the larger the sample size, the better this approximation is.,Ex 2:An automatic machine in a manu

28、facturing process is operating properly if the lengths of an import sub-component are normally distributed, with mean = 117 cm and standard deviation = 2.1 cm.,Find the probability that one randomly selected unit has a length of greater than 120 cm.,Find the probability that if three units are rando

29、mly selected, their mean length exceeds 120 cm.,X,i.e. X : N (117, 2.1),n,Since X is normally distributed, X-bar is also normal,and,X-bar : N (117, 1.212),The probability of randomly selecting one unit longer than 120 cm is 7.64%, while the probability of selecting three units with an average length

30、 of greater than 120 cm is only 0.68%.,第二節(jié) 總體和樣本,、全及總體和抽樣總體 、全及指標(biāo)和抽樣指標(biāo) 、樣本容量和樣本個(gè)數(shù),、全及總體和抽樣總體,全及總體是所要研究的對(duì)象,又稱(chēng)母體,簡(jiǎn)稱(chēng)總體,它是指所要認(rèn)識(shí)的,具有某種共同性質(zhì)的許多單位的集合體。 全及總體單位數(shù)(N)一般很大。,抽樣總體(又稱(chēng)子樣),抽樣總體則是所要觀(guān)察的對(duì)象。簡(jiǎn)稱(chēng)樣本、子樣,是從全及總體中隨機(jī)抽取出來(lái),代表全及總體的那部分單位的集合體。 樣本的單位數(shù)(n)總是有限的。 全及總體和抽樣總體兩者是既有區(qū)別而又有聯(lián)系的不同范疇。,樣本容量,抽樣總體的單位數(shù),通常用小寫(xiě)英文字母 n 來(lái)表示。

31、隨著樣本容量的增大,樣本對(duì)總體的代表性越來(lái)越高,并且當(dāng)樣本單位數(shù)足夠多時(shí),樣本平均數(shù)愈接近總體平均數(shù)。,樣本的特點(diǎn),在一次抽樣調(diào)查中,全及總體是唯一確定的,樣本是不確定的,具有隨機(jī)性。 一個(gè)全及總體可能抽出很多個(gè)樣本,可能樣本的個(gè)數(shù)與樣本容量和抽樣方法有關(guān)。,如:,N=4 n=2 (考慮順序)重置抽樣時(shí) : 樣本個(gè)數(shù)=16 若改變樣本單位數(shù),取n=3 , 則,樣本個(gè)數(shù)=44464 應(yīng)用數(shù)學(xué)排列計(jì)算公式: N個(gè)元素中任取n個(gè)元素組成的可重復(fù)排列,如:,N=4 n=2 (考慮順序)不重置抽樣時(shí) :樣本個(gè)數(shù)=12 若改變樣本單位數(shù),取n=3 , 則 樣本個(gè)數(shù)=43224 應(yīng)用數(shù)學(xué)排列計(jì)算公式: N個(gè)

32、元素中任取n個(gè)元素組成的不可重復(fù)排列,如:,N=4 n=2 (不考慮順序)不重置抽樣時(shí) :樣本個(gè)數(shù)=6 若改變樣本單位數(shù),取n=3 , 則 樣本個(gè)數(shù)=(432)/( 32) 4 應(yīng)用數(shù)學(xué)組合計(jì)算公式: N個(gè)元素中任取n個(gè)元素組成的不可重復(fù)排列,如:,N=4 n=2 (不考慮順序)重置抽樣時(shí) :樣本個(gè)數(shù)=10 若改變樣本單位數(shù),取n=3 , 則 樣本個(gè)數(shù)=(654)/(3 2)20 應(yīng)用數(shù)學(xué)排列組合計(jì)算公式: N個(gè)元素中任取n個(gè)元素組成的不可重復(fù)排列,判斷題,從全部總體單位中按照隨機(jī)原則抽取部分單位組成樣本,只可能組成一個(gè)樣本。( ),答案: 一個(gè)全及總體可能抽出很多個(gè)樣本,判斷題,在抽樣推斷中

33、,作為推斷的總體和作為觀(guān)察對(duì)象的樣本都是確定的、唯一的。( ),答案: 總體唯一,樣本不唯一,.參數(shù)和統(tǒng)計(jì)量(全及指標(biāo)和抽樣指標(biāo)),參數(shù)(全及指標(biāo))(parameter) 根據(jù)全及總體各個(gè)單位的標(biāo)志值或標(biāo)志屬性計(jì)算的,反映總體某種屬性或特征的綜合指標(biāo)稱(chēng)為全及指標(biāo)。 全及指標(biāo)值具有唯一性。 常用的全及指標(biāo)有總體平均數(shù)( )(或總體成數(shù)P)、總體標(biāo)準(zhǔn)差(或總體方差2 )。,不同性質(zhì)的總體,需要計(jì)算不同的全及指標(biāo)。 對(duì)于變量總體,由于各單位的標(biāo)志可以用數(shù)量來(lái)表示,所以可以計(jì)算總體平均數(shù)。,對(duì)于屬性總體,由于各單位的標(biāo)志不可以用數(shù)量來(lái)表示,只能計(jì)算比重結(jié)構(gòu)指標(biāo),稱(chēng)為總體成數(shù)。用大寫(xiě)英文字母P來(lái)表示,它

34、說(shuō)明總體中具有某種標(biāo)志表現(xiàn)的單位數(shù)在總體中所占的比重。 設(shè)總體N個(gè)單位中,有N1個(gè)單位具有某種標(biāo)志表現(xiàn)的,N0個(gè)單位不具有某種標(biāo)志表現(xiàn), N1 + N0 N,P為總體中具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的比重,Q為不具有某種標(biāo)志表現(xiàn)的單位數(shù)所占的比重,則總體成數(shù)為,此外,全及指標(biāo)還有總體標(biāo)準(zhǔn)差和總體方差,它們都是測(cè)度總體標(biāo)志值離散程度的指標(biāo)。, 統(tǒng)計(jì)量(抽樣指標(biāo)),由抽樣總體各單位標(biāo)志值計(jì)算出來(lái)反映樣本特征,用來(lái)估計(jì)全及指標(biāo)的綜合指標(biāo)稱(chēng)為統(tǒng)計(jì)量(抽樣指標(biāo))。,統(tǒng)計(jì)量的特點(diǎn),統(tǒng)計(jì)量(抽樣指標(biāo))是隨機(jī)變量,取值不唯一。 統(tǒng)計(jì)量是樣本變量的函數(shù),用來(lái)估計(jì)總體參數(shù),因此與總體參數(shù)相對(duì)應(yīng)。,統(tǒng)計(jì)量的計(jì)算,統(tǒng)計(jì)

35、量有 樣本平均數(shù)(或抽樣成數(shù)) 樣本標(biāo)準(zhǔn)差 (或樣本方差 ),成數(shù)(P),具有某種性質(zhì)的單位數(shù)占總體單位數(shù)的比重。 成數(shù)是(0,1)分布的平均數(shù),如:,某一批產(chǎn)品的合格率是90%,這里的合格率即是成數(shù)=0.9。 合格率=合格品數(shù)量 / 產(chǎn)品總數(shù)量,成數(shù)方差( ),成數(shù)方差:成數(shù)標(biāo)準(zhǔn)差的平方 某一批產(chǎn)品的合格率是90%,則合格率的方差為:p = 90% = 0.9,第三節(jié) 抽樣估計(jì)的一般原理,一、抽樣估計(jì)的優(yōu)良標(biāo)準(zhǔn) 由于抽樣指標(biāo)作為統(tǒng)計(jì)量,它是一個(gè)隨機(jī)變量,隨著抽取的樣本不同,便有不同估計(jì)值。因此要判斷一種估計(jì)量的好壞,僅從某一次試驗(yàn)的結(jié)果來(lái)衡量是不可能的,而應(yīng)該從多次重復(fù)試驗(yàn)中,看這種估計(jì)量是

36、否在某種意義上說(shuō)最接近于被估計(jì)參數(shù)的真值。 一般地說(shuō),用抽樣指標(biāo)估計(jì)總體指標(biāo)應(yīng)該有三個(gè)要求。滿(mǎn)足了這個(gè)要求的,就可以認(rèn)為是合理的估計(jì)或優(yōu)良的估計(jì)。,(一)無(wú)偏性,用抽樣指標(biāo)估計(jì)總體指標(biāo)要求抽樣指標(biāo)的平均數(shù)等于被估計(jì)的總體指標(biāo)。就是說(shuō),雖然每一次的抽樣指標(biāo)和未知的總體指標(biāo)可能不相同,但在多次反復(fù)的估計(jì)中各個(gè)抽樣指標(biāo)的平均數(shù)應(yīng)該等于總體指標(biāo),即抽樣指標(biāo)的估計(jì)平均說(shuō)來(lái)是沒(méi)有偏誤的。 抽樣平均數(shù)是無(wú)偏估計(jì)量,即抽樣平均數(shù)的平均數(shù)等于總體平均數(shù)。,(二)一致性,用抽樣指標(biāo)估計(jì)總體指標(biāo)要求當(dāng)樣本的單位數(shù)充分大時(shí),抽樣指標(biāo)也充分地靠近總體指標(biāo)。換句話(huà)說(shuō),隨著樣本的單位數(shù)n的無(wú)限增大,抽樣指標(biāo)和未知的總體指標(biāo)

37、之間的絕對(duì)離差為任意小的可能性也趨于必然性。,(三)有效性,用抽樣指標(biāo)估計(jì)總體要求作為優(yōu)良估計(jì)量的方差應(yīng)該比其他估計(jì)量的方差小,即用抽樣平均數(shù)和總體某一變量來(lái)估計(jì)總體平均數(shù),雖然兩者都是無(wú)偏的估計(jì)量,而且在每一次的估計(jì)中兩種估計(jì)量和總體平均數(shù)都可能有離差,但樣本平均數(shù)更靠近在總體平均數(shù)的周?chē)骄f(shuō)來(lái)它的離差比較小,所以對(duì)比來(lái)說(shuō),抽樣平均數(shù)是更為優(yōu)良的估計(jì)量。 樣本平均數(shù)作為估計(jì)量的有效性,我們?cè)谙旅嬷v抽樣平均誤差計(jì)算時(shí)再加以說(shuō)明。,二、抽樣誤差,抽樣誤差是指由于隨機(jī)抽樣的偶然因素使樣本不足以代表總體,而引起抽樣指標(biāo)和全及指標(biāo)之間的絕對(duì)離差。也稱(chēng)為隨機(jī)誤差。 它不包括登記誤差,也不包括系統(tǒng)性誤

38、差。,抽樣中,誤差的來(lái)源有許多方面。 其中一類(lèi)是登記性誤差,即在調(diào)查過(guò)程中由于主客觀(guān)原因而引起登記上的差錯(cuò)所造成的誤差。 另一類(lèi)是代表性的誤差,即樣本各單位的結(jié)構(gòu)情況不足以代表總體特征者。代表性誤差的發(fā)生,有以下兩種情況:一種是由于違反抽樣調(diào)查的隨機(jī)原則,如有意地多選較好的單位或較壞的單位進(jìn)行調(diào)查,這樣,所據(jù)以計(jì)算的抽樣指標(biāo)必然出現(xiàn)偏高或偏低現(xiàn)象,造成系統(tǒng)性的誤差。,系統(tǒng)性的誤差和登記性的誤差都是抽樣工作中的組織問(wèn)題,應(yīng)該采取措施預(yù)防發(fā)生或把它減少到最小限度。 另一種情形,即使遵守隨機(jī)原則,由于被抽選的樣本有各種各樣,只要被抽中的樣本其內(nèi)部各單位被研究標(biāo)志的構(gòu)成比例和總體有所出入,就會(huì)出現(xiàn)或大

39、或小的偶然性的代表性誤差。這種偶然性的代表性誤差是無(wú)法消除的,是抽樣誤差。,三種誤差的區(qū)別:,抽樣誤差:抽樣指標(biāo)和全及指標(biāo)之間的絕對(duì)離差,不可避免,可以控制。 登記誤差:由于觀(guān)察、測(cè)量、登記、計(jì)算造成的誤差,可以避免。 系統(tǒng)性誤差:由于有意識(shí)選取調(diào)查單位造成的系統(tǒng)偏差。理論上可以避免。,單選題,抽樣誤差是指( )。A.在調(diào)查過(guò)程中由于觀(guān)察、測(cè)量等差錯(cuò)所引起的誤差B.在調(diào)查中違反隨機(jī)原則出現(xiàn)的系統(tǒng)誤差C.隨機(jī)抽樣而產(chǎn)生的代表性誤差D.人為原因所造成的誤差,答案: C,影響抽樣誤差的因素,總體各單位標(biāo)志值的差異程度 在其他條件不變的情況下,總體標(biāo)志的變異程度愈小則抽樣誤差也愈小。 樣本的單位數(shù) 在

40、其他條件不變的情況下,抽樣單位數(shù)愈多,抽樣誤差就愈小;反之抽樣單位數(shù)少了,則抽樣誤差就要增大。,抽樣調(diào)查的組織形式 這是因?yàn)椴煌某闃咏M織所抽出的樣本對(duì)于總體的代表性不相同。我們常常利用不同的抽樣誤差作出判斷各種抽樣組織估計(jì)有效性的比較標(biāo)準(zhǔn)。,、抽樣平均誤差,反映抽樣誤差一般水平的指標(biāo)。實(shí)質(zhì)含義是指抽樣平均數(shù)(或成數(shù))的標(biāo)準(zhǔn)差,反映了抽樣指標(biāo)與總體指標(biāo)的平均離差程度。,單選題,抽樣平均誤差是( )。 A.全及總體的標(biāo)準(zhǔn)差 B.樣本的標(biāo)準(zhǔn)差 C.抽樣指標(biāo)的標(biāo)準(zhǔn)差 D.抽樣誤差的平均差,答案: C,抽樣平均誤差的作用,作用:說(shuō)明樣本指標(biāo)代表性的大小。平均誤差大,說(shuō)明樣本指標(biāo)對(duì)總體指標(biāo)的代表性低;反

41、之則說(shuō)明樣本指標(biāo)對(duì)總體指標(biāo)代表性高。,判斷題,抽樣平均均誤差反映抽樣的可能誤差范圍,實(shí)際上每次的抽樣誤差可能大于抽樣平均誤差,也可能小于抽樣平均誤差。( ),答案:,抽樣平均誤差的計(jì)算:,重置抽樣,不重置抽樣,平均數(shù),成數(shù),成數(shù),平均數(shù),如:,某鄉(xiāng)糧食畝產(chǎn)量的標(biāo)準(zhǔn)差87。 若按重置抽樣計(jì)算,其抽樣平均誤差為,如:,已知秧苗成活率. 如果改為:從100畝地中隨機(jī)抽取10畝地進(jìn)行測(cè)試,秧苗成活率為92%,則按不重置抽樣計(jì)算,其抽樣平均誤差為:,抽樣平均誤差的應(yīng)用,在抽樣推斷中,抽樣平均誤差用于計(jì)算極限誤差,、抽樣極限誤差,用絕對(duì)值形式表示的樣本指標(biāo)與總體指標(biāo)偏差的可允許的最大范圍。 也稱(chēng)為允許誤差

42、。 由抽樣指標(biāo)變動(dòng)可允許的上限或下限與總體指標(biāo)之差的絕對(duì)值求得。,抽樣極限誤差()的計(jì)算方法,平均數(shù)的抽樣極限誤差 成數(shù)的抽樣極限誤差,估計(jì)區(qū)間,估計(jì)區(qū)間(置信區(qū)間):根據(jù)抽樣平均數(shù)和抽樣極限誤差確定的總體指標(biāo)取值范圍。 總體平均數(shù)的估計(jì)區(qū)間 總體成數(shù)的估計(jì)區(qū)間,如:,從某工廠(chǎng)工人中隨機(jī)抽取100人,計(jì)算平均工資為1500元,若要求抽樣允許誤差最大值為160元,則該廠(chǎng)工人的總平均工資取值范圍在13401660元之間。 即,兩種抽樣誤差的關(guān)系,抽樣平均誤差具有較強(qiáng)的客觀(guān)性,抽取的樣本一旦確定,抽樣平均誤差也就隨之確定。它由樣本單位數(shù)、總體標(biāo)準(zhǔn)差、總體單位數(shù)確定。 抽樣極限誤差具有較強(qiáng)的主觀(guān)性,人

43、們可以根據(jù)工作需要、歷史經(jīng)驗(yàn)規(guī)定抽樣允許誤差的范圍,以保證抽樣的有效性。,概率度(t),基于理論上的要求,抽樣極限誤差需要以抽樣平均誤差為標(biāo)準(zhǔn)單位來(lái)衡量。即用抽樣極限誤差除以抽樣平均誤差,得出相對(duì)的誤差程度t倍。 t稱(chēng)為抽樣誤差的概率度。于是有:,、t 三者之間的關(guān)系, = t,確定和 t,確定,根據(jù)抽樣平均數(shù)和 就能估計(jì)總體平均數(shù)的取值區(qū)間, t 相互制約。確定后,與 t 成正比關(guān)系,單選題,反映樣本指標(biāo)與總體指標(biāo)之間的平均誤差程度的指標(biāo)是( )。 A.抽樣誤差系數(shù) B.概率度 C.抽樣平均誤差 D.抽樣極限誤差,答案: C,填空題,如果總體平均數(shù)落在區(qū)間內(nèi)的概率保證程度是95.45%,則抽

44、樣極限誤差等于 ,抽樣平均誤差等于 。,答案:2,四、抽樣估計(jì)方法,抽樣估計(jì)就是利用實(shí)際調(diào)查計(jì)算的樣本指標(biāo)值來(lái)估計(jì)相應(yīng)的總體指標(biāo)數(shù)值。 抽樣估計(jì)有點(diǎn)估計(jì)和區(qū)間估計(jì)兩種。,點(diǎn)估計(jì),根據(jù)總體指標(biāo)的結(jié)構(gòu)形式設(shè)計(jì)樣本指標(biāo)作為總體參數(shù)的估計(jì)量,并以樣本指標(biāo)的實(shí)際值直接作為相應(yīng)總體參數(shù)的估計(jì)值。,點(diǎn)估計(jì)的基本特點(diǎn):,簡(jiǎn)單易行,原理直觀(guān)。 沒(méi)有表明抽樣誤差和誤差在一定區(qū)間的概率保證程度。,抽樣估計(jì)的置信度F(t),表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過(guò)一定范圍的概率有多大。即抽樣估計(jì)的可靠性有多大。 也稱(chēng)為概率保證程度。 它是t的函數(shù)。 0t5 , 0F(t)1, F(t)是增函數(shù)。,如:,t=1 F(1)=0

45、.6827=68.27% t=1時(shí)全及指標(biāo)落在估計(jì)區(qū)間的可能性有68.27% t=2 F(2)=0.9545=95.45% t=1.96 F(1.96)=0.95=95%,判斷題,抽樣估計(jì)置信度就是表明抽樣指標(biāo)和總體指標(biāo)的誤差不超過(guò)一定范圍的概率保證程度。( ),答案:,單選題,在一定的抽樣平均誤差條件下( )。A. 擴(kuò)大極限誤差范圍,可以提高推斷的可靠程度B. 擴(kuò)大極限誤差范圍,會(huì)降低推斷的可靠程度C. 縮小極限誤差范圍,可以提高推斷的可靠程度D. 縮小極限誤差范圍,不改變推斷的可靠程度,答案:A 擴(kuò)大極限誤差范圍,估計(jì)區(qū)間擴(kuò)大,總體指標(biāo)落在該區(qū)間內(nèi)的可能性越大,即推斷的可靠程度越高。,單選

46、題,在其它條件不變的情況下,提高估計(jì)的概率保證程度,其估計(jì)的精確程度( )。A.隨之?dāng)U大 B.隨之縮小C.保持不變 D.無(wú)法確定,答案: B *原因,*原因,精確度指抽樣指標(biāo)與總體指標(biāo)偏離的相對(duì)程度, 概率保證程度提高,即F(t)增大,則t增大。 在其它條件不變的情況下, t增大,抽樣極限誤差增大,因此抽樣估計(jì)的精確度減小。,判斷題,在其它條件不變的情況下,提高抽樣估計(jì)的可靠程度,可以提高抽樣估計(jì)的精確度。( ),答案:,F(t)、 t、 、之間的關(guān)系,F(t)與t具有11對(duì)應(yīng)的關(guān)系,所以已知概率保證程度F(t)就可以求出概率度t ;若已知t就可以知道F(t)。,樣本確定,給定F(t),t,

47、= t ,/= t,給定,F(t),填空題,如果總體平均數(shù)落在區(qū)間內(nèi)的概率保證程度是95.45%,則抽樣極限誤差等于 ,抽樣平均誤差等于 。,答案:2 F(t)=95.45 t=2 =t=2,總體參數(shù)區(qū)間估計(jì),根據(jù)給定的概率保證程度的要求,利用實(shí)際抽樣資料,指出被估計(jì)值的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍。,參數(shù)區(qū)間估計(jì)基本特點(diǎn),指出總體被估計(jì)值的上限和下限,即指出總體參數(shù)可能存在的區(qū)間范圍,而不是直接給出總體參數(shù)的估計(jì)值。 同時(shí)指出總體參數(shù)落在估計(jì)區(qū)間內(nèi)的可能性有多大。,總體參數(shù)區(qū)間三個(gè)要素,必須同時(shí)具備:估計(jì)值、抽樣誤差范圍、概率保證程度。 估計(jì)值:一般為樣本平均數(shù) 或樣本成數(shù)p

48、 抽樣誤差范圍: 概率保證程度:F(t),填空題,總體參數(shù)區(qū)間估計(jì)必須具備的三個(gè)要素是:估計(jì)值、 、 。,答案:抽樣誤差范圍、概率保證程度,區(qū)間估計(jì)的步驟,區(qū)間估計(jì)根據(jù)給定的條件不同,有兩種估計(jì)方法: 給出允許誤差(),求概率保證程度F(t)。 給出概率保證程度F(t),求估計(jì)區(qū)間。, 給出,求F(t), 抽取樣本,計(jì)算樣本指標(biāo)(樣本平均數(shù)、樣本方差、抽樣平均誤差); 根據(jù)給定的抽樣誤差允許誤差計(jì)算估計(jì)區(qū)間的上、下限; 求出概率度t,F(xiàn)(t),對(duì)總體參數(shù)作區(qū)間估計(jì)。, 給出概率保證程度F(t),求估計(jì)區(qū)間。, 抽取樣本,計(jì)算樣本指標(biāo)(樣本平均數(shù)、樣本方差、抽樣平均誤差); 根據(jù)給定的F(t),

49、查表求出t; 求出抽樣極限誤差和估計(jì)區(qū)間的上、下限,對(duì)總體參數(shù)作區(qū)間估計(jì)。,區(qū)間估計(jì)注意,首先確定被估計(jì)總體指標(biāo)的種類(lèi),是平均數(shù)還是成數(shù); 其次取定抽樣方法,是重置抽樣還是不重置抽樣; 然后再根據(jù)給定的樣本資料和抽樣條件(給定概率保證程度還是給定抽樣極限誤差),確定計(jì)算步驟,進(jìn)行計(jì)算。,練習(xí)1,某學(xué)校進(jìn)行一次英語(yǔ)測(cè)驗(yàn),為了解學(xué)生的考試情況,隨機(jī)抽選部分學(xué)生進(jìn)行調(diào)查,所得資料如下: 試以95.45%的可靠性估計(jì)該校學(xué)生英語(yǔ)考試的平均成績(jī)的范圍及該校學(xué)生成績(jī)?cè)?0分以上的學(xué)生所占的比重的范圍。,解:,(1)估計(jì)該校學(xué)生英語(yǔ)考試的平均成績(jī)的范圍: 分析:考試成績(jī)是平均數(shù),應(yīng)選用關(guān)于 的抽樣計(jì)算公式;

50、資料沒(méi)有給出總體單位數(shù)N,抽樣方法應(yīng)選用重置抽樣。 當(dāng)資料中沒(méi)有指出抽樣方法,同時(shí)也沒(méi)有給出總體單位數(shù)N時(shí),默認(rèn)為重置抽樣。,計(jì)算樣本指標(biāo),樣本平均成績(jī) 樣本標(biāo)準(zhǔn)差S= 抽樣平均誤差,根據(jù)給定的F(t),查表求t,F(t)=95.45% 查表 t=2 求出抽樣極限誤差和估計(jì)區(qū)間的上、下限 估計(jì)區(qū)間下限 :76.62.2754=74.32 估計(jì)區(qū)間上限 :76.62.2754=78.89,可以95.45%的概率保證程度估計(jì) 該校學(xué)生考試平均成績(jī)的區(qū)間范圍是: 74.32 78.89,(2)估計(jì)該校學(xué)生成績(jī)?cè)?0分以上的學(xué)生所占的比重的范圍,分析:學(xué)生所占比重是成數(shù),應(yīng)選用關(guān)于P的抽樣計(jì)算公式;抽樣方法仍為重置抽樣。,計(jì)算樣本指標(biāo),樣本成數(shù) 抽樣平均誤差,根據(jù)給定的F(t),查表求t,F(t)=95.45% 查表 t=2 求出抽樣極限誤差和估計(jì)區(qū)間的上、下限 20.049960.09992 估計(jì)區(qū)間下限 :0.48-0.09992=0.3801 估計(jì)區(qū)間上限 :0.48+0.09992=0.5799,以95.45概率保證程度估計(jì),該校學(xué)生成績(jī)?cè)?0分以上的學(xué)生所占的比重的范圍在

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論