抽樣估計(jì)和假設(shè)檢驗(yàn)_第1頁(yè)
抽樣估計(jì)和假設(shè)檢驗(yàn)_第2頁(yè)
抽樣估計(jì)和假設(shè)檢驗(yàn)_第3頁(yè)
抽樣估計(jì)和假設(shè)檢驗(yàn)_第4頁(yè)
抽樣估計(jì)和假設(shè)檢驗(yàn)_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

抽樣估計(jì)和假設(shè)檢驗(yàn)第1頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)在數(shù)理統(tǒng)計(jì)學(xué)中,統(tǒng)計(jì)推斷常包含兩個(gè)方面的內(nèi)容,一是已知條件:所研究問(wèn)題的總體、總體分布(部分未知或未知)、樣本;二是推斷結(jié)論:通過(guò)樣本(觀測(cè)數(shù)據(jù))作出與未知分布有關(guān)的某種結(jié)論。例如,某一群人的身高構(gòu)成一個(gè)總體,通常認(rèn)為身高服從正態(tài)分布,但不知道這個(gè)總體的均值,隨機(jī)抽部分人,測(cè)得身高的值,用這些數(shù)據(jù)來(lái)估計(jì)這群人的平均身高,即屬參數(shù)估計(jì)問(wèn)題。若感興趣的問(wèn)題是“平均身高是否超過(guò)170cm”,就需要通過(guò)樣本檢驗(yàn)此命題是否成立,即假設(shè)檢驗(yàn)。第2頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)本章要介紹的內(nèi)容由抽樣估計(jì)和假設(shè)檢驗(yàn)兩部分組成。抽樣估計(jì)包括總體均值的抽樣估計(jì)和總體比率的抽樣估計(jì)第3頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.1抽樣估計(jì)概述§5.1.1抽樣估計(jì)的概念1.抽樣估計(jì)抽樣估計(jì)就是按照隨機(jī)抽樣的原則,從總體中抽出一部分單位作為樣本,并利用樣本的實(shí)際資料計(jì)算樣本指標(biāo)值,然后根據(jù)樣本指標(biāo)對(duì)總體的數(shù)量特征(總體指標(biāo))做出具有一定可靠程度的估計(jì)和判斷的一種統(tǒng)計(jì)分析方法。第4頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.1.12.總體和樣本總體也稱全及總體,指所要認(rèn)識(shí)研究對(duì)象的全體。它是由所研究范圍內(nèi)具有某種共同性質(zhì)的全體單位所組成的集合體??傮w的單位數(shù)通常是很大的,甚至是無(wú)限的,一般用N表示總體的單位數(shù)。樣本又稱子樣,它是從全及總體中隨機(jī)抽取出來(lái)的們作為代表這一總體的哪部分單位組成的集合體,樣本的單位數(shù)是有限的,相對(duì)值或標(biāo)志屬性決定的。第5頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.1.13.總體參數(shù)和樣本統(tǒng)計(jì)量總體參數(shù)是總體的數(shù)量特征。對(duì)于某個(gè)總體來(lái)說(shuō),其參數(shù)是定值。但是在某一實(shí)際問(wèn)題中,總體參數(shù)通常是未知的,這就需要通過(guò)樣本數(shù)據(jù)所提供的總體的有關(guān)信息對(duì)參數(shù)進(jìn)行推斷。一個(gè)全及指標(biāo)的指標(biāo)數(shù)值是確定的、唯一的,所以稱為參數(shù)。一個(gè)總體常常有多個(gè)參數(shù),這些參數(shù)從各個(gè)不同的角度反映總體分布的基本情況和特征。通常最關(guān)心的就是表示總體分布集中趨勢(shì)和分散趨勢(shì)的兩個(gè)參數(shù),即總體的均值和方差。第6頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.1.1樣本統(tǒng)計(jì)量是樣本的數(shù)量特征。它隨樣本的不同而變化,是一個(gè)不包含任何未知參數(shù)的樣本函數(shù),因此是個(gè)隨機(jī)變量。樣本統(tǒng)計(jì)量一方面表示樣本本身的分布狀況和特征,另一方面也是總體參數(shù)的估計(jì)量。第7頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.1.14.樣本容量和樣本數(shù)目樣本容量是一個(gè)樣本所包含的單位數(shù),一般用n表示。通常認(rèn)為n≥30為大樣本,n<30為小樣本。樣本數(shù)目是從一個(gè)總體中按照一定樣本容量可能抽取的樣本的數(shù)目。第8頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.1.15.抽樣的方法⑴重復(fù)抽樣(重置抽樣)從具有N個(gè)單位的總體中隨機(jī)抽取一個(gè)單位(登記其序號(hào)和相應(yīng)的標(biāo)志值)之后,又將它重新放回總體,參加下一次抽選,依次連續(xù)進(jìn)行n次抽選,便構(gòu)成一個(gè)容量為n的樣本,這樣的抽樣方法稱為重復(fù)抽樣??傮w每個(gè)單位在各次抽樣中被抽取的概率都相同。第9頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.1.1⑵不重復(fù)抽樣(不重置抽樣)從具有N個(gè)單位的總體中隨機(jī)抽取一個(gè)單位,不再將它重新放回總體參加下一次的抽選,這樣的抽樣方法稱為不重復(fù)抽樣。從抽樣分布角度來(lái)看,這種抽樣分布實(shí)際上等同于一次從總體中同時(shí)抽取n個(gè)單位組成一個(gè)樣本。第10頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.1.2抽樣估計(jì)的理論依據(jù)抽樣估計(jì)是通過(guò)樣本對(duì)總體的推算,這樣統(tǒng)計(jì)量與被估算的總體指標(biāo)之間的關(guān)系,就是推算的關(guān)鍵。而兩者的關(guān)系主要通過(guò)統(tǒng)計(jì)量的分布來(lái)反映,且因樣本量的大小而有所差別。第11頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)1.大數(shù)定律大數(shù)定律是指一切關(guān)于大量隨機(jī)現(xiàn)象平均結(jié)果穩(wěn)定性的定理,包含馬爾可夫定理、辛欽定理、車貝雪夫定理、貝努里定理、普阿松定理等等,它為均值穩(wěn)定性的存在及整個(gè)抽樣估計(jì)提供了最基本的理論依據(jù)。大數(shù)定律的本質(zhì)是盡管單個(gè)隨機(jī)現(xiàn)象的具體表現(xiàn)不可避免地引起隨機(jī)偏差,然而在大量隨機(jī)現(xiàn)象共同作用時(shí),由于這些隨機(jī)偏差互相抵消,致使總的平均結(jié)果趨于穩(wěn)定。第12頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)2.中心極限定理中心極限定理是指在一定的條件下,大量相互獨(dú)立的隨機(jī)現(xiàn)象的概率分布以正態(tài)分布為極限的定理。因正態(tài)分布在概率論中占有中心地位,所以把以正態(tài)分布為極限的定理叫做中心極限定理。中心極限定理表明,在實(shí)際問(wèn)題中,隨機(jī)變量不論來(lái)自什么樣分布的總體,都可用正態(tài)分布的理論來(lái)說(shuō)明和估計(jì)平均數(shù)的問(wèn)題。當(dāng)然原分布與正態(tài)分布的差異越大,抽樣數(shù)目就要越多,這樣才能保證平均數(shù)的分布接近正態(tài)分布。第13頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)大數(shù)定律揭示了大量隨機(jī)變量的平均結(jié)果,但并沒有涉及到隨機(jī)變量的分布規(guī)律。而中心極限定理則說(shuō)明了許多隨機(jī)變量的分布是正態(tài)或近似正態(tài)的,這就可以簡(jiǎn)化抽樣估計(jì)中許多統(tǒng)計(jì)量的分布問(wèn)題,所以它是統(tǒng)計(jì)學(xué)中的重要工具之一。第14頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.2抽樣分布§5.2.1抽樣分布1.抽樣分布樣本統(tǒng)計(jì)量的所有可能取值及其概率所形成的概率分布稱為抽樣分布。某個(gè)樣本統(tǒng)計(jì)量(如均值、比例、方差等)的抽樣分布,從理論上說(shuō)就是在重復(fù)選取容量為n的樣本時(shí),由每一個(gè)樣本計(jì)算出的該統(tǒng)計(jì)量數(shù)值的相對(duì)頻數(shù)分布或概率分布。第15頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.2.1抽樣分布2.樣本均值的抽樣分布若總體服從均值為,方差為的正態(tài)分布,則從總體中抽取出的樣本均值仍然服從正態(tài)分布,即。如果總體不是正態(tài)分布,根據(jù)統(tǒng)計(jì)學(xué)中的中心極限定理,隨著樣本容量的增加,的抽樣分布近似服從正態(tài)分布。第16頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.2.1抽樣分布3.樣本方差的分布當(dāng)總體服從正態(tài)分布時(shí),服從分布(將在下一節(jié)中介紹),其中樣本方差為第17頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.2.1抽樣分布4.樣本比例的分布總體中具有某種屬性的單位數(shù)與總體全部單位數(shù)之比稱為總體的比例,記作。而樣本中具有某種屬性的單位數(shù)與樣本總數(shù)之比稱為樣本比例,記作。若從總體中隨機(jī)抽取出容量為n的樣本,發(fā)現(xiàn)其中具有某種屬性的單位數(shù)為,則樣本中具有某種屬性的單位的比例為當(dāng)樣本容量很大時(shí),樣本比例近似地服從正態(tài)分布第18頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.2.1抽樣分布5.兩個(gè)樣本平均數(shù)之差的分布統(tǒng)計(jì)學(xué)中還經(jīng)常用到分別來(lái)自兩個(gè)正態(tài)總體的樣本均值差的分布問(wèn)題。如果有兩個(gè)正態(tài)分布的總體和,其均值分別為和,方差分別為和,若從這兩個(gè)正態(tài)總體中分別抽取容量為n1和n2的兩個(gè)獨(dú)立樣本,則兩個(gè)樣本平均數(shù)之差也一定服從均值為,方差為的正態(tài)分布,即第19頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)第20頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.2.2t分布當(dāng)樣本容量小于30時(shí),樣本均值的分布與正態(tài)分布之間的誤差較大,此時(shí)可用分布來(lái)描述。分布與正態(tài)分布一樣也是對(duì)稱的。一般地,分布比正態(tài)分布更平坦一些。隨著樣本容量的增加,分布的形狀由平坦逐漸變得接近于正態(tài)分布。通常認(rèn)為當(dāng)樣本容量時(shí),可以用正態(tài)分布代替分布。第21頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)不同大小的樣本對(duì)應(yīng)于不同的分布,這是因?yàn)榉植寂c自由度有關(guān)。所謂自由度就是可以自由選樣的數(shù)值的個(gè)數(shù)。比如樣本容量是n,在樣本均值確定的條件下,對(duì)樣本中的數(shù)據(jù)能夠自由決定數(shù)值的個(gè)數(shù)就只有n-1個(gè)了。實(shí)際上,當(dāng)把n-1個(gè)數(shù)值選定以后,第n個(gè)數(shù)據(jù)的值也就自動(dòng)確定了。由此可見,大小為n的樣本的自由度就是n-1。圖3-2是自由度分別為1和10的t分布曲線并與標(biāo)準(zhǔn)正態(tài)分布曲線比較。第22頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)第23頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.2.3分布設(shè)總體服從于標(biāo)準(zhǔn)正態(tài)分布,即,又為取自該總體的一個(gè)樣本,它們的平方和記作,即=++…+則稱統(tǒng)計(jì)量為服從自由度為n的分布,記作。分布的密度曲線與自由度有關(guān)。從圖5-5可以看出,當(dāng)自由度很小時(shí),分布密度曲線向右伸展。隨著自由度的增加,分布的密度曲線變得愈來(lái)愈對(duì)稱,當(dāng)自由度達(dá)到相當(dāng)大時(shí),分布的密度曲線接近正態(tài)分布。第24頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.2.4F分布設(shè)X和Y分別服從自由度為n1-1和n2-1的分布,即,且相互獨(dú)立,則稱統(tǒng)計(jì)量服從自由度為n1-1和n2-1的F分布。F分布有兩個(gè)自由度,一個(gè)是分子的自由度,一個(gè)是分母的自由度。第25頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.3.1抽樣誤差的概念抽樣誤差是指由于隨機(jī)抽樣的偶然因素使樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起樣本指標(biāo)與總體指標(biāo)之間的絕對(duì)離差。表示如下:第26頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)抽樣實(shí)際誤差是指每次抽樣所得的樣本指標(biāo)與總體指標(biāo)之間的離差,它隨著樣本的不同而不同,是一個(gè)隨機(jī)變量,即有多少種可能的樣本就有多少種可能的實(shí)際抽樣誤差。因此,在抽樣估計(jì)中要結(jié)合所有可能的樣本來(lái)研究所有可能的實(shí)際抽樣誤差。但是在現(xiàn)實(shí)的抽樣估計(jì)中,抽樣實(shí)際誤差是不可能得到的,我們只能通過(guò)抽樣分布推算抽樣誤差。第27頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)抽樣平均誤差是指所有可能出現(xiàn)的樣本統(tǒng)計(jì)量的標(biāo)準(zhǔn)差。對(duì)于一個(gè)特定的總體和樣本容量來(lái)說(shuō),它是固定的、可以計(jì)算的。其定義公式如下第28頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.3.2抽樣平均誤差的計(jì)算抽樣平均誤差是反映抽樣誤差一般水平的指標(biāo),即所有可能出現(xiàn)的樣本指標(biāo)與總體指標(biāo)的標(biāo)準(zhǔn)差。1.抽樣平均誤差的計(jì)算方法樣本平均數(shù)的抽樣平均誤差⑴重復(fù)抽樣:⑵不重復(fù)抽樣:第29頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)2.樣本比例的抽樣平均誤差⑴重復(fù)抽樣:⑵不重復(fù)抽樣:在實(shí)際計(jì)算抽樣平均誤差時(shí),當(dāng)總體比例P未知時(shí),可用樣本比例p來(lái)代替,即:第30頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)3.影響抽樣(平均)誤差的因素⑴總體標(biāo)志變異程度的大?。傮w標(biāo)準(zhǔn)差σ的大?。┡cμ成正比例關(guān)系。⑵樣本容量的平方與μ成反比例關(guān)系。例如:要使抽樣誤差減少為原來(lái)的一半,則樣本容量將為原來(lái)的4倍。⑶抽樣方法的不同。重復(fù)抽樣的μ總是大于不重復(fù)抽樣的μ。⑷抽樣的組織形式。抽樣的組織形式不同,抽樣誤差也不同。第31頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.3.2抽樣極限誤差抽樣極限誤差是從另外一個(gè)角度來(lái)考慮抽樣誤差的問(wèn)題,又稱為允許誤差或抽樣誤差范圍。用樣本指標(biāo)估計(jì)總體指標(biāo),必須要考慮抽樣誤差的大小。抽樣極限誤差是指抽樣指標(biāo)與總體指標(biāo)之間抽樣誤差可允許的范圍,它等于樣本指標(biāo)可允許變動(dòng)的上下限與總體指標(biāo)的絕對(duì)值。第32頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.3.3概率度

或稱為抽樣誤差的概率度。

第33頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)如例5.7,已知某鄉(xiāng)糧食畝產(chǎn)量的標(biāo)準(zhǔn)差為σ=80公斤,總體單位數(shù)N=20000畝,樣本單位數(shù)n=400畝,求得其抽樣平均誤差為:如果確定抽樣極限誤差為5公斤,則,我們可以用概率度:表示抽樣極限的誤差范圍,即用1.25μx來(lái)規(guī)定誤差范圍的大小。第34頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.3.3置信度抽樣估計(jì)的置信度是樣本指標(biāo)與總體指標(biāo)的誤差不超過(guò)一定范圍的概率,用F(t)表示,又稱抽樣估計(jì)的概率保證程度。1.總體平均數(shù)抽樣估計(jì)的置信度2.總體比例抽樣估計(jì)的置信度第35頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)若反復(fù)抽樣多次,每個(gè)樣本值確定一個(gè)區(qū)間[],每個(gè)這樣的區(qū)間要么包含的真值,要么不包含的真值,據(jù)Bernoulli大數(shù)定律,在這樣多的區(qū)間中,包含真值的約占,不包含真值的約僅占,比如,=0.005,反復(fù)抽樣1000次,則得到的1000個(gè)區(qū)間中不包含真值的區(qū)間僅為5個(gè)。第36頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)置信度1-α越大,則臨界值的絕對(duì)值就越大,估計(jì)區(qū)間的精度就越低;反之,置信度愈小,則區(qū)間精度就愈高。同時(shí),樣本容量n愈大,精度愈高,容量提高到4倍,精度才提高1倍。其實(shí)在樣本容量一定時(shí),估計(jì)的精度和置信度是彼此矛盾的,提高精度(即縮小區(qū)間)就降低了置信度;而提高置信度,往往需要擴(kuò)大置信區(qū)間,從而又降低了估計(jì)的精度。統(tǒng)計(jì)學(xué)家尼曼(Neyman、J)提出的原則是:先保證可靠性,以接近1的概率來(lái)確定估計(jì)區(qū)間,然后再盡可能的提高精度。所以人們常給α以較小的概率值(如0.01或0.05),使置信度1-α較高。第37頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.3抽樣估計(jì)的方法§5.3.1總體參數(shù)的點(diǎn)估計(jì)1.點(diǎn)估計(jì)的概念點(diǎn)估計(jì)指用樣本統(tǒng)計(jì)量直接代替總體總體參數(shù)的估計(jì)方法。2.抽樣估計(jì)的優(yōu)良標(biāo)準(zhǔn)在對(duì)總體特征做出估計(jì)時(shí),并非所有估計(jì)量都是優(yōu)良的,從而產(chǎn)生了評(píng)價(jià)估計(jì)量是否優(yōu)良的標(biāo)準(zhǔn)。衡量一個(gè)樣本統(tǒng)計(jì)量是否是總體參數(shù)的優(yōu)良的估計(jì)量一般有如下三條標(biāo)準(zhǔn),即:無(wú)偏性、一致性和有效性。第38頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.3.2總體參數(shù)的區(qū)間估計(jì)1.區(qū)間估計(jì)的概念在統(tǒng)計(jì)分析中,我們常常用一個(gè)區(qū)間及其出現(xiàn)的概率來(lái)估計(jì)總體參數(shù)。這種估計(jì)總體參數(shù)的方法稱為區(qū)間估計(jì)。具體地說(shuō),區(qū)間估計(jì)是用估計(jì)量所構(gòu)成的區(qū)間來(lái)估計(jì)總體參數(shù),并以一定的概率保證總體參數(shù)將落在所估計(jì)的區(qū)間內(nèi)。這一概率保證程度稱為置信度,這種估計(jì)區(qū)間稱為置信區(qū)間。例如,第39頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)2.區(qū)間估計(jì)的方法及要素⑴總體平均數(shù)的區(qū)間估計(jì)或⑵總體比例的區(qū)間估計(jì)或由上述區(qū)間估計(jì)公式可概括出區(qū)間估計(jì)的基本要素,即:⑴估計(jì)值;⑵抽樣極限誤差;⑶置信度(概率保證程度)。第40頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)3.區(qū)間估計(jì)的步驟⑴置信度約束下的區(qū)間估計(jì)步驟。根據(jù)抽樣估計(jì)原理自總體中抽取容量為n的樣本,在置信度一定的情況下,我們可以采取如下步驟進(jìn)行區(qū)間估計(jì):第41頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)①明確置信水平1-α或。常用的置信水平主要有95%,95.45%,99.73%等;②確定概率度t(即臨界值水平)。根據(jù)置信度,查標(biāo)準(zhǔn)正態(tài)概率雙側(cè)臨界值表確定概率度(臨界值)±t;③計(jì)算統(tǒng)計(jì)量的值。對(duì)總體平均數(shù)進(jìn)行估計(jì)時(shí),要計(jì)算樣本平均數(shù)及抽樣平均誤差μx和允許誤差Δx;對(duì)總體比例(比重)進(jìn)行估計(jì)時(shí),要計(jì)算樣本比例p和抽樣平均誤差μp及允許誤差Δp;對(duì)總體方差進(jìn)行估計(jì)時(shí),要計(jì)算樣本修正方差及其抽樣誤差和允許誤差。④構(gòu)造置信區(qū)間。置信區(qū)間是優(yōu)良的統(tǒng)計(jì)量±允許誤差構(gòu)成的,對(duì)于總體平均數(shù)在某置信度約束下的置信區(qū)間就是樣本平均數(shù)±允許誤差。第42頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.3.3總體總量的抽樣估計(jì)抽樣調(diào)查的如期完成,能使我們得到兩個(gè)重要的抽樣指標(biāo):一個(gè)是代表抽樣總體(樣本)一般特征的樣本平均數(shù),或稱抽樣平均數(shù);一個(gè)是反映某一標(biāo)志的單位數(shù)在樣本中所占的比重,或稱抽樣比例。有了這兩個(gè)表示抽象調(diào)查結(jié)果的綜合指標(biāo),就可以對(duì)于某些未知的結(jié)果進(jìn)行預(yù)測(cè)與預(yù)算。第43頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)抽樣調(diào)查的功能和作用,在于它能以點(diǎn)推面。所謂“以點(diǎn)推面”就是用樣本所包括的點(diǎn)來(lái)推算總體所代表的面,即用樣本平均數(shù)來(lái)代表總體平均指標(biāo)或用樣本比例來(lái)代表某一標(biāo)志在總體中所占的比重。這里的樣本平均數(shù)的求得并不是最終目的,而是通過(guò)它門來(lái)反映和代替統(tǒng)計(jì)總體的平均指標(biāo)或相對(duì)數(shù)。如果結(jié)合總體中已知的有關(guān)總量指標(biāo)(即絕對(duì)數(shù))還可以通過(guò)樣本平均數(shù)和樣本比例來(lái)推算總體中未知的其它總量指標(biāo)。根據(jù)抽樣結(jié)果,推算總體的總量指標(biāo)可以有如下兩種方法:第44頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4抽樣的組織形式§5.4.1抽樣設(shè)計(jì)的有關(guān)問(wèn)題抽樣估計(jì)是建立在隨機(jī)抽樣的基礎(chǔ)上的,而隨機(jī)抽樣的中心是抽樣調(diào)查方案的設(shè)計(jì),主要包括抽樣技術(shù)和試驗(yàn)設(shè)計(jì)兩項(xiàng)主要內(nèi)容。抽樣技術(shù)是指為保證樣本的隨機(jī)性和代表性而選擇抽樣方法和制定抽樣方案等應(yīng)遵循的基本原則的研究。試驗(yàn)設(shè)計(jì)是指對(duì)試驗(yàn)方案的選擇和對(duì)試驗(yàn)數(shù)據(jù)的統(tǒng)計(jì)分析等。試驗(yàn)設(shè)計(jì)主要是對(duì)自然現(xiàn)象進(jìn)行觀察的方法,在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)學(xué)中應(yīng)用較少,為此我們不作詳細(xì)介紹。第45頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.1抽樣設(shè)計(jì)的有關(guān)問(wèn)題抽樣調(diào)查方案的主要內(nèi)容:確定調(diào)查的目的。確定調(diào)查對(duì)象、調(diào)查單位和報(bào)告單位。擬定調(diào)查提綱、確定調(diào)查項(xiàng)目、并設(shè)計(jì)調(diào)查表。確定調(diào)查的時(shí)間。確定調(diào)查的組織實(shí)施計(jì)劃。第46頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式抽樣組織方式是指在抽樣時(shí)對(duì)總體的加工整理形式,根據(jù)對(duì)總體的加工整理形式不同,在隨機(jī)抽樣中抽樣的組織形式很多,如:簡(jiǎn)單純隨機(jī)抽樣、分類抽樣、等距抽樣、整群抽樣和多階段抽樣等。第47頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式1.簡(jiǎn)單隨機(jī)抽樣簡(jiǎn)單隨機(jī)抽樣又稱為純隨機(jī)抽樣,它是不對(duì)總體作任何加工整理,直接從總體中隨機(jī)抽取調(diào)查單位的抽樣調(diào)查方法。所以也叫簡(jiǎn)單隨機(jī)抽樣。簡(jiǎn)單隨機(jī)抽樣是最常用的純隨機(jī)抽樣。它必須滿足下列兩條要求:①代表性,即要求樣本(x1,x2……,xn)中的每個(gè)x

都與總體X具有相同的概率分布,簡(jiǎn)稱為同分布。②獨(dú)立性,即要求樣本(x1,x2……,xn)中的各x是相互獨(dú)立的。在前面講解中我們所使用抽樣概念都是簡(jiǎn)單純隨機(jī)抽樣,在以后的學(xué)習(xí)中如果不說(shuō)明抽樣的形式,則都是指簡(jiǎn)單隨機(jī)抽樣。簡(jiǎn)單隨機(jī)抽樣是抽樣中最基本的方式,它適用于均勻總體,即具有某種特征的單位均勻地分布于總體的各個(gè)部分。第48頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式簡(jiǎn)單隨機(jī)抽樣的平均誤差⑴簡(jiǎn)單重復(fù)隨機(jī)抽樣:

⑵簡(jiǎn)單不重復(fù)隨機(jī)抽樣:第49頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式2.類型抽樣⑴類型抽樣的概念類型抽樣又稱分層或分類抽樣。它是先對(duì)總體各單位按主要標(biāo)志加以分組,然后再?gòu)母鹘M中按隨機(jī)原則抽取一定單位構(gòu)成樣本的抽樣組織方式。第50頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式類型抽樣是應(yīng)用于總體內(nèi)各單位在被研究標(biāo)志上有明顯差別或差別懸殊的總體的抽樣。如:研究農(nóng)作物產(chǎn)量時(shí),耕地有平原、丘陵和山地等;研究職工的工資水平時(shí),各行業(yè)之間有明顯的差別;研究居民家庭收支情況時(shí),家庭的收入水平差距很大。類型抽樣實(shí)質(zhì)上是把統(tǒng)計(jì)分組和抽樣原理有機(jī)結(jié)合的抽樣組織方式。通過(guò)分組,使組中具有同質(zhì)性,組間具有差異性,然后從各組中簡(jiǎn)單隨機(jī)抽樣。這樣可以保證樣本對(duì)總體具有更高的代表性,所以計(jì)算出的抽樣誤差就比較小。類型抽樣應(yīng)掌握的主要原則是:分組時(shí)應(yīng)使組內(nèi)差異盡可能小,使組間差異盡可能大。第51頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式⑵類型抽樣的方法按樣本單位在各組中的分配狀況,類型抽樣可分為等比例抽樣和不等比例抽樣。等比例抽樣就是按同樣的抽樣比n/N,確定各組中應(yīng)抽的樣本單位數(shù)。如各組單位數(shù)為Ni,則從中抽取的樣本單位數(shù)為ni。各組樣本單位數(shù)確定后,按隨機(jī)原則從各組中抽取各類單位組成樣本。不等比例抽樣多指某類單位在總體中占的比重過(guò)小時(shí),按比例抽不到或只能抽到很少單位,為了保證樣本中各類單位的代表性而采取不等比例抽樣的方法。第52頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式⑶類型抽樣的抽樣平均數(shù)和抽樣平均誤差①抽樣平均數(shù):②重復(fù)抽樣的平均誤差:③不重復(fù)抽樣的平均誤差:⑷類型抽樣的優(yōu)點(diǎn):①它提高了樣本代表性;②降低了影響抽樣平均誤差的總體方差。第53頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式3.等距抽樣⑴等距抽樣的概念等距抽樣又稱機(jī)械抽樣或系統(tǒng)抽樣它是先將總體單位按某一標(biāo)志排序,然后按照固定的順序和相同的間隔來(lái)抽選樣本單位的抽樣組織形式。①無(wú)關(guān)標(biāo)志抽樣是指排序的標(biāo)志與研究的標(biāo)志無(wú)關(guān)。如觀察學(xué)生考試成績(jī),用姓氏筆劃排序;觀察產(chǎn)品的質(zhì)量,按生產(chǎn)的先后順序等。無(wú)關(guān)標(biāo)志排序可以保證抽樣的隨機(jī)性。它實(shí)質(zhì)上相當(dāng)于簡(jiǎn)單隨機(jī)抽樣。②有關(guān)標(biāo)志排序抽樣是指排序的標(biāo)志與被研究標(biāo)志相關(guān)。如農(nóng)產(chǎn)品產(chǎn)量調(diào)查時(shí),將地塊按過(guò)去連續(xù)幾年的畝產(chǎn)排序;家庭消費(fèi)水平調(diào)查中,按收入額排序等。按有關(guān)標(biāo)志排序可以利用輔助的信息,使抽樣估計(jì)的效率提高,但必須采用科學(xué)的方法,避免由于抽樣間隔與排序標(biāo)志的周期性變化的重合所產(chǎn)生的系統(tǒng)性誤差。第54頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式①無(wú)關(guān)標(biāo)志抽樣是指排序的標(biāo)志與研究的標(biāo)志無(wú)關(guān)。如觀察學(xué)生考試成績(jī),用姓氏筆劃排序;觀察產(chǎn)品的質(zhì)量,按生產(chǎn)的先后順序等。無(wú)關(guān)標(biāo)志排序可以保證抽樣的隨機(jī)性。它實(shí)質(zhì)上相當(dāng)于簡(jiǎn)單隨機(jī)抽樣。②有關(guān)標(biāo)志排序抽樣是指排序的標(biāo)志與被研究標(biāo)志相關(guān)。如農(nóng)產(chǎn)品產(chǎn)量調(diào)查時(shí),將地塊按過(guò)去連續(xù)幾年的畝產(chǎn)排序;家庭消費(fèi)水平調(diào)查中,按收入額排序等。按有關(guān)標(biāo)志排序可以利用輔助的信息,使抽樣估計(jì)的效率提高,但必須采用科學(xué)的方法,避免由于抽樣間隔與排序標(biāo)志的周期性變化的重合所產(chǎn)生的系統(tǒng)性誤差。第55頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式⑵等距抽樣的優(yōu)點(diǎn)按等距抽樣組織形式抽取樣本單位,能夠使抽出的樣本單位更均勻地分布在總體中,等距抽樣的誤差一般較簡(jiǎn)單隨機(jī)抽樣的誤差小,特別是當(dāng)研究的現(xiàn)象標(biāo)志變異程度較大時(shí),更能顯示出等距抽樣的優(yōu)越性。⑶等距抽樣的抽樣平均誤差等距抽樣均為不重復(fù)抽樣,其平均誤差的計(jì)算可分為兩類,一是按無(wú)關(guān)標(biāo)志排序時(shí),可用簡(jiǎn)單隨機(jī)不重復(fù)抽樣的平均誤差公式計(jì)算。按有關(guān)標(biāo)志排序時(shí),可用類型抽樣的平均誤差公式計(jì)算。第56頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式4.整群抽樣⑴整群抽樣的概念。整群抽樣也叫分群抽樣或集團(tuán)抽樣,是將總體劃分為若干群,然后以群為單位從中隨機(jī)抽取部分群。對(duì)中選群中的所有單位進(jìn)行全面調(diào)查的抽樣組織方式。第57頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式在大規(guī)模的抽樣調(diào)查中,如果總體單位多,且分布區(qū)域廣,缺少進(jìn)行抽樣的抽樣框,或按經(jīng)濟(jì)效益原則不宜編制這種抽樣框的情況下,宜采用這種形式。因?yàn)檎撼闃訉⒊闃訂挝挥煽傮w單位擴(kuò)大到群,所以它的抽樣框是很簡(jiǎn)單的。如:對(duì)某市居民的家庭收入進(jìn)行調(diào)查,采用整群抽樣,就可以按行政區(qū)域分為街道,然后隨機(jī)抽取一些街道,進(jìn)行全面調(diào)查,相對(duì)于以上的三種抽樣更加適宜。整群抽樣中的群,主要是自然形成的,如按行政區(qū)域,地理區(qū)域等。由于整群抽樣的樣本單位的分布集中于群內(nèi),所以同樣條件下,較簡(jiǎn)單隨機(jī)抽樣的樣本代表性差,所以應(yīng)適當(dāng)增加樣本單位,以提高估計(jì)的精確度。第58頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式⑵整群抽樣的估計(jì)方法。設(shè)總體中的全部單位劃為R群,每群中所包含單位數(shù)為m,現(xiàn)從群中隨機(jī)抽?。蛉航M成樣本。則各群的平均數(shù)為:第59頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)各群的樣本平均數(shù):全樣本平均數(shù):群間方差為:整群抽樣一般為不重復(fù)抽樣,其抽樣誤差為:第60頁(yè)/共68頁(yè)第5章抽樣估計(jì)和假設(shè)檢驗(yàn)§5.4.2抽樣組織方式5.多階段抽樣前面所介紹的幾種抽樣方式

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論