樣本量的確定方法_第1頁
樣本量的確定方法_第2頁
樣本量的確定方法_第3頁
樣本量的確定方法_第4頁
樣本量的確定方法_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

樣本量的確定方法(2008-10-14 09:12:34)一、樣本單位數(shù)量的確定原則一般情況下,確定樣本量需要考慮調(diào)查的目的、性質(zhì)和精度要求。以及實(shí)際操作的可行性、經(jīng)費(fèi)承受能力等。根據(jù)調(diào)查經(jīng)驗(yàn),市場潛力和推斷等涉及量比較嚴(yán)格的調(diào)查需要的樣本量比較大,而一般廣告效果等人們差異不是很大或?qū)颖玖恳蟛皇呛車?yán)格的調(diào)查,樣本量相對可以少一些。實(shí)際上確定樣本量大小是比較復(fù)雜的問題,即要有定性的考慮,也要有定量的考慮;從定性的方面考慮,決策的重要性、調(diào)研的性質(zhì)、數(shù)據(jù)分析的性質(zhì)、資源、抽樣方法等都決定樣本量的大小。但是這只能原則上確定樣本量大小。具體確定樣本量還需要從定量的角度考慮。從定量的方面考慮,有具體的統(tǒng)計(jì)學(xué)公式,不同的抽樣方法有不同的公式。歸納起來,樣本量的大小主要取決于:(1)研究對象的變化程度,即變異程度;(2)要求和允許的誤差大小,即精度要求;(3)要求推斷的置信度,一般情況下,置信度取為95%;(4)總體的大??;(5)抽樣的方法。也就是說,研究的問題越復(fù)雜,差異越大時(shí),樣本量要求越大;要求的精度越高,可推斷性要求越高時(shí),樣本量也越大;同時(shí),總體越大,樣本量也相對要大,但是,增大呈現(xiàn)出一定對數(shù)特征,而不是線形關(guān)系;而抽樣方法問題,決定設(shè)計(jì)效應(yīng)的值,如果我們設(shè)定簡單隨機(jī)抽樣設(shè)計(jì)效應(yīng)的值是1;分層抽樣由于抽樣效率高于簡單隨機(jī)抽樣,其設(shè)計(jì)效應(yīng)的值小于1,合適恰當(dāng)?shù)姆謱樱瑢⑹箤觾?nèi)樣本差異變小,層內(nèi)差異越小,設(shè)計(jì)效應(yīng)小于1的幅度越大;多階抽樣由于效率低于簡單隨機(jī)抽樣,設(shè)計(jì)效應(yīng)的值大于1,所以抽樣調(diào)查方法的復(fù)雜程度決定其樣本量大小。對于不同城市,如果總體不知道或很大,需要進(jìn)行推斷時(shí),大城市多抽,小城市少抽,這種說法原則上是不對的。實(shí)際上,在大城市抽樣太大是浪費(fèi),在小城市抽樣太少?zèng)]有推斷價(jià)值。二、樣本量的確定方法如何確定樣本量,基本方法很多,但是公式檢驗(yàn)表明,當(dāng)誤差和置信區(qū)間一定時(shí),不同的樣本量計(jì)算公式計(jì)算出來的樣本量是十分相近的,所以,我們完全可以使用簡單隨機(jī)抽樣計(jì)算樣本量的公式去近似估計(jì)其他抽樣方法的樣本量,這樣可以更加快捷方便,然后將樣本量根據(jù)一定方法分配到各個(gè)子域中去。所以,區(qū)域二相抽樣不能計(jì)算樣本量的說法是不科學(xué)的。1簡單隨機(jī)抽樣確定樣本量主要有兩種類型:(1)對于平均數(shù)類型的變量對于已知數(shù)據(jù)為絕對數(shù),我們一般根據(jù)下列步驟來計(jì)算所需要的樣本量。已知期望調(diào)查結(jié)果的精度(E), 期望調(diào)查結(jié)果的置信度(L),以及總體的標(biāo)準(zhǔn)差估計(jì)值的具體數(shù)據(jù),總體單位數(shù)N。計(jì)算公式為:n=2/(e2/Z2+2/N)特殊情況下,如果是很大總體,計(jì)算公式變?yōu)?n= Z22/e2例如希望平均收入的誤差在正負(fù)人民幣30元之間,調(diào)查結(jié)果在95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計(jì)量為1.96。根據(jù)估計(jì)總體的標(biāo)準(zhǔn)差為150元,總體單位數(shù)為1000。樣本量:n=150*150/(30*30/(1.96*1.96)+150*150/1000)=88(2)于百分比類型的變量對于已知數(shù)據(jù)為百分比,一般根據(jù)下列步驟計(jì)算樣本量。已知調(diào)查結(jié)果的精度值百分比(E),以及置信度(L),比例估計(jì)(P)的精度,即樣本變異程度,總體數(shù)為N。則計(jì)算公式為:n=P(1-P)/(e2/Z2+ P(1-P)/N)同樣,特殊情況下如果不考慮總體,公式為:n= Z2P(1-P)/e2 一般情況下,我們不知道P的取值,取其樣本變異程度最大時(shí)的值為0.5。例如:希望平均收入的誤差在正負(fù)0.05之間,調(diào)查結(jié)果在95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計(jì)量為1.96,估計(jì)P為0.5,總體單位數(shù)為1000。樣本量為:n=0.5*0.5/(0.05*0.05/(1.96*1.96)+0.5*0.5/1000)=2782.樣本量分配方法以上分析我們獲得了采用簡單隨機(jī)抽樣公式計(jì)算得到的樣本量,總的樣本量需要在此基礎(chǔ)上乘以設(shè)計(jì)效應(yīng)的值得到。由于樣本總量已經(jīng)確定,我們采用總樣本量固定方法分配樣本,這種方法包括按照比例分配和不按照比例分配兩類。實(shí)際工作中首先計(jì)算取得區(qū)縣總的樣本量,然后逐級(jí)將其分配到各階分層中,如果不清楚各階分層的規(guī)模和方差等,一般采取比例分配或者比例平方根分配法。如果有一定輔助變量可以使用,可以采用按照規(guī)模分配法分配樣本量。3.樣本量和總體大小的關(guān)系:在其它條件一定的情況下,即誤差、置信度、抽樣比率一定,樣本量隨總體的大小而變化。但是,總體越大,其變化越不明顯;總體較小時(shí),變化明顯。其變化趨勢如下:二者之間的變化并非是線性關(guān)系。所以,樣本量并不是越大越好,應(yīng)該綜合考慮,實(shí)際工作中只要達(dá)到要求就可以了。三、抽樣調(diào)查方案樣本量的確定我們決定首先采取簡單隨機(jī)抽樣的方法計(jì)算區(qū)縣的樣本量,之所以首先對區(qū)縣計(jì)算樣本量,主要是考慮,雖然我們方案中沒有要求對區(qū)縣的估計(jì)量,但是區(qū)縣一級(jí)是我們做計(jì)劃和決策的基礎(chǔ),具有承上啟下的作用,如果區(qū)縣級(jí)獲得的估計(jì)量精度比較高,就可以保證上一級(jí)的估計(jì)量具有更高的精度,而且各個(gè)區(qū)縣的樣本量可以認(rèn)為是相同的,這主要是因?yàn)楦鱾€(gè)區(qū)縣的總體數(shù)都比較多,而且我們也不清楚;同時(shí)也不可能事先進(jìn)行區(qū)縣方差估計(jì)。沒有首先計(jì)算區(qū)縣以下各階分層的樣本量,主要是考慮:(1)如果計(jì)算區(qū)縣以下某階分層的樣本量,然后再將計(jì)算的樣本量合并,將顯著增加樣本量,增加基層的負(fù)擔(dān)。(2)事實(shí)上,對于計(jì)算階可以比較好的得到它的估計(jì)量,但我們現(xiàn)在不需要得到區(qū)縣以下各階分層的估計(jì)量,我們僅僅需要區(qū)縣的估計(jì)量,沒有必要計(jì)算區(qū)縣以下階樣本量。(3)我們直接對整個(gè)區(qū)縣以簡單隨機(jī)抽樣進(jìn)行抽取,然后將其樣本量合理分配到各階分層中,這樣可以使用較少樣本量得到區(qū)縣較好的估計(jì)量。以下我們以試點(diǎn)地區(qū)批零業(yè)為對象進(jìn)行研究。由于沒有誤差限以及置信度和抽樣比率的值。我們可以采用常用參數(shù):設(shè)定區(qū)縣總體為很大,置信度是95%,抽樣比率保守估計(jì)是0.5,抽樣誤差不能大于15%,根據(jù)公式計(jì)算得到樣本量為43個(gè)。由于采取多階分層抽樣,我們?nèi)绾卧O(shè)定抽樣設(shè)計(jì)效應(yīng)呢?區(qū)縣及以下是三階分層抽樣,只要在各階進(jìn)行合適的分層,其設(shè)計(jì)效應(yīng)應(yīng)該在2-3之間,我們在這里取保守值3,那么得到本區(qū)縣樣本量是129個(gè),這個(gè)樣本量就可以根據(jù)新方案得到區(qū)縣要求誤差內(nèi)的估計(jì)值。1.確定辦事處、居委會(huì)、村委會(huì)樣本量根據(jù)方案,每個(gè)居委會(huì)抽取樣本5-10個(gè),那么這個(gè)樣本量是否可行呢?這里涉及如何將區(qū)縣樣本分配到街道和居委會(huì)中去,根據(jù)方案要求,街道抽取采取先分層,后對層內(nèi)進(jìn)行PPS抽樣;那么分配樣本是否也采取同樣方法呢?主要看輔助變量與樣本量之間的關(guān)聯(lián)程度,方案中提供了兩個(gè)輔助變量:人口數(shù)和個(gè)體數(shù),對于輔助變量是個(gè)體數(shù)的完全可以使用規(guī)模分配方法分配樣本量,個(gè)體數(shù)多的分配較多的樣本量;對于輔助變量是人口數(shù)的如果采取規(guī)模分配方法,由于人口數(shù)與一個(gè)地區(qū)的個(gè)體單位數(shù)沒有必然的聯(lián)系,可能導(dǎo)致某些居委會(huì)的個(gè)體數(shù)比較多,卻分配了較少的樣本量,使得居委會(huì)分層變的困難,同時(shí)使居委會(huì)方差顯著增大。而獲得較多樣本量的居委會(huì),分層的效果和方差提高幅度有限,故采用比例分配的方法可能更加合適一些。對于居委會(huì)村委會(huì)的抽取,由于本階可能存在市場內(nèi)的抽樣,分配復(fù)雜一些;如果本階有市場內(nèi)抽樣,可以適當(dāng)減少居委會(huì)村委會(huì)的樣本量,但應(yīng)該大于本階樣本量的80%,由于市場內(nèi)抽樣的特殊性,建議將本階樣本量全部分配給居委會(huì)村委會(huì),我們所進(jìn)行的試點(diǎn)就是將樣本全部分配給居委會(huì);至于市場內(nèi)抽樣的具體實(shí)施,可以根據(jù)方案操作完成。對居委會(huì)村委會(huì)層內(nèi),由于使用簡單隨機(jī)抽樣完成,采用比例分配平均分配就可。在實(shí)際工作時(shí),由于一個(gè)區(qū)縣包括全部鄉(xiāng)鎮(zhèn)街道或其中的一個(gè);根據(jù)方案,區(qū)縣抽取辦事處的數(shù)量應(yīng)該介于12-4個(gè)之間,對應(yīng)于抽中鄉(xiāng)、鎮(zhèn)、街道的全部或其中一個(gè),那么其每一個(gè)鄉(xiāng)鎮(zhèn)街道采取比例分配平均分配的樣本量應(yīng)該是11-32個(gè)之間;所抽中的居委會(huì)、村委會(huì)數(shù)量應(yīng)該介于16-48個(gè)之間,如果個(gè)別鄉(xiāng)鎮(zhèn)街道抽中的居委會(huì)是2個(gè),則其居委會(huì)總數(shù)相應(yīng)減少一些;最后,每個(gè)居委會(huì)、村委會(huì)的樣本量應(yīng)該介于3-16個(gè)之間,大部分介于5-10之間。以上的討論沒有考慮總體的大小,如果考慮到居委會(huì)、村委會(huì)的總體有限,則每個(gè)居委會(huì)村委會(huì)的樣本量可以減少一些,具體可以采用以下公式得到具體樣本量的調(diào)整數(shù):樣本量n=n1*N/(N+n1)。N是本地區(qū)總體,n1 是給本地區(qū)分配樣本量居委會(huì)樣本量的調(diào)整數(shù),應(yīng)該作為本居委會(huì)樣本量的底限。確定辦事處、居委會(huì)村委會(huì)的樣本量,與以下幾點(diǎn)有關(guān):a)估計(jì)量的誤差、置信度,可以決定簡單隨機(jī)抽樣的樣本量b)與采用的抽樣方法有關(guān)系,它決定了設(shè)計(jì)效應(yīng)的大小。例如:分層抽樣的設(shè)計(jì)效應(yīng)值小于1,多階抽樣的設(shè)計(jì)效應(yīng)值大于1??梢詻Q定整個(gè)抽樣的樣本量。c)與每一階的分層的數(shù)目有關(guān)系,所以,應(yīng)該重點(diǎn)考慮分層的問題,分層太多,沒有必要;分層太少,導(dǎo)致層內(nèi)的方差增大,可能影響估計(jì)值的精度以及設(shè)計(jì)效應(yīng)的值,所以,在每階分層時(shí),應(yīng)該合理考慮,使得樣本的變異程度在層內(nèi)達(dá)到一個(gè)合理水平。根據(jù)以上原則,我們在包頭的抽樣試點(diǎn)共抽取4個(gè)辦事處,包括14個(gè)居委會(huì);一個(gè)鄉(xiāng),包括4個(gè)村委會(huì),經(jīng)過清查共有批零業(yè)1042個(gè),單位70個(gè);餐飲業(yè)250個(gè),單位3個(gè)。由于我們使用人口數(shù)作為輔助變量,應(yīng)該采用比例分配方法平均分配樣本量,這樣每個(gè)街道辦事處得到26個(gè)樣本, 對于抽取4個(gè)居委會(huì)的辦事處,每個(gè)居委會(huì)分配得到7個(gè)樣本;對于抽取2個(gè)居委會(huì)的辦事處,每個(gè)居委會(huì)分配到13個(gè)樣本。然后根據(jù)居委會(huì)總體對樣本量做出調(diào)整,得到居委會(huì)實(shí)際樣本量。2.確定居委會(huì)村委會(huì)內(nèi)分層樣本量以上我們討論如何分配給鄉(xiāng)鎮(zhèn)居委會(huì)村委會(huì)樣本量,現(xiàn)在分析給居委會(huì)村委會(huì)以下各層分配樣本量,這一步,清查的工作就顯得非常重要了,重點(diǎn)應(yīng)該清查規(guī)模、類別,首先是規(guī)模,規(guī)模的大小不應(yīng)該根據(jù)工商注冊為單位或個(gè)體決定,應(yīng)該根據(jù)實(shí)際情況,即使是個(gè)體,如果規(guī)模較大,也應(yīng)該歸入大規(guī)模分層中,這樣就可以使得每層的樣本變異程度顯著降低,從而提高精確度。根據(jù)實(shí)際情況可以包括兩種:(1)如果全部是規(guī)模比較小的單位個(gè)體戶,我們可以根據(jù)類別進(jìn)行適當(dāng)?shù)姆纸M,將某一類單位比較多的單獨(dú)分層;將另外類別比較少的,可以幾類合并進(jìn)行抽取具體樣本,分層不要多于4層,并保證每層的樣本量不小于2個(gè)。由于居委會(huì)樣本量數(shù)目已經(jīng)確定,我們可以直接采取比例分配方法,確定各層樣本量。(2)如果規(guī)模比較大的和規(guī)模小的并存,可以將規(guī)模比較大的單獨(dú)分層,不用考慮其中的類別;將規(guī)模較小的主要是個(gè)體戶可以根據(jù)類別進(jìn)行分層;其中的難題是如何將樣本量在規(guī)模大的和規(guī)模小的之間分配,因?yàn)榇笠?guī)模層內(nèi)樣本變異程度有可能很大,應(yīng)該抽取較多的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論