樣本量的確定方法_第1頁
樣本量的確定方法_第2頁
樣本量的確定方法_第3頁
樣本量的確定方法_第4頁
樣本量的確定方法_第5頁
全文預覽已結束

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

樣本量的確定方法(2008-10-14 09:12:34)一、樣本單位數(shù)量的確定原則一般情況下,確定樣本量需要考慮調查的目的、性質和精度要求。以及實際操作的可行性、經(jīng)費承受能力等。根據(jù)調查經(jīng)驗,市場潛力和推斷等涉及量比較嚴格的調查需要的樣本量比較大,而一般廣告效果等人們差異不是很大或對樣本量要求不是很嚴格的調查,樣本量相對可以少一些。實際上確定樣本量大小是比較復雜的問題,即要有定性的考慮,也要有定量的考慮;從定性的方面考慮,決策的重要性、調研的性質、數(shù)據(jù)分析的性質、資源、抽樣方法等都決定樣本量的大小。但是這只能原則上確定樣本量大小。具體確定樣本量還需要從定量的角度考慮。從定量的方面考慮,有具體的統(tǒng)計學公式,不同的抽樣方法有不同的公式。歸納起來,樣本量的大小主要取決于:(1)研究對象的變化程度,即變異程度;(2)要求和允許的誤差大小,即精度要求;(3)要求推斷的置信度,一般情況下,置信度取為95%;(4)總體的大?。?5)抽樣的方法。也就是說,研究的問題越復雜,差異越大時,樣本量要求越大;要求的精度越高,可推斷性要求越高時,樣本量也越大;同時,總體越大,樣本量也相對要大,但是,增大呈現(xiàn)出一定對數(shù)特征,而不是線形關系;而抽樣方法問題,決定設計效應的值,如果我們設定簡單隨機抽樣設計效應的值是1;分層抽樣由于抽樣效率高于簡單隨機抽樣,其設計效應的值小于1,合適恰當?shù)姆謱?,將使層?nèi)樣本差異變小,層內(nèi)差異越小,設計效應小于1的幅度越大;多階抽樣由于效率低于簡單隨機抽樣,設計效應的值大于1,所以抽樣調查方法的復雜程度決定其樣本量大小。對于不同城市,如果總體不知道或很大,需要進行推斷時,大城市多抽,小城市少抽,這種說法原則上是不對的。實際上,在大城市抽樣太大是浪費,在小城市抽樣太少沒有推斷價值。二、樣本量的確定方法如何確定樣本量,基本方法很多,但是公式檢驗表明,當誤差和置信區(qū)間一定時,不同的樣本量計算公式計算出來的樣本量是十分相近的,所以,我們完全可以使用簡單隨機抽樣計算樣本量的公式去近似估計其他抽樣方法的樣本量,這樣可以更加快捷方便,然后將樣本量根據(jù)一定方法分配到各個子域中去。所以,區(qū)域二相抽樣不能計算樣本量的說法是不科學的。1簡單隨機抽樣確定樣本量主要有兩種類型:(1)對于平均數(shù)類型的變量對于已知數(shù)據(jù)為絕對數(shù),我們一般根據(jù)下列步驟來計算所需要的樣本量。已知期望調查結果的精度(E), 期望調查結果的置信度(L),以及總體的標準差估計值的具體數(shù)據(jù),總體單位數(shù)N。計算公式為:n=2/(e2/Z2+2/N)特殊情況下,如果是很大總體,計算公式變?yōu)?n= Z22/e2例如希望平均收入的誤差在正負人民幣30元之間,調查結果在95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計量為1.96。根據(jù)估計總體的標準差為150元,總體單位數(shù)為1000。樣本量:n=150*150/(30*30/(1.96*1.96)+150*150/1000)=88(2)于百分比類型的變量對于已知數(shù)據(jù)為百分比,一般根據(jù)下列步驟計算樣本量。已知調查結果的精度值百分比(E),以及置信度(L),比例估計(P)的精度,即樣本變異程度,總體數(shù)為N。則計算公式為:n=P(1-P)/(e2/Z2+ P(1-P)/N)同樣,特殊情況下如果不考慮總體,公式為:n= Z2P(1-P)/e2 一般情況下,我們不知道P的取值,取其樣本變異程度最大時的值為0.5。例如:希望平均收入的誤差在正負0.05之間,調查結果在95%的置信范圍以內(nèi),其95%的置信度要求Z的統(tǒng)計量為1.96,估計P為0.5,總體單位數(shù)為1000。樣本量為:n=0.5*0.5/(0.05*0.05/(1.96*1.96)+0.5*0.5/1000)=2782.樣本量分配方法以上分析我們獲得了采用簡單隨機抽樣公式計算得到的樣本量,總的樣本量需要在此基礎上乘以設計效應的值得到。由于樣本總量已經(jīng)確定,我們采用總樣本量固定方法分配樣本,這種方法包括按照比例分配和不按照比例分配兩類。實際工作中首先計算取得區(qū)縣總的樣本量,然后逐級將其分配到各階分層中,如果不清楚各階分層的規(guī)模和方差等,一般采取比例分配或者比例平方根分配法。如果有一定輔助變量可以使用,可以采用按照規(guī)模分配法分配樣本量。3.樣本量和總體大小的關系:在其它條件一定的情況下,即誤差、置信度、抽樣比率一定,樣本量隨總體的大小而變化。但是,總體越大,其變化越不明顯;總體較小時,變化明顯。其變化趨勢如下:二者之間的變化并非是線性關系。所以,樣本量并不是越大越好,應該綜合考慮,實際工作中只要達到要求就可以了。三、抽樣調查方案樣本量的確定我們決定首先采取簡單隨機抽樣的方法計算區(qū)縣的樣本量,之所以首先對區(qū)縣計算樣本量,主要是考慮,雖然我們方案中沒有要求對區(qū)縣的估計量,但是區(qū)縣一級是我們做計劃和決策的基礎,具有承上啟下的作用,如果區(qū)縣級獲得的估計量精度比較高,就可以保證上一級的估計量具有更高的精度,而且各個區(qū)縣的樣本量可以認為是相同的,這主要是因為各個區(qū)縣的總體數(shù)都比較多,而且我們也不清楚;同時也不可能事先進行區(qū)縣方差估計。沒有首先計算區(qū)縣以下各階分層的樣本量,主要是考慮:(1)如果計算區(qū)縣以下某階分層的樣本量,然后再將計算的樣本量合并,將顯著增加樣本量,增加基層的負擔。(2)事實上,對于計算階可以比較好的得到它的估計量,但我們現(xiàn)在不需要得到區(qū)縣以下各階分層的估計量,我們僅僅需要區(qū)縣的估計量,沒有必要計算區(qū)縣以下階樣本量。(3)我們直接對整個區(qū)縣以簡單隨機抽樣進行抽取,然后將其樣本量合理分配到各階分層中,這樣可以使用較少樣本量得到區(qū)縣較好的估計量。以下我們以試點地區(qū)批零業(yè)為對象進行研究。由于沒有誤差限以及置信度和抽樣比率的值。我們可以采用常用參數(shù):設定區(qū)縣總體為很大,置信度是95%,抽樣比率保守估計是0.5,抽樣誤差不能大于15%,根據(jù)公式計算得到樣本量為43個。由于采取多階分層抽樣,我們?nèi)绾卧O定抽樣設計效應呢?區(qū)縣及以下是三階分層抽樣,只要在各階進行合適的分層,其設計效應應該在2-3之間,我們在這里取保守值3,那么得到本區(qū)縣樣本量是129個,這個樣本量就可以根據(jù)新方案得到區(qū)縣要求誤差內(nèi)的估計值。1.確定辦事處、居委會、村委會樣本量根據(jù)方案,每個居委會抽取樣本5-10個,那么這個樣本量是否可行呢?這里涉及如何將區(qū)縣樣本分配到街道和居委會中去,根據(jù)方案要求,街道抽取采取先分層,后對層內(nèi)進行PPS抽樣;那么分配樣本是否也采取同樣方法呢?主要看輔助變量與樣本量之間的關聯(lián)程度,方案中提供了兩個輔助變量:人口數(shù)和個體數(shù),對于輔助變量是個體數(shù)的完全可以使用規(guī)模分配方法分配樣本量,個體數(shù)多的分配較多的樣本量;對于輔助變量是人口數(shù)的如果采取規(guī)模分配方法,由于人口數(shù)與一個地區(qū)的個體單位數(shù)沒有必然的聯(lián)系,可能導致某些居委會的個體數(shù)比較多,卻分配了較少的樣本量,使得居委會分層變的困難,同時使居委會方差顯著增大。而獲得較多樣本量的居委會,分層的效果和方差提高幅度有限,故采用比例分配的方法可能更加合適一些。對于居委會村委會的抽取,由于本階可能存在市場內(nèi)的抽樣,分配復雜一些;如果本階有市場內(nèi)抽樣,可以適當減少居委會村委會的樣本量,但應該大于本階樣本量的80%,由于市場內(nèi)抽樣的特殊性,建議將本階樣本量全部分配給居委會村委會,我們所進行的試點就是將樣本全部分配給居委會;至于市場內(nèi)抽樣的具體實施,可以根據(jù)方案操作完成。對居委會村委會層內(nèi),由于使用簡單隨機抽樣完成,采用比例分配平均分配就可。在實際工作時,由于一個區(qū)縣包括全部鄉(xiāng)鎮(zhèn)街道或其中的一個;根據(jù)方案,區(qū)縣抽取辦事處的數(shù)量應該介于12-4個之間,對應于抽中鄉(xiāng)、鎮(zhèn)、街道的全部或其中一個,那么其每一個鄉(xiāng)鎮(zhèn)街道采取比例分配平均分配的樣本量應該是11-32個之間;所抽中的居委會、村委會數(shù)量應該介于16-48個之間,如果個別鄉(xiāng)鎮(zhèn)街道抽中的居委會是2個,則其居委會總數(shù)相應減少一些;最后,每個居委會、村委會的樣本量應該介于3-16個之間,大部分介于5-10之間。以上的討論沒有考慮總體的大小,如果考慮到居委會、村委會的總體有限,則每個居委會村委會的樣本量可以減少一些,具體可以采用以下公式得到具體樣本量的調整數(shù):樣本量n=n1*N/(N+n1)。N是本地區(qū)總體,n1 是給本地區(qū)分配樣本量居委會樣本量的調整數(shù),應該作為本居委會樣本量的底限。確定辦事處、居委會村委會的樣本量,與以下幾點有關:a)估計量的誤差、置信度,可以決定簡單隨機抽樣的樣本量b)與采用的抽樣方法有關系,它決定了設計效應的大小。例如:分層抽樣的設計效應值小于1,多階抽樣的設計效應值大于1??梢詻Q定整個抽樣的樣本量。c)與每一階的分層的數(shù)目有關系,所以,應該重點考慮分層的問題,分層太多,沒有必要;分層太少,導致層內(nèi)的方差增大,可能影響估計值的精度以及設計效應的值,所以,在每階分層時,應該合理考慮,使得樣本的變異程度在層內(nèi)達到一個合理水平。根據(jù)以上原則,我們在包頭的抽樣試點共抽取4個辦事處,包括14個居委會;一個鄉(xiāng),包括4個村委會,經(jīng)過清查共有批零業(yè)1042個,單位70個;餐飲業(yè)250個,單位3個。由于我們使用人口數(shù)作為輔助變量,應該采用比例分配方法平均分配樣本量,這樣每個街道辦事處得到26個樣本, 對于抽取4個居委會的辦事處,每個居委會分配得到7個樣本;對于抽取2個居委會的辦事處,每個居委會分配到13個樣本。然后根據(jù)居委會總體對樣本量做出調整,得到居委會實際樣本量。2.確定居委會村委會內(nèi)分層樣本量以上我們討論如何分配給鄉(xiāng)鎮(zhèn)居委會村委會樣本量,現(xiàn)在分析給居委會村委會以下各層分配樣本量,這一步,清查的工作就顯得非常重要了,重點應該清查規(guī)模、類別,首先是規(guī)模,規(guī)模的大小不應該根據(jù)工商注冊為單位或個體決定,應該根據(jù)實際情況,即使是個體,如果規(guī)模較大,也應該歸入大規(guī)模分層中,這樣就可以使得每層的樣本變異程度顯著降低,從而提高精確度。根據(jù)實際情況可以包括兩種:(1)如果全部是規(guī)模比較小的單位個體戶,我們可以根據(jù)類別進行適當?shù)姆纸M,將某一類單位比較多的單獨分層;將另外類別比較少的,可以幾類合并進行抽取具體樣本,分層不要多于4層,并保證每層的樣本量不小于2個。由于居委會樣本量數(shù)目已經(jīng)確定,我們可以直接采取比例分配方法,確定各層樣本量。(2)如果規(guī)模比較大的和規(guī)模小的并存,可以將規(guī)模比較大的單獨分層,不用考慮其中的類別;將規(guī)模較小的主要是個體戶可以根據(jù)類別進行分層;其中的難題是如何將樣本量在規(guī)模大的和規(guī)模小的之間分配,因為大規(guī)模層內(nèi)樣本變異程度有可能很大,應該抽取較多的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論