版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
抽樣的基本方法及
樣本量確定的方法目錄基本概念隨機(jī)抽樣非隨機(jī)抽樣確定樣本量的方法抽樣決策基本概念抽樣誤差和非抽樣誤差隨機(jī)性原則和效果最佳原則置信度標(biāo)準(zhǔn)方差抽樣誤差和非抽樣誤差抽樣誤差(用d或E表示)樣本是總體的一部分,雖然有代表性,但是不能等同于總體。如果從抽樣樣本中得出的結(jié)論去推斷總體的情況,必然會產(chǎn)生一定的誤差,這種由于抽樣調(diào)查而引起的誤差就是抽樣誤差。抽樣誤差和非抽樣誤差非抽樣誤差在調(diào)查過程中除了抽樣計劃和樣本大小引起的誤差以外的所有誤差.?dāng)?shù)據(jù)收集過程是整個調(diào)查中最容易產(chǎn)生非抽樣誤差的環(huán)節(jié).包括實地訪問誤差和被訪者誤差這兩種誤差中又可定義為有意誤差和無意誤差.隨機(jī)性原則和效果最佳原則
任何調(diào)查活動、任何研究人員在進(jìn)行抽樣設(shè)計時,都必須遵循隨機(jī)性原則和效果最佳原則。隨機(jī)性原則是指在進(jìn)行抽樣時,總體中的每一個體被抽取的可能性是相等的,而不是由研究者主觀決定的。效果最佳原則指在調(diào)查經(jīng)費固定的條件下,選取抽樣誤差最小的方案;或在所要求的精度確定的條件下,使調(diào)查費用最少。置信度(用標(biāo)準(zhǔn)正態(tài)分布Z值表示)置信度,也稱把握度,是指由抽樣調(diào)查結(jié)果來推斷總體情況的可信程度,用1-α表示,α指置信水平。在抽樣調(diào)查中,一般規(guī)定置信度為95%,99%和99.9%,即置信水平為0.05,0.01,0.001。標(biāo)準(zhǔn)方差(σ)計算公式σ=
(Xi-X)2N標(biāo)準(zhǔn)差是用以描述數(shù)據(jù)資料分布的離散程度,其值愈小,說明數(shù)據(jù)分布愈集中。每一個觀測數(shù)據(jù)平均數(shù)樣本總數(shù)隨機(jī)抽樣簡單隨機(jī)抽樣系統(tǒng)抽樣分層抽樣整群抽樣(劃塊抽樣)簡單隨機(jī)抽樣是最基本、
適用范圍最廣、
最能體現(xiàn)隨機(jī)原則的方法包括:抽簽法隨機(jī)數(shù)字表法抽簽法把總體中的每一個體都編上號碼并做成標(biāo)簽,充分混合后從中隨機(jī)抽取一部分,這部分簽所對應(yīng)的個體就組成樣本。隨機(jī)數(shù)字表法是由一些任意數(shù)字無規(guī)律排列組成的隨機(jī)數(shù)字表。簡單隨機(jī)抽樣是其他隨機(jī)抽樣方法的基礎(chǔ)。從理論上說它是最符合隨機(jī)原則的。分析抽樣誤差比較簡明。簡單抽樣的局限簡單隨機(jī)抽樣需要把總體中每一個體編上號碼,如果總體很大時,這種編號相當(dāng)困難,甚至不可能;樣本量通常有好幾百,即使總體的編號不成問題,用抽簽法或用隨機(jī)數(shù)字表法一個一個地抽取,既費時又費力;忽略了總體已有的信息,降低了樣本的代表性。系統(tǒng)抽樣也稱等距抽樣或機(jī)械抽樣,是從總體中等距離地抽取樣本。其抽樣過程如下:將總體中每一個個體按順序排列并加以編號計算抽樣距離以隨機(jī)起點,按抽樣距離進(jìn)行抽樣=總體數(shù)量
樣本數(shù)量-1系統(tǒng)抽樣系統(tǒng)抽樣比簡單隨機(jī)簡便易行,而且能比較均勻地抽到總體中各個部分的個體,樣本的代表性比簡單隨機(jī)抽樣強(qiáng)。抽樣誤差比較復(fù)雜,一般用簡單隨機(jī)抽樣的抽樣誤差來估計。系統(tǒng)抽樣單獨使用時,系統(tǒng)抽樣也面臨著簡單隨機(jī)抽樣總體大不便編號的困難,所以在大規(guī)模的市場調(diào)查(如電話訪問)中,常把它與其他抽樣方法結(jié)合起來使用。分層抽樣也叫分類抽樣,是按總體已有的某些特征,將總體分成若干個層,再從各層中分別隨機(jī)抽取一定的單元構(gòu)成樣本。N1000000N1180000N2350000N3300000N4170000n1180n2350n3300n4170n1000總體層子樣本樣本將總體(N)分成若干(K)個互不重疊的部分(分別用N1、N2、N3、…、nk表示),每一部分叫一個層,每一個層也是一個子總體;確定分層的特征,如年齡、性別、行政區(qū)等;根據(jù)一定的方式(如各層單元占總體的比例)確定各層應(yīng)抽取的樣本量;分別采用簡單隨機(jī)抽樣或系統(tǒng)抽樣方法,從各層中抽取相應(yīng)的樣本,分別為n1,n2,n3…,nk,這些樣本也叫子樣本,子樣本之和為總樣本。分層抽樣分層抽樣充分利用了總體的已有信息,是一種非常實用的抽樣方法。原則:各層內(nèi)的變異要小,而層與層之間的變異要大。在分層抽樣中,可在分層子總體的基礎(chǔ)上進(jìn)一步加以分層。分層抽樣的樣本代表性及推論的精確性一般優(yōu)于簡單隨機(jī)抽樣,而且執(zhí)行比簡單隨機(jī)抽樣簡便。整體抽樣(劃塊抽樣)先將總體分為I個群,然后從I個群中隨機(jī)抽取若干個群,對這些群內(nèi)的個體或單元進(jìn)行調(diào)查。將總體(N)分成若干個互不重疊的部分(分別用R1、R2、R3、…、Ri),每個部分為一群;確定分群的標(biāo)準(zhǔn),如班級、自然行政區(qū)等;根據(jù)總樣本量,確定該抽取的群數(shù)。采用簡單隨機(jī)抽樣或系統(tǒng)的抽樣方法,從i群中抽取確定的群數(shù)。N5000R153R250R358R448R153R448R3352R9850n250總體群抽樣樣本…...R13045R11047整體抽樣(劃塊抽樣)整群抽樣與分層抽樣在形式上有相似之處,但實際上差別很大。分層抽樣要求各層之間的差異大,層內(nèi)個體或單元差異?。徽撼闃觿t要求群與群之間的差異比較小,群內(nèi)的個體或單元差異大;分層抽樣的樣本是從每個層內(nèi)抽取若干單元或個體構(gòu)成;整群抽樣則是要么整群抽取,要么整群不被抽取。整體抽樣(劃塊抽樣)整群抽樣在調(diào)查實施過程中比較方便,在抽樣設(shè)計上比較便利。整群抽樣的抽樣單元過于集中,整群抽樣的抽樣誤差相對比較大。非隨機(jī)抽樣一般是對于較小規(guī)模的研究采用的方法任意抽樣判斷抽樣配額抽樣滾雪球抽樣任意抽樣在街訪中應(yīng)用最廣比較節(jié)省費用,執(zhí)行方便時效性高。抽樣誤差很大,結(jié)果的可靠性差。一般只用于預(yù)備性的調(diào)查研究中。判斷抽樣研究者依據(jù)自己的經(jīng)驗和判斷,從調(diào)查對象中選取那些最適合于該研究項目的樣本。優(yōu)點是研究人員可以運用自己的技能、知識和經(jīng)驗去選擇被訪者,抽樣方法簡單。但缺點是容易因為研究人員的主觀判斷偏差而導(dǎo)致嚴(yán)重的誤差。配額抽樣與隨機(jī)抽樣中的分層抽樣對應(yīng),實際上是一種分層判斷抽樣。先依據(jù)一定標(biāo)準(zhǔn)規(guī)定各群體的樣本配額。對配額外負(fù)擔(dān)內(nèi)群體的抽樣由調(diào)查人員主觀抽出。?選擇“控制特征”作為細(xì)分群體的標(biāo)準(zhǔn)將總體按“控制制征”細(xì)分確定各子總體樣本的大小制作配額控制表,以便于抽樣實施按配額控制表的要求從各子總體中,采用任意抽樣或判斷抽樣抽取樣本這一步驟與分層抽樣的第一步驟相同使其分成若干個子總體通常是將總樣本按各子總體在總本中所占的比例分配座談會約人多用滾雪球抽樣在對個別符合要求的被訪者進(jìn)行調(diào)查的基礎(chǔ)上,根據(jù)他們提供的信息進(jìn)一步對其他人進(jìn)行調(diào)查,直至滿足樣本量要求為止。認(rèn)定并訪問一個或幾個具有所需特征的人,依據(jù)他們所提供的情況,去尋找其他被訪者;訪問第一批受訪者提供的第二批被訪者,并讓他們引薦下一批被訪者;重復(fù)第二步的過程,直至滿足樣本要求為止。非隨機(jī)抽樣在實踐當(dāng)中,我們通常會將幾種抽樣方法結(jié)合起來加以運用,常見的有將分層抽樣、系統(tǒng)抽樣與隨機(jī)表法抽樣相結(jié)合(隨機(jī)入戶抽樣);整群抽樣與分層抽樣結(jié)合。確定樣本量的方法估計總體平均數(shù)時的樣本量計算方法估計總體比率時的樣本量計算方法應(yīng)用到目標(biāo)群體的比例的計算方法抽樣樣本量與總體樣本量間的關(guān)系估計總體平均數(shù)的樣本量計算方法抽樣方法為簡單隨機(jī)抽樣時,其公式為:d2N=Za/2*σ樣本量允許的最大抽樣誤差置信水平ó為總體標(biāo)準(zhǔn)差。最大抽樣誤差d和置信水平α通常是由研究者事先確定的;總體標(biāo)準(zhǔn)差ó可以從以前的調(diào)查結(jié)果獲得,也可以從二手資料獲得,還可以通過小規(guī)模的調(diào)查獲得??傮w標(biāo)準(zhǔn)方差例題例:了解某大城市平均每一家庭每月花多少錢給孩子買玩具,要求最大誤差不超過0.5元,置信水平為95%(即1-α=0.05),問至少應(yīng)該調(diào)查多少家庭(據(jù)以往調(diào)查估計總體標(biāo)準(zhǔn)差σ=3元)。
由題意已知d=0.5,α=0.05,σ=3,因而得:dZa/2*σ=2N=0.51.96*32=138.3說明至少應(yīng)抽樣140個家庭。以上1.96是通過標(biāo)準(zhǔn)正態(tài)分布——Z值查出來的,即95%/2=0.475,而0.475相應(yīng)的Z值為1.96。估計總體比率時的樣本量計算方法當(dāng)研究目的為估計總體比率,而且采用的抽樣方法為簡單隨機(jī)抽樣時,樣本量的計算公式為:2d2N=Za/2樣本量允許的最大抽樣誤差例題例:某電視臺正在籌建觀眾調(diào)查網(wǎng),要求全國觀眾調(diào)查網(wǎng)的置信度為95%,誤差不超過3%。
即α=1-95%=0.05,d=3%,因而得:2d2N=Za/2=2*0.0321.96
1067
說明調(diào)查網(wǎng)所需最小樣本量為1067。以上1.96是通過標(biāo)準(zhǔn)正態(tài)分布——Z值查出來的,即95%/2=0.475,而0.475相應(yīng)的Z值為1.96。E2N=Za/22*[P(1-P)]應(yīng)用到目標(biāo)群體的比例的計算方法E2N=Za/22
*0.25目標(biāo)群體的比例允許的最大抽樣誤差(同d)最大值為0.25保守起見上式轉(zhuǎn)變成:確定樣本量的方法其他隨機(jī)抽樣方式的計算公式均有所不同,而且比簡單隨機(jī)抽樣方法復(fù)雜;在實際運用當(dāng)中,常常運用簡單隨機(jī)抽樣的計算公式來計算樣本量。抽樣樣本量與總體樣本量間的關(guān)系嚴(yán)格來說是有關(guān)系的,但其相關(guān)程度不高。對于系統(tǒng)抽
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 部編本二年級語文下冊20 蜘蛛開店公開課教案
- 科學(xué)家故事閱讀指導(dǎo)教案編輯
- 液化氣安全使用規(guī)程培訓(xùn)資料
- 企業(yè)賦能培訓(xùn)心得及提升執(zhí)行力方法
- 水域救援培訓(xùn)室建設(shè)方案
- 2025年高素質(zhì)農(nóng)民培訓(xùn)試題及答案
- 培訓(xùn)機(jī)構(gòu)衛(wèi)生監(jiān)管制度
- 廠區(qū)衛(wèi)生防疫制度
- 米廠公司衛(wèi)生制度
- 婦幼衛(wèi)生督導(dǎo)制度
- 對外話語體系構(gòu)建的敘事話語建構(gòu)課題申報書
- 馬年猜猜樂(馬的成語)打印版
- 精神障礙防治責(zé)任承諾書(3篇)
- 2025年擔(dān)保公司考試題庫(含答案)
- 實施指南(2025)《HG-T3187-2012矩形塊孔式石墨換熱器》
- 2025年江西省高考物理試卷真題(含答案及解析)
- 數(shù)字交互視角下普寧英歌舞傳承創(chuàng)新研究
- TCOSOCC016-2024信息技術(shù)應(yīng)用創(chuàng)新軟件測試要求
- 介入病人安全管理
- 人教版PEP五年級英語下冊單詞表與單詞字帖 手寫體可打印
- 戶口未婚改已婚委托書
評論
0/150
提交評論