版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、1,第8講 抽樣方法,2,探討一些問題: 1.樣本大小問題; 2.抽樣誤差問題; 3.無回復(fù)情況;,3,4,5,83 抽樣方法,6,抽樣方式的特點(diǎn),概率抽樣的特點(diǎn) 隨機(jī)性、成本高、要求高、精確度。 非概率抽樣的特點(diǎn) 最大特點(diǎn)是操作簡便,時效快,成本低。,7,概率抽樣方法,1簡單隨機(jī)抽樣(SRS) 為抽出一個簡單隨機(jī)樣本,調(diào)研人員首先需要編輯一個抽樣框,給其中每個個體分配一個號碼,然后用計(jì)算機(jī)程序或隨機(jī)數(shù)表(見附錄B-1)生成隨機(jī)數(shù),根據(jù)這些隨機(jī)數(shù)來確定哪些個體被包括進(jìn)樣本中。 簡單隨機(jī)抽樣有許多優(yōu)點(diǎn): 最簡單、最典型的概率抽樣技術(shù),易于理解; 抽樣框不需要其他(輔助)信息就能進(jìn)行抽樣; 樣本結(jié)
2、果可以推論到目標(biāo)總體上,大多數(shù)統(tǒng)計(jì)推論方法都假定數(shù)據(jù)是由簡單隨機(jī)抽樣方法收集的。,8,概率抽樣方法,2系統(tǒng)抽樣(SYS) 指將調(diào)查總體單位按照一定標(biāo)志進(jìn)行順序排列,然后根據(jù)總體單位數(shù)和樣本單位數(shù)計(jì)算出抽樣間距(k),并從抽樣框中每隔k個單位抽選一個個體,組成樣本。 抽樣間距(k)總體單位數(shù)(N)/樣本單位數(shù)(n) 例1:總體中有50000個單位,想要抽取一個樣本量為500的樣本,此時抽樣間距k為100.在1100之間選出一個隨機(jī)數(shù)如36,則該樣本就由個體36、136、236、336、43649736、49836、49936等500個樣本組成。,9,概率抽樣方法,總體單位的排序決定著系統(tǒng)抽樣的代
3、表性,并決定系統(tǒng)抽樣調(diào)查結(jié)果的統(tǒng)計(jì)效率。 分三種情況說明: 1.如果排序與要研究的特征無關(guān),則結(jié)果與SRS相似; 2.當(dāng)排序與要研究的特征有關(guān)時,SYS能增加樣本的代表性。 3.若排序呈現(xiàn)循環(huán)形式,抽樣間距又與循環(huán)周期相同時,系統(tǒng)抽樣會降低樣本的代表性。,10,概率抽樣方法,例2:如果在某行業(yè)中按照年銷售額的增序排列公司,那么一個系統(tǒng) 抽樣的樣本將包括一些小公司和一些大公司,通常會比一個簡單隨機(jī)樣本具有更好的代表性。 例3:想對商場的零售額進(jìn)行抽樣調(diào)查,以7天為抽樣間隔。因?yàn)槊恐?天中商場的銷售額實(shí)際是不同的,而且有一定規(guī)律,那就是周末和假日零售額比較多,平時比較少。若抽中周末為系統(tǒng)樣本的起點(diǎn)
4、,估計(jì)結(jié)果就會偏高;反之,若抽中平時為樣本起點(diǎn),估計(jì)結(jié)果則偏低。,11,概率抽樣方法,系統(tǒng)抽樣的優(yōu)點(diǎn): 1.在沒有抽樣框時,可代替簡單隨機(jī)抽樣; 2.與簡單隨機(jī)抽樣一樣,系統(tǒng)抽樣不需要輔助的抽樣框信息; 3.與簡單隨機(jī)抽樣相比,系統(tǒng)抽樣樣本的分布較好(這還取決于抽樣間隔及抽樣框架是如何排列的); 4.與簡單隨機(jī)抽樣一樣,有較好的理論支持,估計(jì)值容易計(jì)算; 5.只需要一個隨機(jī)起點(diǎn),系統(tǒng)抽樣更簡單,成本低,更容易實(shí)現(xiàn)。,12,系統(tǒng)抽樣的缺點(diǎn): 1.如果間隔正好碰上總體變化的某種周期,就會得到一個差的系統(tǒng)樣本; 2.與簡單隨機(jī)相同,由于不使用抽樣框中的輔助信息,抽樣策略的效率不高; 3.系統(tǒng)抽樣的抽
5、樣方差沒有一個無偏的估計(jì)量,為了進(jìn)行方差估計(jì),必須把系統(tǒng)看做簡單隨機(jī)樣本,而且在名錄框中的單元確實(shí)是隨機(jī)排列的。,13,概率抽樣方法,3分層抽樣(Stratified Sampling) 指將調(diào)查總體中的所有單位按照一定的屬性或特征分成不相重疊的若干層次(或類),然后在每一個層次(或類)中進(jìn)行簡單隨機(jī)抽樣或等距抽樣。 分層標(biāo)志,一定是總體的某種重要屬性或特征,而且與調(diào)查主題內(nèi)容之間聯(lián)系越密切越好。 分層的目的是使樣本單位在各層、各類中分布比較均勻,具有更好的代表性。 分層抽樣在操作上分為四種方法:比例分層、紐曼分層、德明分層和多次分層。,14,概率抽樣方法,分層抽樣: 設(shè)n為樣本總數(shù),ni為第
6、i層應(yīng)抽取的樣本單位數(shù),N為調(diào)查總體單位數(shù),Ni為第i層總體單位數(shù),則分比例為n/N,等比例意味著ni/n=Ni/N。所以第i層應(yīng)抽取的樣本數(shù)量: ni=n(Ni/N). 例如:某街道有居民20000戶,按經(jīng)濟(jì)收入分為三層,分布情況如表所示。假定樣本數(shù)為200,通過等比例分層進(jìn)行購買力調(diào)查。各層應(yīng)抽取的樣本數(shù)量可以按上述公式計(jì)算出來,結(jié)果如下表:,15,16,概率抽樣方法,4整群抽樣(Cluster Sampling) 指首先將調(diào)查總體區(qū)分為若干群,然后采用SRS方法抽出部分群作樣本,最后對這些樣本群進(jìn)行全面調(diào)查。即,兩段整群抽樣。在兩段整群抽樣中,如果不對所抽樣本群進(jìn)行全面調(diào)查,而是進(jìn)一步將
7、這些群劃分為若干小群,然后按照隨機(jī)原則抽出一部分群進(jìn)行全面調(diào)查,就形成所謂的三段整群抽樣。,17,概率抽樣方法,整群抽樣有以下主要優(yōu)點(diǎn): 由于樣本相對集中,整群抽樣能大大降低數(shù)據(jù)收集的費(fèi)用。 當(dāng)總體單位自然聚合成群時,創(chuàng)建地域抽樣框較容易; 對于研究變量而言,若群內(nèi)單元差異大且群間差異小,則整群抽樣策略比SRS的統(tǒng)計(jì)效率更高。 整群抽樣的缺點(diǎn): 如果群內(nèi)單元對調(diào)查變量有趨同勢,則整群抽樣的統(tǒng)計(jì)效率比簡單隨機(jī)抽樣低,而這正是通常遇到的情況; 無法提前知道調(diào)查的總樣本量,因?yàn)椴恢廊簝?nèi)到底有多少單位; 調(diào)查的組織比其他方法復(fù)雜; 方差估計(jì)可能比簡單隨機(jī)抽樣更為復(fù)雜。,18,概率抽樣方法,5與個體大
8、小成比例的概率抽樣(PPS) PPS是一種使用輔助信息從而使入樣概率不相等的抽樣技術(shù)。如果總體單位的大小變化很大且己知,這些信息就可用在抽樣中,以提高統(tǒng)計(jì)效率。 PPS抽樣的主要優(yōu)點(diǎn)是它使用了輔助信息,提高了抽樣策略的統(tǒng)計(jì)效率,與SRS方法甚至與分層抽樣相比,都能顯著地減少抽樣誤差。,19,概率抽樣方法,PPS抽樣有以下缺點(diǎn): 抽樣框中所有單位,都要有高質(zhì)量的、能用作大小度量的輔助信息; 抽樣框的創(chuàng)建比簡單隨機(jī)抽樣和系統(tǒng)抽樣成本高、更復(fù)雜,因?yàn)樾枰攘亢痛鎯傮w中每一個單位的大?。?并非在任何情況下都能使用,因?yàn)椴⒉皇敲恳粋€總體都有穩(wěn)定且與主要調(diào)查變量相關(guān)的有關(guān)大小或規(guī)模的度量; 對于那些與大
9、小變量不相關(guān)的調(diào)查變量,會導(dǎo)致抽樣策略的統(tǒng)計(jì)效率比簡單隨機(jī)抽樣低; 估計(jì)量的抽樣方差的估計(jì)較復(fù)雜; 當(dāng)總體單位大小度量不準(zhǔn)確或不穩(wěn)定時,PPS抽樣不再適用。,20,其他概率抽樣方法,多階抽樣 多階抽樣是用兩個或更多個連續(xù)的階段抽取樣本的過程。第一階段抽取的單位稱為初級抽樣單位,第二階段抽取的單位稱為次級抽樣單位,依次類推。每個階段抽取的單位在結(jié)構(gòu)上是不同的。 二階抽樣是常見形式:第一階用地域框抽小的地理小區(qū);第二階用系統(tǒng)抽樣抽小區(qū)內(nèi)的住所。與整群抽樣中樣本群的所有單位都入樣不同,在兩階抽樣中,則從每個抽中的群中再抽一部分單位進(jìn)行調(diào)查。,21,其他概率抽樣方法,多相抽樣(或多重抽樣) 多相抽樣先
10、抽一個包含很多單位的大樣本,收集基本信息,然后在這個大樣本中抽一個子樣本,收集更詳細(xì)的信息。第一相收集的數(shù)據(jù)能夠用作分層及篩選信息,同時也可以用來提高估計(jì)的效率。 多相抽樣能用在抽樣框缺乏輔助信息,而又想對總體進(jìn)行分層或篩選部分總體的情況。 當(dāng)沒有充足的預(yù)算收集整個樣本的信息,或這樣做會導(dǎo)致額外的回答負(fù)擔(dān),也可以考慮使用多相抽樣。,22,非概率抽樣方法,1便利抽樣 便利抽樣就是依據(jù)方便原則抽取樣本,對抽樣單位的選擇主要是由調(diào)查人員完成,通常被訪者由于碰巧在適當(dāng)?shù)臅r間出現(xiàn)在適當(dāng)?shù)牡攸c(diǎn)而被選中。 “街頭攔人法”和“空間抽樣”,是方便抽樣的兩種最常用方法。,23,非概率抽樣方法,2判斷抽樣(立意或目
11、的抽樣) 它是按照調(diào)研設(shè)計(jì)者的主觀判斷選取調(diào)查單位組成樣本的一種抽樣方法。應(yīng)用前提是,調(diào)研設(shè)計(jì)的必須以對調(diào)查總體的有關(guān)特征相當(dāng)了解,或者可以依靠專家判斷來決定樣本。 在判斷抽樣中,樣本單位的選取通常分為兩種情況: 第一種情況是,選擇最能代表普遍情況的調(diào)查對象,即選取“多數(shù)型”、或“平均型”的樣本作為調(diào)查對象。 第二種情況是,選擇那些異乎尋常的個案,目的是調(diào)查造成異常的原因。,24,非概率抽樣方法,3配額抽樣 所謂配額抽樣,是指首先將總體單位按照一定的屬性或者特征分成若干類,然后在每類中按照方便抽樣或者判斷抽樣的方法選取樣本單位。 配額抽樣的具體步驟: S1:選定控制特征。即據(jù)以對總體單位分層的
12、屬性和特征。 S2:確定調(diào)查總體中各個控制特征的比例。 S3:按照分層比例表確定各層次樣本數(shù)目,建立樣本配額表。 S4:確定抽樣單位。采用方便/判斷抽樣方式抽取樣本單位。,25,非概率抽樣方法,表8-3 獨(dú)立控制樣本配額表,表8-4 交叉控制樣本配額表,26,非概率抽樣方法,4滾雪球抽樣 指一種抽樣程序,最初的應(yīng)答者通過概率方法進(jìn)行選擇,而另外的應(yīng)答者則是通過最初應(yīng)答者所提供的信息而獲得。該過程可以通過一輪接一輪的推薦進(jìn)行下去,因而產(chǎn)生一個“滾雪球”效應(yīng)。即使在選擇最初的被訪者時使用了概率抽樣,最終的樣本還是一個非概率樣本。 該技術(shù)用于通過推舉找到那些罕見的總體單位。,27,抽樣方法的選擇,1是否要以樣本結(jié)果對總體進(jìn)行推斷 2非抽樣誤差相對于抽樣誤差是大還是小 3總體的差異化程度如何 4有沒有或是否有可能建立一個總體所有單位的名錄 5調(diào)查是否要求對一個相當(dāng)大的地理區(qū)域進(jìn)行面訪 6總體單位是否自然成群,或是否有此類群體的名錄 7抽樣框是否有能用作分層或度量大小等輔助信息 8是否需要進(jìn)行域(子總
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- (完整版)生理學(xué)試題及答案400題
- 郵政招聘考試真題及答案
- vivo秋招試題及答案
- 單體電壓技師考試題庫及答案
- 車子駕駛證考試題庫及答案
- 中共臺州市路橋區(qū)委全面深化改革委員會辦公室關(guān)于公開選聘工作人員1人參考題庫必考題
- 中國金融出版社有限公司2026校園招聘4人考試備考題庫附答案
- 公主嶺市公安局2025年招聘警務(wù)輔助人員(150人)考試備考題庫必考題
- 南充市司法局2025年下半年公開遴選公務(wù)員(參公人員)公 告(2人)備考題庫必考題
- 吉水縣園區(qū)開發(fā)建設(shè)有限公司及下屬子公司2026年第一批面向社會公開招聘備考題庫附答案
- 2026年浙江高考語文真題試卷+答案
- 2025 年大學(xué)人工智能(AI 應(yīng)用)期中測試卷
- 《市場營銷(第四版)》中職完整全套教學(xué)課件
- (正式版)DB61∕T 2121-2025 《風(fēng)力發(fā)電場集電線路設(shè)計(jì)規(guī)范》
- 疑難病例討論制度落實(shí)常見問題與改進(jìn)建議
- 創(chuàng)傷性脾破裂的護(hù)理
- 蓬深102井鉆井工程(重新報批)項(xiàng)目環(huán)境影響報告表
- 大模型金融領(lǐng)域可信應(yīng)用參考框架
- (新教材)2025年人教版七年級上冊歷史期末復(fù)習(xí)??贾R點(diǎn)梳理復(fù)習(xí)提綱(教師版)
- 中國全色盲診療專家共識2026
- 中國地質(zhì)大學(xué)武漢本科畢業(yè)論文格式
評論
0/150
提交評論