版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第6章 抽樣,第1節(jié) 抽樣原理,第2節(jié) 抽樣的方法,第3節(jié) 樣本容量,第1節(jié) 抽樣原理,一、抽樣與抽樣調(diào)查,二、抽樣術(shù)語,三、抽樣的程序,四、抽樣分布與抽樣原理,一、抽樣與抽樣調(diào)查,抽樣(Sampling)是一種選擇調(diào)查對象的程序和方法。 抽樣調(diào)查是依據(jù)一定抽樣方法從構(gòu)成研究對象整體的總體中抽取部分作為樣本進行調(diào)查研究,然后用樣本的調(diào)查結(jié)果來推論和說明總體的一種調(diào)查方式。,總體:是構(gòu)成研究單位的所有單位的集合,該單位是構(gòu)成總體的基本單位。 Population:The set of units that the researcher wishes to explain. 樣本:就是從總體中以一
2、定的抽樣方法抽取的一部分單位的集合,一個樣本也就是總體的一個子集。 Sample: A subset of all units (elements) in the population,二、抽樣術(shù)語:總體與樣本,抽樣框:是一次直接抽樣時所有抽樣單位的名單。 Sample Frame: a list of which is used to represent all the element in the population . 抽樣比率:一次抽樣中,樣本占總體的比率。 Sampling Ratio: ratio of the size of the sample to the size of
3、population.,二、抽樣術(shù)語:抽樣框與抽樣比率,參數(shù)值:是關(guān)于總體中某一變量的綜合描述,或者說是總體中所有元素的某種特征的綜合數(shù)量表現(xiàn)。 Parameter: a characteristic of the population 統(tǒng)計值:也稱樣本值,它是關(guān)于樣本中某一變量的綜合描述,或者說是總體中所有元素的某種特征的綜合數(shù)量表現(xiàn)。 Statistic: a characteristic of the sample,二、抽樣術(shù)語:參數(shù)值與統(tǒng)計值,抽樣單位(sampling unit):是一次直接抽樣所使用的基本單位。 抽樣誤差:是指由于抽樣本身的隨機性而導(dǎo)致的用樣本值推論總體值時的誤差,
4、它是樣本代表性大小的一個標準,是不可避免的。,二、抽樣術(shù)語:抽樣單位與抽樣誤差,1界定總體 2編制抽樣框 3確定樣本數(shù)和抽樣方法 4實際抽取樣本 5評估樣本質(zhì)量,三、抽樣的程序,四、抽樣分布,四、抽樣分布原理:SAMPLE=1,四、抽樣分布原理:SAMPLE=2,四、抽樣分布原理:樣本增大與抽樣誤差的關(guān)系,第2節(jié) 抽樣的方法,一、概率抽樣方法(Probability Sampling),二、非概率抽樣方法(Nonprobability sampling),1.簡單隨機抽樣,一、概率抽樣方法,2.系統(tǒng)抽樣,3.分層抽樣,4.整群抽樣,5.多階段抽樣,6.PPS抽樣,7.戶內(nèi)抽樣,1.簡單隨機抽樣
5、 Sample random sampling: select people based on a true random procedure (1)運用隨機數(shù)表、抓鬮、計算機處理; (2)要求調(diào)查對象的名單必須是可以列舉出來的。,一、概率抽樣方法:簡單隨機抽樣,示例:EXCELL隨機抽樣“=INT(RAND()*(b-a)+a) ”,用隨機數(shù)表抽樣方法:500名學(xué)生中抽取80名,2.系統(tǒng)抽樣 Systematic sampling: select every Kth person 步驟: (1)排列抽樣框名單; (2)計算抽樣距離K(抽樣比率的倒數(shù),實為抽樣框數(shù)N/樣本數(shù)); (3)選擇起始
6、CASE; (4)選擇樣本:A+nK(n=0,1,2,3),一、概率抽樣方法:系統(tǒng)抽樣,系統(tǒng)抽樣示例:36人中選5人,系統(tǒng)抽樣可能遇到的問題: (1)當總體的排列沒有規(guī)律時,用等距抽樣較好,但如果總體排列按某種規(guī)律循環(huán)出現(xiàn),用等距抽樣就有危險(以總體的隨機排列為前提) (距離不能等于循環(huán)節(jié)的倍數(shù)) (2)抽樣框的名單如果可以按一定標準編號,比如從收入高到低,間距為25,則起點對樣本的偏差比較大。 (3)K不為整數(shù)時的處理。,一、概率抽樣方法:系統(tǒng)抽樣,K=8:,K=7:,系統(tǒng)抽樣示例:36人中選5人,分層抽樣: Stratified sampling: systematically selec
7、t elements in each of previously established categories 先將總體依照某種或某幾種特性分為幾個子總體 整群抽樣: Cluster sampling: take multi stage samples in each of several levels 各群體的同質(zhì)性高的總體用整群抽樣較好 各分層群體異質(zhì)性高的總體用分層抽樣較好,一、概率抽樣方法:分層抽樣與整群抽樣,群內(nèi)異質(zhì)性低 群間異質(zhì)性高,群內(nèi)異質(zhì)性高 群間異質(zhì)性低,整群抽樣,分層抽樣,一、概率抽樣方法:分層抽樣與整群抽樣,一、概率抽樣方法:分層抽樣,1.分層的標準選擇: (1)研究的主
8、要變量或相關(guān)變量作為分層的標準; (2)分層標準具有區(qū)分層間差異大而層內(nèi)差異小的特征; (3),一、概率抽樣方法:分層抽樣,農(nóng)村學(xué)生95%,某高校 學(xué)生分 布情況,城市 學(xué)生占5%,抽樣條件:學(xué)生總數(shù)5000人,現(xiàn)要抽取500人,抽樣調(diào)查該校學(xué)生的月平均消費。 假如農(nóng)村學(xué)生的月均消費為500元,城市學(xué)生月消費為800元。,等比抽樣與異比抽樣:,一、概率抽樣方法:分層抽樣,抽樣條件:學(xué)生總數(shù)5000人,現(xiàn)要抽取500人,計算該校學(xué)生的月平均消費。 假如農(nóng)村學(xué)生的月均消費為500元,城市學(xué)生月消費為800元,因此該校學(xué)生的月均消費(參數(shù)值)應(yīng)為: (500元/人*4500人+800元/人*250人
9、)/5000人=490元 異比抽樣法:農(nóng)村城市各抽取250名,其計算的月均消費統(tǒng)計值: (500元/人*250人+800元/人*250人)/500人=650元 加權(quán)后計算的統(tǒng)計值(權(quán)重=等比抽樣人數(shù)/異比抽樣人數(shù)): 475/250(500元/人*250人)+25/250(800元/人*250人)/500人=515元,等比抽樣與異比抽樣:,群內(nèi)異質(zhì)性高 群間異質(zhì)性高,一、概率抽樣方法:多階段抽樣,總 體,哪一級的異質(zhì)性高,就在哪一級提高樣本比率,一級抽樣,二級抽樣,一、概率抽樣方法:多階段抽樣,一、概率抽樣方法:多階段抽樣,從某縣10個鄉(xiāng)鎮(zhèn)200個村中抽取1200名農(nóng)民調(diào)查。,10X4X30=
10、1200 2X20X30=1200 10X20X6=1200 8X15X10=1200 5X12X20=1200 4X10X30=1200 3X10X40=1200 2X10X60=1200 1X12X100=1200,三種抽樣方法的比較,一、概率抽樣方法:PPS抽樣,PPS抽樣:概率與元素的規(guī)模大小成比例的抽樣Sampling with probability proportional to size特點:是多階段抽樣方法的特定形式,其二級單位規(guī)模的大小影響到被抽取的概率。,例: 抽樣條件:在武漢50所大學(xué),每個大學(xué)的學(xué)生數(shù)差異很大,現(xiàn)在要在這50所大學(xué)中抽取20所,共抽取2000名學(xué)生進行
11、調(diào)查。,一、概率抽樣方法:PPS抽樣,一、概率抽樣方法:戶內(nèi)抽樣,戶內(nèi)抽樣:Within-household Sampling往往是多階段抽樣的最后環(huán)節(jié),一般使用“KISH選擇法”,一、概率抽樣方法:戶內(nèi)抽樣,KISH表,1.偶遇抽樣,二、非概率抽樣方法,2.主觀抽樣,3.定額抽樣,4.滾雪球抽樣,偶遇抽樣(方便抽樣) Haphazard sampling: select anyone who is convenient 主觀抽樣 Purposive sampling: select anyone in a hard to find target population,二、非概率抽樣方法:偶遇
12、抽樣與主觀抽樣,定額抽樣 Quota sampling: select anyone in predetermined groups 滾雪球抽樣 Snowball sampling: select people connected to another,二、非概率抽樣方法:定額抽樣與雪球抽樣,第3節(jié) 樣本容量,一、樣本容量定性確定方法,二、樣本容量定量確定方法,三、常用抽樣比率,影響樣本容量的因素: 1.決策的重要性 2.研究的性質(zhì) 3.變量的個數(shù) 4.完成率(回復(fù)率低則樣本容量大) 5.總體的性質(zhì)(同質(zhì)性高則小,否則大) 6.資源限制(資金與時間),一、樣本容量確定的定性方法,N=t2s2/
13、e2 N=t2p(1-p)/e2,二、樣本容量確定的定量方法,總體規(guī)模與樣本量間的關(guān)系,樣本容量確定的統(tǒng)計學(xué)方法,1.調(diào)查平均值問題,對于估計平均值問題,計算其所需的樣本容量的公式: Z 標準誤差的置信水平的臨界值(即總體平均值包括在指定置信區(qū)間內(nèi)的置信度是多少?標準誤差的置信水平允許確切值Z) 總體標準差; E 可接受的抽樣誤差范圍(允許誤差)。 t值與E值必須由調(diào)查人員與客戶進行磋商后確定。 總體標準差 值只能通過以前的資料、試點調(diào)查、二手資料通過主觀判斷等途徑來確定。 應(yīng)用舉例,計算平均數(shù)的樣本容量確定應(yīng)用舉例,例:研究快餐族平均每月吃快餐的次數(shù)。 與委托單位磋商以及對精確度的要求后,調(diào)
14、查人員規(guī)定估計值不得超過實際值的0.10(1/10)。即允許誤差E值確定為0.10。 調(diào)研人員認為,考慮全局,需要把實際總體平均值在(樣本平均值E)區(qū)間以內(nèi)的置信度定為95%。而若要置信度為95%,應(yīng)必須在2倍標準誤差范圍內(nèi)(嚴格是1.96)。即Z值可確定為2。 值借用公司以前作過的類似調(diào)查的資料,標準差為1.39,以此作為 值。,2.計算比例問題,這就是比例問題調(diào)查的樣本容量確定問題。 公式: 公式中,P為總體比例的估計值,可以借用過去的調(diào)查估計值。 例:確定研究最90天內(nèi)曾在網(wǎng)上購物的所有成年人的比例或百分比的調(diào)查的樣本容量。 假設(shè)可接受的誤差范圍為2%,即E值確定為0.02。 假定調(diào)查人
15、員要求抽樣估計在實際總體比例的2%范圍內(nèi)的置信度為95%,那么按前例,可將2作為Z值代入公式。 根據(jù)前一次調(diào)查,有5%的被調(diào)查者表示在最近90天內(nèi)曾在網(wǎng)上購物,因此,可將0.05作為P值代入公式。,計算樣本容量的公式中沒有一個用到總體容量。只有樣本容量相對于總體容量而言過大(5%以上)時,總體容量才會影響到樣本量的大小。 當樣本容量超過總體容量的5%時,就需要調(diào)整樣本容量。 一般都假設(shè)樣本的抽取是相互獨立的(獨立假設(shè)),這一假設(shè)在樣本相對于總體很小時成立。當樣本量占總體比例相對較大(5%以上)時,假設(shè)就不成立。因此,我們必須調(diào)整標準公式。 如前面關(guān)于平均數(shù)的樣本容量就應(yīng)作調(diào)整,公式為: n修改
16、后的樣本量。n原樣本量。 N為總體單位數(shù)。 如總體單位數(shù)為2000,原樣本量為400,則修改后的樣本量應(yīng)為:,3.注意事項抽樣比率過大問題,3.注意事項無回答的問題,實際調(diào)查中,由于調(diào)查對象未找到或拒絕訪問等原因,實際收回的樣本數(shù)與理論決定的樣本數(shù)可能不同。 另外,即使所有樣本單位都接受了調(diào)查,還會因為他們對調(diào)查中各個問題的回答率不同,而發(fā)生不同的調(diào)查項目樣本規(guī)模不一致的情況。 因此,確定樣本大小時,還應(yīng)將這些情況考慮進去。 例,初確定的樣本容量是1000,但估計可能有20%的無回答,則實際調(diào)查所用的樣本容量1000/80%=1250。,4.附錄總體異質(zhì)程度,其他條件一定,總體異質(zhì)性程度越大,所要求的樣本容量越大;反之,所要求的樣本容量就越小。 總體的異質(zhì)程度大小可用標準差估計值來反映。 標準差計算公式: 應(yīng)用舉例:,4.附錄標準差計算公式應(yīng)用舉例,調(diào)查某地家庭每月用于購買家用電器的支出情況。事先抽取10戶(n)進行調(diào)查。經(jīng)計算,平均每月每戶用于購買家電的支出為500元( )。實際上,每戶用于購買家電的支出有很大差別,分別為:385、390、500、450、800、345、510
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職(大數(shù)據(jù)與會計)成本會計核算試題及答案
- 2026年河北能源職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試備考題庫帶答案解析
- 2026年及未來5年市場數(shù)據(jù)中國小型壓路機行業(yè)發(fā)展監(jiān)測及投資戰(zhàn)略規(guī)劃研究報告
- 2026年河北政法職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試備考題庫帶答案解析
- 2026年黑龍江林業(yè)職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試備考題庫帶答案解析
- 2026年湖北工程職業(yè)學(xué)院單招綜合素質(zhì)考試備考題庫帶答案解析
- 投資合作意向協(xié)議2025年資金條款
- 投資并購框架協(xié)議(2025年商業(yè)投資)
- 2026年廣西衛(wèi)生職業(yè)技術(shù)學(xué)院單招綜合素質(zhì)考試模擬試題帶答案解析
- 碳中和認證服務(wù)協(xié)議(產(chǎn)品)2025年工業(yè)生產(chǎn)版
- 2026年寧夏黃河農(nóng)村商業(yè)銀行科技人員社會招聘備考題庫及完整答案詳解1套
- 2026年尼勒克縣輔警招聘考試備考題庫必考題
- 2024年黑龍江三江美術(shù)職業(yè)學(xué)院單招職業(yè)適應(yīng)性測試題庫附答案解析
- 成都傳媒集團招聘筆試題庫2026
- 污泥處置合同協(xié)議
- 2025年蘇州工業(yè)園區(qū)領(lǐng)軍創(chuàng)業(yè)投資有限公司招聘備考題庫及一套完整答案詳解
- 食品工廠設(shè)計 課件 第二章 廠址選擇
- 2023年生產(chǎn)車間各類文件匯總
- WORD版A4橫版密封條打印模板(可編輯)
- 2013標致508使用說明書
- GB/T 18993.1-2020冷熱水用氯化聚氯乙烯(PVC-C)管道系統(tǒng)第1部分:總則
評論
0/150
提交評論