版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
社會(huì)調(diào)查與統(tǒng)計(jì)分析公共管理學(xué)院盧小君第四章抽樣抽樣的意義與作用概率抽樣的原理與程序概率抽樣方法非概率抽樣方法樣本規(guī)模與抽樣誤差4.1抽樣的意義與作用抽樣的基本概念總體(Population):構(gòu)成它的所有元素(Element)的集合。樣本(Sample):從總體中按一定方式抽取出的一部分元素的集合。抽樣(Sampling):從總體中按一定方式抽取樣本的過程。抽樣單位(SamplingUnit):一次直接抽樣所使用的基本單位。抽樣框(SamplingFrame):一次直接抽樣中總體中所有抽樣單位的名單。抽樣框的經(jīng)典例子《文學(xué)摘要》雜志在1920年、1924年、1928年和1932年,以郵寄明信片的方式對美國總統(tǒng)大選,進(jìn)行了民意測驗(yàn),并準(zhǔn)確預(yù)測出這4次選舉的結(jié)果。當(dāng)1936年總統(tǒng)大選來臨時(shí),雜志回收了200多萬份明信片。測驗(yàn)結(jié)果顯示57%的人支持共和黨的候選人蘭登,民主黨候選人、在任總統(tǒng)羅斯福的支持率為43%。然而,兩星期后的選舉結(jié)果,羅斯福以62%的得票率當(dāng)選。雜志因此聲譽(yù)掃地,不久就關(guān)門大吉了。選民的地址與姓名大都取自于電話簿與汽車俱樂部會(huì)員名單抽樣的基本概念參數(shù)值(Parameter):也稱為總體值,是關(guān)于總體中某一變量的綜合描述。統(tǒng)計(jì)值(Statistic):也稱為樣本值,是關(guān)于樣本中某一變量的綜合描述。置信度(ConfidenceLevel):又稱為置信水平,指的是總體參數(shù)值落在樣本統(tǒng)計(jì)值某一區(qū)間內(nèi)的概率或把握性程度。置信區(qū)間(ConfidenceInterval):在一定的置信度下,樣本統(tǒng)計(jì)值與總體參數(shù)值之間的誤差范圍。置信區(qū)間越大,誤差范圍越大,抽樣的精確性程度就越低。抽樣的基本概念
調(diào)查1000名大學(xué)生家庭平均月收入水平為5000元如何估計(jì)總體參數(shù)值?90%的置信度置信區(qū)間[4800,5200]95%的置信度置信區(qū)間[4500,5500]99%的置信度置信區(qū)間[4300,5700]樣本統(tǒng)計(jì)值抽樣的基本概念
置信度越高,置信區(qū)間越大;置信度越低,置信區(qū)間越小抽樣的可靠性(置信度)越高,抽樣的精確性程度(置信區(qū)間)就越低;反之,抽樣的可靠性越低,抽樣的精確程度就越高。抽樣的類型40個(gè)人的總體16人13人4人7人抽樣的類型抽樣方法概率抽樣簡單隨機(jī)抽樣系統(tǒng)抽樣分層抽樣整群抽樣多段抽樣非概率抽樣偶遇抽樣判斷抽樣定額抽樣雪球抽樣代表性:當(dāng)選出的樣本的各種集合特征大體接近于總體的集合特征時(shí),樣本就具有代表性。4.2概率抽樣的原理與程序定義:概率抽樣要求保證總體中的每一個(gè)個(gè)體都有同等的機(jī)會(huì)入選樣本;且任一個(gè)個(gè)體入選與否,與其他個(gè)體毫不相關(guān),互不影響,即每一個(gè)個(gè)體的抽取都是相互獨(dú)立的?;蛘哒f,每一個(gè)個(gè)體的抽取都是相互獨(dú)立的,是一種隨機(jī)事件?;驹?當(dāng)樣本規(guī)模越大時(shí),樣本平均值(統(tǒng)計(jì)值)接近總體平均值的(參數(shù)值)的可能性越大。抽樣分布抽樣分布:從一個(gè)總體中不斷抽取樣本時(shí),各種可能出現(xiàn)的樣本統(tǒng)計(jì)值的分布情況。假如10個(gè)人受教育的年限分別為6、7、8、9、10、11、12、13、14、15年,那么這一總體中的成員平均受教育年限為10.5年。抽樣分布抽樣分布抽樣分布抽樣分布抽樣分布當(dāng)樣本容量增大時(shí),樣本平均值接近總體平均值的次數(shù)會(huì)越來越多抽樣分布當(dāng)n足夠大時(shí)(通常假定大于30),無論總體的分布如何,其樣本平均數(shù)所構(gòu)成的分布都趨于正態(tài)分布。μμ+SEμ-SEμ+2SEμ+3SEμ-2SEμ-3SE34.13%34.13%13.6%13.6%2.16%2.16%小概率事件區(qū)小概率事件區(qū)抽樣的一般程序(1)界定總體:界定總體的范圍和界限1988年全國1‰生育率調(diào)查對總體的定義是:1988年7月1日零時(shí)全國(除西藏、中國臺灣外)28個(gè)省、市、自治區(qū)所有15~67歲的婦女。(2)制定抽樣框:收集全部抽樣單位的名單當(dāng)抽樣是分幾個(gè)階段、在不同層次上進(jìn)行時(shí),要分別建立幾個(gè)抽樣框。(3)決定抽樣方案:確定抽樣方法、樣本規(guī)模影響樣本規(guī)模的三個(gè)因素:總體的規(guī)??傮w內(nèi)部的差異程度對調(diào)查結(jié)果的精確度的要求抽樣的一般程序(4)實(shí)際抽取樣本(5)評估樣本質(zhì)量:對樣本的質(zhì)量、代表性、偏差等進(jìn)行初步的檢查和衡量?;痉椒ǎ簩⒖傻玫降姆从晨傮w中某些重要特征及分布的資料與樣本中的同類指標(biāo)的資料進(jìn)行對比??傮w(4000名大學(xué)生):男78%,女22%;大一28%,大二25%,大三25%,大四22%樣本1(200名大學(xué)生):男76%,女24%;大一29%,大二24%,大三27%,大四20%樣本2(200名大學(xué)生):男54%,女46%;大一38%,大二12%,大三17%,大四33%4.3概率抽樣方法簡單隨機(jī)抽樣系統(tǒng)抽樣分層抽樣整群抽樣多段抽樣PPS抽樣戶內(nèi)抽樣(1)簡單隨機(jī)抽樣(SimpleRandomSampling)又稱為純隨機(jī)抽樣,是概率抽樣的最基本形式。它是按等概率原則直接從含有N個(gè)元素的總體中抽取n個(gè)元素組成樣本(N>n)。抽簽法隨機(jī)數(shù)表法隨機(jī)數(shù)表法第一步:先取得一份調(diào)查總體所有元素的名單(即抽樣框)第二步:將總體中所有元素都按順序編號,根據(jù)編號的最大數(shù)確定使用隨機(jī)數(shù)表中幾位數(shù)碼;第三步:對隨機(jī)數(shù)表中的數(shù)碼逐一進(jìn)行衡量并決定取舍,根據(jù)樣本規(guī)模的要求選擇出足夠多的數(shù)碼個(gè)數(shù);第四步:依據(jù)從隨機(jī)數(shù)表中選出的數(shù)碼,到抽樣框中找出它所對應(yīng)的元素。隨機(jī)數(shù)表法8135146844
6362895006
3210235370
31523382311629105549
6126863470
8320171912
96642948624811714890
2694464096
4574425373
36595486327487287852
9574892523
8016523862
34254591416773135283
1312945866
7919104047
70629061403455597166
3784979155
1247776366
64811658152552654745
9478609124
8412722821
52722030171254777565
6144968943
3019777311
72922591719598596878
1528196387
3641827221
37129381430425475978
3882338758
9447759760
37297337174457466575
4669738749
6321332898
69989729186822347065
9711581230
6754715370
36553490826547308059
1286381349
2042302277
85369893353574142598
2692847855
8017015594
36605371772103371519
1298583727
5748323262
27107729866116708625
6474632492
1234476453
73338506275412164092
4599372732
8522125833
50247459371685543885
1999133972
2998301447
36107417365461401140
6916568879
7628215983
24454663769436966977
7210363756
4137235877
78826998366799954269
5169509662
7087806097
17520653389013921911
8973679618
6287691252
47393574926766832446
1061757589
2605189859
19521150451889947275
8834696982
2982144368
57418548231142539819
4845592651
9342582336
54808777257970315491
1872412232
8385497065
25391729476184147135
8137264037
7966264261
14508594359868516088
9671271338
6610961839
11534672964645428573
7446875341
1699113737
65141221617119442266
6040585661
1422708002
68973640953793101417
4310485698
5620397196
49537453497465588976
9312164533
4204794468
86901455655855625374
9065403581
6380413195
39844213613590235585
6566164545
0993593568
43771251566067396082
6827801041
7831859820
1298462110隨機(jī)數(shù)表應(yīng)用實(shí)例(2)系統(tǒng)抽樣(SystematicSampling)又稱為等距抽樣或間隔抽樣。步驟:將總體中的每一個(gè)元素按順序編上號碼,即制定出抽樣框;計(jì)算出抽樣間距,方法是用總體的規(guī)模除以樣本的規(guī)模;
K(抽樣間距)=N(總體規(guī)模)/n(樣本規(guī)模)在最前面的K個(gè)元素中,采用簡單隨機(jī)抽樣的方法抽取一個(gè)元素,記下這個(gè)元素的編號(A),它稱做隨機(jī)的起點(diǎn)。在抽樣框中,自A開始,每隔K個(gè)元素抽取一個(gè)元素,即所抽取元素的編號分別為A,A+K,A+2K,…,A+(n-1)K;將這n個(gè)元素合起來,就構(gòu)成了該總體的一個(gè)樣本。(2)系統(tǒng)抽樣(SystematicSampling)例:在一個(gè)有5010名員工的單位中,抽取200人進(jìn)行工作滿意度調(diào)查,如采取系統(tǒng)抽樣法,應(yīng)如何操作?如果N/n不是整數(shù),則可以采用循環(huán)等距抽樣方法。即先將N個(gè)總體元素首尾相接排成一個(gè)封閉圓,抽樣間距K取最接近N/n的整數(shù),再從1~N中隨機(jī)抽取一個(gè)起點(diǎn)作為起始單位,然后每隔K抽取一個(gè)元素,直到抽滿n個(gè)元素為止。K=25.05=2550、75、100、125……5000、5025?→5025-5010=15(2)系統(tǒng)抽樣(SystematicSampling)前提條件:總體中個(gè)體的排列應(yīng)是隨機(jī)的,即不存在某種與研究變量相關(guān)的規(guī)則分布。注意兩種情況:總體名單中,個(gè)體的排列具有某種次序上的先后、等級上的高低的情況??傮w名單中,個(gè)體的排列上有與抽樣間隔相對應(yīng)的周期性分布的情況。(3)分層抽樣(StratifiedSampling)又稱為類型抽樣。它是先將總體中所有元素按一定標(biāo)準(zhǔn)(如年齡、性別、職業(yè)等)分成若干類型或?qū)哟危缓笤诟鱾€(gè)類型或?qū)哟沃胁扇『唵坞S機(jī)抽樣或系統(tǒng)抽樣的方法抽取一個(gè)子樣本,最后將這些子樣本合起來構(gòu)成總體的樣本。優(yōu)點(diǎn):在不增加樣本的規(guī)模的前提下降低抽樣誤差,提高抽樣的精度;非常便于了解總體內(nèi)不同類型和層次的情況。(3)分層抽樣(StratifiedSampling)(3)分層抽樣(StratifiedSampling)(3)分層抽樣(StratifiedSampling)分層抽樣的運(yùn)用分層的標(biāo)準(zhǔn)問題,一般依據(jù):已有明顯層次區(qū)分的變量;把分析和研究的主要變量或相關(guān)的變量作為分層的標(biāo)準(zhǔn);保證各層內(nèi)部同質(zhì)性強(qiáng)和各層之間的異質(zhì)性強(qiáng)。思考:在“青年人價(jià)值觀念研究”中,可以采用哪類變量進(jìn)行分層?性別、文化程度、戶籍分層抽樣的運(yùn)用分層的比例問題:按比例和不按比例分層按比例:多則多抽,少則少抽;樣本中比例與總體中比例相同;不按比例:有時(shí)由于個(gè)案太少而不便于了解各個(gè)層次的情況。例如,某工廠有工人500人,男性有450人,女性有50人,男女比例為9:1,樣本為100人。按比例分層抽樣,男性90人,女性10人。不按比例的方法進(jìn)行分層抽樣,男性70人,女性30人。(4)整群抽樣(ClusterSampling)又稱為集體抽樣或群體抽樣,是從總體中隨機(jī)抽取一些小的群體,然后由所抽出的若干個(gè)小群體內(nèi)的所有元素構(gòu)成調(diào)查的樣本的方法。整群抽樣區(qū)別于其它抽樣方法的最大特點(diǎn)在于它的抽樣單位不是單個(gè)元素,而是成群的元素。整群抽樣的優(yōu)缺點(diǎn)優(yōu)點(diǎn)在于可以簡化抽樣的過程,降低調(diào)查的費(fèi)用。缺點(diǎn)就是其樣本的分布面不大、樣本對總體的代表性相對較差。整群抽樣與分層抽樣區(qū)別運(yùn)用不同子群相互之間差別不大、而每個(gè)子群內(nèi)部的異質(zhì)性較大時(shí),則適合于采用整群抽樣的方法;反之,當(dāng)不同子群相互之間差別很大、而每個(gè)子群內(nèi)部的差異不大時(shí),則特別適合于采用分層抽樣的方法。銷售部行政部技術(shù)部制造部(5)多段抽樣(MultistageSampling)又稱為多級抽樣或分段抽樣,它是按總體中元素的層次關(guān)系,把抽樣過程分成兩個(gè)或兩個(gè)以上的階段進(jìn)行。具體做法:先從總體中隨機(jī)抽取若干個(gè)大群(組),然后再從這幾個(gè)大群(組)內(nèi)抽取幾個(gè)小群(組),這樣一層層抽下來,直至抽到最基本的抽樣元素為止。例1:一個(gè)城市有100000戶居民,分屬200個(gè)居委會(huì),要從總體中抽取1000戶居民構(gòu)成樣本。200個(gè)居委會(huì)→20個(gè)居委會(huì)→50戶居民例2:一個(gè)城市有100000戶居民,分屬40個(gè)街道的200個(gè)居委會(huì),要從總體中抽取1000戶居民構(gòu)成樣本。40個(gè)街道→10個(gè)街道→2個(gè)居委會(huì)→50戶居民多段抽樣的優(yōu)缺點(diǎn)優(yōu)點(diǎn):它不需要總體的全部名單,各階段的抽樣單位數(shù)一般較少,因而抽樣比較容易進(jìn)行。缺點(diǎn):每階段抽樣時(shí)都會(huì)有一定誤差,故最后結(jié)果誤差較大。抽樣方案選擇的考慮因素例:從全市100家企業(yè)(總共20萬名職工)中,抽取1000名職工進(jìn)行調(diào)查。1000名職工構(gòu)成的調(diào)查樣本:方案1:抽20個(gè)企業(yè),每個(gè)企業(yè)50個(gè)人方案2:抽5個(gè)企業(yè),每個(gè)企業(yè)200個(gè)人應(yīng)該在類別和個(gè)體之間保持平衡:各個(gè)抽樣階段中的子總體同質(zhì)性程度;各層子總體的人數(shù);要考慮研究者所擁有的人力和經(jīng)費(fèi)。練習(xí):設(shè)計(jì)抽樣方案
某省有200所高中,共200000名學(xué)生。這些中學(xué)分布在全省10個(gè)城市中。其中公立高中150所,私立高中50所?,F(xiàn)要從全省高中生中抽取1800名學(xué)生進(jìn)行學(xué)習(xí)情況的調(diào)查。請?jiān)O(shè)計(jì)一種多段抽樣方案以保證樣本的代表性。(6)PPS抽樣——概率與元素的規(guī)模大小成比例的抽樣(SamplingwithProbabilityProportionaltoSize)多段抽樣暗含的假定:每一個(gè)階段抽樣時(shí),其元素的規(guī)模是相同的。例1:一個(gè)城市有100000戶居民,分屬200個(gè)居委會(huì),要從中抽取1000戶居民構(gòu)成樣本。500戶居民500戶居民800戶居民200戶居民不符合等概率原則(6)PPS抽樣——概率與元素的規(guī)模大小成比例的抽樣(SamplingwithProbabilityProportionaltoSize)原理:以階段性的不等概率換取最終的、總體的等概率。實(shí)質(zhì):在第一個(gè)階段中,大的群被抽中的概率大,而小的群被抽中的概率小;這樣到了第二個(gè)階段,被抽中的大的群中的元素被抽中的概率就小于被抽中的小的群中的元素了。正是這一大一小,平衡了由于群的規(guī)模不同帶來的概率差異。PPS抽樣的原理=所抽取的群數(shù)╳平均每個(gè)群中所要抽取的元素/總體的規(guī)模=樣本規(guī)模/總體規(guī)模PPS抽樣的原理=所選擇的街道數(shù)╳所選擇的居委會(huì)數(shù)╳每個(gè)居委會(huì)中所要抽取的戶數(shù)/總體的規(guī)模=樣本規(guī)模/總體規(guī)模╳所選擇的居委會(huì)數(shù)一個(gè)城市有100000戶居民,分屬40個(gè)街道的200個(gè)居委會(huì),要從中總體中抽取1000戶居民構(gòu)成樣本。PPS的具體操作
例2:從全市100家企業(yè)(總共20萬名職工)中,抽取1000名職工進(jìn)行調(diào)查。(7)戶內(nèi)抽樣(SamplingwithinHousehold)在有關(guān)家庭的調(diào)查研究中,不僅需要抽出家庭戶的樣本,同時(shí)還要進(jìn)行戶內(nèi)抽樣——從所抽中的每戶家庭中抽取一個(gè)成年人,以構(gòu)成訪談對象的樣本。Kish選擇法工具:調(diào)查表(8種編號的調(diào)查問卷)選擇卡(1套8種)Kish選擇法研究者首選將調(diào)查表分為(編號為)A、B1、B2、C、D、E1、E2、F,每種表的數(shù)目分別占調(diào)查表總數(shù)的1/6、1/12、1/12、1/6、1/6、1/12、1/12、1/6。調(diào)查員首先要對每戶家庭中成年人進(jìn)行排序和編號,排序的方法是男性在前,女性在后;年紀(jì)大的在前,年紀(jì)小的在后。然后根據(jù)調(diào)查表上的編號,選用“選擇表”,確定最后人選。A式選擇表如果家庭戶中18歲以上人口為被抽選人的序號為123456人以上111111B1式選擇表如果家庭戶中18歲以上人口為被抽選人的序號為123456人以上111122B2式選擇表如果家庭戶中18歲以上人口為被抽選人的序號為123456人以上111222C式選擇表如果家庭戶中18歲以上人口為被抽選人的序號為123456人以上112233D式選擇表如果家庭戶中18歲以上人口為被抽選人的序號為123456人以上122344E1式選擇表如果家庭戶中18歲以上人口為被抽選人的序號為123456人以上123335E2式選擇表如果家庭戶中18歲以上人口為被抽選人的序號為123456人以上122355F式選擇表如果家庭戶中18歲以上人口為被抽選人的序號為123456人以上123456序號稱呼性別年齡1爸爸男482兒子男203奶奶女694媽媽女46家庭內(nèi)成年人的排序序號稱呼性別年齡1爺爺男722爸爸男483奶奶女694媽媽女465女兒女21家庭內(nèi)成年人的排序Kish選擇法Kish方法的好處是,它不僅可以使研究者收集到樣本家庭的資料,同時(shí)也可以收集到這些被訪者所構(gòu)成的個(gè)人樣本的資料,可以用來描述這一地區(qū)所有成年人所構(gòu)成的總體。4.4非概率抽樣方法不是按照概率原則,而是根據(jù)人們的主觀經(jīng)驗(yàn)或其他條件來抽取樣本。樣本的代表性成問題,誤差無法估計(jì)。非概率抽樣方法偶遇抽樣判斷抽樣定額抽樣雪球抽樣(1)偶遇抽樣(AccidentalorConvenienceSampling)又稱為方便抽樣或自然抽樣,指研究者根據(jù)現(xiàn)實(shí)情況,以自己方便的形式抽取偶然遇到的人作為調(diào)查對象;或者僅僅選擇那些離得最近的、最容易找到的人作為調(diào)查對象。偶遇抽樣與隨機(jī)抽樣的區(qū)別:偶遇抽樣沒有保證使總體中的每一個(gè)成員都具有同等的被抽中的概率。(2)判斷抽樣(JudgmentalorPurposiveSampling)又稱立意抽樣。它是調(diào)查者根據(jù)研究的目標(biāo)和自己主觀的分析來選擇和確定調(diào)查對象的方法??傮w規(guī)模小、調(diào)查所涉及的范圍窄或調(diào)查時(shí)間、人力等條件有限而難以進(jìn)行大規(guī)模抽樣的情況。(3)定額抽樣(QuotaSampling)又稱為配額抽樣。研究者盡可能找出各種因素來對總體分層,并找出具有各種不同特征的成員所占的比例,然后去選擇調(diào)查對象。假設(shè)某高校有2000名學(xué)生,其中男生占60%,女生占40%;文科學(xué)生和理科學(xué)生各占50%;博士研究生占20%,碩士研究生占30%,本科生占50%?,F(xiàn)要用定額抽樣方法依上述三個(gè)變量抽取一個(gè)規(guī)模為100人的樣本。男生(60人)女生(40人)文科(30人)理科(30人)文科(20人)理科(20人)博士碩士本科博士碩士本科博士碩士本科博士碩士本科6915691546104610(3)定額抽樣(QuotaSampling)又稱為配額抽樣。研究者盡可能找出各種因素來對總體分層,并找出具有各種不同特征的成員所占的比例,然后去選擇調(diào)查對象。定額抽樣與分層抽樣的區(qū)別:抽樣方法不同。定額:判斷抽樣分層:隨機(jī)或系統(tǒng)抽樣(4)雪球抽樣(SnowballSampling)當(dāng)我們無法了解總體情況時(shí),可以從少數(shù)成員入手,對他們進(jìn)行調(diào)查,再去找他們知道的人。具體步驟:第一,從總體中少數(shù)人員入手,認(rèn)定和訪問幾個(gè)具有研究特征的人;第二,通過這些人,去了解更多的人,依靠他們找到提供情況、信息的其他人;第三,通過更多的調(diào)查對象去了解另外的人。
(4)雪球抽樣(SnowballSampling)例如,美國社會(huì)學(xué)家E.古德于1967年春夏兩季,先訪問了二十幾個(gè)大麻吸食者;訪問每個(gè)人之后,請他或她提供幾個(gè)其他吸毒者,從而擴(kuò)大到204個(gè)吸毒者,通過對這些人的訪問,研究了吸毒的社會(huì)環(huán)境等問題。雪球抽樣的缺點(diǎn):能找到的樣本量有限所選擇的樣本有時(shí)會(huì)有很大的隨意性和特殊性,因而
代表性不高
抽樣調(diào)查實(shí)例:全國城市職工家計(jì)調(diào)查抽樣方法1980年國家統(tǒng)計(jì)局通過多階段、多種方式抽樣的結(jié)合,在全國范圍內(nèi)隨機(jī)抽取44個(gè)城市的8萬多戶職工家庭,進(jìn)行家庭生活調(diào)查。其抽樣方法是將總體各單位按其屬性特征分為若干類型。然后在各類型中用等距抽樣方法抽選樣本單位。具體步驟是:第一階段,在全國范圍內(nèi)抽選調(diào)查城市。(1)分層。把全國城市分為大、中、小三種類型;然后將三種類型的各個(gè)城市分別按六個(gè)大區(qū)(東北、華北、西北、中南、西南、華東)歸類;這樣一共得到18個(gè)層。(2)等距抽樣。將全國城市按18個(gè)分層排列起來。把城市的職工人數(shù)累積起來,進(jìn)行等距抽樣。每隔100萬職工定一點(diǎn),每個(gè)點(diǎn)所在城市就是選中的調(diào)查城市。第1層城市名全部職工人數(shù)(萬人)職工人數(shù)累計(jì)(萬人)選中記號東北區(qū)中型城市A4343B2366(50)C37103D58161(150)E42203F27230G46276(250)H36312I54366(350)第二階段,在被抽中的城市里抽取職工家庭。第一步,抽選調(diào)查單位。首先根據(jù)城市規(guī)模的大小確定應(yīng)抽選的職工人數(shù),然后把應(yīng)抽選的職工人數(shù)按所有制和國民經(jīng)濟(jì)部門的職工人數(shù)比例分配。例如,某市有職工70萬人,其中全民所有制單位職工56萬人,按5%計(jì)算,應(yīng)調(diào)查2800人;集體所有制單位職工14萬人,應(yīng)調(diào)查700人。中選城市調(diào)查單位抽樣表職工人數(shù)分配好以后,接著在各部門內(nèi)抽選調(diào)查單位。例如,全民所有制工業(yè)部門,應(yīng)調(diào)查的職工人數(shù)是1160人,假定每個(gè)調(diào)查單位的調(diào)查人數(shù)為50人,則:應(yīng)抽選的調(diào)查單位數(shù)=工業(yè)部門應(yīng)調(diào)查人數(shù)/每個(gè)調(diào)查單位調(diào)查人數(shù)=1160/50≈23抽樣間距=工業(yè)部門職工總?cè)藬?shù)/應(yīng)抽選的調(diào)查單位數(shù)=23.2/23≈1(萬人/個(gè))將工業(yè)部門內(nèi)各企業(yè)按等距離抽選調(diào)查單位。每隔1萬人抽一個(gè)調(diào)查單位,直到抽滿23個(gè)調(diào)查單位為止。第二步,抽選職工戶。在抽中的單位中按人員分類排隊(duì),如在工廠里按管理人員、工程技術(shù)人員、工人分層排列。每層中再按抽樣單位分到的數(shù)額決定抽樣間隔進(jìn)行等距抽樣,抽到的那位職工,他的家庭作為調(diào)查戶。企業(yè)名全部職工人數(shù)(萬人)職工人數(shù)累計(jì)(萬人)選中記號全民所有制工業(yè)部門A0.430.430.40B0.230.66C0.371.03D0.581.611.40E1.423.032.40F0.273.30G0.463.763.40H2.366.124.40,5.404.5樣本規(guī)模樣本規(guī)模(SampleSize)又稱為樣本容量,它指的是樣本中所含個(gè)案的多少。確定樣本規(guī)模也是每一項(xiàng)具體的社會(huì)調(diào)查所必須解決的問題之一。統(tǒng)計(jì)學(xué)中以30為界;社會(huì)調(diào)查中以100為界計(jì)算公式簡單隨機(jī)抽樣中推論總體平均數(shù)的樣本規(guī)模計(jì)算公式為:
n=(t2×σ2)/e2簡單隨機(jī)抽樣中推論總體成數(shù)(百分比)的樣本規(guī)模計(jì)算公式為:
n=[t2×p(1-p)]/e2t為置信度所對應(yīng)臨界值;σ為總體的標(biāo)準(zhǔn)差;e為抽樣誤差;P為總體的成數(shù)或百分比。計(jì)算公式在計(jì)算推論總體平均值的樣本規(guī)模時(shí),根據(jù)經(jīng)驗(yàn):在計(jì)算推論總體成數(shù)的樣本規(guī)模時(shí),采取比較保險(xiǎn)的辦法,取p=0.5,使n達(dá)到最大值。
n=[t2×p(1-p)]/e2=t2/4e2總體規(guī)模100以下100-500500-10001000-50005000-1萬1萬-10萬10萬以上樣本比例50%以上30%-50%20%-50%10%-30%3%-15%1%-5%1%以下總體規(guī)模(人)1020501005001000200050001000050000100000樣本10194480133217278322357
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年寧夏黃河農(nóng)村商業(yè)銀行科技人員社會(huì)招聘備考題庫及參考答案詳解
- 隨機(jī)變量課程設(shè)計(jì)
- 兒童托管師資2025年十年薪酬體系優(yōu)化報(bào)告
- 2025年醫(yī)療廢物隔離塑料袋發(fā)展報(bào)告
- 中國電力科學(xué)研究院有限公司2026年高校畢業(yè)生招聘200人的備考題庫及一套答案詳解
- 2025年溫州甌海區(qū)人民醫(yī)院公開招聘2人模擬筆試試題及答案解析
- 2025年招商銀行海口分行社會(huì)招聘備考題庫及答案詳解一套
- 2025中國農(nóng)業(yè)科學(xué)院飼料研究所家禽營養(yǎng)與飼料創(chuàng)新團(tuán)隊(duì)科研助理招聘1人(北京)考試重點(diǎn)試題及答案解析
- 2025年電力線纜檢測機(jī)器人技術(shù)報(bào)告
- 2025年新能源分布式發(fā)電并網(wǎng)在綠色數(shù)據(jù)中心冷卻系統(tǒng)中的節(jié)能分析
- GB/T 25085.2-2024道路車輛汽車電纜第2部分:試驗(yàn)方法
- 第三方協(xié)議合同范本
- 《元旦新氣象夢想再出發(fā)》主題班會(huì)
- 《法制教育守護(hù)成長》主題班會(huì)
- 新舊《預(yù)包裝食品標(biāo)簽通則》對比(中文簡體)
- 利用對稱性計(jì)算圖示結(jié)構(gòu),作彎矩圖EI=常數(shù)
- DL∕T 1053-2017 電能質(zhì)量技術(shù)監(jiān)督規(guī)程
- 某圖書館應(yīng)急救援體系研究
- 《淳安縣養(yǎng)老服務(wù)設(shè)施布局專項(xiàng)規(guī)劃(2022-2035年)》
- NB-T20319-2014壓水堆核電廠技術(shù)規(guī)格書編制準(zhǔn)則
- DZ/T 0426-2023 固體礦產(chǎn)地質(zhì)調(diào)查規(guī)范(1:50000)(正式版)
評論
0/150
提交評論