第四章-抽樣調(diào)查.ppt_第1頁
第四章-抽樣調(diào)查.ppt_第2頁
第四章-抽樣調(diào)查.ppt_第3頁
第四章-抽樣調(diào)查.ppt_第4頁
第四章-抽樣調(diào)查.ppt_第5頁
免費(fèi)預(yù)覽已結(jié)束,剩余78頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第五章 抽樣調(diào)查,生活常識(shí) 為什么要知道一個(gè)人的血液情況,只需抽一點(diǎn)點(diǎn)血來化驗(yàn)就行了? 由部分認(rèn)識(shí)總體 同質(zhì)和異質(zhì),一天,爸爸叫兒子小華去買一盒火柴。臨出門前,爸爸囑咐兒子要買能劃燃的火柴。小華拿著錢出門了,過了好一會(huì)兒,小華才回到家。 “火柴能劃燃嗎?”爸爸問。 “都能劃燃。” “你這么肯定?” 小華遞過一盒劃過的火柴,興奮地說:“我每根都試過啦?!?生活小片段,思考:得到火柴能否劃燃的信息準(zhǔn)確嗎? 這樣做有什么后果?,問1:在這則笑話中,兒子采用的是什么調(diào)查方式?,全面調(diào)查,問2:這種調(diào)查方式好不好?還可采用什么方法調(diào)查?,抽樣調(diào)查,調(diào)查方式的選擇,下列調(diào)查中,你認(rèn)為應(yīng)該采用哪種調(diào)查方式,

2、并說出自己選擇這一觀點(diǎn)的理由。,(1)了解你們班同學(xué)周末時(shí)間是如何安排的; (2)了解一批圓珠筆芯的使用壽命; (3)了解我國八年級(jí)學(xué)生的視力情況; (4)要保證嫦娥三號(hào)衛(wèi)星的成功發(fā)射,對重要零部件采用何種方式檢查; (5)全國中學(xué)生的節(jié)水意識(shí); (6)中央電視臺(tái)春節(jié)聯(lián)歡晚會(huì)的收視率。,通過調(diào)查總體來收集數(shù)據(jù),調(diào)查的結(jié)果準(zhǔn)確。,工作量大,難度大,而且有些調(diào)查不宜使用普查,通過調(diào)查樣本來收集數(shù)據(jù),工作量較小,便于進(jìn)行。,調(diào)查結(jié)果往往不如普查得到的結(jié)果準(zhǔn)確,普查與抽樣調(diào)查的比較,思考學(xué)習(xí),為了了解你所在地區(qū)老年人的健康狀況,你準(zhǔn)備怎樣收集數(shù)據(jù)? 下面分別是A、B、C三個(gè)小組的調(diào)查結(jié)果:,A:小組在

3、公園里調(diào)查了100名老年人,他們一年中生病的次數(shù)如圖所示:,B:小組在醫(yī)院調(diào)查了100名老年病人,他們一年中生病的次數(shù)如圖所示:,C:小組調(diào)查了10名老年鄰居,他們一年中生病的次數(shù)如下表所示:,感悟與反思:,抽樣調(diào)查只考察總體的一部分個(gè)體,因此它的優(yōu)點(diǎn)是調(diào)查范圍小,節(jié)省時(shí)間、人力、物力和財(cái)力,但其調(diào)查結(jié)果往往不如普查得到的結(jié)果準(zhǔn)確。 為了獲得較為準(zhǔn)確的調(diào)查結(jié)果,抽樣時(shí)要注意樣本的代表性和廣泛性.,大樣本一定能保證調(diào)查結(jié)論準(zhǔn)確嗎 1936年美國總統(tǒng)競選時(shí),文學(xué)文摘向1000萬選民寄去了調(diào)查問卷,這些選民的名單是從電話簿、俱樂部名冊以及雜志的訂戶中挑選的.結(jié)果在寄出的1000萬份調(diào)查問卷中,約有2

4、40萬的選民寄回了調(diào)查表.根據(jù)這部分選民的回答,文學(xué)文摘預(yù)測共和黨的布蘭登將當(dāng)選。選舉那天的結(jié)果完全出乎他們的意料,選民中只有38%投了共和黨的票,而民主黨的羅斯福以多數(shù)票當(dāng)選。文學(xué)文摘采用了1000萬的巨大樣本,為何會(huì)預(yù)測失敗呢? 原來20世紀(jì)30年代是美國經(jīng)濟(jì)衰退的時(shí)期,那時(shí)能夠安裝電話、加入上流社會(huì)俱樂部或能訂閱雜志的美國人,大部分支持共和黨。也就是說文學(xué)文摘選擇的樣本雖然巨大卻存在偏差,樣本不具有廣泛性和代表性。 文學(xué)文摘的事例表明抽樣調(diào)查時(shí),既要關(guān)注樣本的大小,又要關(guān)注樣本的代表性。那是不是在樣本具有代表性的情況下,樣本越大越好呢?一般來說,在樣本具有代表性的情況下,樣本增大,所得結(jié)

5、果誤差會(huì)減小。但是當(dāng)樣本大到一定程度之后,再增加樣本,精確度的增加卻是微小的,同時(shí)巨大的樣本不僅耗資太大,也不便于管理。因此在進(jìn)行抽樣調(diào)查時(shí),關(guān)鍵在于精心設(shè)計(jì)抽樣方案,選擇有代表性的樣本,這樣,只用較少的經(jīng)費(fèi),就可能作出接近真實(shí)情況的預(yù)測。,(一)概念 抽樣調(diào)查是按照一定程序,從調(diào)查總體中抽取部分樣本進(jìn)行調(diào)查或觀察,用所獲取的數(shù)據(jù)對總體的數(shù)量特征進(jìn)行估計(jì)和推斷。 抽樣調(diào)查是目前國際上公認(rèn)和普遍采用的科學(xué)的調(diào)查手段。 抽樣調(diào)查旨在以樣本資料來推斷調(diào)查對象總體的相關(guān)統(tǒng)計(jì)數(shù)據(jù)。,一、抽樣調(diào)查概述,總體,樣本,樣本統(tǒng)計(jì)量 (X),總體參數(shù)估計(jì),(二)相關(guān)術(shù)語 1.總體與樣本 總體:是所要調(diào)查的全體。一

6、般用“ N ”表示。 樣本:是總體的一部分,是從總體中按一定的程序抽選出來的個(gè)體或單元組合。一般用“ n ”表示。,某市在12萬名大學(xué)生中抽出1000人進(jìn)行消費(fèi)結(jié)構(gòu)調(diào)查。,認(rèn)識(shí):,總體:12萬名大學(xué)生。 樣本:被抽到的1000名大學(xué)生。,學(xué)校的全體學(xué)生的愛好情況是我們要考察的全體對象,稱為總體。,所有實(shí)際被調(diào)查的學(xué)生的愛好情況組成一個(gè)樣本。,總體中每一個(gè)考察對象叫做個(gè)體,樣本的個(gè)數(shù)稱為樣本容量,在一次考前摸底考試中,考生有2萬名。怎樣才能既省時(shí)又省力的了解到這些考生的英語平均成績呢?,總體是; 個(gè)體是; 樣本是; 樣本的容量是。,萬名考生英語成績,其中每名考生的英語成績,所抽取的名考生的英語成

7、績,深化認(rèn)識(shí),2、抽樣框與抽樣單元,抽樣框:指對可以供抽樣用的所有調(diào)查單位的名冊或詳細(xì)名單。,抽樣框的主要形式有三種: 名單抽樣框 區(qū)域抽樣框 時(shí)間表抽樣框。,認(rèn)識(shí):,例如:要從10000名職工中抽出200名組成一個(gè)樣本,則10000名職工的名冊,就是抽樣框。,常見的抽樣框:大學(xué)學(xué)生花名冊、城市黃頁里的電話列表、工商企業(yè)名錄、街道派出所里居民戶籍冊、意向購房人信息冊。,注意:,在利用現(xiàn)有的名單作為抽樣框時(shí),要先對該名錄進(jìn)行檢查,避免有重復(fù)、遺漏的情況發(fā)生。以提高樣本對總體的代表性。,抽樣單元指構(gòu)成抽樣框的有限又不重復(fù)的個(gè)體。,1、抽樣單元不僅指構(gòu)成抽樣框的目錄項(xiàng),同時(shí)還表示該目錄項(xiàng)所對應(yīng)的實(shí)際

8、總體特定的一個(gè)或一些單元。 2、抽樣單元可大可小。 如:在手機(jī)調(diào)查中我們抽中一棟居民樓,居民樓是一級(jí)單元,而樓中的每個(gè)居民就是二級(jí)單元。,說明:,抽樣框的重要性,案例:1936年文學(xué)文摘的民意測量:從電話薄和車牌登記名單中選擇1000萬人,最后收到200萬人,預(yù)測出43% 的羅斯福支持率(實(shí)際是61%),思考:為什么預(yù)測不準(zhǔn)?,抽樣框選擇的不合理:只選擇了不成比例的富人樣本,而排除了窮人。,在大蕭條時(shí)期擁有汽車、電話的是富人,從電話薄和私人汽車登記薄上抽樣必然導(dǎo)致樣本中富人過多,而窮人基本上都為羅斯福新政投了贊成票。,案例啟示:錯(cuò)誤的抽樣框?qū)?dǎo)致調(diào)查的失敗,當(dāng)樣本框不恰當(dāng)時(shí),再大的樣本量也無濟(jì)

9、于事。,成功的對比:蓋洛普的配額抽樣,但喬治蓋洛普運(yùn)用抽樣調(diào)查,卻正確地預(yù)測到羅斯福當(dāng)選。 他之所以成功,是由于運(yùn)用了配額抽樣法,保證了樣本的代表性。配額抽樣是建立在了解抽樣總體性質(zhì)的基礎(chǔ)上,從各階層各種類型的人中按比例進(jìn)行抽樣。 此外,他還運(yùn)用了配額抽樣法,正確地預(yù)測了1940年和1944年大選的結(jié)果。,但是,在1948年,他用配額抽樣法也曾導(dǎo)致預(yù)測失敗,他預(yù)言共和黨侯選人戰(zhàn)勝民主黨侯選人,結(jié)果卻相反。 為什么呢?,主要原因是樣本的代表性出了偏差。 因?yàn)?948年,經(jīng)過二戰(zhàn),美國大量人口從農(nóng)村流向城市,而蓋洛普對人口總體的認(rèn)識(shí)仍停留在1940年的狀況。城市居民傾向于投民主黨的票,因此,樣本中

10、過大的農(nóng)村人口比例造成了對民主黨投票人數(shù)的過低估計(jì)。 在1948年,一些研究者開始采用隨機(jī)抽樣方法,結(jié)果比配額抽樣方法更成功。,3.抽樣誤差 因使用樣本而產(chǎn)生的誤差 抽樣必然會(huì)產(chǎn)生誤差,調(diào)查人員應(yīng)該做的不是消除誤差,而是通過提高設(shè)計(jì)的有效性、尋找更好的抽樣框、選擇更合適的抽樣方法來減少或控制抽樣誤差。,抽樣誤差影響因素,總 體,樣本,樣本容量大小,抽樣調(diào)查的方法,日期 10.3011.2 11.13 11.13 11.23 11.23 11.34 11.34 選舉結(jié)果,主辦機(jī)構(gòu) New York Times(紐約時(shí)報(bào)) Reuter(路透社) Harris Poll(哈里斯民意測驗(yàn)) ABC(

11、美國廣播公司) NBC(國家廣播公司) USA Today(今日美國報(bào)) Gallup(蓋洛普公司),克林頓 54 49 51 52 51 51 51 49,多爾 35 41 39 39 38 38 38 40,佩羅特 9 8 9 7 9 9 9 9,其他 2 2 1 2 2 2 2 2,候選人得票百分比,案例:美國1996年大選,調(diào)查研究總體:美國全體選民 調(diào)查訪問樣本:2000名選民,(11月5日公布),二、抽樣調(diào)查程序,確定目標(biāo)總體,確定抽樣框架和個(gè)體編號(hào),選擇抽樣樣本,實(shí)施調(diào)查,測算結(jié)果,(一)確定目標(biāo)總體,一種新品牌男士古龍香水的消費(fèi)者反映。,即明確調(diào)查的全部對象及其范圍。這是抽樣調(diào)

12、查的前提和基礎(chǔ)。清楚地說明研究對象的人口統(tǒng)計(jì)學(xué)特征(時(shí)間、地點(diǎn)、年齡范圍、收入范圍、性別等)。,(二)確定抽樣框架和個(gè)體編號(hào),依據(jù)已明確界定的總體范圍,收集總體中所有樣本單位的名單,建立供抽樣使用的抽樣框。完整的抽樣框架中,每個(gè)調(diào)查對象應(yīng)該出現(xiàn)一次,而且只能出現(xiàn)一次;抽樣框的不完整,往往會(huì)導(dǎo)致抽樣框誤差產(chǎn)生。 個(gè)體編號(hào),即對調(diào)查總體中的個(gè)體進(jìn)行編號(hào)。在概率抽樣中,需要對總體中的每一個(gè)個(gè)體進(jìn)行編號(hào),以使抽出的每一個(gè)個(gè)體更具有代表性。,包含盡可能多的樣本單位,所有樣本單位出現(xiàn)的概率相等,問:為了解重慶市中學(xué)生的飲料消費(fèi)情況,需要從全市500所中學(xué)中抽取10所中學(xué),再從每所抽中的中學(xué)中抽取3個(gè)班級(jí),

13、最后從每個(gè)抽中的班級(jí)中抽取10名中學(xué)生。需要選擇哪些抽樣框? 答:分別收集三個(gè)不同層次的抽樣框: 全市500所中學(xué)的名單; 每所抽中的中學(xué)里所有班級(jí)的名單; 每個(gè)抽中的班級(jí)中所有學(xué)生的名單。,以合理的成本選擇誤差最小的抽樣框,依據(jù)研究目的的要求、各種抽樣方法的特點(diǎn),以及其他限制因素決定采用哪種抽樣方法。,三、確定抽樣方法,考慮調(diào)查精確度的要求、總體性質(zhì)、抽樣方法和人力、財(cái)力等客觀條件確定樣本的大小。 其原則是:“代價(jià)小,代表性高。”,四、決定樣本大小,(三)選擇抽樣樣本,確定抽樣的技術(shù) 抽樣方法 樣本的數(shù)量 選擇樣本 合理地確定一個(gè)抽樣數(shù)目,既滿足抽樣誤差的要求,又使抽樣調(diào)查所需成本費(fèi)用最小。

14、樣本容量的確定原則是控制在必要的最低限度。,考慮調(diào)查精確度的要求、總體性質(zhì)、抽樣方法和人力、財(cái)力等客觀條件確定樣本的大小。 其原則是:“代價(jià)小,代表性高?!?在上述幾個(gè)步驟的基礎(chǔ)上,嚴(yán)格按照所選定的抽樣方法和數(shù)量,從抽樣框中抽取一個(gè)個(gè)的樣本單位,構(gòu)成樣本。,五、抽取樣本,如何確定替代受訪者:舍棄、過多抽樣、再抽樣,(四)實(shí)施調(diào)查,(五)測算結(jié)果,百分比推算法:根據(jù)樣本框架中不同調(diào)研結(jié)果所占比例推斷總體中的各比例結(jié)果。 平均數(shù)推算法:將調(diào)查的樣本結(jié)果加以平均,求出樣本平均數(shù),代入平均數(shù)推算公式,即 總體=總體個(gè)數(shù)X樣本平均數(shù),用樣本指標(biāo)推斷總體指標(biāo)的結(jié)果。,三、抽樣技術(shù)的分類及選擇,(一)隨機(jī)抽

15、樣技術(shù)及應(yīng)用,隨機(jī)抽樣:又叫概率抽樣,是對總體中每一個(gè)個(gè)體都給予平等的抽取機(jī)會(huì)的抽樣技術(shù)。,隨機(jī)原則:完全排除了人的主觀因素影響,使每一個(gè)單位都有同等的可能性被抽到 。,優(yōu)點(diǎn):,1、抽出樣本的分布情況接近總體,樣本對總體研究具有充分的代表性 。 2、有助于調(diào)查人員準(zhǔn)確地計(jì)算抽樣誤差,并有效的加以控制,從而提高調(diào)查的精度,1.簡單隨機(jī)抽樣,(1)定義 又叫純隨機(jī)抽樣,它是概率抽樣技術(shù)中最簡單的一種。它對調(diào)研總體不經(jīng)過任何分組、排隊(duì),完全憑著偶然的機(jī)會(huì)從中抽取個(gè)體加以調(diào)查。 適應(yīng)于調(diào)研總體中各個(gè)體之間差異較小且各個(gè)體數(shù)目較小的情況,或者調(diào)查對象不明,難以分組、分類時(shí)的情況。,指樣本單位的抽取不受主

16、觀因素及其他系統(tǒng)性因素的影響,每個(gè)總體單位都有均等的被抽中機(jī)會(huì),(2)常用方法 抽簽法:a、先編號(hào) b、再把相應(yīng)號(hào)碼寫在卡片上 c、任意抽選,直到抽足規(guī)定樣本數(shù) 適用于調(diào)查總數(shù)中個(gè)體數(shù)目少的情況。 搖號(hào)機(jī)法:使用專門的機(jī)器對事先編號(hào)的各樣本單位進(jìn)行選擇。適合于規(guī)模較大的總體。 隨機(jī)數(shù)碼表法:又稱亂數(shù)表法,先將總體中的全部個(gè)體分別標(biāo)上1到n個(gè)號(hào)碼,然后利用隨機(jī)數(shù)表隨機(jī)抽出所需的樣本。,例:從300人中抽取10人,用隨機(jī)數(shù)表法,如何抽取?,總體單位數(shù)目為300,樣本單位數(shù)目為10。利用隨機(jī)數(shù)表進(jìn)行抽樣,其程序如下: 第一步:給總體各單位編號(hào),號(hào)碼的位數(shù)要一致,都是三位,不夠位的在前加“0”,總體各

17、單位編號(hào)是從001-300。 第二步:以隨機(jī)數(shù)表中第二行,第三列的數(shù)字“0”作起點(diǎn),往后取兩位數(shù)字,構(gòu)成一個(gè)與總體單位具有相同位數(shù)的號(hào)碼“093”作為起始號(hào)碼。 第三步:從起始號(hào)碼開始,從左到右依次抽取10個(gè)不重復(fù)的位于001-300之間的號(hào)碼,分別是:093,240,006,120,143,254,085,047,164,148,特點(diǎn):在差異較大的總體中,簡單隨機(jī)抽樣的樣本不一定能保證樣本的代表性。,(3)簡單隨機(jī)抽樣的適用性,優(yōu)點(diǎn): 方法簡單、直觀,理論上是最符合隨機(jī)原則的。 每個(gè)樣本單位被抽取的概率相同,易估計(jì)總體指標(biāo) 適合與其他抽樣方法結(jié)合使用 缺點(diǎn): 要求有總體的完整列表且預(yù)編碼,樣

18、本較大時(shí)編號(hào)困難; 總體的差異較大時(shí),樣本能否代表目標(biāo)總體; 抽出的樣本分散,人力、物力、費(fèi)用消耗較大 某些事物無法使用簡單隨機(jī)抽樣(連續(xù)生產(chǎn)的產(chǎn)品檢驗(yàn)),2.系統(tǒng)或等距隨機(jī)抽樣,標(biāo)志可以是有關(guān)標(biāo)志(誤差小),也可以是無關(guān)標(biāo)志,(1)定義 首先要選擇標(biāo)志將調(diào)查對象的全部個(gè)體按一定順序排隊(duì),其次依簡單隨機(jī)抽樣方式從總體中抽取第一個(gè)樣本點(diǎn),即隨機(jī)起點(diǎn),然后依據(jù)按某種固定順序和規(guī)律(抽樣間隔)依次抽取其余樣本點(diǎn),最終構(gòu)成系統(tǒng)樣本。,按有關(guān)標(biāo)志:比簡單隨機(jī)抽樣更具代表性,按無關(guān)標(biāo)志:等同于簡單隨機(jī)抽樣,(2)操作辦法,將所有樣本單位按某種標(biāo)志排列,并連續(xù)編號(hào) 一種是按與調(diào)查項(xiàng)目無關(guān)的標(biāo)志排隊(duì),如按照門

19、牌號(hào)排列。 一種是按與調(diào)查項(xiàng)目有關(guān)的標(biāo)志排隊(duì),如按收入給家庭排序。,排隊(duì)標(biāo)志,抽樣間隔,抽選方法,計(jì)算抽樣間隔(距離): A=調(diào)研總體數(shù)N/樣本數(shù)n(遇小數(shù)四舍五入);,在第一段距離中,完全隨機(jī)地抽取一個(gè)號(hào)碼,設(shè)其所在位置的序號(hào)是 a; 自 a開始,每隔 A個(gè)樣本單位抽取一個(gè),即所抽取的樣本單位所在位置的編號(hào)依次為:a,a+A,a+2A,。a+(n-1)A,1 2 3 4 5 6 7 8 9 10,11 12 13 14 15 16 17 18 19 20,21 22 23 24 25 26 27 28 29 30,31 32 33 34 35 36 37 38 39 40,41 42 43

20、44 45 46 47 48 49 50,51 52 53 54 55 56 57 58 59 60,61 62 63 64 65 66 67 68 69 70,71 72 73 74 75 76 77 78 79 80,N=90,n=10, 則:A=90/10 =9;設(shè)a=6,81 82 83 84 85 86 87 88 89 90,舉例,舉例:某居委會(huì)擁有居民720戶,在某次市場調(diào)查中需在這一居委會(huì)的居民中抽取10戶樣本單元。,若第一個(gè)樣本為051,則051,123,195, 267,339,411,483,555,627,699;,若第一個(gè)樣本為102,則102,174,246,318

21、,390,462,534,606,678,(750,),練 習(xí),某城市有私營企業(yè)5989個(gè),擬定樣本量為100個(gè),進(jìn)行企業(yè)營銷狀況調(diào)查。請問如何使用系統(tǒng)抽樣方法進(jìn)行抽樣?,1、按照5889個(gè)私營企業(yè)的年銷售額(或職工人數(shù)、利潤總額等)進(jìn)行排序; 2、計(jì)算抽樣距離:K=5989/100=59.89,約等于60; 3、采用簡單隨機(jī)方法在160號(hào)中抽取一個(gè)號(hào)碼作為第一個(gè)樣本單位,如28; 4、以序號(hào)28為起點(diǎn),依照抽樣距離確定所抽取的其他樣本單位編號(hào)為:88,148,208,。,直到抽足100個(gè)樣本單位為止。,優(yōu)點(diǎn): 抽中的樣本比較均勻的分布在總體中,利于推算總體目標(biāo)量,是應(yīng)用廣泛的一種抽樣方式。

22、缺點(diǎn): 前提是要有總體每個(gè)單位的相關(guān)資料,特別是按有關(guān)標(biāo)志排隊(duì)時(shí),需要更詳細(xì)、具體的相關(guān)資料,這是一項(xiàng)復(fù)雜和細(xì)致的工作。 當(dāng)抽選間隔和被調(diào)查對象本身的節(jié)奏性(或循環(huán)周期)重合時(shí),會(huì)影響調(diào)查精度。,國家統(tǒng)計(jì)局的調(diào)查多采用系統(tǒng)抽樣,它便于操作。,3.分層隨機(jī)抽樣,(1)定義 是先將調(diào)研總體的所有個(gè)體按某一重要特征或標(biāo)志(如性別、年齡、職業(yè)或地域等)進(jìn)行分類(組),然后在各類(組)中采用簡單隨機(jī)抽樣方式或系統(tǒng)抽樣方式抽取樣本個(gè)體的一種抽樣方式。 (*與系統(tǒng)抽樣不同,只能按有關(guān)標(biāo)志來分組) 分層時(shí): 層間差異性要明顯,避免發(fā)生混淆; 要知道各層中的個(gè)體數(shù)目和比例; 分層數(shù)目不宜過多,每個(gè)層次內(nèi)的各個(gè)個(gè)

23、體應(yīng)保持一致性。,2.1.3,(2)操作辦法 確定分層的標(biāo)志,如年齡、收入、職業(yè); 將總體(N)分成若干個(gè)互不重疊的部分(N1,N2,N3),每一部分為一層(相互獨(dú)立,同層同質(zhì)異層異質(zhì)); 根據(jù)樣本量(n)大小,確定各層應(yīng)抽取的樣本量(n1,n2,n3) 各層子樣本構(gòu)成調(diào)查樣本,(3)分層隨機(jī)抽樣的形式 等比例分層抽樣 按各層(或各類)中的個(gè)體數(shù)目占總體數(shù)量的比例分配各層的樣本數(shù)量。 此方式簡便易行、分配合理,適應(yīng)于層內(nèi)差異較小的情況。,N=100000,n=1000,分層等比例抽樣,ni/n = Ni/N,練習(xí),某地調(diào)查商業(yè)網(wǎng)點(diǎn)銷售情況。該地區(qū)有商業(yè)網(wǎng)點(diǎn)20000個(gè),計(jì)劃抽取樣本200個(gè)。按

24、企業(yè)規(guī)模分層,大型商店1500個(gè),中型商店8500個(gè),小型商店10000個(gè)。采用分層比例抽樣法,應(yīng)從各層選取多少個(gè)樣本單位?,答案,大型商店應(yīng)選取樣本數(shù):,n中=(8500/20000)*200=85(個(gè)),小型商店應(yīng)選取樣本數(shù):,n大=(1500/20000)*200=15 (個(gè)),中型商店應(yīng)選取樣本數(shù):,n小=(10000/20000)*200=100(個(gè)),非等比例分層抽樣 不是按各層中個(gè)體數(shù)占總體數(shù)的比例分配樣本個(gè)數(shù),而是根據(jù)其他因素(層內(nèi)均方差、抽樣工作量和費(fèi)用大小等)調(diào)整各層的樣本個(gè)體數(shù),即有的層可多抽些樣本個(gè)體,有的可少抽些樣本個(gè)體。 適用于各層的單位數(shù)目相差懸殊,或?qū)觾?nèi)方差較大

25、的 情形,N=100000,n=1000,分層非等比例抽樣(分層最佳抽樣),考慮各層在總體中比例、重要性、層內(nèi)標(biāo)準(zhǔn)差計(jì)算抽取比例,ni/n = Ni*Si/ Ni*Si,(3)分層隨機(jī)抽樣的優(yōu)缺點(diǎn) 優(yōu)點(diǎn):一是在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣的精度;二是非常便于了解總體內(nèi)不同層次的情況,便于對總體中不同的層次或類別進(jìn)行單獨(dú)研究,或者進(jìn)行比較。 缺點(diǎn):“分層注意”,特點(diǎn):層內(nèi)同質(zhì),層間異質(zhì) 分層抽樣在層內(nèi)是抽樣調(diào)查,層間是全面調(diào)查,所以分層時(shí)應(yīng)該盡量讓每層內(nèi)的變異程度小,而層間的變異程度大。 (因此分層要全面考慮,而分層的首要目標(biāo)就是達(dá)到同質(zhì)性) 。,4.分群隨機(jī)抽樣,(1)定義 又

26、稱整群抽樣、集團(tuán)抽樣、群體抽樣,是指將總體各個(gè)單位按一定標(biāo)準(zhǔn)劃分成若干群,然后以群為單位,從中隨機(jī)抽取一些群,對選中的群進(jìn)行普查。 與分層抽樣相反,其在群內(nèi)是全面調(diào)查,在群間是抽樣調(diào)查。 分群原則: 應(yīng)選擇能使群間差異小,而群內(nèi)差異大的標(biāo)志作為分群標(biāo)志。,適用于: 不同子群相互之間差別不大,而每個(gè)子群內(nèi)部的異質(zhì)性程度比較大-層內(nèi)異質(zhì),層間同質(zhì)(與分層抽樣相反) 當(dāng)我們不可能或不方便編制一個(gè)完整的名單形成目標(biāo)總體的時(shí)候,可以使用整群抽樣。 如對城市的人口進(jìn)行抽樣的時(shí)候,沒有整個(gè)城市的人的名冊,可以先選出幾個(gè)街道樣本,對街道中的所有戶進(jìn)行抽樣。,(2)方式 對總體分群,每群個(gè)體數(shù)可以相等,也可以不

27、相等。 采用簡單隨機(jī)抽樣或系統(tǒng)抽樣方式抽選群體。 對抽中的群體的所有個(gè)體調(diào)查。,示意圖:,優(yōu)點(diǎn) 抽取樣本比較簡單方便,樣本比較集中,時(shí)間費(fèi)用少 缺點(diǎn) 樣本集中在某些群,不能均勻分布在總體,如果群體間差異較大或每群中個(gè)體的特征非常相似,則抽樣誤差會(huì)增大,此方法的可靠程度,主要取決于群與群之間的差異性大小。在大規(guī)模市場調(diào)查時(shí),當(dāng)群內(nèi)各個(gè)體間差異較大,而群間差異較小時(shí),最適合采用分群抽樣。,比較分層抽樣和整群抽樣,通信公司將對某大學(xué)學(xué)生的通信消費(fèi)狀況進(jìn)行調(diào)查,樣本容量為800個(gè)。公司對該大學(xué)的學(xué)生情況不太了解,而且很難得到所有大學(xué)生的人員清單。但他們通過努力,獲得了該學(xué)校所有班級(jí)的名單。為此,研究人

28、員擬采用何種抽樣方法?其步驟是?,練習(xí),答:采取整群抽樣法。其步驟是: 1、對該大學(xué)的學(xué)生以班級(jí)分成若干群; 2、隨機(jī)抽取20個(gè)班級(jí)(群); 3、獲取被抽取班級(jí)的人員清單; 4、對該20個(gè)班級(jí)進(jìn)行普查,獲得最終樣本。,(1)定義 又稱多級(jí)抽樣或分段抽樣,它是按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣過程分為幾個(gè)階段進(jìn)行。 在社會(huì)調(diào)查中,當(dāng)總體規(guī)模特別大,或者總體分布的范圍特別廣時(shí),研究者一般采取多段抽樣的方法抽取樣本。,5.多階段抽樣,(2)操作步驟,從總體中隨機(jī)抽取若干大群(子群); 再從這幾個(gè)大群內(nèi)抽取幾個(gè)小群,這樣一層層抽下來,直至抽到最基本的樣本單位為止。,例,(3)特點(diǎn) 抽樣單位的抽選不

29、是一步到位,而是分階段抽樣。 組織方便,對于總體單位多且分散的情況更有效。 在上述每個(gè)階段的抽樣中,都要采用簡單隨機(jī)抽樣或等距抽樣或分層抽樣的方法進(jìn)行。,案例: 99 尼爾森全國零售調(diào)研,案 例,某市有24000名教師,分布在全市10個(gè)區(qū)的200所學(xué)校中?,F(xiàn)要抽取一個(gè)由1200名教師組成的樣本,了解他們的住房需求。如果按照三階段抽樣的方法,有以下各種不同的抽樣選擇。請?jiān)u價(jià)以下哪個(gè)方案為優(yōu)?,案例小結(jié),B 如果又已知各抽樣階段子總體的差異程度 如果區(qū)與區(qū)之間差別很大,則所抽的區(qū)的規(guī)模就要大一些,如方案1;反之,則小一點(diǎn); 如果區(qū)與區(qū)之間差別不大,而在每一個(gè)區(qū)中,不同學(xué)校差別很大,則減小第一階段的

30、抽樣規(guī)模,加大第二階段的抽樣規(guī)模,如方案3; 如區(qū)與區(qū)之間差別不大,且學(xué)校與學(xué)校之間差別也不大,則盡量加大第三階段的抽樣規(guī)模,相應(yīng)減小第一、第二階段的抽樣規(guī)模,如方案8或9。,A 如果考慮樣本具有較好的代表性 一般來說,樣本覆蓋的面越大,樣本的代表性越好。則方案3最好,依次遞減,方案9最差;方案1、2居中;,D 綜合考慮抽樣誤差和調(diào)查成本 相對增加開頭階段的樣本數(shù),適當(dāng)減少最后階段的樣本數(shù)。也就是說,在人力、經(jīng)費(fèi)和時(shí)間允許的情況下,可選擇方案4、5。,C 考慮研究者所擁有的人力和經(jīng)費(fèi) 抽的區(qū)和學(xué)校越多,意味著所需的人力、經(jīng)費(fèi)和時(shí)間就越多。從這個(gè)方面考慮,則方案9最好,依次遞減,方案3最差。,(

31、二)非隨機(jī)抽樣技術(shù)及應(yīng)用,非隨機(jī)抽樣 不遵循隨機(jī)原則,從方便出發(fā)或根據(jù)主觀判斷來抽取樣本。,簡單易行,尤其適用于做探索性研究,無法估計(jì)和控制抽樣誤差,無法用樣本的定量資料,采用統(tǒng)計(jì)方法來推斷總體,優(yōu)點(diǎn):,缺點(diǎn):,非隨機(jī)抽樣技術(shù)有四種:方便抽樣、判斷抽樣、配額抽樣、雪球抽樣,1.任意抽樣,(1)定義 任意抽樣:又稱偶遇抽樣,即從調(diào)研人員工作方便出發(fā),在調(diào)研對象范圍內(nèi)隨意抽選一定數(shù)量的樣本進(jìn)行調(diào)查。 如:如在商店門口、街頭路口、車站碼頭、公園廣場等公共場所,隨便選取某些顧客、行人、旅客、觀眾等 。 (2)兩種方法 街頭攔人法:在街上或路口任意找某個(gè)行人,將他(她)作為被訪者,進(jìn)行調(diào)查。 空間抽樣法

32、:對某一聚集的人群,從空間的不同方向和方位對他們進(jìn)行抽樣調(diào)查。 (4)特點(diǎn) 簡便易行,節(jié)約時(shí)間和費(fèi)用; 要求調(diào)研總體同質(zhì)性高 樣本的代表性較差,具有很大的偶然性,2.判斷抽樣,調(diào)查者根據(jù)自己的主觀印象、以往的經(jīng)驗(yàn)和對調(diào)查對象的了解從總體中選擇“最符合調(diào)查對象特征”的原則來確定調(diào)查樣本。 前提是研究人員須對總體的有關(guān)特征有相當(dāng)高的了解,此法在我國市場調(diào)研中得到廣泛運(yùn)用。 不同于任意抽樣的“最方便”,而是“最合適”。,方法,1、選擇最能代表普遍情況的調(diào)查對象,分平均型和多數(shù)型。 平均型:選擇代表平均水平的樣本。 多數(shù)型:選擇代表多數(shù)水平的樣本。 2、利用調(diào)查總體的全面統(tǒng)計(jì)資料,按照一定標(biāo)準(zhǔn)選擇樣本

33、。,3.配額抽樣,(1)定義 首先將總體中的所有單位按一定的標(biāo)志分為若干類(組),然后在每個(gè)類(組)中用方便抽樣或判斷抽樣方法選取樣本單位。 采用配額抽樣,首先對總體中所有單位按其屬性、特征分類,這些屬性、特性稱為“控制特征”(如性別、年齡、收入、職業(yè)、文化程度等),然后按各個(gè)控制特征分配樣本數(shù)額。 它與分層抽樣的區(qū)別在于: 分層抽樣是按照隨機(jī)原則在層內(nèi)抽取樣本; 配額抽樣是由調(diào)查人員在配額內(nèi)主觀判斷選定樣本。,根據(jù)配額的要求不同,配額抽樣可分為:獨(dú)立控制配額抽樣、非獨(dú)立控制配額抽樣,優(yōu)點(diǎn):簡單易行,選擇余地較大; 缺點(diǎn):選擇樣本過于偏向某一組別,影響樣本代表性。,某市進(jìn)行空調(diào)器消費(fèi)需求調(diào)查,

34、確定樣本容量為200名,選擇消費(fèi)者收入、年齡、性別三個(gè)標(biāo)準(zhǔn)為控制特征進(jìn)行獨(dú)立控制配額抽樣,其各個(gè)樣本配額比例及配額數(shù)如下表所示。,獨(dú)立控制配額抽樣: 是根據(jù)調(diào)研總體的不同特性,對具有某個(gè)特性的調(diào)查樣本分別規(guī)定單獨(dú)分配數(shù)額,而不規(guī)定必須同時(shí)具有兩種或兩種以上特性的樣本數(shù)額。,非獨(dú)立控制配額抽樣: 又稱交叉控制配額抽樣,是同時(shí)對兩種或者兩種以上控制特征的每一個(gè)樣本數(shù)目都做出具體規(guī)定。,上例中如果采用交叉控制配額抽樣,就必須對收入、年齡、性別這三項(xiàng)特性同時(shí)規(guī)定樣本分配數(shù)額,其配額如下表所示。,優(yōu)點(diǎn):調(diào)查面較廣,提高了樣本代表性; 缺點(diǎn):操作復(fù)雜。,舉例:,4.滾雪球抽樣,(1)定義 以“滾雪球”的方

35、式抽取樣本,即以少量樣本為基礎(chǔ),逐漸擴(kuò)大樣本的規(guī)模,直至找出足夠的樣本。 前提:總體樣本單位之間具有一定的聯(lián)系。 (2)基本步驟 找出少量樣本單位;(通常采用隨機(jī)方式) 通過這些少量樣本了解更多的樣本單位; 再通過更多的樣本單位去了解更多更多的樣本單位; 如此類推,如同滾雪球,使調(diào)查結(jié)果愈來愈接近總體。,例如,要研究退休老人的生活,可以清晨到公園去結(jié)識(shí)幾位散步老人再通過他們結(jié)識(shí)其朋友,不用很久,你就可以交上一大批老年朋友。,(3)優(yōu)缺點(diǎn) 優(yōu): 有針對性,且樣本個(gè)體間相似性強(qiáng)。 抽樣誤差較小,成本較低。 缺: 樣本單位之間須有一定的聯(lián)系,且愿意提供此聯(lián)系。,總結(jié),非概率抽樣,常用于概念測試、包裝測試、名稱測試等,這些測試通常不需要對總體的推論 概率抽樣,當(dāng)需要對整個(gè)市場的市場份額或銷售容量做出高度精確的估計(jì)時(shí),非概率抽樣的樣本設(shè)計(jì)不是基于精確概率,但是依然追求樣本的代表性!,四、確定樣本容量,(一)樣本容量: 樣本所含個(gè)體數(shù)量的多少。,總體越大,樣本容量越大嗎? 樣本容量最少需要滿足多少數(shù)量? 從統(tǒng)計(jì)意義上看,選擇多少樣本容量比較合適? 成本因素如何在確定樣本容量時(shí)得到體現(xiàn)?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論