第四章-抽樣調(diào)查.ppt_第1頁
第四章-抽樣調(diào)查.ppt_第2頁
第四章-抽樣調(diào)查.ppt_第3頁
第四章-抽樣調(diào)查.ppt_第4頁
第四章-抽樣調(diào)查.ppt_第5頁
免費預覽已結(jié)束,剩余78頁可下載查看

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、第五章 抽樣調(diào)查,生活常識 為什么要知道一個人的血液情況,只需抽一點點血來化驗就行了? 由部分認識總體 同質(zhì)和異質(zhì),一天,爸爸叫兒子小華去買一盒火柴。臨出門前,爸爸囑咐兒子要買能劃燃的火柴。小華拿著錢出門了,過了好一會兒,小華才回到家。 “火柴能劃燃嗎?”爸爸問。 “都能劃燃?!?“你這么肯定?” 小華遞過一盒劃過的火柴,興奮地說:“我每根都試過啦?!?生活小片段,思考:得到火柴能否劃燃的信息準確嗎? 這樣做有什么后果?,問1:在這則笑話中,兒子采用的是什么調(diào)查方式?,全面調(diào)查,問2:這種調(diào)查方式好不好?還可采用什么方法調(diào)查?,抽樣調(diào)查,調(diào)查方式的選擇,下列調(diào)查中,你認為應該采用哪種調(diào)查方式,

2、并說出自己選擇這一觀點的理由。,(1)了解你們班同學周末時間是如何安排的; (2)了解一批圓珠筆芯的使用壽命; (3)了解我國八年級學生的視力情況; (4)要保證嫦娥三號衛(wèi)星的成功發(fā)射,對重要零部件采用何種方式檢查; (5)全國中學生的節(jié)水意識; (6)中央電視臺春節(jié)聯(lián)歡晚會的收視率。,通過調(diào)查總體來收集數(shù)據(jù),調(diào)查的結(jié)果準確。,工作量大,難度大,而且有些調(diào)查不宜使用普查,通過調(diào)查樣本來收集數(shù)據(jù),工作量較小,便于進行。,調(diào)查結(jié)果往往不如普查得到的結(jié)果準確,普查與抽樣調(diào)查的比較,思考學習,為了了解你所在地區(qū)老年人的健康狀況,你準備怎樣收集數(shù)據(jù)? 下面分別是A、B、C三個小組的調(diào)查結(jié)果:,A:小組在

3、公園里調(diào)查了100名老年人,他們一年中生病的次數(shù)如圖所示:,B:小組在醫(yī)院調(diào)查了100名老年病人,他們一年中生病的次數(shù)如圖所示:,C:小組調(diào)查了10名老年鄰居,他們一年中生病的次數(shù)如下表所示:,感悟與反思:,抽樣調(diào)查只考察總體的一部分個體,因此它的優(yōu)點是調(diào)查范圍小,節(jié)省時間、人力、物力和財力,但其調(diào)查結(jié)果往往不如普查得到的結(jié)果準確。 為了獲得較為準確的調(diào)查結(jié)果,抽樣時要注意樣本的代表性和廣泛性.,大樣本一定能保證調(diào)查結(jié)論準確嗎 1936年美國總統(tǒng)競選時,文學文摘向1000萬選民寄去了調(diào)查問卷,這些選民的名單是從電話簿、俱樂部名冊以及雜志的訂戶中挑選的.結(jié)果在寄出的1000萬份調(diào)查問卷中,約有2

4、40萬的選民寄回了調(diào)查表.根據(jù)這部分選民的回答,文學文摘預測共和黨的布蘭登將當選。選舉那天的結(jié)果完全出乎他們的意料,選民中只有38%投了共和黨的票,而民主黨的羅斯福以多數(shù)票當選。文學文摘采用了1000萬的巨大樣本,為何會預測失敗呢? 原來20世紀30年代是美國經(jīng)濟衰退的時期,那時能夠安裝電話、加入上流社會俱樂部或能訂閱雜志的美國人,大部分支持共和黨。也就是說文學文摘選擇的樣本雖然巨大卻存在偏差,樣本不具有廣泛性和代表性。 文學文摘的事例表明抽樣調(diào)查時,既要關(guān)注樣本的大小,又要關(guān)注樣本的代表性。那是不是在樣本具有代表性的情況下,樣本越大越好呢?一般來說,在樣本具有代表性的情況下,樣本增大,所得結(jié)

5、果誤差會減小。但是當樣本大到一定程度之后,再增加樣本,精確度的增加卻是微小的,同時巨大的樣本不僅耗資太大,也不便于管理。因此在進行抽樣調(diào)查時,關(guān)鍵在于精心設計抽樣方案,選擇有代表性的樣本,這樣,只用較少的經(jīng)費,就可能作出接近真實情況的預測。,(一)概念 抽樣調(diào)查是按照一定程序,從調(diào)查總體中抽取部分樣本進行調(diào)查或觀察,用所獲取的數(shù)據(jù)對總體的數(shù)量特征進行估計和推斷。 抽樣調(diào)查是目前國際上公認和普遍采用的科學的調(diào)查手段。 抽樣調(diào)查旨在以樣本資料來推斷調(diào)查對象總體的相關(guān)統(tǒng)計數(shù)據(jù)。,一、抽樣調(diào)查概述,總體,樣本,樣本統(tǒng)計量 (X),總體參數(shù)估計,(二)相關(guān)術(shù)語 1.總體與樣本 總體:是所要調(diào)查的全體。一

6、般用“ N ”表示。 樣本:是總體的一部分,是從總體中按一定的程序抽選出來的個體或單元組合。一般用“ n ”表示。,某市在12萬名大學生中抽出1000人進行消費結(jié)構(gòu)調(diào)查。,認識:,總體:12萬名大學生。 樣本:被抽到的1000名大學生。,學校的全體學生的愛好情況是我們要考察的全體對象,稱為總體。,所有實際被調(diào)查的學生的愛好情況組成一個樣本。,總體中每一個考察對象叫做個體,樣本的個數(shù)稱為樣本容量,在一次考前摸底考試中,考生有2萬名。怎樣才能既省時又省力的了解到這些考生的英語平均成績呢?,總體是; 個體是; 樣本是; 樣本的容量是。,萬名考生英語成績,其中每名考生的英語成績,所抽取的名考生的英語成

7、績,深化認識,2、抽樣框與抽樣單元,抽樣框:指對可以供抽樣用的所有調(diào)查單位的名冊或詳細名單。,抽樣框的主要形式有三種: 名單抽樣框 區(qū)域抽樣框 時間表抽樣框。,認識:,例如:要從10000名職工中抽出200名組成一個樣本,則10000名職工的名冊,就是抽樣框。,常見的抽樣框:大學學生花名冊、城市黃頁里的電話列表、工商企業(yè)名錄、街道派出所里居民戶籍冊、意向購房人信息冊。,注意:,在利用現(xiàn)有的名單作為抽樣框時,要先對該名錄進行檢查,避免有重復、遺漏的情況發(fā)生。以提高樣本對總體的代表性。,抽樣單元指構(gòu)成抽樣框的有限又不重復的個體。,1、抽樣單元不僅指構(gòu)成抽樣框的目錄項,同時還表示該目錄項所對應的實際

8、總體特定的一個或一些單元。 2、抽樣單元可大可小。 如:在手機調(diào)查中我們抽中一棟居民樓,居民樓是一級單元,而樓中的每個居民就是二級單元。,說明:,抽樣框的重要性,案例:1936年文學文摘的民意測量:從電話薄和車牌登記名單中選擇1000萬人,最后收到200萬人,預測出43% 的羅斯福支持率(實際是61%),思考:為什么預測不準?,抽樣框選擇的不合理:只選擇了不成比例的富人樣本,而排除了窮人。,在大蕭條時期擁有汽車、電話的是富人,從電話薄和私人汽車登記薄上抽樣必然導致樣本中富人過多,而窮人基本上都為羅斯福新政投了贊成票。,案例啟示:錯誤的抽樣框?qū)е抡{(diào)查的失敗,當樣本框不恰當時,再大的樣本量也無濟

9、于事。,成功的對比:蓋洛普的配額抽樣,但喬治蓋洛普運用抽樣調(diào)查,卻正確地預測到羅斯福當選。 他之所以成功,是由于運用了配額抽樣法,保證了樣本的代表性。配額抽樣是建立在了解抽樣總體性質(zhì)的基礎上,從各階層各種類型的人中按比例進行抽樣。 此外,他還運用了配額抽樣法,正確地預測了1940年和1944年大選的結(jié)果。,但是,在1948年,他用配額抽樣法也曾導致預測失敗,他預言共和黨侯選人戰(zhàn)勝民主黨侯選人,結(jié)果卻相反。 為什么呢?,主要原因是樣本的代表性出了偏差。 因為1948年,經(jīng)過二戰(zhàn),美國大量人口從農(nóng)村流向城市,而蓋洛普對人口總體的認識仍停留在1940年的狀況。城市居民傾向于投民主黨的票,因此,樣本中

10、過大的農(nóng)村人口比例造成了對民主黨投票人數(shù)的過低估計。 在1948年,一些研究者開始采用隨機抽樣方法,結(jié)果比配額抽樣方法更成功。,3.抽樣誤差 因使用樣本而產(chǎn)生的誤差 抽樣必然會產(chǎn)生誤差,調(diào)查人員應該做的不是消除誤差,而是通過提高設計的有效性、尋找更好的抽樣框、選擇更合適的抽樣方法來減少或控制抽樣誤差。,抽樣誤差影響因素,總 體,樣本,樣本容量大小,抽樣調(diào)查的方法,日期 10.3011.2 11.13 11.13 11.23 11.23 11.34 11.34 選舉結(jié)果,主辦機構(gòu) New York Times(紐約時報) Reuter(路透社) Harris Poll(哈里斯民意測驗) ABC(

11、美國廣播公司) NBC(國家廣播公司) USA Today(今日美國報) Gallup(蓋洛普公司),克林頓 54 49 51 52 51 51 51 49,多爾 35 41 39 39 38 38 38 40,佩羅特 9 8 9 7 9 9 9 9,其他 2 2 1 2 2 2 2 2,候選人得票百分比,案例:美國1996年大選,調(diào)查研究總體:美國全體選民 調(diào)查訪問樣本:2000名選民,(11月5日公布),二、抽樣調(diào)查程序,確定目標總體,確定抽樣框架和個體編號,選擇抽樣樣本,實施調(diào)查,測算結(jié)果,(一)確定目標總體,一種新品牌男士古龍香水的消費者反映。,即明確調(diào)查的全部對象及其范圍。這是抽樣調(diào)

12、查的前提和基礎。清楚地說明研究對象的人口統(tǒng)計學特征(時間、地點、年齡范圍、收入范圍、性別等)。,(二)確定抽樣框架和個體編號,依據(jù)已明確界定的總體范圍,收集總體中所有樣本單位的名單,建立供抽樣使用的抽樣框。完整的抽樣框架中,每個調(diào)查對象應該出現(xiàn)一次,而且只能出現(xiàn)一次;抽樣框的不完整,往往會導致抽樣框誤差產(chǎn)生。 個體編號,即對調(diào)查總體中的個體進行編號。在概率抽樣中,需要對總體中的每一個個體進行編號,以使抽出的每一個個體更具有代表性。,包含盡可能多的樣本單位,所有樣本單位出現(xiàn)的概率相等,問:為了解重慶市中學生的飲料消費情況,需要從全市500所中學中抽取10所中學,再從每所抽中的中學中抽取3個班級,

13、最后從每個抽中的班級中抽取10名中學生。需要選擇哪些抽樣框? 答:分別收集三個不同層次的抽樣框: 全市500所中學的名單; 每所抽中的中學里所有班級的名單; 每個抽中的班級中所有學生的名單。,以合理的成本選擇誤差最小的抽樣框,依據(jù)研究目的的要求、各種抽樣方法的特點,以及其他限制因素決定采用哪種抽樣方法。,三、確定抽樣方法,考慮調(diào)查精確度的要求、總體性質(zhì)、抽樣方法和人力、財力等客觀條件確定樣本的大小。 其原則是:“代價小,代表性高?!?四、決定樣本大小,(三)選擇抽樣樣本,確定抽樣的技術(shù) 抽樣方法 樣本的數(shù)量 選擇樣本 合理地確定一個抽樣數(shù)目,既滿足抽樣誤差的要求,又使抽樣調(diào)查所需成本費用最小。

14、樣本容量的確定原則是控制在必要的最低限度。,考慮調(diào)查精確度的要求、總體性質(zhì)、抽樣方法和人力、財力等客觀條件確定樣本的大小。 其原則是:“代價小,代表性高?!?在上述幾個步驟的基礎上,嚴格按照所選定的抽樣方法和數(shù)量,從抽樣框中抽取一個個的樣本單位,構(gòu)成樣本。,五、抽取樣本,如何確定替代受訪者:舍棄、過多抽樣、再抽樣,(四)實施調(diào)查,(五)測算結(jié)果,百分比推算法:根據(jù)樣本框架中不同調(diào)研結(jié)果所占比例推斷總體中的各比例結(jié)果。 平均數(shù)推算法:將調(diào)查的樣本結(jié)果加以平均,求出樣本平均數(shù),代入平均數(shù)推算公式,即 總體=總體個數(shù)X樣本平均數(shù),用樣本指標推斷總體指標的結(jié)果。,三、抽樣技術(shù)的分類及選擇,(一)隨機抽

15、樣技術(shù)及應用,隨機抽樣:又叫概率抽樣,是對總體中每一個個體都給予平等的抽取機會的抽樣技術(shù)。,隨機原則:完全排除了人的主觀因素影響,使每一個單位都有同等的可能性被抽到 。,優(yōu)點:,1、抽出樣本的分布情況接近總體,樣本對總體研究具有充分的代表性 。 2、有助于調(diào)查人員準確地計算抽樣誤差,并有效的加以控制,從而提高調(diào)查的精度,1.簡單隨機抽樣,(1)定義 又叫純隨機抽樣,它是概率抽樣技術(shù)中最簡單的一種。它對調(diào)研總體不經(jīng)過任何分組、排隊,完全憑著偶然的機會從中抽取個體加以調(diào)查。 適應于調(diào)研總體中各個體之間差異較小且各個體數(shù)目較小的情況,或者調(diào)查對象不明,難以分組、分類時的情況。,指樣本單位的抽取不受主

16、觀因素及其他系統(tǒng)性因素的影響,每個總體單位都有均等的被抽中機會,(2)常用方法 抽簽法:a、先編號 b、再把相應號碼寫在卡片上 c、任意抽選,直到抽足規(guī)定樣本數(shù) 適用于調(diào)查總數(shù)中個體數(shù)目少的情況。 搖號機法:使用專門的機器對事先編號的各樣本單位進行選擇。適合于規(guī)模較大的總體。 隨機數(shù)碼表法:又稱亂數(shù)表法,先將總體中的全部個體分別標上1到n個號碼,然后利用隨機數(shù)表隨機抽出所需的樣本。,例:從300人中抽取10人,用隨機數(shù)表法,如何抽?。?總體單位數(shù)目為300,樣本單位數(shù)目為10。利用隨機數(shù)表進行抽樣,其程序如下: 第一步:給總體各單位編號,號碼的位數(shù)要一致,都是三位,不夠位的在前加“0”,總體各

17、單位編號是從001-300。 第二步:以隨機數(shù)表中第二行,第三列的數(shù)字“0”作起點,往后取兩位數(shù)字,構(gòu)成一個與總體單位具有相同位數(shù)的號碼“093”作為起始號碼。 第三步:從起始號碼開始,從左到右依次抽取10個不重復的位于001-300之間的號碼,分別是:093,240,006,120,143,254,085,047,164,148,特點:在差異較大的總體中,簡單隨機抽樣的樣本不一定能保證樣本的代表性。,(3)簡單隨機抽樣的適用性,優(yōu)點: 方法簡單、直觀,理論上是最符合隨機原則的。 每個樣本單位被抽取的概率相同,易估計總體指標 適合與其他抽樣方法結(jié)合使用 缺點: 要求有總體的完整列表且預編碼,樣

18、本較大時編號困難; 總體的差異較大時,樣本能否代表目標總體; 抽出的樣本分散,人力、物力、費用消耗較大 某些事物無法使用簡單隨機抽樣(連續(xù)生產(chǎn)的產(chǎn)品檢驗),2.系統(tǒng)或等距隨機抽樣,標志可以是有關(guān)標志(誤差?。部梢允菬o關(guān)標志,(1)定義 首先要選擇標志將調(diào)查對象的全部個體按一定順序排隊,其次依簡單隨機抽樣方式從總體中抽取第一個樣本點,即隨機起點,然后依據(jù)按某種固定順序和規(guī)律(抽樣間隔)依次抽取其余樣本點,最終構(gòu)成系統(tǒng)樣本。,按有關(guān)標志:比簡單隨機抽樣更具代表性,按無關(guān)標志:等同于簡單隨機抽樣,(2)操作辦法,將所有樣本單位按某種標志排列,并連續(xù)編號 一種是按與調(diào)查項目無關(guān)的標志排隊,如按照門

19、牌號排列。 一種是按與調(diào)查項目有關(guān)的標志排隊,如按收入給家庭排序。,排隊標志,抽樣間隔,抽選方法,計算抽樣間隔(距離): A=調(diào)研總體數(shù)N/樣本數(shù)n(遇小數(shù)四舍五入);,在第一段距離中,完全隨機地抽取一個號碼,設其所在位置的序號是 a; 自 a開始,每隔 A個樣本單位抽取一個,即所抽取的樣本單位所在位置的編號依次為:a,a+A,a+2A,。a+(n-1)A,1 2 3 4 5 6 7 8 9 10,11 12 13 14 15 16 17 18 19 20,21 22 23 24 25 26 27 28 29 30,31 32 33 34 35 36 37 38 39 40,41 42 43

20、44 45 46 47 48 49 50,51 52 53 54 55 56 57 58 59 60,61 62 63 64 65 66 67 68 69 70,71 72 73 74 75 76 77 78 79 80,N=90,n=10, 則:A=90/10 =9;設a=6,81 82 83 84 85 86 87 88 89 90,舉例,舉例:某居委會擁有居民720戶,在某次市場調(diào)查中需在這一居委會的居民中抽取10戶樣本單元。,若第一個樣本為051,則051,123,195, 267,339,411,483,555,627,699;,若第一個樣本為102,則102,174,246,318

21、,390,462,534,606,678,(750,),練 習,某城市有私營企業(yè)5989個,擬定樣本量為100個,進行企業(yè)營銷狀況調(diào)查。請問如何使用系統(tǒng)抽樣方法進行抽樣?,1、按照5889個私營企業(yè)的年銷售額(或職工人數(shù)、利潤總額等)進行排序; 2、計算抽樣距離:K=5989/100=59.89,約等于60; 3、采用簡單隨機方法在160號中抽取一個號碼作為第一個樣本單位,如28; 4、以序號28為起點,依照抽樣距離確定所抽取的其他樣本單位編號為:88,148,208,。,直到抽足100個樣本單位為止。,優(yōu)點: 抽中的樣本比較均勻的分布在總體中,利于推算總體目標量,是應用廣泛的一種抽樣方式。

22、缺點: 前提是要有總體每個單位的相關(guān)資料,特別是按有關(guān)標志排隊時,需要更詳細、具體的相關(guān)資料,這是一項復雜和細致的工作。 當抽選間隔和被調(diào)查對象本身的節(jié)奏性(或循環(huán)周期)重合時,會影響調(diào)查精度。,國家統(tǒng)計局的調(diào)查多采用系統(tǒng)抽樣,它便于操作。,3.分層隨機抽樣,(1)定義 是先將調(diào)研總體的所有個體按某一重要特征或標志(如性別、年齡、職業(yè)或地域等)進行分類(組),然后在各類(組)中采用簡單隨機抽樣方式或系統(tǒng)抽樣方式抽取樣本個體的一種抽樣方式。 (*與系統(tǒng)抽樣不同,只能按有關(guān)標志來分組) 分層時: 層間差異性要明顯,避免發(fā)生混淆; 要知道各層中的個體數(shù)目和比例; 分層數(shù)目不宜過多,每個層次內(nèi)的各個個

23、體應保持一致性。,2.1.3,(2)操作辦法 確定分層的標志,如年齡、收入、職業(yè); 將總體(N)分成若干個互不重疊的部分(N1,N2,N3),每一部分為一層(相互獨立,同層同質(zhì)異層異質(zhì)); 根據(jù)樣本量(n)大小,確定各層應抽取的樣本量(n1,n2,n3) 各層子樣本構(gòu)成調(diào)查樣本,(3)分層隨機抽樣的形式 等比例分層抽樣 按各層(或各類)中的個體數(shù)目占總體數(shù)量的比例分配各層的樣本數(shù)量。 此方式簡便易行、分配合理,適應于層內(nèi)差異較小的情況。,N=100000,n=1000,分層等比例抽樣,ni/n = Ni/N,練習,某地調(diào)查商業(yè)網(wǎng)點銷售情況。該地區(qū)有商業(yè)網(wǎng)點20000個,計劃抽取樣本200個。按

24、企業(yè)規(guī)模分層,大型商店1500個,中型商店8500個,小型商店10000個。采用分層比例抽樣法,應從各層選取多少個樣本單位?,答案,大型商店應選取樣本數(shù):,n中=(8500/20000)*200=85(個),小型商店應選取樣本數(shù):,n大=(1500/20000)*200=15 (個),中型商店應選取樣本數(shù):,n小=(10000/20000)*200=100(個),非等比例分層抽樣 不是按各層中個體數(shù)占總體數(shù)的比例分配樣本個數(shù),而是根據(jù)其他因素(層內(nèi)均方差、抽樣工作量和費用大小等)調(diào)整各層的樣本個體數(shù),即有的層可多抽些樣本個體,有的可少抽些樣本個體。 適用于各層的單位數(shù)目相差懸殊,或?qū)觾?nèi)方差較大

25、的 情形,N=100000,n=1000,分層非等比例抽樣(分層最佳抽樣),考慮各層在總體中比例、重要性、層內(nèi)標準差計算抽取比例,ni/n = Ni*Si/ Ni*Si,(3)分層隨機抽樣的優(yōu)缺點 優(yōu)點:一是在不增加樣本規(guī)模的前提下降低抽樣誤差,提高抽樣的精度;二是非常便于了解總體內(nèi)不同層次的情況,便于對總體中不同的層次或類別進行單獨研究,或者進行比較。 缺點:“分層注意”,特點:層內(nèi)同質(zhì),層間異質(zhì) 分層抽樣在層內(nèi)是抽樣調(diào)查,層間是全面調(diào)查,所以分層時應該盡量讓每層內(nèi)的變異程度小,而層間的變異程度大。 (因此分層要全面考慮,而分層的首要目標就是達到同質(zhì)性) 。,4.分群隨機抽樣,(1)定義 又

26、稱整群抽樣、集團抽樣、群體抽樣,是指將總體各個單位按一定標準劃分成若干群,然后以群為單位,從中隨機抽取一些群,對選中的群進行普查。 與分層抽樣相反,其在群內(nèi)是全面調(diào)查,在群間是抽樣調(diào)查。 分群原則: 應選擇能使群間差異小,而群內(nèi)差異大的標志作為分群標志。,適用于: 不同子群相互之間差別不大,而每個子群內(nèi)部的異質(zhì)性程度比較大-層內(nèi)異質(zhì),層間同質(zhì)(與分層抽樣相反) 當我們不可能或不方便編制一個完整的名單形成目標總體的時候,可以使用整群抽樣。 如對城市的人口進行抽樣的時候,沒有整個城市的人的名冊,可以先選出幾個街道樣本,對街道中的所有戶進行抽樣。,(2)方式 對總體分群,每群個體數(shù)可以相等,也可以不

27、相等。 采用簡單隨機抽樣或系統(tǒng)抽樣方式抽選群體。 對抽中的群體的所有個體調(diào)查。,示意圖:,優(yōu)點 抽取樣本比較簡單方便,樣本比較集中,時間費用少 缺點 樣本集中在某些群,不能均勻分布在總體,如果群體間差異較大或每群中個體的特征非常相似,則抽樣誤差會增大,此方法的可靠程度,主要取決于群與群之間的差異性大小。在大規(guī)模市場調(diào)查時,當群內(nèi)各個體間差異較大,而群間差異較小時,最適合采用分群抽樣。,比較分層抽樣和整群抽樣,通信公司將對某大學學生的通信消費狀況進行調(diào)查,樣本容量為800個。公司對該大學的學生情況不太了解,而且很難得到所有大學生的人員清單。但他們通過努力,獲得了該學校所有班級的名單。為此,研究人

28、員擬采用何種抽樣方法?其步驟是?,練習,答:采取整群抽樣法。其步驟是: 1、對該大學的學生以班級分成若干群; 2、隨機抽取20個班級(群); 3、獲取被抽取班級的人員清單; 4、對該20個班級進行普查,獲得最終樣本。,(1)定義 又稱多級抽樣或分段抽樣,它是按抽樣元素的隸屬關(guān)系或?qū)哟侮P(guān)系,把抽樣過程分為幾個階段進行。 在社會調(diào)查中,當總體規(guī)模特別大,或者總體分布的范圍特別廣時,研究者一般采取多段抽樣的方法抽取樣本。,5.多階段抽樣,(2)操作步驟,從總體中隨機抽取若干大群(子群); 再從這幾個大群內(nèi)抽取幾個小群,這樣一層層抽下來,直至抽到最基本的樣本單位為止。,例,(3)特點 抽樣單位的抽選不

29、是一步到位,而是分階段抽樣。 組織方便,對于總體單位多且分散的情況更有效。 在上述每個階段的抽樣中,都要采用簡單隨機抽樣或等距抽樣或分層抽樣的方法進行。,案例: 99 尼爾森全國零售調(diào)研,案 例,某市有24000名教師,分布在全市10個區(qū)的200所學校中?,F(xiàn)要抽取一個由1200名教師組成的樣本,了解他們的住房需求。如果按照三階段抽樣的方法,有以下各種不同的抽樣選擇。請評價以下哪個方案為優(yōu)?,案例小結(jié),B 如果又已知各抽樣階段子總體的差異程度 如果區(qū)與區(qū)之間差別很大,則所抽的區(qū)的規(guī)模就要大一些,如方案1;反之,則小一點; 如果區(qū)與區(qū)之間差別不大,而在每一個區(qū)中,不同學校差別很大,則減小第一階段的

30、抽樣規(guī)模,加大第二階段的抽樣規(guī)模,如方案3; 如區(qū)與區(qū)之間差別不大,且學校與學校之間差別也不大,則盡量加大第三階段的抽樣規(guī)模,相應減小第一、第二階段的抽樣規(guī)模,如方案8或9。,A 如果考慮樣本具有較好的代表性 一般來說,樣本覆蓋的面越大,樣本的代表性越好。則方案3最好,依次遞減,方案9最差;方案1、2居中;,D 綜合考慮抽樣誤差和調(diào)查成本 相對增加開頭階段的樣本數(shù),適當減少最后階段的樣本數(shù)。也就是說,在人力、經(jīng)費和時間允許的情況下,可選擇方案4、5。,C 考慮研究者所擁有的人力和經(jīng)費 抽的區(qū)和學校越多,意味著所需的人力、經(jīng)費和時間就越多。從這個方面考慮,則方案9最好,依次遞減,方案3最差。,(

31、二)非隨機抽樣技術(shù)及應用,非隨機抽樣 不遵循隨機原則,從方便出發(fā)或根據(jù)主觀判斷來抽取樣本。,簡單易行,尤其適用于做探索性研究,無法估計和控制抽樣誤差,無法用樣本的定量資料,采用統(tǒng)計方法來推斷總體,優(yōu)點:,缺點:,非隨機抽樣技術(shù)有四種:方便抽樣、判斷抽樣、配額抽樣、雪球抽樣,1.任意抽樣,(1)定義 任意抽樣:又稱偶遇抽樣,即從調(diào)研人員工作方便出發(fā),在調(diào)研對象范圍內(nèi)隨意抽選一定數(shù)量的樣本進行調(diào)查。 如:如在商店門口、街頭路口、車站碼頭、公園廣場等公共場所,隨便選取某些顧客、行人、旅客、觀眾等 。 (2)兩種方法 街頭攔人法:在街上或路口任意找某個行人,將他(她)作為被訪者,進行調(diào)查。 空間抽樣法

32、:對某一聚集的人群,從空間的不同方向和方位對他們進行抽樣調(diào)查。 (4)特點 簡便易行,節(jié)約時間和費用; 要求調(diào)研總體同質(zhì)性高 樣本的代表性較差,具有很大的偶然性,2.判斷抽樣,調(diào)查者根據(jù)自己的主觀印象、以往的經(jīng)驗和對調(diào)查對象的了解從總體中選擇“最符合調(diào)查對象特征”的原則來確定調(diào)查樣本。 前提是研究人員須對總體的有關(guān)特征有相當高的了解,此法在我國市場調(diào)研中得到廣泛運用。 不同于任意抽樣的“最方便”,而是“最合適”。,方法,1、選擇最能代表普遍情況的調(diào)查對象,分平均型和多數(shù)型。 平均型:選擇代表平均水平的樣本。 多數(shù)型:選擇代表多數(shù)水平的樣本。 2、利用調(diào)查總體的全面統(tǒng)計資料,按照一定標準選擇樣本

33、。,3.配額抽樣,(1)定義 首先將總體中的所有單位按一定的標志分為若干類(組),然后在每個類(組)中用方便抽樣或判斷抽樣方法選取樣本單位。 采用配額抽樣,首先對總體中所有單位按其屬性、特征分類,這些屬性、特性稱為“控制特征”(如性別、年齡、收入、職業(yè)、文化程度等),然后按各個控制特征分配樣本數(shù)額。 它與分層抽樣的區(qū)別在于: 分層抽樣是按照隨機原則在層內(nèi)抽取樣本; 配額抽樣是由調(diào)查人員在配額內(nèi)主觀判斷選定樣本。,根據(jù)配額的要求不同,配額抽樣可分為:獨立控制配額抽樣、非獨立控制配額抽樣,優(yōu)點:簡單易行,選擇余地較大; 缺點:選擇樣本過于偏向某一組別,影響樣本代表性。,某市進行空調(diào)器消費需求調(diào)查,

34、確定樣本容量為200名,選擇消費者收入、年齡、性別三個標準為控制特征進行獨立控制配額抽樣,其各個樣本配額比例及配額數(shù)如下表所示。,獨立控制配額抽樣: 是根據(jù)調(diào)研總體的不同特性,對具有某個特性的調(diào)查樣本分別規(guī)定單獨分配數(shù)額,而不規(guī)定必須同時具有兩種或兩種以上特性的樣本數(shù)額。,非獨立控制配額抽樣: 又稱交叉控制配額抽樣,是同時對兩種或者兩種以上控制特征的每一個樣本數(shù)目都做出具體規(guī)定。,上例中如果采用交叉控制配額抽樣,就必須對收入、年齡、性別這三項特性同時規(guī)定樣本分配數(shù)額,其配額如下表所示。,優(yōu)點:調(diào)查面較廣,提高了樣本代表性; 缺點:操作復雜。,舉例:,4.滾雪球抽樣,(1)定義 以“滾雪球”的方

35、式抽取樣本,即以少量樣本為基礎,逐漸擴大樣本的規(guī)模,直至找出足夠的樣本。 前提:總體樣本單位之間具有一定的聯(lián)系。 (2)基本步驟 找出少量樣本單位;(通常采用隨機方式) 通過這些少量樣本了解更多的樣本單位; 再通過更多的樣本單位去了解更多更多的樣本單位; 如此類推,如同滾雪球,使調(diào)查結(jié)果愈來愈接近總體。,例如,要研究退休老人的生活,可以清晨到公園去結(jié)識幾位散步老人再通過他們結(jié)識其朋友,不用很久,你就可以交上一大批老年朋友。,(3)優(yōu)缺點 優(yōu): 有針對性,且樣本個體間相似性強。 抽樣誤差較小,成本較低。 缺: 樣本單位之間須有一定的聯(lián)系,且愿意提供此聯(lián)系。,總結(jié),非概率抽樣,常用于概念測試、包裝測試、名稱測試等,這些測試通常不需要對總體的推論 概率抽樣,當需要對整個市場的市場份額或銷售容量做出高度精確的估計時,非概率抽樣的樣本設計不是基于精確概率,但是依然追求樣本的代表性!,四、確定樣本容量,(一)樣本容量: 樣本所含個體數(shù)量的多少。,總體越大,樣本容量越大嗎? 樣本容量最少需要滿足多少數(shù)量? 從統(tǒng)計意義上看,選擇多少樣本容量比較合適? 成本因素如何在確定樣本容量時得到體現(xiàn)?

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論