第十 抽樣設(shè)計_第1頁
第十 抽樣設(shè)計_第2頁
第十 抽樣設(shè)計_第3頁
第十 抽樣設(shè)計_第4頁
第十 抽樣設(shè)計_第5頁
已閱讀5頁,還剩68頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第十抽樣設(shè)計第一頁,共七十三頁,編輯于2023年,星期一本章學習目的了解抽樣過程掌握各種抽樣方法第二頁,共七十三頁,編輯于2023年,星期一本章學習重點與難點如何定義總體、確定抽樣框科學確定樣本容量恰當?shù)剡x擇抽樣方法進行抽樣第三頁,共七十三頁,編輯于2023年,星期一一、相關(guān)基本概念(一)、總體(或全域)總體是統(tǒng)計研究對象的全體,它有許多元素(總體單位)構(gòu)成,特點是:各個總體單位都有某種相同的特征把他們聯(lián)系在一起,同時各個個體的某個特征之間又存在差異,這種統(tǒng)一和差異就構(gòu)成了總體分布。抽樣調(diào)查的目的往往是對總體分布的一些特征作出估計,因此抽樣調(diào)查中首先遇到的是確定總體的問題。第四頁,共七十三頁,編輯于2023年,星期一1、

全及總體:目標總體。

所需研究的全部單位的集合體無論認識與否,所有符合規(guī)定屬性或數(shù)量特征的單位合在一起就構(gòu)成了一個全及總體。它是抽樣調(diào)查推斷的目標包括u有限總體與無限總體第五頁,共七十三頁,編輯于2023年,星期一

2、作業(yè)總體N:抽樣總體即已被掌握和了解的,能按某一標志排列或已經(jīng)編號的總體單位的集合,是抽取樣本的來源和依據(jù)。

第六頁,共七十三頁,編輯于2023年,星期一

顯然它是有限總體,它在范圍上比全及總體受到較多的限制。可以等于,但一般小于全及總體。

由于樣本來自于作業(yè)總體,因此結(jié)論也只適用于作業(yè)總體,因此要求作業(yè)總體盡可能接近全及總體。第七頁,共七十三頁,編輯于2023年,星期一

3、變量總體:總體單位的標志的性質(zhì)為數(shù)量,如身高、收入、銷售額、需求量等。屬性總體:研究標志為品質(zhì)、類別等屬性,如質(zhì)量、等。第八頁,共七十三頁,編輯于2023年,星期一同一總體,既可以是變量總體,也可以是屬性總體,取決于研究標志的屬性,有時兩者都研究,兩者都是。如企業(yè)總體,研究標志是職工人數(shù)、產(chǎn)值、稅、利等,為變量總體。研究標志為所有制形式,就是屬性總體。第九頁,共七十三頁,編輯于2023年,星期一(二)、抽樣與普查普查這一概念用于描述獲取同質(zhì)總體中每個成員的信息。抽樣指一個相對較小、但精心選擇的樣本能準確地反映出所抽簽的總體的特征。一個樣本是總體所有成員的一個子集。從總體中子集獲得的有關(guān)信息,可以用來估測總體的特征。理想的狀況是,子集能夠代表總體的各個部分。第十頁,共七十三頁,編輯于2023年,星期一(三)、樣本:X從作業(yè)總體中抽取出來進行觀察的一部分總體單位的集合。又稱為子集。樣本容量:n

抽樣比:n/N

第十一頁,共七十三頁,編輯于2023年,星期一樣本與總體的關(guān)系:

全及總體是唯一的,但樣本不是

作業(yè)總體不一定是唯一的,作業(yè)總體小于全及總體時就不是唯一的。

樣本是總體的縮影與代表,抽樣調(diào)查的目的就是以對樣本的觀察結(jié)果來推斷總體的特征分布。第十二頁,共七十三頁,編輯于2023年,星期一樣本不是唯一的。不同的抽樣方法產(chǎn)生不同的樣本,同樣的抽樣方法每次獲得的樣本也不一定是相同的,如概率抽樣。

如果說總體是要研究推斷的對象,樣本就是要觀察的對象。第十三頁,共七十三頁,編輯于2023年,星期一(四)、總體指標與樣本指標總體指標:根據(jù)總體單位標志值計算出的,唯一的。樣本指標:根據(jù)樣本計算出的,用于估計總體的。常用指標:平均數(shù)、期望、成數(shù)(比例)方差第十四頁,共七十三頁,編輯于2023年,星期一(五)調(diào)查單位與抽樣單位調(diào)查單位:總體單位,家庭、個人、企業(yè)、與抽樣單位:便于抽樣的中介單位

兩者可以相同,也可不同。有時一個抽樣單位包含多個調(diào)查單位,如以家庭為抽樣單位,以個人為調(diào)查單位;有時一個調(diào)查單位又包括多個抽樣單位。

第十五頁,共七十三頁,編輯于2023年,星期一單位可以自然形成,如個人、家庭、村莊、城鎮(zhèn),也可以人為劃分。如居委會、班級等。單位之間不能重合交叉、且完備能形成總體。

第十六頁,共七十三頁,編輯于2023年,星期一(六)抽樣框:編制抽樣單位的目錄

其范圍與作業(yè)總體一致。但單位是抽樣單位,有時與作業(yè)總體在形式上是有區(qū)別的。如:作業(yè)總體:全體在校生,以學號排列。抽樣框:學生宿舍隊列。

第十七頁,共七十三頁,編輯于2023年,星期一抽樣框幾種形式:名單抽樣框區(qū)域抽樣框(地圖)時間表抽樣框第十八頁,共七十三頁,編輯于2023年,星期一二、抽樣調(diào)查有關(guān)特征1、特點經(jīng)濟性效率高,時效性強準確性(在可接受誤差范圍內(nèi)):如:總體指標均值=80,樣本指標:80+-0.5第十九頁,共七十三頁,編輯于2023年,星期一2、抽樣調(diào)查適用情況無限總體

范圍過大、分布過散的有限總體:水庫中魚苗數(shù)量、森林木材儲量。

動態(tài)總體:連續(xù)生產(chǎn)的產(chǎn)品性能,物價監(jiān)測、河流污染第二十頁,共七十三頁,編輯于2023年,星期一不適于全面調(diào)查又必須了解總體特征的事物。如產(chǎn)品壽命、汽車性能、血液檢驗不必全面調(diào)查的總體:居民收支、兒童身高、體重、等,有其內(nèi)在相似性和規(guī)律性。時效性強的總體第二十一頁,共七十三頁,編輯于2023年,星期一用于對總體特征的某種假設(shè)進行檢驗,判斷真?zhèn)?,為決策提供依據(jù),如某項新工藝是否值得推廣。

第二十二頁,共七十三頁,編輯于2023年,星期一3、關(guān)于抽樣調(diào)查的準確性

人們對事物特征認識準確性的要求是相對的:載人航天、一般性的設(shè)備加工精度。

精度與費用直接相關(guān),卻又不是線性相關(guān),也有一個邊際效用遞減,假設(shè)100%精度對應100%費用,20%費用即可達到50%的精度,50%的費用即可達到98%的精度。第二十三頁,共七十三頁,編輯于2023年,星期一第二十四頁,共七十三頁,編輯于2023年,星期一三、抽樣原理和抽樣設(shè)計研究的主要問題(一)、抽樣原理1、抽樣科學性基于理由:部分來自于總體,帶有反映全體的信息。構(gòu)成總體的個體之間在性質(zhì)上必定有相似或相近。不管原始分布如何,樣本特征的分布總可視為正態(tài)分布,而且由此得到總體參數(shù)的概率極大。第二十五頁,共七十三頁,編輯于2023年,星期一如以一個總體分布已知的例子說明:N=6,原始分布為均勻分布,如下表,試通過容量為2的樣本估計總體的均值。

第二十六頁,共七十三頁,編輯于2023年,星期一第二十七頁,共七十三頁,編輯于2023年,星期一第二十八頁,共七十三頁,編輯于2023年,星期一同時:均值分布于3~4之間的概率是(5+6+5)/36=16/36=4/9均值位于2.5~4.5之間的概率是(4+5+6+5+4)/36=24/36=6/9如果增加樣本容量為3,精度就更高。第二十九頁,共七十三頁,編輯于2023年,星期一(二)、抽樣設(shè)計主要問題樣本是用來代表并以此推斷總體的,故而樣本的代表性就是抽樣設(shè)計的主要問題,需要多少容量、如何抽樣、分布如何、誤差大小,都關(guān)系到樣本的代表性。如前文中樣本數(shù)量為3可以提高精度,不放回抽樣也可提高精度。又如估計全班的成績均值,概率抽樣、等距抽樣、非概率抽樣都可以,容量大小也可以,但精度不同。第三十頁,共七十三頁,編輯于2023年,星期一同時不同的抽樣方法和樣本容量對應著不同的成本費用。因此,抽樣設(shè)計就是要在保證樣本的充分代表性前提下,力求取得最經(jīng)濟最有效的效果。往往在預算一定情況下,抽樣設(shè)計須在精度與與預算之間求得平衡?;蛘咴诩榷ň纫笙铝η蠼?jīng)濟性。另外,抽樣設(shè)計須與甄別問卷、數(shù)據(jù)處理相適應。還要取得委托方的認可。第三十一頁,共七十三頁,編輯于2023年,星期一四、制定抽樣計劃的步驟1.定義同質(zhì)總體詳細說明可提供信息或與所需信息有關(guān)的個體或?qū)嶓w所具有的特性。可從以下幾方面進行描述:地域特征、人口統(tǒng)計學的特征、產(chǎn)品或服務(wù)使用情況、認知程度等。第三十二頁,共七十三頁,編輯于2023年,星期一2、選擇資料收集方法3、選擇抽樣框抽樣框是指總體的數(shù)據(jù)目錄或單位的名單,從中可以抽出樣本單位。理想的完整和準確的名單通常是不存在的,因而需要依據(jù)能夠產(chǎn)生具有希望特征的樣本個體的程序來反映抽樣框。第三十三頁,共七十三頁,編輯于2023年,星期一4、選擇抽樣方法取決于研究目的、經(jīng)濟實力、時間限制、欲調(diào)查問題的性質(zhì)。第三十四頁,共七十三頁,編輯于2023年,星期一1)概率抽樣概率抽樣指在總體中的每個單位都具有同等可能性被抽中。概率抽樣的優(yōu)點:信息全面、能估算出抽樣誤差、調(diào)查結(jié)果可以用來推斷總體。概率抽樣的弊?。嘿M用高、策劃和實施時間長。第三十五頁,共七十三頁,編輯于2023年,星期一2)非概率抽樣非概率抽樣指從總體中非隨機地選擇特定的要素(單位)。非概率抽樣的弊?。翰荒芄烙嫵龀闃诱`差、難以確定樣本代表性的程度、難以推及總體。非概率抽樣的固有優(yōu)勢:費用低、實施時間少、若合理運用也能產(chǎn)生極具代表性的合理的抽樣結(jié)果。第三十六頁,共七十三頁,編輯于2023年,星期一5、確定樣本量考慮可得預算的重要性、各種各樣的抽選規(guī)則、子集量的分析和傳統(tǒng)的統(tǒng)計樣本量的計算。第三十七頁,共七十三頁,編輯于2023年,星期一對非概率抽樣,通常依靠可得預算、抽選規(guī)則(憑經(jīng)驗確定)、子集量分析來決定樣本量。對概率抽樣,需要在允許誤差的目標水平和置信水平)下,計算樣本量。第三十八頁,共七十三頁,編輯于2023年,星期一確定樣本量通??紤]這樣一些因素:A個體差異大?。捍髣t多些B調(diào)查項目多少:多則多些C控制質(zhì)量情況:差則多些D抽樣組織方式:不嚴密則多些第三十九頁,共七十三頁,編輯于2023年,星期一

6、制定選擇樣本單位的操作程序示例:抽樣的操作程序可以如下:以下指南是有關(guān)你在某個街區(qū)訪問時應走的路徑。在城市中,這可能是一個城市街區(qū);在農(nóng)村,街區(qū)可能是一塊被道路包圍的土地。第四十頁,共七十三頁,編輯于2023年,星期一1)、如果在你的路線當中遇到死胡同,繼續(xù)沿這條路或街道的另一面向反方向走。在可能的地方又拐,每隔兩戶住家訪問一戶。2)、如果你沿街區(qū)走了一圈,又回到了出發(fā)點而沒有完成列出的電話簿上家庭的四個訪問,那么可以試著訪問起點的那一家。第四十一頁,共七十三頁,編輯于2023年,星期一3)、如果你調(diào)查了整個街區(qū),還是沒有完成所要求的訪問,則繼續(xù)從街區(qū)(或鄉(xiāng)間小路)對面附近的第一個住戶開始。只要這個地址在你的紙上的一個“*”旁出現(xiàn)就把它當作你所在區(qū)域的接到中的另一個地址,并訪問這一家。如果不是,就訪問左邊的一家。永遠遵守右手法則……第四十二頁,共七十三頁,編輯于2023年,星期一7、描樣計劃的實施之前,應先對抽樣進行討論研究,檢查、確定是否要根據(jù)擬好的詳細程序來實施計劃。第四十三頁,共七十三頁,編輯于2023年,星期一五、概率抽樣方法簡單隨機抽樣系統(tǒng)抽樣(等距抽樣)分層抽樣整群抽樣第四十四頁,共七十三頁,編輯于2023年,星期一1、簡單隨機抽樣總體中每個單位在抽選時有相等的被抽中機會抽樣概率公式為:抽樣概率=樣本單位數(shù)/總體單位數(shù)

例如,如果總體單位數(shù)為10000,樣本單位數(shù)為400,那么抽樣概率為4%,計算過程為:0.04=400/10000第四十五頁,共七十三頁,編輯于2023年,星期一如果一個抽樣框是可以得到的,簡單隨機抽樣方式步驟如下:(1)對總體的每個單位進行編號,總體單位數(shù)為10000的總體可編號為1~10000。(2)在隨機數(shù)表中從任意的一個編號數(shù)開始向上數(shù)或向下數(shù)或跳躍數(shù)選編號,在00001和10000之間選出400個(樣本單位數(shù))。(3)在有明確總體單位的數(shù)字表中選出的數(shù)字將包括在樣本中。第四十六頁,共七十三頁,編輯于2023年,星期一優(yōu)點:簡單,并且滿足概率抽樣的一切必要的要求。缺點:編制完整的表極其困難??赏ㄟ^電話隨機撥號功能完成這個步驟。亦可從電腦檔案中挑選調(diào)查對象。第四十七頁,共七十三頁,編輯于2023年,星期一2、等距抽樣按隨機方法決定第一個樣本,之后按等距抽取其余(n-1)個樣本。在不失等概的原則下,將大大簡化抽樣工作。第四十八頁,共七十三頁,編輯于2023年,星期一

實施1)

編號1~N(抽樣框)2)

確定樣本容量n,計算間隔k= N/n3)

隨機確定起點r:1<r<k4)

等距抽取其余(n-1)個樣本:n1=r+0k,n2=r+1k,n3=r+2k……..第四十九頁,共七十三頁,編輯于2023年,星期一優(yōu)缺點1簡便、高效、成本低2標志排隊復雜3效率和樣本代表性取決于排隊使用的標志。若與所研究特征無關(guān),較易,如按電話本;這時代表性與簡單抽樣結(jié)果差別不大,只是在獲取樣本手段上有區(qū)別。若相關(guān),則復雜,如按資金額、銷售量等排序;但這時樣本代表性增強,可以覆蓋大中小各類樣本。第五十頁,共七十三頁,編輯于2023年,星期一

4、如果排序呈現(xiàn)周期性規(guī)律,樣本代表性難以保證。

5、誤差計算較復雜。第五十一頁,共七十三頁,編輯于2023年,星期一3、分層抽樣1、含義:類型抽樣,先將總體單位按照某些重要標志分類(分層),然后在各層(各類)中按照簡單抽樣或等距抽樣抽取樣本單位的方法。第五十二頁,共七十三頁,編輯于2023年,星期一2、分層指標的選擇:標準:分層后層內(nèi)差異最小,層間差異最大選擇:同質(zhì)性:層內(nèi)盡量同質(zhì)異質(zhì)性:層間異質(zhì)相關(guān)性:與所感興趣的特性密切相關(guān)費用:易于測量和應用,以減少分層費用第五十三頁,共七十三頁,編輯于2023年,星期一常用指標:人口統(tǒng)計特征:性別、年齡、種族、文化程度生活方式:媒介接觸行為、運動偏好、娛樂類型等消費者類型單位規(guī)模行業(yè)類型:第五十四頁,共七十三頁,編輯于2023年,星期一精度:分層指標的選擇與精度直接相關(guān),保障層內(nèi)差異?。ǔ闃樱瑢娱g差異大(普查,各層都抽)。分層數(shù)要適當,過度會使精度的增益由于風層費用的增加和抽樣難度增加而被抵消。

第五十五頁,共七十三頁,編輯于2023年,星期一3、抽樣方式比例分層:

等比例分層:各層樣本數(shù)量比例與各層總體單位數(shù)量比例一致。ni/n=Ni/N

不等比例分層:比如當某層標準差較大時,可以多抽樣。當某層規(guī)模大而差異小、均勻時,可以少抽。

第五十六頁,共七十三頁,編輯于2023年,星期一最優(yōu)分層:ni=n×(NiSi/∑NiSi)式中:ni:各層應抽取的樣本量

n:樣本總量

Ni:各層調(diào)查單位總數(shù)

Si:各層調(diào)查單位平均數(shù)(成數(shù))的樣本標準差。

Ci:各層的抽樣費用第五十七頁,共七十三頁,編輯于2023年,星期一4、分層抽樣優(yōu)缺點:精確:在對總體推斷時,還可以對各層推斷復雜,操作困難度大,對各層的特征、大小都要有較精確的了解。5、適用場合:

要對總體和各層推斷要保證樣本的代表性:各層都有,可以提高代表性各層可以獨立調(diào)研第五十八頁,共七十三頁,編輯于2023年,星期一4、整群抽樣1、含義:把整體按照某種標準劃分為一組子群,整體由許多子群體組成(自然或人為行成),各群之間特征相似。以群為抽樣單位,從群中隨機抽取,并對所選子群內(nèi)部進行普查。這時所選中的各個子群的所有個體組成總體樣本。

可以理解為以子群為單位的隨機抽樣。

第五十九頁,共七十三頁,編輯于2023年,星期一2、分群與精度:分群特征的選擇要保證群間差異小,群內(nèi)差異大。一般選擇與待研究內(nèi)容無關(guān)的特征作為分群指標。群間差異越?。ǔ闃樱?,群內(nèi)差異越大(普查),則精度越高。

第六十頁,共七十三頁,編輯于2023年,星期一3、采用原因:抽樣框易于獲得當缺少基本單位名單難以從總體中直接抽取基本單位,而各個子群界限明顯,易于操作,避免了編織基本單位抽樣框問題。即使基本總體單位名單可獲得,但由于直接從基本單位名單抽樣獲得樣本較分散,會增加調(diào)查難度和費用。而按照整群抽樣較集中,方便調(diào)查,費用也低。當各個子群之間差異不大時,整群抽樣不會降低精度。第六十一頁,共七十三頁,編輯于2023年,星期一4、注意問題:群間互斥對子群的抽樣為隨機抽樣。以利于后期數(shù)據(jù)處理和誤差估計。先部分后全部,與分層(先全部后部分)相反誤差取決于群間差異(群間抽樣),而不受群內(nèi)差異影響(群內(nèi)普查)第六十二頁,共七十三頁,編輯于2023年,星期一5、多階段抽樣1、含義:復雜的、大規(guī)模調(diào)查中,調(diào)查單位一般不是直接抽取到,而采用多階段抽取,先按大的抽樣單位抽大的調(diào)查單元,再在大的樣本單位中按照小的抽樣單位抽取小的單元,以此類推。這種抽樣組織形式叫做對階段抽樣。

第六十三頁,共七十三頁,編輯于2023年,星期一例如,全國城市住戶調(diào)查,先抽出城市,再抽出街道,再選擇家庭。

2、二級抽樣:兩階段抽樣。

第六十四頁,共七十三頁,編輯于2023年,星期一第六十五頁,共七十三頁,編輯于2023年,星期一六、非概率抽樣1、即非隨機抽樣,是指抽樣時不遵循隨機原則,而是按照研究人員主觀判斷或僅按方便的原則抽選樣本。由于各個個體入樣的概率是未知,而且排除不了主觀影響,因而無法無法說明是否體現(xiàn)了總體的結(jié)構(gòu),用這樣的

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論