抽樣調(diào)查課件_第1頁(yè)
抽樣調(diào)查課件_第2頁(yè)
抽樣調(diào)查課件_第3頁(yè)
抽樣調(diào)查課件_第4頁(yè)
抽樣調(diào)查課件_第5頁(yè)
已閱讀5頁(yè),還剩326頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第一章抽樣調(diào)查概述第一節(jié)抽樣調(diào)查的意義特點(diǎn)第二節(jié)抽樣調(diào)查的歷史發(fā)展及其實(shí)踐第三節(jié)抽樣調(diào)查的分類與設(shè)計(jì)第四節(jié)抽樣調(diào)查的基礎(chǔ)理論

1.1抽樣調(diào)查的概念1.2抽樣調(diào)查的階段劃分與職業(yè)規(guī)範(fàn)1.3抽樣調(diào)查的特點(diǎn)1.4抽樣調(diào)查的作用1.5抽樣調(diào)查的適應(yīng)範(fàn)圍第一節(jié)抽樣調(diào)查的意義特點(diǎn)

1.1抽樣調(diào)查的概念1.1.1是按照科學(xué)的原理和計(jì)算從所要研究的現(xiàn)象的全部個(gè)體單位中按隨機(jī)原則,抽取部分個(gè)體單位進(jìn)行調(diào)查,取得資料,並用以推算總體數(shù)量特徵的一種方法。

1.1抽樣調(diào)查的概念1.1.2抽樣推斷是按隨機(jī)原則從全部研究對(duì)象中抽取部分單位進(jìn)行觀察,並根據(jù)樣本的實(shí)際數(shù)據(jù)對(duì)總體的數(shù)量特徵作出具有一定可靠程度的估計(jì)和判斷

1.1.3抽樣調(diào)查,是指根據(jù)概率理論,從全體調(diào)查對(duì)象中隨機(jī)抽取一部分樣本單位進(jìn)行觀察,取得樣本統(tǒng)計(jì)調(diào)查數(shù)據(jù),並據(jù)以推斷總體的統(tǒng)計(jì)調(diào)查方法。也就是說,抽樣調(diào)查就是以樣本的資料來推斷調(diào)查對(duì)象的總體的相關(guān)統(tǒng)計(jì)數(shù)據(jù)。1.1抽樣調(diào)查的概念

1.1.4抽樣調(diào)查為科學(xué)研究方法中重要的技術(shù)之一,是指在所要研究的某特定現(xiàn)象母群體中,依隨機(jī)原理抽取一部份作為樣本(Sample),作為研究母群體(Population)的依據(jù)。將樣本研究結(jié)果,在抽樣信賴水準(zhǔn)內(nèi),推算母群體可能特性以作為決策的參考。1.1抽樣調(diào)查的概念

1.2抽樣調(diào)查的階段劃分與職業(yè)規(guī)範(fàn)

1.2.1抽樣調(diào)查的三個(gè)階段1.2.2抽樣調(diào)查的職業(yè)規(guī)範(fàn)

1.2.1抽樣調(diào)查的三個(gè)階段

抽樣設(shè)計(jì)階段調(diào)查階段數(shù)據(jù)處理和估計(jì)推斷階段

抽樣設(shè)計(jì)階段另外,還需設(shè)計(jì)好問卷和進(jìn)行試調(diào)查;以確保抽樣推斷的最佳效果。

調(diào)查階段

選擇具體方法;制定預(yù)防和處理無回答及拒訪的措施;找出對(duì)數(shù)據(jù)品質(zhì)的檢查控制措施與評(píng)價(jià)方法。

數(shù)據(jù)處理和估計(jì)推斷階段審核;篩選;計(jì)算;分析。注意:對(duì)缺失數(shù)據(jù)進(jìn)行處理;對(duì)推斷總體資料的各種方法進(jìn)行比較選擇;對(duì)推斷誤差進(jìn)行計(jì)算與控制。

1.2.2抽樣調(diào)查的職業(yè)規(guī)範(fàn)

除教材第3頁(yè)的四點(diǎn)之外,關(guān)於職業(yè)規(guī)範(fàn)還可以借鑒有關(guān)法律的條款?,F(xiàn)簡(jiǎn)單列舉如下:

《中華人民共和國(guó)統(tǒng)計(jì)法實(shí)施細(xì)則》11條2款如下(二)抽樣調(diào)查、重點(diǎn)調(diào)查或者行政記錄可以滿足需要的,不得制發(fā)全面統(tǒng)計(jì)調(diào)查表;一次性統(tǒng)計(jì)調(diào)查可以滿足需要的,不得進(jìn)行經(jīng)常性統(tǒng)計(jì)調(diào)查;按年統(tǒng)計(jì)調(diào)查可以滿足需要的,不得按季統(tǒng)計(jì)調(diào)查;按季統(tǒng)計(jì)調(diào)查可以滿足需要的,不得按月統(tǒng)計(jì)調(diào)查;月以下的進(jìn)度統(tǒng)計(jì)調(diào)查必須從嚴(yán)控制;

《中華人民共和國(guó)統(tǒng)計(jì)法實(shí)施細(xì)則》12條2款如下

進(jìn)行經(jīng)常性抽樣調(diào)查,應(yīng)當(dāng)通過基本統(tǒng)計(jì)單位普查和行政記錄的方式,查明基本統(tǒng)計(jì)單位及其分佈情況,建立科學(xué)的抽樣框,按照隨機(jī)原則在調(diào)查總體中選取足以代表總體的樣本單位,減少抽樣誤差。

“屬於私人、家庭的單項(xiàng)調(diào)查資料,非經(jīng)本人同意,不得洩露”?!督y(tǒng)計(jì)法》第十五條第一款規(guī)定

單項(xiàng)調(diào)查資料,是指未經(jīng)過加工匯總的反映各個(gè)家庭和個(gè)人情況的調(diào)查登記材料。

《統(tǒng)計(jì)法》之所以作出對(duì)私人、家庭的單項(xiàng)調(diào)查資料不得洩露的規(guī)定,主要是基於兩個(gè)方面的考慮:

一方面,私人、家庭的單項(xiàng)統(tǒng)計(jì)資料往往涉及到個(gè)人隱私,如果洩露可能損害被調(diào)查者的合法權(quán)益;

另一方面,這樣規(guī)定有利於消除被調(diào)查者的後顧之憂,增進(jìn)被調(diào)查者對(duì)調(diào)查者的信任感,使他們能夠如實(shí)提供統(tǒng)計(jì)資料。私人、家庭的單項(xiàng)統(tǒng)計(jì)資料只能在國(guó)家規(guī)定的統(tǒng)計(jì)任務(wù)中供匯總綜合,用於統(tǒng)計(jì)的目的。當(dāng)這些單項(xiàng)調(diào)查資料已經(jīng)匯總成為綜合性的統(tǒng)計(jì)資料時(shí),則可依照國(guó)家規(guī)定予以提供或者公佈。

私人、家庭的單項(xiàng)統(tǒng)計(jì)資料只能在國(guó)家規(guī)定的統(tǒng)計(jì)任務(wù)中供匯總綜合,用於統(tǒng)計(jì)的目的。當(dāng)這些單項(xiàng)調(diào)查資料已經(jīng)匯總成為綜合性的統(tǒng)計(jì)資料時(shí),則可依照國(guó)家規(guī)定予以提供或者公佈。

1.3

抽樣調(diào)查的特點(diǎn)按隨機(jī)的原則從總體中抽選樣本單位根據(jù)樣本資料估算總體的數(shù)量特徵抽樣估算的抽樣誤差可以事先計(jì)算並加以控制

1.3

抽樣調(diào)查的特點(diǎn)速度快,週期短,精度高抽樣技術(shù)靈活多樣應(yīng)用廣泛技術(shù)性更強(qiáng)

理解:抽樣調(diào)查的特點(diǎn)之一注解:所謂“隨機(jī)原則”即機(jī)會(huì)均等。就是在抽取樣本時(shí),使被調(diào)查對(duì)象的所有單位都有同等被抽中的機(jī)會(huì)。限制的隨機(jī)原則。均勻合理地安排被抽取的單位,使之具有更充分可靠的代表性,以取得更好的效果。

理解:抽樣調(diào)查的特點(diǎn)之二注解:樣本對(duì)總體需要充分的代表性。用樣本對(duì)總體數(shù)量特徵進(jìn)行估算時(shí),所依據(jù)的是大數(shù)定律。

理解:抽樣調(diào)查的特點(diǎn)之三注解:誤差可以事先經(jīng)過計(jì)算控制在一定範(fàn)圍內(nèi),並且能採(cǎi)取一定的組織措施來控制這個(gè)誤差範(fàn)圍。

1.4

抽樣調(diào)查的作用見教材5—7頁(yè)(共6條)

1.5抽樣調(diào)查的適應(yīng)範(fàn)圍適合於對(duì)大量現(xiàn)象的調(diào)查不可能實(shí)現(xiàn)的、經(jīng)常的全面調(diào)查有破壞性的產(chǎn)品品質(zhì)調(diào)查資料資訊及時(shí)性強(qiáng)的現(xiàn)象對(duì)全面資料的核實(shí)

第二節(jié)抽樣調(diào)查的歷史發(fā)展及實(shí)踐2.1世界發(fā)展史2.2我國(guó)發(fā)展史(7—22頁(yè))

2.1世界發(fā)展史2.1.1萌芽階段(1895年以前)2.1.2逐步確認(rèn)(1895—1925)2.1.3全面發(fā)展(1925年以後)

2.2我國(guó)發(fā)展史2.2.1認(rèn)識(shí)方面2.2.2實(shí)踐方面

第三節(jié)抽樣調(diào)查的分類與設(shè)計(jì)3.1抽樣調(diào)查的分類3.2抽樣調(diào)查方案的設(shè)計(jì)3.3調(diào)查方案的檢查3.4抽樣調(diào)查的基本步驟

3.1抽樣調(diào)查的分類3.1.1隨機(jī)抽樣(Probability-Sampling),即在抽樣時(shí),母群體中每一個(gè)抽樣單位被選為樣本的機(jī)率相同。隨機(jī)抽樣具有健全的統(tǒng)計(jì)理論基礎(chǔ),可用機(jī)率理論加以解釋,是一種客觀而科學(xué)的抽樣方法,在市場(chǎng)調(diào)查中通常都用隨機(jī)抽樣。抽樣調(diào)查的幾種組織形式:

按完成整個(gè)抽樣過程的階段來分單階段抽樣多階段抽樣只需一次抽樣過程……簡(jiǎn)單隨機(jī)抽樣類型……抽樣系統(tǒng)……抽樣整群……抽樣將總體分層,再逐層抽取樣本單位。

3.1.2非隨時(shí)抽樣(Non-Probabity-Sampling)

在抽樣時(shí),抽樣單位被選為樣本的機(jī)率為不可知。

非機(jī)率抽樣之種類,主要有四種:(1).便利抽樣(ConvenienceSampling)

在樣本的選擇只考慮到接近樣本或衡量便利。如訪問過路行人即為一例。

(2).配額抽樣(QuotaSampling)a選擇「控制特徵」,作為將母體細(xì)分類的標(biāo)準(zhǔn)。

b將母體細(xì)分為幾個(gè)子母體,按比較分配各子母體樣本數(shù)大小。c訪查員有極大自由去選擇子母體中的樣本個(gè)體,只要完成配額調(diào)查,即告完成。

(3).判斷抽樣(JudgementSampling)在母體之構(gòu)體極不相同且樣本數(shù)很小時(shí),根據(jù)抽樣設(shè)計(jì)者的判斷來選擇樣本個(gè)體,設(shè)計(jì)者必須對(duì)母體有關(guān)特徵具有相當(dāng)瞭解。在編制物價(jià)指數(shù)時(shí),有關(guān)產(chǎn)品專案選擇及樣本地區(qū)的決定,即採(cǎi)用判斷抽樣。

(4).雪球抽樣(SnowballSampling)利用隨機(jī)方法或社會(huì)調(diào)查選出原始受訪者。再根據(jù)原始受訪者提供資訊去取得其他受訪者。本法的目的是母體很難尋找或十分稀少時(shí)可用。例如單親家庭抽樣屬之。

3.2抽樣調(diào)查方案的設(shè)計(jì)

3.2.1抽樣調(diào)查方案設(shè)計(jì)的原則抽樣調(diào)查基本的目的是在資訊的搜集基礎(chǔ)上作成結(jié)論,以供決策參考。有效的抽樣調(diào)查應(yīng)滿足如下準(zhǔn)則的要求:

1.有效原則

抽樣調(diào)查應(yīng)該(1)符合調(diào)查目的的需要,(2)所獲資訊價(jià)值應(yīng)超過所支付成本。

2.可測(cè)量原則抽樣的正確程度必須能夠測(cè)量,否則抽樣調(diào)查就失去意義。

3.簡(jiǎn)單原則抽樣調(diào)查必須保持簡(jiǎn)單性要求。俾使抽樣調(diào)查順利進(jìn)行,以避免不必要的節(jié)外生枝。

4保證抽樣的隨機(jī)性原則5目的性與實(shí)踐性結(jié)合的原則

3.2.2抽樣調(diào)查方案設(shè)計(jì)的內(nèi)容目的與任務(wù)單位與對(duì)象專案與表時(shí)間與方法組織與實(shí)施人員與經(jīng)費(fèi)數(shù)據(jù)處理與分析等

3.3抽樣方案的檢查準(zhǔn)確性檢查代表性檢查

3.4抽樣調(diào)查的基本步驟

3.4.1對(duì)母群體的識(shí)別

這次市場(chǎng)調(diào)查的母全體是什麼?

調(diào)查之時(shí),必須一貫性。如果針對(duì)家庭的事實(shí)調(diào)查,就不要混雜個(gè)人意見調(diào)查。

母全體有何特征必須掌握?否則易喪失其代表性。

3.4.2抽樣方法的選擇決定採(cǎi)用抽樣方法考慮因素:(1)抽樣調(diào)查可用資源極為有限,以非機(jī)抽樣為主。(2)要獲得不偏估計(jì)值,必須採(cǎi)用隨機(jī)抽樣。否則可考慮非隨機(jī)抽樣。

3.4.2抽樣方法的選擇(3)必須以客觀方法評(píng)估抽樣設(shè)計(jì)精密度,應(yīng)採(cǎi)用隨機(jī)抽樣;否則就考慮非隨機(jī)抽樣。(4)預(yù)期抽樣誤差是研究誤差主要來源,採(cǎi)用隨機(jī)抽樣,如預(yù)期非抽樣誤差是研究誤差主要來源,則可考慮用非隨機(jī)抽樣。

3.4.2抽樣方法的選擇當(dāng)選用隨機(jī)抽樣之後,斟酌下表各種隨機(jī)抽樣方法之優(yōu)缺點(diǎn)比較,與調(diào)查之時(shí)間,人力,經(jīng)費(fèi)及母群體特徵與需要估計(jì)值精準(zhǔn)度需要,選取適當(dāng)抽樣方法。各種隨機(jī)抽樣方法之優(yōu)劣比較

3.4.3樣本數(shù)決定

決定樣本數(shù)考慮因素及樣本數(shù)估算

1調(diào)查結(jié)果所要求的精準(zhǔn)度。精度愈高,樣本數(shù)愈多。

3.4.3樣本數(shù)決定2抽樣母體的特性。如母體不規(guī)則且分成若干較小子群體(Sar-Groups)則需求較多的樣本,以求抽樣準(zhǔn)確度。

如果樣本能真正代表母群體,樣本數(shù)小準(zhǔn)確性高。由不相干之人來答,其誤差隨樣本數(shù)加大而加大。3.抽樣調(diào)查設(shè)計(jì)優(yōu)良

4.抽樣成本合理化因此最佳抽樣數(shù)量,應(yīng)是樣本數(shù)足以產(chǎn)生準(zhǔn)確的資料,又不超過調(diào)查預(yù)算稱。

第四節(jié)抽樣調(diào)查的基礎(chǔ)理論4.1大數(shù)定律4.2中心極限定理4.3誤差分佈理論4.4概率理論的廣泛應(yīng)用第二章抽樣調(diào)查基本原理第一節(jié)有關(guān)基本概念

第二節(jié)樣本統(tǒng)計(jì)量的抽樣分佈第三節(jié)抽樣誤差第四節(jié)抽樣估計(jì)第一節(jié)有關(guān)基本概念

一、總體總體也叫母體,它是所要認(rèn)識(shí)對(duì)象的全體,是具有同一性質(zhì)的許多單位的集合。組成總體的每個(gè)個(gè)體叫做單位。在抽樣以前,必須根據(jù)實(shí)際情況把總體劃分成若干個(gè)互不重疊並且能組合成總體的部分,每個(gè)部分稱為一個(gè)抽樣單元,不論總體是否有限,總體中的抽樣單元數(shù)一定是有限的,而且是已知的,因此說抽樣調(diào)查的總體總是有限的??傮w應(yīng)具備同質(zhì)性、大量性和差異性的特徵。在抽樣調(diào)查中,通常將反映總體數(shù)量特徵的綜合指標(biāo)稱為總體參數(shù)。常見的總體參數(shù)主要有:總體總和Y總體均值總體比率R總體比例P

二、樣本樣本是由從總體中所抽選出來的若干個(gè)抽樣單元組成的集合體。抽樣前,樣本是一個(gè)n維隨機(jī)變數(shù),屬樣本空間;抽樣後,樣本是一個(gè)n元數(shù)組,是樣本空間的一個(gè)點(diǎn)。影響樣本代表性的因素有以下幾個(gè)方面:(1)總體標(biāo)誌值分佈的離散程度。

(2)抽樣單元數(shù)的多少(或稱樣本容量的大小)。(3)抽樣方法。一般將反映樣本數(shù)量特徵的綜合指標(biāo)稱之為統(tǒng)計(jì)量。統(tǒng)計(jì)量是n元樣本的一個(gè)實(shí)值函數(shù),是一個(gè)隨機(jī)變數(shù),統(tǒng)計(jì)量的一個(gè)具體取值即為統(tǒng)計(jì)值。主要的樣本統(tǒng)計(jì)量有:樣本總和y樣本均值樣本比率r樣本比例p

三、必要樣本容量和樣本可能數(shù)目樣本中包含的抽樣單元個(gè)數(shù)稱為樣本容量,又稱樣本含量或樣本大小。樣本可能數(shù)目則是在容量為N的總體中抽取容量為n的樣本時(shí),所有可能被抽中的不同樣本的個(gè)數(shù)。用A表示。當(dāng)N和n一定時(shí),A的多少與抽樣方法有關(guān),其計(jì)算方法列表如下:抽樣方法放回抽樣不放回抽樣考慮順序不考慮順序四、抽樣框抽樣框是在抽樣前,為便於抽樣工作的組織,在可能條件下編制的用來進(jìn)行抽樣的、記錄或表明總體所有抽樣單元的框架,在抽樣框中,每個(gè)抽樣單元都被編上號(hào)碼。編制抽樣框是一個(gè)實(shí)際的、重要的問題,因此必須要認(rèn)真對(duì)待。抽樣框可以是一份清單(名單抽樣框)、一張地圖(區(qū)域抽樣框)。常見的抽樣框問題可以概括為四種基本類型:(1)缺失一些元素,即抽樣框涵蓋不完全;(2)多個(gè)元素對(duì)應(yīng)一個(gè)號(hào)碼;(3)空白(一些號(hào)碼沒有與之對(duì)應(yīng)的元素)或存在異類元素;(4)重複號(hào)碼,即一個(gè)元素對(duì)應(yīng)多個(gè)號(hào)碼。返回第二節(jié)樣本統(tǒng)計(jì)量的抽樣分佈一、正態(tài)分佈如果總體各個(gè)體的標(biāo)誌值以總體平均數(shù)為中心,形成鐘型對(duì)稱分佈,其分佈曲線向兩側(cè)擴(kuò)展,逐漸向橫軸逼近,無限延伸出去,但不接觸橫軸,則這種分佈就叫做正態(tài)分佈,或高斯分佈、常態(tài)分佈。服從正態(tài)分佈的總體稱為正態(tài)總體。如果一個(gè)隨機(jī)變數(shù)X服從正態(tài)分佈,則其分佈的密度函數(shù)(分佈曲線方程)為:

當(dāng)μ=0,σ2=1時(shí),稱該分佈為標(biāo)準(zhǔn)正態(tài)分佈。標(biāo)準(zhǔn)正態(tài)分佈的密度函數(shù)為,

任何正態(tài)分佈,它的樣本落在任意區(qū)間(a,b)內(nèi)的概率等於直線x=a,x=b,橫坐標(biāo)和曲線f(x)所夾的面積(可由正態(tài)分佈概率積分表查得)。經(jīng)計(jì)算,正態(tài)總體的樣本落在:

(-σ,+σ)概率是68.27%;

(-2σ,+2σ)概率是95.45%;

(-3σ,+3σ)概率是99.73%;

(-1.96σ,+1.96σ)概率是95%;二、抽樣分佈抽樣分佈是根據(jù)所有可能樣本計(jì)算出來的某一統(tǒng)計(jì)量的數(shù)值分佈。抽樣分佈有極限分佈和精確分佈兩類。極限分佈也叫做大樣本分布,它只有正態(tài)分佈一種形式;精確分佈又叫做小樣本分布,其前提是總體服從正態(tài)分佈,它是正態(tài)分佈的導(dǎo)出分佈,包括有t分佈、F分佈和分佈等形式。χ2

一般地,可以證明如果總體服從正態(tài)分佈,且總體均值和方差均為已知,即

Y~N(μ,σ2)則不論樣本量大小如何,樣本均值均圍繞總體均值而服從正態(tài)分佈,並且其抽樣分佈的方差等於總體方差的n分之一,即~N(μ,σ2/n)

而對(duì)於非正態(tài)總體,若均值μ和σ2有限,則根據(jù)中心極限定理,當(dāng)樣本量n充分大時(shí),樣本均值仍然圍繞著總體均值而近似地服從正態(tài)分佈,即~N(μ,σ2/n)

(一)樣本統(tǒng)計(jì)量的極限分佈

例:總體N=5,Y={40,50,60,70,80},則其次數(shù)分佈圖為若取n=2,用放回抽樣,

可抽25個(gè)簡(jiǎn)單隨機(jī)樣本,整理後,即可得出關(guān)於樣本均值的次數(shù)分佈情況為:

404550556065707580f123454321用圖形表示,則為:如果總體容量較大,則當(dāng)樣本容量逐步擴(kuò)大時(shí),樣本平均數(shù)的分佈趨於正態(tài)分佈的趨勢(shì)更加明顯。(二)樣本統(tǒng)計(jì)量的精確分佈1、χ2分佈設(shè)隨機(jī)變數(shù)Yi~N(0,1)(i=1,2,…,n),且相互獨(dú)立,則Y=∑Y2i服從自由度為n的χ2分佈,記作Y~χ2(n)。χ2分佈的概率密度函數(shù)為主要性質(zhì)有:①f(y)恒為正;②χ2分佈呈右偏形態(tài);③χ2分佈隨n的不斷增大而逐漸趨於正態(tài)分佈。

χ2分佈χ2(n)的數(shù)學(xué)期望和方差分別為EY=n,DY=2n.2、t分佈若X~N(0,1),Y~χ2(n),且X與Y相互獨(dú)立,則稱隨機(jī)變數(shù)服從自由度為n的t分佈,記作:T~t(n)。

推論:若X~N(μ,σ2),σ2未知,則

服從自由度為n-1的t分佈,記作:T~t(n-1)

t分佈t(n)的概率密度函數(shù)為

t分佈具有如下性質(zhì):①t分佈對(duì)稱於縱軸,與N(0,1)相似;②在n<30(小樣本)時(shí),t分佈的方差大於N(0,1)的方差;③在n≥30(大樣本)時(shí),t分佈隨n的增大而趨於N(0,1)。

t分佈t(n)的數(shù)學(xué)期望與方差分別為ET=0,DT=n/(n-2).(n>2)

若X~χ2(n1),Y~χ2(n2),且X與Y相互獨(dú)立,則稱隨機(jī)變數(shù)

3、F分佈服從第一自由度為n1,第二自由度為n2的F分佈,記作:F~F(n1,n2)。其概率密度函數(shù)為F分佈的主要性質(zhì)有:①F分佈呈右偏態(tài);②f(x)恒為正;③在

④隨n1,n2的不斷增大,F(xiàn)分佈的右偏程度逐漸減弱,但不會(huì)趨向正態(tài);⑤具有倒數(shù)性質(zhì),即若X~F(n1,n2),則1/X~F(n1,n2);⑥若t~t(n),則t2(n)~F(1,n)。

處取最大值(n1>2,f0<1);其數(shù)學(xué)期望和方差分別為返回第三節(jié)抽樣誤差一、抽樣調(diào)查中的誤差來源誤差就是調(diào)查結(jié)果與現(xiàn)象的實(shí)際結(jié)果之間的偏差,它幾乎在所有的統(tǒng)計(jì)調(diào)查中都或大或小的存在著。在抽樣調(diào)查中,按照形成原因的不同,一般可將誤差分成抽樣誤差和非抽樣誤差兩大類。抽樣誤差是用樣本統(tǒng)計(jì)量推斷總體參數(shù)時(shí)的誤差,它屬於一種代表性誤差。

在抽樣調(diào)查中抽樣誤差是不可避免的。但同非抽樣誤差不同的是,抽樣誤差可以計(jì)算,並且可以被控制在任意小的範(fàn)圍內(nèi)。

影響抽樣誤差的因素

1.抽樣誤差通常會(huì)隨樣本量的大小而增減。

2.所研究現(xiàn)象總體變異程度的大小。

3.抽樣的方式方法。

非抽樣誤差不是由於抽樣引起的。它又包括:調(diào)查誤差;無回答誤差;抽樣框誤差;登記性誤差。同抽樣誤差相反,非抽樣誤差是隨著樣本量的增加而增大的。由於抽樣調(diào)查的訪問和資料整理都比普查更便於進(jìn)行,因此非抽樣誤差也遠(yuǎn)遠(yuǎn)小於普查。有時(shí),普查中的非抽樣誤差甚至大於抽樣調(diào)查中抽樣誤差與非抽樣誤差的總和。二、抽樣誤差的計(jì)算抽樣誤差的計(jì)算,是建立在誤差分佈理論基礎(chǔ)上,從統(tǒng)計(jì)平均意義角度來考慮的。

抽樣誤差用所有可能的實(shí)際誤差的均方誤差表示

MSE()=E(-θ)2=E[

-E(

)]2+[E()-θ]2

式中第一項(xiàng)是估計(jì)量的方差,記作V()。

式中第二項(xiàng)是估計(jì)量的偏倚B()的平方。

無偏估計(jì)時(shí),的方差就等於它的均方誤差。

說明:①上面所給出的估計(jì)量方差公式實(shí)際中當(dāng)σ2未知時(shí),一般用樣本方差s2代替以對(duì)②有偏的估計(jì)並非都是不可用的,有時(shí)有偏估計(jì)量在某些方面反而比無偏估計(jì)量更好。有研究認(rèn)為,在實(shí)踐中當(dāng)偏倚小於標(biāo)準(zhǔn)誤的十分之一時(shí),偏倚對(duì)估計(jì)量準(zhǔn)確度的影響可以忽略不計(jì)。仍然屬於一個(gè)理論公式,是依據(jù)調(diào)查變數(shù)的總體方差σ2進(jìn)行計(jì)算的,估計(jì)量的方差做出估計(jì)。返回第四節(jié)抽樣估計(jì)一、抽樣估計(jì)的特點(diǎn)第一,抽樣估計(jì)在邏輯上運(yùn)用的是歸納推理而不是演繹推理。第二,抽樣估計(jì)在方法上運(yùn)用不確定的概率估計(jì)法而不是運(yùn)用確定的數(shù)學(xué)分析法。第三,抽樣估計(jì)的結(jié)論存在著一定程度的抽樣誤差。二、抽樣估計(jì)的方法抽樣估計(jì)的方法多種多樣。如果以估計(jì)中所依據(jù)的資料不同來區(qū)分,一般可以有簡(jiǎn)單估計(jì)、比估計(jì)和回歸估計(jì)等三種方法。簡(jiǎn)單估計(jì)是單純依靠樣本調(diào)查變數(shù)的資料估計(jì)總體參數(shù),其估計(jì)結(jié)果稱為簡(jiǎn)單估計(jì)量;比估計(jì)和回歸估計(jì)是同時(shí)依據(jù)樣本調(diào)查變數(shù)以及已知的有關(guān)輔助變數(shù)的資料來對(duì)總體參數(shù)做出估計(jì),其結(jié)果分別稱為比估計(jì)量和回歸估計(jì)量。如果以估計(jì)結(jié)果的表示方式來區(qū)分,則抽樣估計(jì)可以有兩種形式,即定值估計(jì)和區(qū)間估計(jì)。三、置信區(qū)間一般地說,若估計(jì)量是無偏的,且呈正態(tài)分佈,則參數(shù)θ的置信度當(dāng)調(diào)查變數(shù)的總體方差σ2已知時(shí),上述置信區(qū)間可表示為為1-α的置信區(qū)間可以寫成當(dāng)調(diào)查變數(shù)的總體方差σ2未知時(shí),則用相應(yīng)的樣本方差s2代替。然而,這時(shí)有可能會(huì)使誤差產(chǎn)生一個(gè)增量,特別是當(dāng)樣本較小時(shí),更容易影響估計(jì)的精度。因此,為了保持1-α的置信度,就應(yīng)該適當(dāng)加寬置信區(qū)間,即用較大的tα/2值來代替Zα/2。此時(shí),置信區(qū)間就可以表示成四、估計(jì)量的優(yōu)良標(biāo)準(zhǔn)1、無偏性2、一致性3、有效性第三章簡(jiǎn)單隨機(jī)抽樣第一節(jié)簡(jiǎn)單隨機(jī)抽樣概述第二節(jié)參數(shù)估計(jì)第三節(jié)樣本容量的確定第一節(jié)簡(jiǎn)單隨機(jī)抽樣概述一、簡(jiǎn)單隨機(jī)抽樣的概念定義之一:簡(jiǎn)單隨機(jī)抽樣就是從總體N個(gè)抽樣單元中,一次抽取n個(gè)單元時(shí),使全部可能的種不同的樣本被抽到的概率均相等,即都等於1/A。定義之二:簡(jiǎn)單隨機(jī)抽樣是從總體的N個(gè)抽樣單元中,每次抽取一個(gè)單元時(shí),使每一個(gè)單元都有相等的概率被抽中,連續(xù)抽n次,以抽中的n個(gè)單元組成簡(jiǎn)單隨機(jī)樣本。按簡(jiǎn)單隨機(jī)抽樣,抽到的樣本稱為簡(jiǎn)單隨機(jī)樣本。二、簡(jiǎn)單隨機(jī)抽樣的具體實(shí)施方法(一)抽籤法抽籤法是先對(duì)總體N個(gè)抽樣單元分別編上1到N的號(hào)碼,再製作與之相對(duì)應(yīng)的N個(gè)號(hào)簽並充分搖勻後,從中隨機(jī)地抽取n個(gè)號(hào)簽(可以是一次抽取n個(gè)號(hào)簽,也可以一次抽一個(gè)號(hào)簽,連續(xù)抽n次),與抽中號(hào)簽號(hào)碼相同的n個(gè)單元即為抽中的單元,由其組成簡(jiǎn)單隨機(jī)樣本。(二)亂數(shù)法亂數(shù)法就是利用亂數(shù)表、亂數(shù)骰子或電腦產(chǎn)生的亂數(shù)進(jìn)行抽樣。

1、亂數(shù)表及其使用方法亂數(shù)表是由0到9的10個(gè)阿拉伯?dāng)?shù)字進(jìn)行隨機(jī)排列組成的表。所謂隨機(jī)排列,即每個(gè)數(shù)字都是按等概和重複獨(dú)立抽取的方式排定的。亂數(shù)表的用途很多,不僅可以組織等概樣本,也可組織不等概樣本。

簡(jiǎn)單隨機(jī)抽樣屬等概率抽樣,在使用亂數(shù)表時(shí),要注意以下幾點(diǎn):①每次使用時(shí),確定使用哪頁(yè)及哪行哪列的數(shù)字為起點(diǎn),必須是隨機(jī)的。②設(shè)總體容量為N,若N的位數(shù)為r,則一定要從r位數(shù)中抽取。遇到1至N的數(shù)可直接使用;遇到其他的數(shù)不能直接使用。③當(dāng)r≥2時(shí),可從含有起點(diǎn)數(shù)字左邊的r位數(shù)開始,也可從右邊的r位數(shù)開始??蓮钠瘘c(diǎn)開始向下抽取,也可向右抽取。但一經(jīng)確定使用哪一種方式,就必須用一種方式抽取全部單元號(hào),中途不能變更。④在重複抽樣時(shí),遇到重複的數(shù)字應(yīng)重複使用;在不重複抽樣時(shí),遇到重複的數(shù)字應(yīng)舍去不用。亂數(shù)表法一般分下述幾步:第一步:確定起點(diǎn)頁(yè)碼;第二步:確定起點(diǎn)的行數(shù)與列數(shù);第三步:確定所抽樣本單元的號(hào)碼??焖俪槿〉某S梅椒ㄓ校吼N數(shù)法。如果N是個(gè)r位數(shù),由1到隨機(jī)取一個(gè)數(shù)R,而是N的最大r位整倍數(shù),則編號(hào)等於R除N所得餘數(shù)的單元便被選中。商數(shù)法。修正餘數(shù)法。修正商數(shù)法。獨(dú)立選擇數(shù)位法。

2、亂數(shù)骰子及其使用方法

亂數(shù)骰子是由均勻材料製成的正二十面體(通常的骰子是正六面體,即正方體),面上刻有0-9的數(shù)字各2個(gè)。(亂數(shù)骰子的圖形特徵)兩個(gè)有名的試驗(yàn)試驗(yàn)一:隨意數(shù)試驗(yàn)。讓六個(gè)人寫下100個(gè)自己隨意想到的三位數(shù),將這些數(shù)內(nèi)的0、1、…、9數(shù)字列成次數(shù)分佈表如右??梢?,六個(gè)人都對(duì)數(shù)字存在偏好,如第一個(gè)人更加偏好數(shù)字4、3、0;第二個(gè)人則偏好數(shù)字1、8、4;等等。這種由於數(shù)字偏好所引起的偏估類型可稱之為數(shù)字偏誤。數(shù)字人的編號(hào)期望次數(shù)1234560123456789501382934592948305733272019283120225039343424245540282915272018311530253026262731151239323542352542302344379282320272930303030303030303030合計(jì)300300300300300300300試驗(yàn)二:著色試驗(yàn)。讓四個(gè)人將10×10方格的紙板著色,可供選擇的顏色有藍(lán)、綠、紅、白和黃色五種,對(duì)每一個(gè)四分象限來說,規(guī)定每種顏色只能在每行和每列出現(xiàn)一次。每個(gè)方格以其所在的列號(hào)與行號(hào)表示,如(4,6)代表第四列第六行的方格。請(qǐng)四個(gè)人對(duì)這100個(gè)方格隨意選擇行列號(hào),而對(duì)其著色。將這些由這四個(gè)人著色所得到的資料形成次數(shù)分佈表如下:四個(gè)人對(duì)方格著色的次數(shù)分佈顏色人的編號(hào)期望數(shù)字1234藍(lán)綠紅白黃14262012282115211512202225232019181825262020202020合計(jì)100100100100100可見四個(gè)人都對(duì)顏色存在偏好,如第一個(gè)人偏愛綠色,第二個(gè)人偏愛藍(lán)色等。這種由於對(duì)顏色偏好所引起的偏估類型,可稱之為顏色偏誤。結(jié)論:隨意抽樣≠隨機(jī)抽樣三、簡(jiǎn)單隨機(jī)抽樣的方法評(píng)估1.簡(jiǎn)單隨機(jī)抽樣對(duì)總體不加任何限制,等概率地從總體中直接抽取樣本,是最簡(jiǎn)單、最單純的抽樣技術(shù),它具有計(jì)算簡(jiǎn)便的優(yōu)點(diǎn),是研究其他複雜抽樣技術(shù)的基礎(chǔ),也是比較各種抽樣技術(shù)之間估計(jì)效率的標(biāo)準(zhǔn),同時(shí),從理論上講簡(jiǎn)單隨機(jī)抽樣在各種抽樣技術(shù)中是貫徹隨機(jī)原則最好的一種,並且數(shù)學(xué)性質(zhì)很簡(jiǎn)單,是等概率抽樣的特殊類型。2.因?yàn)槭堑雀怕食槿颖?,所以要求總體在所研究的主要標(biāo)誌上同質(zhì)性或齊性(共性)較好,也即總體要比較均勻;要求樣本容量要比較大,以保證樣本對(duì)總體具有充分的代表性。但是,在社會(huì)經(jīng)濟(jì)現(xiàn)象中,這種均勻總體是很少見的。因此,實(shí)際工作中很少單純使用簡(jiǎn)單隨機(jī)抽樣方法。3.直接從總體中抽取樣本,未能充分利用關(guān)於總體的各種其他已知資訊,以有效地提高樣本的代表性,並進(jìn)而提高抽樣的估計(jì)效率。4.簡(jiǎn)單隨機(jī)抽樣要求在抽樣前編制出抽樣框,並對(duì)每一個(gè)總體抽樣單元進(jìn)行編號(hào),而且當(dāng)總體抽樣單元的分佈比較分散時(shí),樣本也可能會(huì)比較分散,這些都會(huì)給簡(jiǎn)單隨機(jī)抽樣方法的運(yùn)用造成許多的不便,甚至在某些情況下乾脆無法使用。

結(jié)論:在此基礎(chǔ)上研究其他抽樣技術(shù)顯得更加重要。第二節(jié)總體參數(shù)的估計(jì)一、基本原理-將上述結(jié)論加以推廣,則可得出一般性的結(jié)論,即從總體的N個(gè)單元中不放回抽取n個(gè)單元時(shí)的估計(jì)量及其方差的構(gòu)造形式。第三節(jié)樣本容量的確定必要樣本容量是在最大限度地滿足規(guī)定精度要求以及盡可能節(jié)約調(diào)查費(fèi)用的前提下,所應(yīng)該抽取到的最少的樣本容量。一、必要樣本容量的確定(一)依規(guī)定精度來定1、關(guān)於精度的不同提法第一節(jié)分層抽樣概述第四章分層抽樣第二節(jié)總體參數(shù)的估計(jì)第三節(jié)總樣本量的分配第四節(jié)分層與提高精度第一節(jié)分層抽樣概述分層抽樣是在抽樣之前,先將總體按一定標(biāo)誌劃分為若干個(gè)層(組),後在各層內(nèi)分別獨(dú)立地進(jìn)行抽樣。由此所抽得的樣本稱之為分層樣本。各層所抽的樣本也是互相獨(dú)立的。如果每層中的抽樣都是簡(jiǎn)單隨機(jī)的,則這種抽樣就叫做分層隨機(jī)抽樣。由此所得到的樣本稱做分層隨機(jī)樣本。分層時(shí)應(yīng)遵循“盡可能使層內(nèi)差異小,而使層間差異大”的原則,同時(shí)要使分層的結(jié)果既無重複又無遺漏。進(jìn)行分層抽樣時(shí)應(yīng)注意:①層內(nèi)抽樣設(shè)計(jì)的選擇;②分層變數(shù)的選擇;③各層樣本量的分配;④層數(shù);⑤層的分界。以前只重視③,近年來,④和⑤引起了越來越多的關(guān)注。分層抽樣具有以下特點(diǎn):①分層抽樣能夠充分地利用關(guān)於總體的各種已知資訊進(jìn)行分層,因此抽樣的效果一般比簡(jiǎn)單隨機(jī)抽樣要好。但當(dāng)對(duì)總體缺乏較多的瞭解時(shí),則無法分層或不能保證分層的效果。②在分層抽樣中,總體的方差一般可以分解為層間方差和層內(nèi)方差兩部分。由於分層抽樣的誤差只與層內(nèi)差異有關(guān),而與層間差異無關(guān),因此,分層抽樣可以提高估計(jì)量的精度。③由於分層抽樣是在每層內(nèi)獨(dú)立地進(jìn)行抽樣,因此,使得分層樣本能夠比簡(jiǎn)單隨機(jī)樣本更加均勻地分佈於總體之內(nèi),所以其代表性也更好些。④分層抽樣的隨機(jī)性具體體現(xiàn)在層內(nèi)各單元的抽取過程之中,也即在各層內(nèi)部的每一個(gè)單元都有相同的機(jī)會(huì)被抽中,而在層與層之間則是相互獨(dú)立的。⑤分層抽樣適合於調(diào)查標(biāo)誌在各單元的數(shù)量分佈差異較大的總體。因?yàn)閷?duì)這樣的總體進(jìn)行合理的分層後可將其差異較多地轉(zhuǎn)化為層間差異,從而使層內(nèi)差異大大減弱。⑥分層抽樣中除了可以推斷總體參數(shù)外,還可以推斷各不同層的數(shù)量特徵,並進(jìn)一步作對(duì)比分析,從而滿足不同方面的需要,也能幫助人們對(duì)總體作更全面、更深入的瞭解。但對(duì)各層的估計(jì)缺乏精度保證。⑦分層抽樣調(diào)查實(shí)施中的組織管理及數(shù)據(jù)收集和匯總處理可以分別在各層內(nèi)獨(dú)立地進(jìn)行,因此較之簡(jiǎn)單隨機(jī)抽樣更方便。⑧分層抽樣中,由於各層的抽樣相互獨(dú)立,互不影響,且各層間可能有顯著的不同,因此,對(duì)不同層可以按照具體情況和條件分別採(cǎi)用不同的抽樣和估計(jì)方法進(jìn)行處理,從而提高估計(jì)的精確度。⑨當(dāng)總體有週期現(xiàn)象時(shí),用分層比例抽樣法可以減少抽樣方差。⑩分層抽樣中在進(jìn)行分層時(shí),需收集可用於分層的必要的各種資料,因此可能會(huì)增加一定的額外費(fèi)用。同時(shí),分層抽樣中,總體參數(shù)的估計(jì)以及各層間樣本量的分配、總樣本量的確定等都更為複雜化。滿足下述條件時(shí),分層在精度上會(huì)有很大的得益:①總體是由一些大小差異很大的單元組成的,即總體差異大;②分層後,每層所包含的總體單元數(shù)應(yīng)是可知的,也即分層後各層的權(quán)重是確知的或可以精確估計(jì)的;③要調(diào)查的主要變數(shù)(標(biāo)誌)與單元的大小是密切相關(guān)的;④對(duì)單元的大小有很好的測(cè)量資料可用於分層,也即分層變數(shù)容易確定。第二節(jié)總體參數(shù)的估計(jì)二、估計(jì)量對(duì)於分層隨機(jī)抽樣則可以寫出其方差的具體形式來。四、方差的估計(jì)量按上述方法確定估計(jì)量的方差時(shí),要求各層的總體方差應(yīng)事先已知,但實(shí)際工作中,各層的總體方差又常常是未知的,此時(shí),一般可用對(duì)應(yīng)的各層樣本方差替代,以對(duì)估計(jì)量的方差作出估計(jì)。第三節(jié)總樣本量的分配一、總樣本量在各層間的分配在分層抽樣中,一個(gè)重要的問題是總的樣本量如何在各層之間進(jìn)行分配。通??紤]:⑴精度和費(fèi)用問題。即如何分配才能在費(fèi)用一定時(shí)使總的精度和各層估計(jì)精度最高?⑵數(shù)據(jù)處理問題。即如何分配才能使調(diào)查數(shù)據(jù)的處理工作更加簡(jiǎn)潔,也使估計(jì)量及其方差的確定形式更為簡(jiǎn)單明瞭?⑶各層的容量大小問題。(二)最優(yōu)分配1、一般情形在分層隨機(jī)抽樣中,在給定的費(fèi)用條件下,使估計(jì)量的方差達(dá)到最小,或在精度要求(常用方差表示)一定條件下,使總費(fèi)用最小的各層樣本量的分配稱為最優(yōu)分配。5、最優(yōu)分配與比例分配的精度比較討論:由於比例分配的樣本是自加權(quán)的,因此,其估計(jì)量及其方差的確定形式都較最優(yōu)分配時(shí)更為簡(jiǎn)便。但如果各層的因數(shù)之間差異很大時(shí),最優(yōu)分配將會(huì)比比例分配更為有效。然而,由於方差對(duì)於分配中發(fā)生的小的甚至是中等的變動(dòng)並不敏感,因此,基什(L·Kish)認(rèn)為在實(shí)際中①除非各層的因數(shù)之間有實(shí)質(zhì)性的差異,一般不要採(cǎi)用最優(yōu)分配。否則最優(yōu)分配多出的效益可能會(huì)被加權(quán)和特別細(xì)緻工作的額外花費(fèi)所抵銷。一般來說,要好幾倍的差異才值得作最優(yōu)分配。若的幾個(gè)值大致相等,就要用比例分配。②最優(yōu)分配往往不是估計(jì)比例值的經(jīng)濟(jì)方法,因?yàn)楸壤臉?biāo)準(zhǔn)差等於,它們對(duì)於0.1到0.9之間變動(dòng)的值是不敏感的。③應(yīng)用最優(yōu)分配時(shí),在實(shí)踐上要避免使抽樣比成為複雜的分?jǐn)?shù)。④很多潛在的效益常常只需使用一些不同的抽樣比就可以得到。有時(shí),只用兩個(gè)抽樣比就可以取得大部分效益:對(duì)絕大多數(shù)元素採(cǎi)用一個(gè)低抽樣比,而對(duì)一個(gè)只包含大元素的特殊層則採(cǎi)用一個(gè)高抽樣比。有時(shí),甚至可使這些特殊層能被當(dāng)然地選入樣本(即使其抽樣比為1),以完全排除它對(duì)抽樣誤差的影響。當(dāng)各層抽樣費(fèi)用不同,而總費(fèi)用給定時(shí)第四節(jié)分層與提高精度是否在任何一次抽樣中都應(yīng)該採(cǎi)用分層抽樣呢?答案是不一定。通常要考慮以下四個(gè)問題:一是如果分層抽樣的效果優(yōu)於簡(jiǎn)單隨機(jī)抽樣,那麼從所增加的人力、財(cái)力與所提高的抽樣精度的對(duì)比上看是否值得?二是分層抽樣的效果是否就一定優(yōu)於簡(jiǎn)單隨機(jī)抽樣?三是當(dāng)各層的層權(quán)不準(zhǔn)(有偏)時(shí),層權(quán)偏差所增加的誤差與分層所減少的誤差哪個(gè)更大?四是如果不採(cǎi)用分層抽樣,簡(jiǎn)單隨機(jī)抽樣或其他抽樣方式的估計(jì)精度能否達(dá)到事先設(shè)計(jì)的要求?一、分層隨機(jī)抽樣與簡(jiǎn)單隨機(jī)抽樣的精度比較二、設(shè)計(jì)效應(yīng)三、層權(quán)誤差的影響四、分層標(biāo)誌的選擇五、層數(shù)的確定六、層界的確定七、抽樣後分層第五章比估計(jì)與回歸估計(jì)第一節(jié)比估計(jì)的一般形式第二節(jié)分層比估計(jì)第三節(jié)回歸估計(jì)的一般形式第四節(jié)分層回歸估計(jì)第一節(jié)比估計(jì)的一般形式一、比估計(jì)綜述比估計(jì)是依據(jù)調(diào)查變數(shù)與輔助變數(shù)間的比率來對(duì)總體有關(guān)參數(shù)進(jìn)行估計(jì)和推斷。通常簡(jiǎn)稱比估計(jì)。同簡(jiǎn)單估計(jì)相比,比估計(jì)具有以下特點(diǎn):(1)在比估計(jì)中,除調(diào)查變數(shù)外,還需要瞭解與調(diào)查變數(shù)有關(guān)的輔助變數(shù),並且要求輔助變數(shù)的總體均值或總體總和必須事先已知。充分利用輔助變數(shù)帶來的資訊估計(jì)總體參數(shù),比單純用調(diào)查變數(shù)資料會(huì)有更好的效果。(2)比估計(jì)方法,對(duì)抽樣調(diào)查單元是有條件的,通常是用組成總體的最基層單位為調(diào)查單元。(3)比估計(jì)只適用於有限總體,因?yàn)橹挥杏邢蘅傮w才可能計(jì)算出為比估計(jì)所需要的輔助變數(shù)的總體總和與總體均值。(4)當(dāng)每個(gè)單元的調(diào)查變數(shù)與輔助變數(shù)的比例(一般要求為正比例)十分穩(wěn)定,且變異很小時(shí),比估計(jì)就具有十分精確的估計(jì)效果,只要抽取少量的樣本單元,就可得到滿意的結(jié)論。(5)在比估計(jì)時(shí),出於估計(jì)精度方面的要求,選擇輔助變數(shù)時(shí),須與調(diào)查變數(shù)的關(guān)係愈密切愈好,至少要求相關(guān)係數(shù)在1/2以上。比估計(jì)中,輔助變數(shù)可以是上次普查或調(diào)查時(shí)與調(diào)查變數(shù)相應(yīng)的數(shù)據(jù)(即調(diào)查變數(shù)的前期或歷史資料);也可以是對(duì)調(diào)查變數(shù)的粗略估計(jì);或者是表示單元規(guī)模的某個(gè)量。為了充分發(fā)揮比估計(jì)的優(yōu)越性,在應(yīng)用比估計(jì)時(shí)應(yīng)考慮兩條:一是選與調(diào)查變數(shù)有較密切的正相關(guān)關(guān)係的變數(shù)作為輔助變數(shù)。因?yàn)槿绻o助變數(shù)與調(diào)查變數(shù)的關(guān)係不密切,各自獨(dú)立變化,則對(duì)比估計(jì)起不了應(yīng)有的輔助作用。二是樣本容量要比較大。因?yàn)楸裙烙?jì)是有偏倚的,只有當(dāng)樣本容量n比較大時(shí),其偏倚才能比較小,比估計(jì)才更加有效。比率估計(jì)是有偏的,但當(dāng)樣本量n增大時(shí),偏倚逐漸趨於零。三、總體均值和總和的比估計(jì)當(dāng)調(diào)查變數(shù)和輔助變數(shù)具有正相關(guān)關(guān)係時(shí),為了利用輔助變數(shù)的資訊,可以構(gòu)造總體均值或總和的比估計(jì)量。在簡(jiǎn)單隨機(jī)抽樣中,總體均值和總體總和的比估計(jì)量分別為結(jié)論為:利用比估計(jì)提高抽樣效果的條件是ρ>1/2。五、樣本容量的確定第二節(jié)分層比估計(jì)

分層隨機(jī)抽樣中的比估計(jì)量有兩種形式:先構(gòu)造各層比估計(jì),再加權(quán)平均——各層分別比估計(jì);先加權(quán)平均,再構(gòu)造比估計(jì)——聯(lián)合比估計(jì)。一、各層分別比估計(jì)各層分別比估計(jì)是先對(duì)各層分別進(jìn)行比估計(jì),然後按層權(quán)加權(quán)平均,以得出總體參數(shù)的估計(jì),即:第三節(jié)回歸估計(jì)的一般形式一、回歸估計(jì)概述回歸估計(jì)就是根據(jù)樣本各單元調(diào)查變數(shù)與輔助變數(shù)間的關(guān)係構(gòu)造回歸方程,並據(jù)回歸係數(shù)對(duì)總體有關(guān)參數(shù)進(jìn)行估計(jì)。如果在回歸估計(jì)中只有一個(gè)輔助變數(shù),則所進(jìn)行的估計(jì)稱為一元回歸估計(jì),若同時(shí)採(cǎi)用多個(gè)輔助變數(shù)綜合進(jìn)行估計(jì),則稱為多元回歸估計(jì)。多元回歸估計(jì)比一元回歸估計(jì)效果更好,但更複雜。這裏只介紹一元回歸中的線性回歸估計(jì)?;貧w估計(jì)的主要特點(diǎn)有:同比估計(jì)一樣,回歸估計(jì)充分利用了有關(guān)的輔助變數(shù)資料以有效地提高估計(jì)的精度;回歸估計(jì)中要求輔助變數(shù)的總體均值或總和事先已知;回歸估計(jì)一般只適用於有限總體,因?yàn)橹挥杏邢蘅傮w才可能計(jì)算出輔助變數(shù)的總體均值和總和;回歸估計(jì)量一般優(yōu)於比估計(jì)量和簡(jiǎn)單估計(jì)量。特別地當(dāng)回歸係數(shù)等於總體比率(即總體回歸直線通過原點(diǎn))時(shí),回歸估計(jì)量與比估計(jì)量的效果相同,當(dāng)調(diào)查變數(shù)與輔助變數(shù)間的相關(guān)係數(shù)ρ=0時(shí),回歸估計(jì)與簡(jiǎn)單估計(jì)的效果相同。但是,回歸估計(jì)量的優(yōu)越性只有在大樣本的情形下才能得到較好的發(fā)揮,而在小樣本時(shí),它的性質(zhì)就不大好,因而使用回歸估計(jì)量,樣本量一定要大,一般情況n≥30時(shí),回歸估計(jì)量較比估計(jì)量和簡(jiǎn)單估計(jì)量有較優(yōu)的估計(jì)效果,但它的意義不如後兩法簡(jiǎn)單明瞭,計(jì)算方法也較為複雜,特別是多元線性回歸估計(jì)或非線性回歸估計(jì)時(shí)更是如此。不過隨著電子電腦的廣泛應(yīng)用,再複雜的計(jì)算也可通過電腦進(jìn)行?;貧w估計(jì)中輔助變數(shù)可以是一個(gè),也可以是兩個(gè)或多個(gè);輔助變數(shù)應(yīng)與調(diào)查變數(shù)存在一定的聯(lián)繫(不一定是密切關(guān)係)。1、β為設(shè)定的常數(shù)(如β=B)時(shí)的情形2、β需從樣本計(jì)算時(shí)的情形當(dāng)β需從樣本計(jì)算時(shí),受前面確定B的最佳值的思路的啟發(fā),β的一個(gè)有效估計(jì)應(yīng)是總體回歸係數(shù)B的最小二乘估計(jì),也即取β為樣本回歸係數(shù)b。三、回歸估計(jì)量與簡(jiǎn)單估計(jì)量及比估計(jì)量的比較在大樣本時(shí),回歸估計(jì)量的精度要好於簡(jiǎn)單估計(jì)量和比估計(jì)量。第四節(jié)分層回歸估計(jì)一、各層分別回歸估計(jì)先對(duì)每層分別進(jìn)行回歸估計(jì),然後按層權(quán)加權(quán)平均,得總體平均數(shù)的估計(jì)量。第六章整群抽樣第一節(jié)整群抽樣概述第二節(jié)等概率整群抽樣的情形第三節(jié)不等概率整群抽樣的情形第一節(jié)整群抽樣概述一、整群抽樣的概念整群抽樣是先將總體各單元?jiǎng)澐殖扇舾扇海ńM),然後以群為單位,從中隨機(jī)抽取一部分群,對(duì)中選群內(nèi)的所有單元進(jìn)行全面調(diào)查。確切地說,這種抽樣組織形式應(yīng)稱為單級(jí)整群抽樣。二、分群的原則儘量擴(kuò)大群內(nèi)差異,而縮小群間差異。

三、整群抽樣的特點(diǎn)1.在大規(guī)模抽樣調(diào)查中,常常沒有或很難編制出包括總體所有次級(jí)單元在內(nèi)的抽樣框,而整群抽樣則不需要編制龐大的抽樣框。2.在樣本單元數(shù)相同的條件下,整群抽樣與簡(jiǎn)單隨機(jī)抽樣相比,樣本單元的分佈相對(duì)較集中,雖然樣本的代表性較差,但調(diào)查組織實(shí)施過程更加便利,同時(shí)還可以大大地節(jié)省調(diào)查費(fèi)用。因此,實(shí)際工作中,在權(quán)衡費(fèi)用和精度之後,有時(shí)寧可適當(dāng)增加一些樣本單元數(shù),也採(cǎi)用整群抽樣方法。3.整群抽樣的隨機(jī)性體現(xiàn)在群與群間不重疊,也無遺漏,群的抽選按概率確定。4.如果把每一個(gè)群看作一個(gè)單位,則整群抽樣可以被理解為是一種特殊的簡(jiǎn)單隨機(jī)抽樣。5.整群抽樣也是多階段抽樣的前提和基礎(chǔ)。6.整群抽樣有特殊的用途。有些現(xiàn)象的研究,如果直接調(diào)查作為基本單元的個(gè)體,很難說明問題,必須以一定範(fàn)圍所包括的基本單元為群體,進(jìn)行整群抽樣,才能滿足調(diào)查的目的。如人口普查後的復(fù)查、要想估計(jì)出普查的差錯(cuò)率,只有通過對(duì)一定地理區(qū)域內(nèi)的人口群體作全面調(diào)查才行。類似地諸如人口出生率、流動(dòng)率等調(diào)查都需要採(cǎi)用整群抽樣。7.整群抽樣要求分群後各群所含次級(jí)單元數(shù)目應(yīng)該確知,否則會(huì)給抽樣推斷帶來不便。四、關(guān)於群大小的計(jì)量整群抽樣中,如何有效地對(duì)群的大小進(jìn)行計(jì)量,直接關(guān)係到抽樣估計(jì)效率的高低。研究表明,對(duì)群的大小的最優(yōu)計(jì)量尺度是各群在所研究標(biāo)誌上的標(biāo)誌總量大小。但在實(shí)際工作中,它是未知的。因此通常選擇與所研究標(biāo)誌高度線性相關(guān)的另一輔助標(biāo)誌作為計(jì)量尺度。在整群抽樣的實(shí)際應(yīng)用中,經(jīng)常選擇以各群所含次級(jí)單元數(shù)的多少作為群大小的計(jì)量尺度。當(dāng)各群所含次級(jí)單元數(shù)相等時(shí),就稱群的大小相等;當(dāng)各群所含次級(jí)單元數(shù)不相等時(shí),就稱群的大小不相等。五、整群抽樣與分層抽樣的比較綜合前面的分析,比較整群抽樣和分層抽樣可以發(fā)現(xiàn)二者在分組(層或群)的條件、調(diào)查的方式、分組(層或群)的目的、分組(層或群)的原則、總體方差的分解等方面都存在著較為明顯的差別。第二節(jié)等概率整群抽樣的情形一、群的大小相等時(shí)(一)估計(jì)量整群抽樣是以群為單位進(jìn)行抽樣,如果群的抽取是簡(jiǎn)單隨機(jī)的,則當(dāng)群的大小都相等時(shí),可以將簡(jiǎn)單隨機(jī)抽樣理解為是一種特殊的整群抽樣,特別當(dāng)總體分群後的每個(gè)群都只包括一個(gè)次級(jí)單元時(shí),整群抽樣和簡(jiǎn)單隨機(jī)抽樣一致。因此,整群抽樣的估計(jì)量可以比照簡(jiǎn)單隨機(jī)抽樣方式來構(gòu)造。3、總體比例P的估計(jì)第三節(jié)不等概率整群抽樣的情形

一、放回的不等概率抽樣(一)PPS抽樣的入樣概率和實(shí)施方法1、入樣概率2、實(shí)施方法1)代碼法(累計(jì)和法,由漢森—赫維茨提出)2)拉希裏法(二)PPS抽樣的估計(jì)量對(duì)於PPS抽樣,其估計(jì)量可按漢森—赫維茨1943年提出的方法構(gòu)造。

二、不放回的不等概率抽樣第四節(jié)設(shè)計(jì)效應(yīng)和樣本容量的確定一、設(shè)計(jì)效應(yīng)可見,整群抽樣的設(shè)計(jì)效應(yīng)大?。淳鹊暮脡模┲饕Q於總體中群內(nèi)各次級(jí)單元間相關(guān)程度(在此主要是離散的程度)的大小。二、最佳群大小的確定如果樣本大小固定,雖然調(diào)查費(fèi)用隨著群大小的增加和群數(shù)的減少而變小,但從前面的結(jié)果看出,抽樣誤差將隨著群大小的增加和群數(shù)的減少而變大。因此,就要考慮求得最佳的群數(shù)或群的大小以便在給定費(fèi)用條件下使抽樣誤差最小,或在給定抽樣誤差條件下使費(fèi)用最省。三、樣本容量的確定確定整群抽樣的樣本量一般有兩種思路。1、根據(jù)設(shè)計(jì)效應(yīng)來定第七章

等距抽樣第一節(jié)

等距抽樣概述

第二節(jié)等距抽樣的實(shí)施方法第三節(jié)

總體參數(shù)的估計(jì)第四節(jié)

其他形式的等距抽樣

第一節(jié)

等距抽樣概述

一、等距抽樣的概念二、排序標(biāo)誌三、等距抽樣的特點(diǎn)一、等距抽樣的概念等距抽樣也稱系統(tǒng)抽樣或機(jī)械抽樣。它是將總體各抽樣單元按一定的標(biāo)誌和順序排列以後,每隔一定的距離(間隔)抽取一個(gè)單元組成樣本進(jìn)行調(diào)查。二、排序標(biāo)誌等距抽樣需要有作為排序依據(jù)的輔助標(biāo)誌。排序標(biāo)誌各式各樣,可自由選擇,但歸納起來,可分為兩類,即無關(guān)標(biāo)誌和有關(guān)標(biāo)誌,它們對(duì)等距抽樣的作用和相應(yīng)的估計(jì)精度各有不同的影響。1、按無關(guān)標(biāo)誌排序所謂無關(guān)標(biāo)誌排序,即用來對(duì)總體單元進(jìn)行排序的標(biāo)誌,與所要調(diào)查研究的標(biāo)誌是不同性質(zhì)的,二者沒有任何必然的關(guān)係。如研究人口的收入狀況時(shí),按身份證號(hào)碼、按門牌號(hào)碼排序非常方便,一般說來,這些號(hào)碼與調(diào)查專案沒有關(guān)係,因此可以認(rèn)為總體單元的次序排列是隨機(jī)的,所以也有人直接稱無關(guān)標(biāo)誌排序的等距抽樣為無序等距抽樣。2、按有關(guān)標(biāo)誌排序所謂有關(guān)標(biāo)誌排序,即用來對(duì)總體單元規(guī)定排列次序的輔助標(biāo)誌,與調(diào)查標(biāo)誌具有共同性質(zhì)或密切關(guān)係。這種排序標(biāo)誌,在我國(guó)抽樣調(diào)查實(shí)踐中有廣泛應(yīng)用,如農(nóng)產(chǎn)量調(diào)查,以本年平均畝產(chǎn)為調(diào)查變數(shù),以往年已知平均畝產(chǎn)作為排序標(biāo)誌。利用這些輔助標(biāo)誌排序,有利於提高等距抽樣的抽樣效果。三、等距抽樣的特點(diǎn)(1)將總體各單元按一定的順序排列後再抽樣,使得樣本單元的分佈更加均勻,因而樣本也就更具代表性,比簡(jiǎn)單隨機(jī)抽樣更精確,在某些場(chǎng)合下甚至可以不用抽樣框。並且如果能夠利用好樣本的相應(yīng)順序在總體中均勻分佈這一特點(diǎn),則容易形成一個(gè)按比例樣本。三、等距抽樣的特點(diǎn)(2)等距抽樣簡(jiǎn)單明瞭,快速經(jīng)濟(jì),操作靈活方便,使用面廣,是單階段抽樣中變化最多的一種抽樣技術(shù)。等距抽樣最初用於森林和土地使用情況的調(diào)查,後來經(jīng)過漢森、麥多、科克倫等學(xué)者的努力,使其成為當(dāng)今家計(jì)調(diào)查、記錄抽樣、空間抽樣、工業(yè)抽樣和為普查取得附加資訊及估計(jì)非抽樣誤差的一種常用方法。在我國(guó),等距抽樣已成了最主要、最基本的抽樣方式,一些大規(guī)模的抽樣調(diào)查,如農(nóng)產(chǎn)量抽樣調(diào)查、城鄉(xiāng)住戶調(diào)查、人口抽樣調(diào)查、產(chǎn)品品質(zhì)抽樣檢查中都普遍採(cǎi)用了等距抽樣。三、等距抽樣的特點(diǎn)(3)當(dāng)N=nK時(shí),等距抽樣就等同於每層只抽一個(gè)單元的分層抽樣或群的大小相等時(shí)只抽一個(gè)群的整群抽樣。三、等距抽樣的特點(diǎn)因?yàn)?,這時(shí),總體各單元可排列成如下方式:y11

y21

yi1

yk1

y12y22

yi2yk2

┋┋┋

y1ny2n

yinykn

三、等距抽樣的特點(diǎn)(4)等距抽樣的樣本常被視為一個(gè)集體單元,一般不計(jì)算樣本調(diào)查變數(shù)的方差,所以它只能抽象地進(jìn)行理論分析,而不能對(duì)抽樣方差進(jìn)行估計(jì)。三、等距抽樣的特點(diǎn)(5)若總體中的單元呈週期性的變化,等距抽樣的精度可能很高也可能很差。這時(shí)要慎重地選擇K。第二節(jié)等距抽樣的實(shí)施方法

一、隨機(jī)起點(diǎn)等距抽樣二、迴圈等距抽樣三、中點(diǎn)等距抽樣四、對(duì)稱等距抽樣法五、兩端修正法六、總體有週期性變化時(shí)的等距抽樣七、累計(jì)和等距抽樣一、隨機(jī)起點(diǎn)等距抽樣隨機(jī)起點(diǎn)等距抽樣就是前面概念所描述的方法。具體地說,它是在總體單元排序後的第1至K單元之間(第一個(gè)抽樣間隔之內(nèi))隨機(jī)抽取一個(gè)整數(shù)i,以它作為起始單元的編號(hào),以後按固定的順序和間隔依次在每個(gè)間隔之內(nèi)各抽取一個(gè)單元組成等距樣本,則整個(gè)樣本是由以下編號(hào)的單元所組成的。i+(j-1)K

(j=1,2,…,n)由於N不一定恰好是K的整數(shù)倍,所以按上述方法得到的等距樣本的樣本量可能為為避免這種樣本量不能確定的情況,確保樣本量為n,1952年拉希裏提出了迴圈等距抽樣的方法。二、迴圈等距抽樣在N≠nK時(shí),把總體中的N個(gè)單元按一定順序排列成一個(gè)首尾相接的環(huán)(圓形圖),取最接近於N/n的整數(shù)為抽樣間隔K,然後在1到N的單元中,隨機(jī)抽取一個(gè)單元(設(shè)為第i單元)作為起點(diǎn),再沿著圓圈按一定方向每間隔K抽取一個(gè)單元,直到抽夠n個(gè)單元為止。按此方法,可以保證樣本量n不變。不過此時(shí)首尾兩個(gè)樣本單元的間隔不一定恰好為K,它可能小於K,也可能大於K。迴圈等距抽樣從本質(zhì)上看仍然是隨機(jī)起點(diǎn)等距抽樣。我們注意到,當(dāng)N=nK時(shí),在上述兩種抽樣實(shí)施方法中,無論按哪一種方法,總體中每個(gè)單元的入樣概率都相等,從而是一種嚴(yán)格的等概率抽樣。但當(dāng)N≠nK時(shí),按第一種方法每一個(gè)單元的入樣概率依賴於初始值i,對(duì)不同的i,稍有不同。以下為了處理方便,我們假定N總是n的整數(shù)倍。在實(shí)際工作中,若n充分大,則由於N/n非整數(shù)而帶來的影響就充分小,可以忽略不計(jì)。三、中點(diǎn)等距抽樣1953年麥多為克服隨機(jī)起點(diǎn)等距抽樣容易產(chǎn)生系統(tǒng)性偏差的缺點(diǎn),提出中點(diǎn)等距抽樣(即抽取中心位置的樣本)法:計(jì)算出抽樣間隔K後,以第一組的組中點(diǎn)為起點(diǎn),等距抽取單元組成樣本。如果K為奇數(shù),以(K+1)/2為起點(diǎn),K為偶數(shù),以K/2或(K+2)/2為起點(diǎn)。四、對(duì)稱等距抽樣法對(duì)稱等距抽樣也是針對(duì)有序等距抽樣所提出的,其基本思想是使低標(biāo)誌值的單元與高標(biāo)誌值的單元在樣本中對(duì)等出現(xiàn)。從而使樣本的偏差縮小,代表性增強(qiáng)。由於具體的方法不同,對(duì)稱等距抽樣又有幾種類型。1.塞蒂的方法——

兩兩對(duì)稱等距抽樣1965年塞蒂提出了一種新的等距抽樣方法——對(duì)稱等距抽樣法,以克服總體的線性趨勢(shì)對(duì)估計(jì)效率的影響。設(shè)N=nK,n為偶數(shù)。抽樣時(shí),先把總體單元分成n/2個(gè)抽樣間隔,使每一抽樣間隔含有2K個(gè)單元。然後,在每一抽樣間隔內(nèi),抽取分別與兩端距離相等的兩個(gè)單元,這樣共抽取n個(gè)單元組成等距樣本。即:如果隨機(jī)起點(diǎn)為i,則在第一個(gè)抽樣間隔所抽兩個(gè)樣本單元的號(hào)碼分別為i及2K-i+1;在第二個(gè)抽樣間隔所抽兩個(gè)樣本單元號(hào)碼為i+2K及2(2K)-i+1;如此,最後在第n/2個(gè)抽樣間隔所抽兩個(gè)樣本單元號(hào)碼分別為i+(n-2)K及nK-i+1。一般,若隨機(jī)起為i,則抽中的n/2對(duì)樣本單元的號(hào)碼可以表示為i+2jK,2(j+1)K-i+1]

[j=0,1,…,(n/2)-1]]當(dāng)n為奇數(shù)時(shí),式中的j由0變到(n-1)/2-1為止,並且,要加上接近末端的第i+(n-1)K個(gè)單元。實(shí)際中,為便於對(duì)稱等距抽樣的實(shí)施,當(dāng)N=nK時(shí),可以將原來由小到大(或由大到小)順序排列的單元按照順逆交替的次序排列在一個(gè)表中,這樣,按隨機(jī)起點(diǎn)等距抽樣所抽取的樣本即為對(duì)稱等距樣本。所謂順逆交替是指在單元的排序中,若第一間隔由小到大排序,則第二間隔按由大到小排序,以此類推。2、辛的修正方法——

中心對(duì)稱等距抽樣1968年,辛等人提出另一種對(duì)稱等距抽樣法——中心對(duì)稱等距抽樣法。即在有序排列的總體單元中,從兩端劃分抽樣間隔。並從兩端的抽樣間隔開始,成對(duì)地抽取到兩端距離相等的單元組成等距樣本。這裏,仍假定N=nK。當(dāng)n為偶數(shù)時(shí),若隨機(jī)起點(diǎn)為i,則與之對(duì)稱的樣本單元號(hào)為倒數(shù)第一個(gè)抽樣間隔中的N-i+1;與第二個(gè)抽樣間隔中i+K對(duì)稱的是倒數(shù)第二個(gè)抽樣間隔的(N-K)-i+1;如此,一直抽到中間兩個(gè)抽樣間隔為止。一般,以i(i=1,2,…,K)為隨機(jī)起點(diǎn)的n/2對(duì)對(duì)稱等距樣本單元的號(hào)碼可以表示為:[i+jK,(N-jK)-i+1],[j=0,1,…,(n/2)-1]當(dāng)n為奇數(shù)時(shí),式中的j由0變到[(n-1)/2]-1為止。然後,再加上中間一個(gè)抽樣間隔中的第i+(n-1)K/2個(gè)單元。(我國(guó)抽樣調(diào)查工作者提出在中間一個(gè)抽樣間隔抽取中點(diǎn)處的一個(gè)單元。)五、兩端修正法抽樣方法同隨機(jī)起點(diǎn)等距抽樣時(shí)的情形。但在計(jì)算總體均值的估計(jì)量時(shí),對(duì)第一個(gè)和最後一個(gè)樣本單元加權(quán),其餘單元的權(quán)數(shù)仍為1(在除以n以前),以矯正由於起點(diǎn)不在中心位置而引起的系統(tǒng)偏差。1、耶茨的方法:設(shè)N=nK,i為1~K中的亂數(shù),則兩端的樣本單元的權(quán)數(shù)分別為:

其中“+”號(hào)用於第一個(gè)樣本單元,“-”號(hào)用於第n個(gè)樣本單元(下同)。當(dāng)總體單元具有嚴(yán)格的線性趨勢(shì)時(shí),加權(quán)的樣本均值就是總體均值。2、具爾豪斯與拉奧的方法適用於N≠nK的情況,並採(cǎi)用迴圈等距抽樣法,設(shè)i為1~N中的亂數(shù)。(1)若i+(n-1)K≤N,這時(shí)n個(gè)樣本單元不經(jīng)過yN,則第1個(gè)樣本單元和第n個(gè)樣本單元的權(quán)數(shù)分別為(2)若i+(n-1)K>N,設(shè)yN以後的樣本單元有n2個(gè),則第1個(gè)樣本單元和第n個(gè)樣本單元的權(quán)數(shù)分別為:

六、總體有週期性變化時(shí)的等距抽樣有一些總體,其單元的標(biāo)誌值在隨時(shí)間的自然排列順序中,會(huì)呈現(xiàn)某種明顯或不明顯的週期變化趨勢(shì)。如季節(jié)性消費(fèi)商品的銷售量,隨一年四季的變化而呈現(xiàn)出週期變化。還有些總體,反映出不明顯的週期影響。對(duì)有週期變化趨勢(shì)的總體進(jìn)行等距抽樣時(shí),抽樣間隔K的選擇,對(duì)估計(jì)效率的影響是極為重要的。為了說明問題,我們不妨假定總體單元標(biāo)誌值的變化為一正弦曲線。七、累計(jì)和等距抽樣以上所討論的等距抽樣都是以各單元大小相同為前提的,是等概率抽樣。如果抽樣單元的大小不同,且單元的大小又與調(diào)查變數(shù)相關(guān)時(shí),用上述方法就不大合適了,此時(shí),應(yīng)採(cǎi)用不等概率抽樣。其基本思路是:在總體各單元按某一標(biāo)誌排序後,累計(jì)各單元的大小Mi(當(dāng)各抽樣單元的大小用所含下一階單元的數(shù)目表示時(shí),也可直接累計(jì)其下一階單元數(shù))並進(jìn)行編碼,以總的累計(jì)數(shù)除以n作為抽樣間隔,用K表示,然後在最初的1到K個(gè)數(shù)中隨機(jī)確定一個(gè)數(shù)j(1≤j≤K),j所對(duì)應(yīng)的單元即為第一個(gè)被抽中單元,以後每間隔K抽取一個(gè)亂數(shù),並按同樣的方法確定出對(duì)應(yīng)的單元作為樣本單元,組成等距樣本。累計(jì)和等距抽樣的原理同上一章所討論的群大小不等時(shí)群的代碼法,此法在實(shí)際工作中經(jīng)常用到。第三節(jié)

總體參數(shù)的估計(jì)一、等概率抽樣的情形二、不等概率抽樣的情形一、等概率抽樣的情形為討論方便,仍假設(shè)N=nK,則在如下的排列形式中,有:

(i=1,2,…,K)(一)估計(jì)量設(shè)等距樣本為表中第i列單元,且i是隨機(jī)決定的,總體均值的估計(jì)量用表示,則

是的無偏估計(jì)。若N≠nK,則上述估計(jì)量是有偏的,但當(dāng)n充分大時(shí),其偏倚可以充分小。(二)估計(jì)量的方差如前所述,如果總體單元是按無關(guān)標(biāo)誌排列的,則其方差可按簡(jiǎn)單隨機(jī)抽樣去做。若總體單元是按有關(guān)標(biāo)誌排列的,則此時(shí)的等距抽樣可以看作是整群抽樣或分層抽樣的特例,因此,等距抽樣估計(jì)量的方差可以比照整群抽樣或分層抽樣的方法構(gòu)造,有幾種表示方法1、用等距樣本內(nèi)(群內(nèi))方差表示設(shè)等距樣本為表中第i列單元,且i是隨機(jī)決定的,則:其中為等距樣本(群)內(nèi)方差;S2為總體方差。這表明,當(dāng)?shù)染鄻颖緝?nèi)部的方差大於整個(gè)總體方差時(shí),等距抽樣比簡(jiǎn)單隨機(jī)抽樣有更高的精度。因此,為了提高等距抽樣的精度,只要有可能就在對(duì)總體單元排序時(shí)盡可能擴(kuò)大各等距樣本內(nèi)的差異。當(dāng)且僅當(dāng)>S2時(shí),等距抽樣比簡(jiǎn)單隨機(jī)抽樣精度高。2、用等距樣本內(nèi)(群內(nèi))相關(guān)係數(shù)表示為同一等距樣本內(nèi)(群內(nèi))成對(duì)的單元之間的相關(guān)係數(shù)。當(dāng)?shù)闹荡箪?時(shí),方差的值就會(huì)變大。3、用同一等距樣本內(nèi)單元對(duì)關(guān)於層平均值的相關(guān)係數(shù)表示是第h層即第h間隔的平均值;是等距樣本內(nèi)單位對(duì)關(guān)於層平均值的相關(guān)係數(shù)??梢姡?dāng)=0時(shí),等距樣本與每層取一個(gè)單元的分層隨機(jī)樣本精度相同;>0時(shí),等距抽樣的精度低於分層隨機(jī)抽樣;

<0時(shí),等距抽樣的精度高於分層隨機(jī)抽樣。(三)方差估計(jì)量前已指出,等距抽樣相當(dāng)於群的大小相等時(shí)的整群抽樣,但抽中的是一個(gè)群,這就使這個(gè)受人歡迎的抽樣方法有了一些遺憾:等距抽樣沒有無偏的方差估計(jì)量。這裏只介紹兩種方差估計(jì)方法。而在馮士雍、施錫銓著的《抽樣調(diào)查—理論、方法與實(shí)踐》一書中,列舉了八種不同的方差估計(jì)量,並進(jìn)行了比較分析。1、總體單元無序排列(即按無關(guān)標(biāo)誌排列)時(shí)可把等距樣本看成是簡(jiǎn)單隨機(jī)樣本,因此,其方差估計(jì)量可表示為:其中2、總體單元有序排列(按相關(guān)標(biāo)誌排列)時(shí)前已指出,等距抽樣可看成是從每層抽取1個(gè)單元的分層抽樣。但憑一個(gè)單元的標(biāo)誌值無法估計(jì)層內(nèi)方差,於是把相鄰兩行(層)的2K個(gè)單元組成一層,從中抽取2個(gè)單元作為樣本,這樣總體就被合成了n/2層(假設(shè)n為偶數(shù))。第h層的層內(nèi)方差

h=1,2,…,1/2

將諸代入比例分配的分層隨機(jī)抽樣的有關(guān)公式,則將上式中的下標(biāo)h改為j就得到(1)式式中:是相鄰兩個(gè)標(biāo)誌值的一階差分,它們間互不重疊,中利用了n/2個(gè)這樣的一階差分,這就要求n必須是偶數(shù)。為擺脫這個(gè)限制,增加平方和的自由度,以每相鄰兩個(gè)標(biāo)誌值的一階差分(它們是重疊的,共n-1個(gè))代替n/2個(gè)不相重疊的一階差分,得:(2)式(1)式和(2)式的對(duì)比研究表明:(1)式和(2)式對(duì)大多數(shù)模型的總體都具有一定的優(yōu)良性,即使對(duì)總體的性質(zhì)知道得很少,它們也是一個(gè)好的方差估計(jì)量。但(1)式受到n必為偶數(shù)的限制,因而(2)式更值得推薦。此外,也有人建議採(cǎi)用交叉子樣本法來估計(jì)等距抽樣的方差,但這種方法在實(shí)際操作中有諸多的不便,且當(dāng)各子樣本不大時(shí),效果也一般。對(duì)此感興趣的讀者可參閱有關(guān)文獻(xiàn)。二、不等概率抽樣的情形等距抽樣中每個(gè)單元的入樣概率也可以是不相等的。一般的不等概率等距抽樣定義如下:令{πi}是一組入樣概率,i=1,2,…,N,且時(shí),總體中的第i1,i2,…,in個(gè)單元即為抽中的樣本單元。當(dāng)每個(gè)πi≤1時(shí),抽樣是嚴(yán)格不放回的。最常用的也是最簡(jiǎn)單的不等概率等距抽樣是πPS等距抽樣,即令πi與單元大小Mi成比例不等概率等距抽樣的實(shí)施方法一般是累計(jì)和等距抽樣法,這在第二節(jié)中已作了介紹。與其他不放回的不等概率抽樣一樣,不等概率等距抽樣對(duì)總體總和Y的估計(jì)也是採(cǎi)用霍維茨—湯普森估計(jì)對(duì)於πPS等距抽樣,又有是無偏的,其方差可表示為(此時(shí),n是固定的)

由於對(duì)一般的n,πij的形式極為複雜,且有可能為零,因此,關(guān)於的估計(jì)可按如下思路進(jìn)行:一種考慮是將不放回的πPS等距樣本作為放回的PPS樣本處理可得到如下的方差估計(jì)形式

因?yàn)閷?shí)際抽樣是不放回的,為此,應(yīng)考慮乘上有限總體修正係數(shù)(fpc)1-f,由於這裏的單元實(shí)際上是不平等的,因此,f不是簡(jiǎn)單的等於n/N。我們使用f的以下估計(jì)則可以得到方差

估計(jì)量的另一種形式對(duì)於隨機(jī)排列的總體,此公式的效果很好。若考慮用相鄰樣本觀測(cè)值(但這裏需用nyi/πi代替等概率情形的yi)差值的平方和來表示方差,則得到或?qū)毒哂芯€性趨勢(shì)的總體,這兩個(gè)方差估計(jì)量特別適用。第四節(jié)

其他形式的等距抽樣一、分層等距抽樣二、二維等距抽樣二維等距抽樣二維等距抽樣,是對(duì)分佈在平面上的總體單元直接進(jìn)行的等距抽樣。如農(nóng)產(chǎn)量調(diào)查和森林木材積蓄量調(diào)查中,從抽中地塊抽取樣本點(diǎn),即屬這種情況。實(shí)際上,我們所研究的總體單元絕大多數(shù)分佈在平面上,以前是通過對(duì)總體單元的編號(hào),排隊(duì)等方法,將它化為“一維等距抽樣”。但在一些情況下,還需直接在平面上抽取樣本。二維等距抽樣的方法很多,下麵僅介紹幾種最簡(jiǎn)單、實(shí)用的方法。1、方格法是將總體所在的平面區(qū)域G,按照需要抽取的樣本單元數(shù)劃分為若干大小相同的方格,然後以等距方式在每個(gè)方格抽取一個(gè)樣本單元組成樣本。即抽樣間隔之長(zhǎng)等於方格的邊長(zhǎng),可按下述公式計(jì)算:其中,K=抽樣間隔;G=總體區(qū)域的面積;n=樣本單元數(shù)這裏,為方便討論,假定地塊的圖形是長(zhǎng)為a,寬為b的長(zhǎng)方形,置於平面直角坐標(biāo)系的第一象限。且a=Kp,b=Kq,p、q為整數(shù),pq=n。當(dāng)然,實(shí)際中的地塊常常是不規(guī)則的,並不滿足上述條件,但可通過割補(bǔ)法化成比較規(guī)則的幾何圖形,近似按上述方法處理。從方格中抽取樣本點(diǎn)有多種方法。①若取隨機(jī)起點(diǎn),並且它的座標(biāo)為(i,j)。所有樣本點(diǎn)的座標(biāo)可表示為:(i+Ks,j+Kt),s=0,1,2,…,p-1;t=0,1,2,…,q-1[JB]②另一種方法是,把樣本點(diǎn)放在每一方格的中心處,稱為中心方格法。其樣本的座標(biāo)為:(K/2)+Ks,(K/2)+Kt).(s=0,1,2,…,p-1;t=1,2,…,q-1)這種方法在農(nóng)產(chǎn)量調(diào)查中多用於平播、撒播、窄壟和株行距較小的作物,如麥、水稻等。實(shí)際中,每個(gè)樣本點(diǎn)是用測(cè)規(guī)或測(cè)框劃出的園形或方形小地塊,稱為面積樣本。每個(gè)樣本點(diǎn)的面積常為10平方市尺,這樣,便於計(jì)算。這種方法也稱為框測(cè)法2、壟測(cè)法對(duì)於寬壟和株行距較大的作物,如玉米、薯類等,常採(cǎi)用壟測(cè)法。壟測(cè)法需先計(jì)算地塊所有壟的總壟長(zhǎng),依地塊情況,可按下述方法計(jì)算:總壟長(zhǎng)=平均壟長(zhǎng)×壟數(shù)=地塊總面積/平均壟寬,其中:平均壟寬=地塊兩端寬度之和/地塊兩端壟數(shù)之和,抽樣間隔K=總壟長(zhǎng)/樣本單元數(shù)抽取時(shí),從地塊的一角開始,即從第一壟開始,按等距抽樣方法依次向各壟抽取,每個(gè)樣本點(diǎn)是長(zhǎng)度為10市尺的壟段,這種樣本也稱為長(zhǎng)度樣本。實(shí)用中,還有許多方法,如將地塊劃分為正三角形小塊,形成三角形網(wǎng),使樣本點(diǎn)散佈於正三角形的頂點(diǎn)上。也還可以利用試驗(yàn)設(shè)計(jì)的方法安排樣本。關(guān)於二維等距抽樣的應(yīng)用可參看農(nóng)產(chǎn)量調(diào)查。此外,在實(shí)際工作中當(dāng)總體各單元標(biāo)誌值的變化比較均勻,且層界不明顯時(shí),也常採(cǎi)用等距分層抽樣的方法。其基本思想是,先對(duì)總體按有關(guān)標(biāo)誌排序,然後等分成L個(gè)間隔。將每個(gè)間隔視為一層,在各層內(nèi)分別獨(dú)立進(jìn)行簡(jiǎn)單隨機(jī)抽樣。它與一般分層抽樣的區(qū)別在於,將不同大小的層(用各層所含單元數(shù)表示)調(diào)整為同大小的層;它與一般等距抽樣的區(qū)別在於,改每層按固定位置抽取一個(gè)單元為每層獨(dú)立抽取若干個(gè)單元。在等距分層抽樣中,其估計(jì)量及方差仍按一般分層隨機(jī)抽樣方式去構(gòu)造。第八章多階抽樣第一節(jié)多階抽樣概述第二節(jié)一階單元等大小的兩階抽樣第三節(jié)一階單元不等大小的兩階抽樣返回第一節(jié)多階抽樣概述一、多階抽樣的基本概念根據(jù)實(shí)際情況將整個(gè)抽樣程式分成若干個(gè)階段,一個(gè)階段一個(gè)階段地進(jìn)行抽樣,以完成整個(gè)抽樣過程,這種抽樣就叫多階抽樣。從總體中隨機(jī)抽取一部分一階單元,然後再?gòu)谋怀橹械囊浑A單元內(nèi),隨機(jī)抽取部分二階單元並對(duì)它們進(jìn)行全面調(diào)查,我們把這種抽樣技術(shù)稱為兩階抽樣。它是由印度統(tǒng)計(jì)學(xué)家馬哈拉諾比斯首先提出來的。二、多階抽樣的特點(diǎn)(一)便於組織抽樣(二)抽樣方式靈活,有利於提高抽樣的估計(jì)效率(三)多階段抽樣對(duì)基本調(diào)查單元的抽選不是一步到位的(四)多階段抽樣實(shí)質(zhì)上是分層抽樣與整群抽樣的有機(jī)結(jié)合(五)多階抽樣在抽樣時(shí)並不需要二階或更低階單元的抽樣框(六)多階抽樣還可用於“散料”的抽樣,即散料抽樣第二節(jié)一階單元等大小的兩階抽樣返回2、總體比例的估計(jì)3.最佳抽樣比的確定按費(fèi)用固定條件下,使方差極小,或在方差固定條件下使費(fèi)用極小的條件二、分層二階抽樣設(shè)總體分成L層,第h層有Nh個(gè)一階單元,每個(gè)一階單元均含Mh個(gè)二階單元。在第h層隨機(jī)抽了nh個(gè)一階單元,又從每個(gè)被抽中的一階單元中隨機(jī)抽了mh個(gè)二階單元。則的估計(jì)量為其中是按二階單元的層權(quán);

為第h層的樣本均值。其方差為方差估計(jì)量為

其中上式乘以即總體中每個(gè)二階單元入樣的概率都相等,則樣本是自加權(quán)時(shí),三、三階抽樣

設(shè)總體中含有N個(gè)一階單元,每個(gè)一階單元又含M個(gè)二階單元,而每個(gè)二階單元中又含有K個(gè)三階單元,各階樣本大小分別為n,m和k。令yiju(u=1,2,…K)為第i個(gè)一階單元的第j個(gè)二階單元中,第u個(gè)三階單元的觀測(cè)值,則若

三階抽樣中,每階抽樣都是簡(jiǎn)單隨機(jī)的,則總體均值的無偏估計(jì)量為其方差為方差的無偏估計(jì)量為其中

第三節(jié)一階單元不等大小的兩階抽樣

在兩階抽樣中,各一階單元所包含的二階單元數(shù)不等是最普遍的現(xiàn)象,因此對(duì)其樣本指標(biāo)和抽樣方差的估算,具有普遍意義,但較一階單元等大小的估算複雜很多。根據(jù)各個(gè)一階單元的不相等及其差異程度是否懸殊,在抽樣時(shí)(即抽取一階單元時(shí))就要考慮採(cǎi)用等概抽樣或不等概抽樣。一、等概率抽樣在進(jìn)行兩階段抽樣時(shí),不考慮各一階單元權(quán)重(主要用所含二階單元數(shù)的多少表示)的不同,一律予以

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論