老-6抽樣調(diào)查-p第六章_第1頁
老-6抽樣調(diào)查-p第六章_第2頁
老-6抽樣調(diào)查-p第六章_第3頁
老-6抽樣調(diào)查-p第六章_第4頁
老-6抽樣調(diào)查-p第六章_第5頁
免費預覽已結(jié)束,剩余52頁可下載查看

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領

文檔簡介

本章要求1、基本概念2、抽樣指標計算3、抽樣平均誤差的影響因素及計算4、全及指標推斷:抽樣極限誤差計算、置信區(qū)間計算5、簡單隨機抽樣重復抽樣的必要抽樣單位數(shù)計算掌握分類特點3、全及總體分類及全及指標4、抽樣方式分類5、抽樣誤差概念及分類6、抽樣平均誤差影響因素7、

程度、概率度8、抽樣方案設計基本原則9、主要的抽樣組織方式種類理解1、抽樣2、抽樣1、抽樣2、抽樣的意義的適用范圍3、不同抽樣方式的可能樣本數(shù)目4、抽樣

的理論依據(jù)5、抽樣平均誤差的意義6、各種抽樣組織方式介紹7、不重復抽樣的必要抽樣單位數(shù)計算了解第一節(jié)

述第二節(jié)基本概念及理論依據(jù)第三節(jié)抽樣平均誤差第四節(jié)全及指標推斷第五節(jié)抽樣方案設計練習題人均教育支出抽樣案例第一節(jié)

述1、抽樣

概念廣義:抽取部分單位觀察,并根據(jù)觀察結(jié)果推斷全體。狹義:按照隨機原則抽取部分單位觀察,并運用數(shù)理統(tǒng)計方法,由部分對總體做出數(shù)量上的推斷分析。隨機抽樣:保證總體中各單位具有同等機會被抽中,客觀地抽取樣本,并推斷總體。2、特點只抽取部分單位;用部分推斷總體;抽樣遵循隨機原則;會產(chǎn)生抽樣誤差,但誤差可以計算和控制。3、統(tǒng)計誤差統(tǒng)計數(shù)字與各種實際數(shù)量之間的差別。登記誤差:誤差或工作誤差,指在登記、匯總計算過程中產(chǎn)生的誤差。(可以避免的)代表性誤差:用部分去推斷總體產(chǎn)生的誤差。(一般不可避免)返回第二節(jié)基本概念及理論依據(jù)一、基本概念變量總體:屬性總體:總體中總體單位的標志為品質(zhì)標志2、抽樣總體:從全及總體隨機抽取得部分單位的集合體。一個全及總體中,可以抽取多個抽樣總體,即抽樣總體不是唯一的、確定的。一般認為,樣本容量大于或等于30個單位數(shù)時稱為大樣本,小于30個單位數(shù)時稱為小樣本??傮w中總體單位的標志為數(shù)量標志(一)全及總體和抽樣總體1、全及總體:所要認識對象的全體。它是唯一的、確定的。N屬性總體:P

N1

P(1

P)

PQN1

具有某種屬性的單位數(shù),N0不具有某種屬性的單位數(shù)NP

Q

1N

1

Q(

X

X

)2

稱為總體標準差Q

N0(二)全及指標和抽樣指標1、全及指標:根據(jù)全及總體中的各單位標志值或標志特征計算的、反映總體某種屬性的綜合指標。又稱統(tǒng)計參數(shù)。它是唯一確定的。變量總體:

X

XN屬性總體成數(shù)方差公式推導:則屬性總體的平均數(shù)

P

FN1

N0

N

0

N0

N1X

XF

1

N1XF及格1N1不及格0N0

1

0N1

N0(1

P)2

N

(0

P)2N(

X

X

)2

f

f

P

(1

P)2

P

P2

(1

P)

P(1

P)

PQ2、抽樣指標:根據(jù)抽樣總體中的各單位標志值或標志特征計算的綜合指標。又稱統(tǒng)計量,是一個隨機變量。變量總體:n

1(x

x)2S

nx

xS稱為樣本標準差屬性總體:q

n0np

q

1不具有某種屬性的單位數(shù)nS

p(1

p)

pqn1

具有某種屬性的單位數(shù),n0p

n1(三)抽樣方法和樣本可能數(shù)目1、抽樣方法:從全及總體隨機抽取得部分單位的取樣方法。樣本數(shù)目與樣本容量有關(guān),也與抽樣方法有關(guān),樣本容量既定,則樣本數(shù)目取決于抽樣的方法。重復抽樣根據(jù)取樣的方式不同不重復抽樣考慮順序抽樣根據(jù)對樣本的要求不同不考慮順序抽樣以上結(jié)合為四種抽樣方法:考慮順序的重復抽樣、考慮順序的不重復抽樣、不考慮順序的重復抽樣和不考慮順序的不重復抽樣。NN

!An

k

N

(N

1)

(N

n

1)

(N

n)!3)不考慮順序的不重復抽樣NN

!Cnn!

k

N

(N

1)

(N

n

1)

n!(N

n)!N2)考慮順序的不重復抽樣Bn

k

Nn2、樣本可能數(shù)目1)考慮順序的重復抽樣NDnN

n1

k

Cn

(N

n

1)!n!(N

1)!4)不考慮順序的重復抽樣例如:一個盒子里有三個球,標號分別為1、2、3,現(xiàn)從中隨機抽取兩個。即N=3,n=2:1)考慮順序的重復抽樣11

2

311

12NBn

k

32

92)考慮順序的不重復抽樣3!NAn

k

6(3

2)!NDn

k

C2

63213)不考慮順序的重復抽樣4)不考慮順序的不重復抽樣3!NCn

k

32!(3

2)!二、抽樣的理論依據(jù),抽樣成數(shù)p趨近于總體成數(shù)P。這1、大數(shù)定律:該定律表明,當樣本單位數(shù)n足夠大時,抽樣平均數(shù)x趨近于總體平均數(shù)X為抽樣推斷提供了重要依據(jù)。2、中心極限定律:該定律證明,不論總體服從何種分布,只要它的數(shù)學期望和方差存在,從中抽取容量為n的樣本,當n足夠大,則這個樣本的平均數(shù)

x

趨于正態(tài)分布。這為抽樣誤差的概率估計提供了依據(jù)。返回第三節(jié)

抽樣平均誤差一、抽樣誤差的概念和理解的范圍的登記性誤差存在于所有的統(tǒng)計

中,而且越大、 單位越多,產(chǎn)生誤差的可能性越大。登記性誤差與測量工具的精度、測量技術(shù)、責任心、被

者的合作態(tài)度等密切相關(guān)。1、抽樣誤差:來源于登記性誤差和代表性誤差。登記性誤差:誤差或工作誤差,指在、編輯、編碼、匯總過程中由于觀察、測量、登記、計算上的差錯或被者提供虛假資料而引起的誤差。這種誤差的直接表現(xiàn)就是沒有真實客觀地搜集或記錄被單位的標志值或標志特征,從而使所計算的統(tǒng)計量偏離其真實值。代表性誤差:抽樣過程中產(chǎn)生的以及用部分去推斷總體過程中產(chǎn)生的誤差。(一般不可避免)代表性誤差又分為兩種:偏差:系統(tǒng)性誤差由非隨機因素(違背隨機原則)造成樣本代表性不足而產(chǎn)生的誤差。表現(xiàn)為樣本統(tǒng)計量的值系統(tǒng)性偏高或偏低。這種誤差也屬于工作態(tài)度、水平、技術(shù)等的問題。應盡量避免。隨機誤差:偶然性誤差遵循了隨機原則的原則,由偶然因素引起樣本結(jié)構(gòu)不能

完全代表總體結(jié)構(gòu)而產(chǎn)生的誤差。偶然誤差不可避免,即使

沒有登記誤差和系統(tǒng)性誤差,仍會存在誤差。雖然不可避免,但可以估計和控制。偶然誤差總和等于0。全面 不存在偶然誤差。代表性誤差偏差:系統(tǒng)性誤差實際誤差隨機誤差:偶然誤差抽樣平均誤差隨機誤差又可以分為實際誤差和抽樣平均誤差。實際誤差:樣本指標與總體指標之間的實際差別,這種無法直接計算。抽樣平均誤差:所有可能抽取的樣本的指標的標準差,代表了所有樣本平均數(shù)(成數(shù))與總體平均數(shù)(成數(shù))的差距的平均,可以計算,登記性誤差抽樣中的總誤差的就是這種誤差。二、抽樣平均誤差的計算1、理論公式kkipix22(x

X

)(

p

P)屬性總體

變量總體

(i

1,2,,

k)實際上,全及指標是未知的,而且實踐中只會抽樣一個樣本。所以這個公式實踐中不采用。nn

2變量總體:x

1公式說明了,抽樣平均誤差僅為全及總體標準差的

n

。

為總體標準差2、實際使用公式(1)重復抽樣:nP(1

P)屬性總體:P

P為總體成數(shù)(2)不重復抽樣:x(1

)(當N很大時)n

N

n(

)

n

N

1N

n

2

2

當抽樣比大大小于1時,不重復抽樣的抽樣平均誤差與重復抽樣的平均誤差就非常接近。PP(1

P)

(1

n

)n

N

前面公式中用的是總體標準差和總體成數(shù),而總體標準差和總體成數(shù)是未知的,實際運用中,常采用以下方法估計:1、用過去的取得的資料;2、用樣本方差和成數(shù)代替總體方差和成數(shù);3、用小規(guī)模的

資料;4、用預估的資料。一般采用第二種方法,即用樣本方差和成數(shù)代替總體方差和成數(shù)。1、抽樣平均誤差計算總結(jié)變量總體重復抽樣不重復抽樣x

)xs2n

N(1nN

s

n

n

2

n(1

)

n屬性總體重復抽樣p

P(1

P)

p(1

p)n

nP(1

P)

(1

n

)n

N不重復抽樣

pp(1

p)

(1

n

)n

N現(xiàn)實中,總體標準差往往是未知的,此時采用樣本標準差和樣本成數(shù)作為總體標準差和總體成數(shù)的估計值。當總體單位總數(shù)未知時,則默認采用重復抽樣的計算公式。例2、抽樣平均誤差的影響因素:全及總體標志變動程度??傮w標志變動越大,抽樣平均誤差越大,反之則越小。抽樣單位數(shù)的多少。其他條件不變,抽取的單位數(shù)越多,抽樣平均誤差越小,反之越大。抽樣方法。重復抽樣的平均誤差大,不重復抽樣的平均誤差小。抽樣的組織方式。返回第四節(jié)全及指標的推斷一、概述抽樣

的目的是為了用樣本指標推斷總體它不能說明誤差大小,意義不大。但它可以說明優(yōu)良估計的標準。(無偏性、一致性和有效性)2、區(qū)間估計可以將誤差控制在一定的范圍內(nèi)(即說明總體指標在某一范圍內(nèi)的可能性大?。??;騪

P指標。對總體指標的估計方法有兩種:一種是點估計,另一種是區(qū)間估計。

1、點估計:x

X二、抽樣極限誤差

x

x

X

p

p

P由于存在誤差,而且抽樣指標會隨著樣本的不同而變動。這樣,可以在統(tǒng)計意義上,推斷總體指標在一定范圍內(nèi)。樣本指標與總體指標的離差絕對值就是抽樣極限誤差

。由于離差可正可負,整個變動的范圍區(qū)間稱為置信區(qū)間。變量總體屬性總體置信區(qū)間:X

[x

x

,

x

x

]P

[

p

p

,

p

p

]對上式去掉絕對值符號,并且移項可得到:x

x

X

x

xp

p

P

p

p置信區(qū)間是統(tǒng)計意義上的,即一定概率下,總體指標所落在的區(qū)間范圍。抽樣平均誤差說明估計的準確程度,因此可以將抽樣平均誤差作為誤差單位(當然在不同的條件下,這個單位的具體值是不同的),抽樣極限誤差可以表示為多少個誤差單位(即抽樣平均誤差的多少倍),表示為:x

x

X

tx

p

p

P

t

p抽樣極限誤差為t個抽樣平均誤差,或者是抽樣平均誤差的t倍。這個t就稱為概率度或置信度。顯然,概率度與抽樣極限誤差成正比。tP

F

(t)x68.27%95.45%99.73%123

3

2

1P(概率)常用的t及對應的F(t)tF(t)10.68271.640.901.960.9520.954530.9973四、全及平均指標的區(qū)間估計計算步驟根據(jù)上面的

,全及平均指標推斷的最終結(jié)果表現(xiàn)為一定概率保證程度下的置信區(qū)間。2、根據(jù)概率保證要求,查表得出t

值,然后計算出抽樣極限誤差。3、得出置信區(qū)間顯然:當置信區(qū)間已知時,可以根據(jù)已知條件倒推,計算抽樣平均誤差、樣本容量、概率度等。1、根據(jù)

資料計算出抽樣平均誤差[x

x

,

x

x

][

p

p

,

p

p

]例

2

tx

t2xt

2

2n

x重復抽樣:xnx(1

)n

N不重復抽樣:

2

tx

t2xNt

2

2n

x

N

t

2

2五、簡單隨機抽樣的必要樣本容量的確定(一)計算公式:nnp(1

p)

p

t

p

t2pt2

p(1

p)np

2pNt

2

p(1

p)np

N

t

2

p(1

p)例(二)確定抽樣單位數(shù)的依據(jù)1、抽樣推斷的可靠程度和精確度的要求;如果要求高則抽樣單位多,反之則少。2、總體標志的變異程度,大則多,小則少。3、抽樣組織方法。簡單隨機抽樣所需要的抽樣單位數(shù)一般大于類型抽樣或機械抽樣,不重復抽樣所需要的抽樣單位數(shù)少于重復抽樣。4、根據(jù)成本效益原則。返回第五節(jié)抽樣方案設計一、抽樣方案設計的原則保證實現(xiàn)抽樣隨機性的原則;保證實現(xiàn)最大抽樣效果原則。二、抽樣組織形式(一)簡單隨機抽樣直接抽選法;抽簽法隨機數(shù)碼表法(二)類型抽樣(分類抽樣、分層抽樣)類型抽樣是先對總體各單位按一定標志加以分類,然后再從各類中按隨機原則抽取樣本,由各類中的樣本組成一個總的樣本。確定各類型組的抽樣單位數(shù):標志差異大的組多抽一些,標志差異小的組少抽一些;按各組的單位數(shù)占總體單位數(shù)的比例來確定各組的抽樣單位數(shù),稱為類型比例抽樣,這是通常采用的方法。適用于各組組間單位標志差異較大,而組內(nèi)差異較小的情況。(三)機械抽樣(等距抽樣、系統(tǒng)抽樣)機械抽樣是對研究的總體按一定的順序排列,每隔一定的間隔抽取一個或若干個單位,將這些抽取的單位組成樣本。方法有:隨機起點等距抽樣半距起點等距抽樣對稱等距抽樣機械抽樣是一種簡單易行的,在大規(guī)模抽樣

中常用的方法。(四)整群抽樣整群抽樣是將總體劃分為由總體單位所組成的若干群,然后以群為抽樣單位,從總體中抽取若干個群體作為樣本,對選中群內(nèi)的所有單位進行全面的抽樣方式。當群間差異較小,而群內(nèi)差異較大時適合采用?;蛘哒f,在分群時應使群內(nèi)方差盡可能大,而使群間方差盡可能小。(五)多階段抽樣多階段抽樣是先從總體中抽取部分群,再從抽中的群內(nèi)抽取部分群或單位。比如對某省農(nóng)戶,先從全省抽取部分縣作為第一階段抽取的樣本,再從抽中的縣內(nèi),抽取部分鄉(xiāng)或村作為第二階段抽取的樣本,再從抽中的鄉(xiāng)或村內(nèi),抽取部分農(nóng)戶。多階段抽樣在組織技術(shù)上是整群抽樣和類型抽樣的綜合。返回總返回例

題例1、某地對1萬畝糧食耕地進行糧食產(chǎn)量,根據(jù)去年的資料,去年畝產(chǎn)1000公斤,方差為500,此次抽取100畝耕地 ,平均畝產(chǎn)1050公斤,請問在重復和不重

復抽樣條件下,

平均畝產(chǎn)的抽樣平均誤差分別為多少?500100)10000x(1n

2

n)

N(1

1002.2(2

公斤)重復抽樣:100xn

2

500

5

2.2(4

公斤)不重復抽樣:例2,某公司進口一批電子器件5000件,為了檢測其抽取了500件進行檢驗,結(jié)果如下:分別計算重復抽樣和不重復抽樣方式下電子器件的抽樣平均誤差。8以下8-99-1010-1111以上20703404030合計500—xf器件數(shù)

組中值千小時

(只)f

xx2

f

(x

x)2

f150595323042034511255057.53068544103967.578.4167.230.13641.62122.414740

45245

309.87.58.59.510.511.5

f

500x

xf

4740

9.48(千小時)45245500S

2

x

2

9.482

0.6196

x2

f

f重復抽樣下:500xs2nn

2

0.6196

0.04(千小時)不重復抽樣下:xs2N(1

)n

N

2

n(1

)

n

n

0.6196

(1

500

)

0.0(3

千小時)500

5000例3:如果

低于9000小時的產(chǎn)品是不合格品,計算不合格率的抽樣平均誤差。90pn

500

p

n1

18%不

x重復抽樣下:500pn

p(1

p)

0.18

(1

0.18)

1.72%不重復抽樣下:p

p(1

p)

(1

n

)

n

N0.18

(1

0.18)

(1

500

)

1.71%500

5000返回例4:某公司對一批新產(chǎn)品的使用

進試。隨機收取為2800小時,標準差100小時,了400個產(chǎn)品,測得其平均不合格產(chǎn)品數(shù)為80個。要求:以95.45%的可靠程度估計這批新產(chǎn)品的平均使用

;以95%的可靠程度估計這批新產(chǎn)品的不

;若要將這批產(chǎn)品的使用

范圍控制在2788—2812小時之間,其他條件不變,則應該抽取多少個零件進

試?若要將這批產(chǎn)品的不

控制在15%—25%之間,并保證有95%的置信度,則至少應該抽取多少個產(chǎn)品進

試?答案1答案2

S

100

5(小時)n

n

400x

(1)

F

(t)

95.45%t

2x

tx

2x

x

X

x

x2800

10

X

2800

102790

X

2810則這批新產(chǎn)品在95.45%的可靠程度上的置信區(qū)間為(2790,2810)小時。pn

400

p(1

p)

0.2

(1

0.2)

2%(2)為

F

(t)

95%t

1.96

p

t

p

1.96

2%

3.92%20

3.9%2%

P

20

3.9%2%16.08%

P

23.92%在95%的可靠程度下這批新產(chǎn)品的不(16.08%,23.92%)不:p

80

400/20%返回(3)x

(2812

2788)

/

2

12或x

2812

2800

2800

2788

1212222

277.8(個)22

1002

xxt

2

S

2n

t

2

2在95.45%的可靠程度,至少需要抽取278個產(chǎn)品,才能滿足可靠性和準確度要求。

p

(25%

15%)

/

2

5%或

p

25%

20%

5%0.0522

245.9(個)pt

2

p(1

p)

1.962

0.2

0.8n

在95%的可靠程度,至少需要抽取246個產(chǎn)品,才能滿足可靠性和準確度要求。(4)返回練習題1、某企業(yè)對某批產(chǎn)品抽取60件進行穩(wěn)定性檢驗,檢驗結(jié)果如下:1以下1-22-33-44以上51720162xfx2

f穩(wěn)定時間

件數(shù)

組中值(分鐘)

fx2.525.5505691.2538.512519640.5401.250.51.52.53.54.5合

60

1431)計算穩(wěn)定時間的抽樣平均誤差。2)若1分鐘以上為合格,計算的抽樣平均誤差。

f

60x

xf

143

2.38(小時)1)60401.25

2.38

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論