社會統(tǒng)計學(xué)-6參數(shù)估計1大數(shù)定律、中心極限定理和抽樣分布_第1頁
社會統(tǒng)計學(xué)-6參數(shù)估計1大數(shù)定律、中心極限定理和抽樣分布_第2頁
社會統(tǒng)計學(xué)-6參數(shù)估計1大數(shù)定律、中心極限定理和抽樣分布_第3頁
社會統(tǒng)計學(xué)-6參數(shù)估計1大數(shù)定律、中心極限定理和抽樣分布_第4頁
社會統(tǒng)計學(xué)-6參數(shù)估計1大數(shù)定律、中心極限定理和抽樣分布_第5頁
已閱讀5頁,還剩34頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第6講

參數(shù)估計本講概要大數(shù)定律、中心極限定理和抽樣分布參數(shù)估計樣本容量的確定1.大數(shù)定律、中心極限定理和抽樣分布要研究隨機現(xiàn)象的規(guī)律性,必須做大量的觀察或試驗。對于隨機現(xiàn)象而言,的表現(xiàn)純屬偶然,但通過大量的觀察或試驗,可以發(fā)現(xiàn)隨機現(xiàn)象表現(xiàn)出一定的規(guī)律性。這種規(guī)律性的出現(xiàn)是由于在大量觀察或試驗的過程中,隨機現(xiàn)象的各種偶然性在一定程度上相互抵消、相互補償。因此,大量觀察或試驗的結(jié)果表現(xiàn)出來的規(guī)律性會非常穩(wěn)定。(1)大數(shù)定律大數(shù)定律:設(shè)m是在n次獨立觀察中事件A出現(xiàn)的次數(shù),p是事件A在一次觀察中出現(xiàn)的概率,則對于任意正數(shù)ε,有當(dāng)n足夠大

件A出現(xiàn)的頻率將無限接近于其發(fā)生的概率,即頻率的穩(wěn)定性。Law

of

Large

Numbers:

Comparing

Relative

versusAbsolute

Frequency

of

Coin

FlipsIf

you

wereto

flip

acoin

10,000

times,

you

would

expect

the

number

ofheads

tobeapproxima

y

equal

to

the

numberof

tailswhenusing

afair

coin.

Theabsolute

difference

plot

can

show

qui

arge

differences

in

absolute

terms,

,

asthe

number

of

tosses

increases.

In

comparison,

the

relative

difference

plot

showsthat

in

relative

terms,

,

the

differenceconverges

to

zero.This

Demonstration

showcases

the

law

of

large

numbers,

a

key

theorem

inprobability

theory,

that

describes

the

result

of

performing

the

same

experiment

alarge

number

of

times.

According

to

the

law,

the

average

of

the

results

obtainedfrom

a

large

number

of

trials

should

be

close

to

the

expected

value,

and

will

tendto e

closer

as

more

trials

are

performed.

For

this

Demonstration,

thinkaboutthe

simple

case

of

tossing

a

fair

coin.

If

each

flip

is

independent

of

the

next(so

that

the

result

of

one

flip

does

not

change

the

probabilities

of

seeing

heads

ortails

on

the

next

flip),

then

the

proportion

of

heads

in

tosses

should

get

close

to0.5

as

gets

large.(2)中心極限定理大數(shù)定律和切比雪夫大數(shù)定律說明了在大量觀察的情況下,隨

量特征值的穩(wěn)定性,即頻率穩(wěn)定率,均值穩(wěn)定于數(shù)學(xué)期望。中心極限定理則說明了在大量觀察的情況下,隨的特征值在分布上所表現(xiàn)的穩(wěn)定性。具體到抽樣量來說,只要樣本量足夠大,不管總體的分布如何,樣本均值的分布都將是已知的,即服從正態(tài)分布。這就為通過樣本來研究未知總體奠定了理論基礎(chǔ)。共有10名工作人員,他們的工作年限分別為:6789101112131415隨機抽取3人,則樣本均值的分布特征可以表示為右圖。(3)抽樣分布抽樣分布是所有樣本指標(如均值、比例、方差等)形成的分布。它是根據(jù)概率原則而成立的理論性分布,顯示由同一總體中反復(fù)抽取樣本時,各個可能出現(xiàn)的樣本統(tǒng)計量的分布情況。抽樣分布的概念要點:①抽樣分布是一種理論概論分布;②

抽樣分布中的隨 量是樣本統(tǒng)計量,如樣本均值、樣本成數(shù)等;③結(jié)果來自容量相同的所有可能樣本。例:共有10名

,他們的工作年限分別為:6

7

8

9

10

11

1213

1415隨機抽取3人,計算均值的抽樣分布。2.參數(shù)估計推論統(tǒng)計:根據(jù)局部資料(樣本資料)對總體的特征進行推斷。統(tǒng)計推論具有兩方面的特點:一方面由于局部資料來源于總體,因此局部資料的特性在某種程度上能反映總體的特性;但另-方面由于社會資料的隨機性,即抽樣的結(jié)果不是唯一的,又使得一次抽樣結(jié)果不能恰好就等于總體的結(jié)果。推論統(tǒng)計可分為兩大類別:①參數(shù)估計:根據(jù)一個隨機樣本的統(tǒng)計值來估計總體的參數(shù)值;②假設(shè)檢驗:首先對總體參數(shù)作出某種假設(shè),然后以一個隨機樣本的統(tǒng)計值來檢驗這個假設(shè)是否成立。(1)點估計點估計:也稱點值估計,是從總體中抽取一個樣本,根據(jù)該樣本的統(tǒng)計量對總體的未知參數(shù)作出一個數(shù)值點的估計。如果估計量具有無偏性、一致性和有效性,就可以認為這種統(tǒng)計量是總體參數(shù)的合理估計或最佳估計。1)求點估計值的標準①無偏性:要求統(tǒng)計量抽樣分布的均值恰好等于被估計的參數(shù)值。換句話說,從最終的結(jié)果來看,估計量的數(shù)學(xué)期望就是參數(shù)本身。注意,這里所說的并不是任何一個特定樣本結(jié)果的值。根據(jù)這一定義,隨機樣本的就是總體均值μ的無偏估計量,因為的抽樣分布的均值或期望值就是μ,即

,然而這并不意味著,的任何一個特定值都等于μ。②有效性:要求估計值的抽樣分布有較小的分散性,即選擇抽樣分布的標準差較小的統(tǒng)計量作為估計量,因為,才能保證一次抽樣的結(jié)果就能以較高的概率接近待估的總體參數(shù)。③一致性:要求統(tǒng)計量隨著樣本容量n的增大以更大的概率接近被估計參數(shù)。2)點估計值的計算①總體均值的點估計使用樣本均值:②總體方差的點估計使用樣本方差:(2)區(qū)間估計點估計是用一個數(shù)值估計總體參數(shù)的值,它沒有給出估計值接近總體未知參數(shù)程度的信息,所以無法判斷誤差的大小。區(qū)間估計則對此進行了改進,它是根據(jù)樣本的觀察值給出總體參數(shù)的估計范圍,同時給出總體參數(shù)值落在這一區(qū)間的概率。有關(guān)區(qū)間估計的幾個概念:①置信水平:總體參數(shù)落在某區(qū)間內(nèi)的概率。②置信區(qū)間:為了增加參數(shù)被估計到的信心而在點估計兩邊設(shè)置的估計區(qū)間。③顯著性水平:總體參數(shù)未落在置信區(qū)間內(nèi)的概率,它是用置信區(qū)間來估計的不可靠程度,用α表示。置信區(qū)間與置信水平的關(guān)系:置信水平愈高,則相應(yīng)的置信區(qū)間也愈寬。④抽樣平均誤差(標準誤)抽樣平均誤差:樣本均值抽樣分布的標準差,它反映在參數(shù)周圍抽樣平均值的平均變異程度。它的值等于總體標準差除以樣本大小的平方根,即:1)

單個總體

的情況為總體設(shè)已給定置信水平為1-α,并設(shè)的樣本,

分別為樣本均值和樣本方差。①

已知,則在1-α的置信水平上,總體均值μ的置信區(qū)間為:例:想要了解某班學(xué)生的從中隨機抽取一個樣本,好友數(shù)量,假設(shè)滿足正態(tài)分布,,若已知總體方差為25的情況下,求顯著性水平為0.05時的置信區(qū)間。所求置信區(qū)間=② 未知,則無法使用①中的方法,因其中含有未知參數(shù)

??紤]到

的無偏估計,且有可得:→置信水平為1-α?xí)r,μ的置信區(qū)間為:例:想要了解某班學(xué)生的從中隨機抽取一個樣本,好友數(shù)量,假設(shè)滿足正態(tài)分布,,求顯著性水平為0.05時的置信區(qū)間。所求置信區(qū)間=③方差

的置信區(qū)間(選學(xué))由,可得→置信水平為1-α?xí)r,方差的置信區(qū)間為:2)兩個總體

的情況①

均為已知時,兩個總體均值差的置信區(qū)間由

可知,置信水平為1-

α?xí)r兩個總體均值差

的置信區(qū)間為:②但為未知時,兩個總體均值差的置信區(qū)間由可知,置信水平為1-α?xí)r兩個總體均值差的置信區(qū)間為:例:為了比較兩所學(xué)校的學(xué)生身高,隨機抽取甲校10名學(xué)生,其均值為167cm,標準差為12cm;隨機抽取乙校15名學(xué)生,其均值為166cm,標準差為10cm。假設(shè)兩校學(xué)生的身高都近似服從正態(tài)分布,且方差相等。求置信水平為0.95時的兩校學(xué)生身高均值之差的置信區(qū)間。3)總體成數(shù)的估計①總體成數(shù)p的點估計如果在樣本容量為n的簡單隨機抽樣中,對于所要研究的事件A共出現(xiàn)m次,則樣本成數(shù)

為總體中A的成數(shù)p的點估計值,且有:②大樣本總體成數(shù)p的區(qū)間估計區(qū)間估計公式:在1-α的置信水平下,大樣本總體成數(shù)p的置信區(qū)間為:在p未知時,可用代替p。例:某高校100人抽樣,60人使用

,求該校學(xué)生中使用的成數(shù)p的置信區(qū)間(α

=

0.05)。所求置信區(qū)間=4.抽樣誤差樣本容量的確定1)抽樣誤差由于隨機抽樣的偶然因素使樣本各單位的結(jié)構(gòu)不足以代表總體各單位的結(jié)構(gòu),而引起抽樣指標和全及指標之間的絕對離差。我們平時想像的抽樣誤差可能是針對某個具體的樣本的檢測結(jié)果與總體真實結(jié)果的差異而言的,然后統(tǒng)計學(xué)上的抽樣誤差描述的是所有樣本可能的結(jié)果與總體真值之間的平均性差異。影響抽樣誤差的因素:①抽樣單位的數(shù)目:數(shù)目越大,樣本越接近總體。②總體被研究標志的變異程度:抽樣誤差和總體標志的變異程度成正比變化

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論