生物統(tǒng)計(jì)學(xué)-抽樣分布教案資料_第1頁
生物統(tǒng)計(jì)學(xué)-抽樣分布教案資料_第2頁
生物統(tǒng)計(jì)學(xué)-抽樣分布教案資料_第3頁
生物統(tǒng)計(jì)學(xué)-抽樣分布教案資料_第4頁
生物統(tǒng)計(jì)學(xué)-抽樣分布教案資料_第5頁
已閱讀5頁,還剩28頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

生物統(tǒng)計(jì)學(xué)-抽樣分布總體……隨機(jī)樣本123

無窮個(gè)樣本樣本可以代表總體,但是又不能完全代表總體抽樣誤差2.抽樣分布從一個(gè)總體按一定的樣本容量隨機(jī)地抽出所有可能的樣本,由這些樣本計(jì)算出的統(tǒng)計(jì)量(如χ

和s2)必然形成一種分布(亦即一個(gè)新的總體),這種分布稱為該統(tǒng)計(jì)量的隨機(jī)抽樣分布或抽樣分布。抽樣誤差(samplingerror)

x1

μ

x2

x3

如果從容量為N的有限總體抽樣,若每次抽取容量為n的樣本,那么一共可以得到N’個(gè)樣本(所有可能的樣本個(gè)數(shù))。抽樣所得到的每一個(gè)樣本可以計(jì)算一個(gè)平均數(shù),全部可能的樣本都被抽取后可以得到N’個(gè)平均數(shù)。如果將抽樣所得到的所有可能的樣本平均數(shù)集合起來便構(gòu)成一個(gè)新的總體,平均數(shù)就成為這個(gè)新總體的變量。由平均數(shù)構(gòu)成的新總體的分布,稱為平均數(shù)的抽樣分布。隨機(jī)樣本的任何一種統(tǒng)計(jì)數(shù)都可以是一個(gè)變量,這種變量的分布稱為統(tǒng)計(jì)數(shù)的抽樣分布。除平均數(shù)抽樣分布外還有總和數(shù)、方差的抽樣分布等。2.抽樣分布1.樣本均數(shù)的抽樣分布1)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差已知)-u分布正態(tài)總體抽得的樣本平均數(shù)的分布非正態(tài)總體抽得的樣本平均數(shù)的分布2)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差未知)-t分布正態(tài)總體抽得的樣本平均數(shù)的分布非正態(tài)總體抽得的樣本平均數(shù)的分布3)樣本均數(shù)和與差的分布標(biāo)準(zhǔn)差已知-u分布標(biāo)準(zhǔn)差未知-t分布4)頻率的抽樣分布(標(biāo)準(zhǔn)差已知)-u分布2.樣本方差的抽樣分布-χ2分布3.樣本標(biāo)準(zhǔn)差的抽樣分布-F分布二.從總體中抽取樣本統(tǒng)計(jì)量的分布1.樣本均數(shù)的抽樣分布1)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差已知)-u分布正態(tài)總體抽得的樣本平均數(shù)的分布

實(shí)驗(yàn)1:假定某年某地所有13歲女學(xué)生身高服從總體均數(shù)為155.4cm,總體標(biāo)準(zhǔn)差5.3cm的正態(tài)分布。在總體中隨機(jī)抽樣,每次均抽取30例組成一份樣本,共抽取100份,得到的均數(shù)分別為:153.6,153.9,154.1……

x1

μ

x2

x3

1.樣本均數(shù)的抽樣分布1)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差已知)-u分布正態(tài)總體抽得的樣本平均數(shù)的分布

組段下限值(cm)頻數(shù)頻率(%)152.6~10.01153.2~40.04153.8~40.04154.4~220.22155.0~250.25155.6~210.21156.2~170.17156.8~30.03157.4~20.02158.0~10.01合計(jì)1001表4.1從正態(tài)總體N(155.4,5.32)抽樣得到的100個(gè)樣本均數(shù)的頻數(shù)分布(n1=30)圖4.1從正態(tài)總體N(155.4,5.32)抽樣得到的100個(gè)樣本均數(shù)的頻數(shù)分布(n1=30)每個(gè)均數(shù)大小不同,并與總體不同(抽樣誤差)均數(shù)分布具有一定的特點(diǎn):單峰,對(duì)稱隨著樣本量的增大,樣本平均數(shù)的分布的方差越來越小。n理論上:若隨機(jī)變量X~N(μ,σ2),(x1,x2,x3,…,xn

),則:樣本平均數(shù)服從平均數(shù)為μ,方差為σ2/n的正態(tài)分布:X~N(μ,σ2/n

)

標(biāo)準(zhǔn)差(standarddeviation,SD):

標(biāo)準(zhǔn)誤(standarderrorofmean,SEM

standarderror):

樣本均數(shù)的標(biāo)準(zhǔn)差(導(dǎo)出量的標(biāo)準(zhǔn)差)1.樣本均數(shù)的抽樣分布1)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差已知)-u分布正態(tài)總體抽得的樣本平均數(shù)的分布非正態(tài)總體抽得的樣本平均數(shù)的分布N=5,抽樣:1000次MeanMediumSdSkewkurtosisMeanMediumSdSkewkurtosis實(shí)驗(yàn)2:偏斜度(skewness):度量數(shù)據(jù)圍繞眾數(shù)呈不對(duì)稱的程度g1>0,正偏;g1<0,正偏;峭度(kurtosis):一個(gè)分布的尖峭或平坦程度的指標(biāo)g2>0,尖峭;g2<0,平坦MeanMediumSdSkewkurtosisMeanMediumSdSkewkurtosisMeanMediumSdSkewKurtosisN=2,抽樣:1000次N=16,抽樣:1000次N=25,抽樣:1000次任意樣本平均數(shù)的極限分布中心極限定理(centrallimitedtheory):

如果被抽樣總體不是正態(tài)總體,但具有一定的平均數(shù)μ和方差σ2,則隨樣本容量n的不斷增大,樣本平均數(shù)的分布越來越趨近于正態(tài)分布,且具有平均數(shù)μ和方差

σ2/n

,這稱為中心極限定理。中心極限定理的應(yīng)用:

這一定理對(duì)于連續(xù)性變量或非連續(xù)性變量都能適用。 不論總體為何種分布,一般只要樣本容量,如n≥50,屬于大樣本,就可以應(yīng)用中心極限定理,認(rèn)為樣本平均數(shù)的分布是正態(tài)分布。1.樣本均數(shù)的分布1)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差已知)-u分布正態(tài)總體抽得的樣本平均數(shù)的分布非正態(tài)總體抽得的樣本平均數(shù)的分布樣本均數(shù)具有規(guī)律,容易掌握!

樣本量小,不是正態(tài)分布隨著樣本含量的增大(如n>50),接近于正態(tài)分布,并且變異性逐漸縮小2)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差未知)-t分布

0f(t)n=5n=3t從正態(tài)總體抽樣,σ未知時(shí),所得的樣本平均數(shù)服從t分布(student

tdistribution,W.S.Goesst

1908),X~N(μ,σ2/n)σσu正態(tài)總體抽得的樣本平均數(shù)的分布

與正態(tài)分布相似,t分布為單峰,0為中心,左右對(duì)稱與正態(tài)分布相比,t分布的離散度較大,頂部偏低,尾部偏高,尤其是自由度小的t分布更為明顯t分布是一簇曲線,分布曲線是一簇曲線,其形態(tài)變化與自由度的大小有關(guān)隨著樣本含量的增大,接近于正態(tài)分布當(dāng)自由度df>30時(shí),t分布曲線就比較接近正態(tài)分布曲線;當(dāng)df→+∞時(shí)則和正態(tài)分布曲線重合(最瘦高)2)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差未知)-t分布

t分布(t-distribution)t分布表p329受自由度df影響df增大,f(t)減小n無窮大,為正態(tài)分布dfdf單側(cè)t0.05,9=1.833雙側(cè)t0.05/2,9=2.262

=單側(cè)t0.025,9單側(cè)t0.01,9=2.821雙側(cè)t0.01/2,9=3.250

=單側(cè)t0.005,9雙側(cè)t0.05/2,∞=1.96

=單側(cè)t0.025,∞單側(cè)t0.05,∞=1.64隨著樣本含量的增大,樣本均數(shù)的分布接近于正態(tài)分布的進(jìn)度較慢1.樣本均數(shù)的分布

2)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差未知)-t分布非正態(tài)總體抽得的樣本平均數(shù)的分布

設(shè)y1

~N(

μ1,σ12

),y2

~N(

μ2,σ22

),且與相互獨(dú)立,由這兩個(gè)正態(tài)總體中抽樣(無論樣本容量n1、n2多大),則樣本平均數(shù)之差()服從正態(tài)分布:

且總體參數(shù)有如下關(guān)系:

~N(μ

,σ2)

μ=μ1±μ2

σ2

u3)來自兩個(gè)總體的樣本均數(shù)的和與差的分布標(biāo)準(zhǔn)差已知σ1和

σ2未知,s1和s2分別代替σ1和

σ2

兩個(gè)樣本為正態(tài)分布σ1=σ2服從的t分布:3)來自兩個(gè)總體的樣本均數(shù)的和與差的分布標(biāo)準(zhǔn)差未知選擇容量為n的簡單隨機(jī)樣本計(jì)算樣本方差s2計(jì)算卡方值2=(n-1)s2/σ2計(jì)算出所有的

2值不同容量樣本的抽樣分布ms正態(tài)總體n=1n=4n=10n=20c21)單個(gè)樣本方差的2分布2分布的圖示2.樣本方差的分布-2分布(

2distribution)在重復(fù)選取容量為n的樣本時(shí),由樣本方差的所有可能取值形成的相對(duì)頻數(shù)分布對(duì)于來自正態(tài)總體的簡單隨機(jī)樣本,則比值

的抽樣分布服從自由度為(n-1)的2分布,即2分布的定義分布的變量值始終為正分布的形狀取決于其自由度df的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,

U~2(n1),V~2(n2),則U+V這一隨機(jī)變量服從自由度為n1+n2的2分布2分布的特點(diǎn)

設(shè):從兩個(gè)正態(tài)總體N1(μ1,σ12)和N2(μ2,σ22)中隨機(jī)抽取樣本容量為n1和n2的獨(dú)立樣本,σ1和σ2可以相等或者不等,標(biāo)準(zhǔn)化的樣本方差為s12/σ12和s22/σ22則:標(biāo)準(zhǔn)化的樣本方差的比值為

2)兩個(gè)樣本方差比的分布-F分布(Fisher)F分布密度曲線是隨自由度df1、df2的變化而變化的一簇偏態(tài)曲線,其形態(tài)隨著df1、df2的增大逐漸趨于對(duì)稱。F0.35(8,20)本節(jié)課重點(diǎn)內(nèi)容1.中心極限定理2.樣本均數(shù)的抽樣分布3.樣本方差的抽樣分布1.樣本均數(shù)的抽樣分布1)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差已知)-u分布正態(tài)總體抽得的樣本平均數(shù)的分布非正態(tài)總體抽得的樣本平均數(shù)的分布2)樣本均數(shù)的抽樣分布(標(biāo)準(zhǔn)差未知)-t分布正態(tài)總體抽得的樣本平均數(shù)的分布非正態(tài)總體抽得的樣本平均數(shù)的分布3)樣本均數(shù)和與差的分布標(biāo)準(zhǔn)差已知–u分布標(biāo)準(zhǔn)差未知–t分布2.樣本方差的抽樣分布1)樣本方差的抽樣分布-χ2分布2)樣本標(biāo)準(zhǔn)差的抽樣分布-F分布課后作業(yè)用下面的例子,通過計(jì)算理解均數(shù)抽樣分布特點(diǎn):假設(shè)有一個(gè)有限總體,包括1,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論