樣本及抽樣分析培訓(xùn)課件_第1頁
樣本及抽樣分析培訓(xùn)課件_第2頁
樣本及抽樣分析培訓(xùn)課件_第3頁
樣本及抽樣分析培訓(xùn)課件_第4頁
樣本及抽樣分析培訓(xùn)課件_第5頁
已閱讀5頁,還剩61頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

第六章樣本及抽樣分析總體與樣本

在實際問題中,往往并不知道是什么樣分布,或者分布中的參數(shù)值是什么,這需要用數(shù)理統(tǒng)計的辦法來解決。從全體研究對象中抽取部分個體(有限)進行試驗,盡可能從中獲取對研究對象統(tǒng)計規(guī)律 作出精確可靠的推測 -統(tǒng)計推斷。

統(tǒng)計學(xué)最關(guān)心的是:如何抽取數(shù)據(jù)如何從數(shù)據(jù)中提取信息所得結(jié)論的可靠性--抽樣問題--參數(shù)估計問題--假設(shè)檢驗問題統(tǒng)計學(xué)的研究對象:客觀事物總體的數(shù)量特征和數(shù)量關(guān)系等。統(tǒng)計推斷問題學(xué)生身高的變化中國的經(jīng)濟發(fā)展使得人民生活得到了很大的提高,孩子這一代的身高比上一代有了很大的變化,下面是在一個城市中學(xué)和一個農(nóng)村中學(xué)收集到的17歲學(xué)生身高數(shù)據(jù)。(1)試對目前17歲城市男生的平均身高做出估計?(2)查到20年前該校同齡男生平均身高為168cm,20年來城市男生的身高是否發(fā)生了變化?(3)收集到100名農(nóng)村男生的平均身高和標(biāo)準差分別為168.9cm和5.4cm,問與城市同齡男生的身高有否差距?50名17歲城市男生身高(單位:cm)163.3179.0176.5178.4165.1179.4176.3179.0173.9173.7173.2172.3169.3172.8176.4163.7177.0165.6167.4166.6174.0174.3184.5171.9181.4164.6176.4172.4180.3160.5166.2173.5171.7167.9168.7175.6179.6171.6168.1172.2179.0171.5173.1174.1177.2170.3176.2163.7175.4170.147名17歲農(nóng)村男生身高(單位:cm)171.2163.7173.1171.9164.4167.4162.4157.0174.2166.0170.6170.1169.0163.4163.7166.8162.4163.1176.8169.2162.3168.6162.8161.6167.4174.0169.5172.4162.5166.4167.4162.3161.7173.9168.9165.4173.2170.1163.5176.1170.4176.8175.0165.2161.9168.5167.1第六章樣本及抽樣分析總體與樣本

總體,母體(研究對象)個體(組成總體的元素)隨機變量X可能取值的全體對總體X的一次觀測表現(xiàn)為:某個指標(biāo)表現(xiàn)為:一次觀測值抽樣—總體中抽取一部分個體的過程;樣本—抽樣得到X的一組數(shù)據(jù);樣本容量(大?。獦颖局械膫€體數(shù)量第六章樣本及抽樣分析總體與樣本

從總體抽取容量為n的樣本,即對隨機變量X隨機地、獨立地進行n次觀測,每個結(jié)果也看成一個隨機變量:它們互相獨立,且與總體X服從相同的分布。一次觀測的結(jié)果:樣本可看成n

維隨機變量( ),則有或獨立同分布例1某電話交換臺一小時內(nèi)呼入次數(shù)X~P(λ),λ>0。求來自這一總體 的簡單隨機樣本的樣本分布律。解:第六章樣本及抽樣分析總體與樣本

第六章樣本及抽樣分析總體與樣本

例2某批燈泡壽命X~E(λ),求樣本 的聯(lián)合概率密度。解:例3樣本 來自均勻分布U(0,1),求聯(lián)合概率密度。

178.4161.5174.9182.7171.0165.3172.8182.1180.2176.8181.7175.7177.3180.0179.4177.0181.3176.5176.0175.7168.1184.6169.1177.8175.1161.8174.3176.0163.7176.8177.3175.3180.2176.8181.9178.4181.5177.6179.9178.2174.7176.0175.7180.3166.2177.2171.9182.9176.8179.5167.0174.8182.7174.9178.1179.9175.4184.4175.1179.4173.2176.1177.6180.5164.3170.5177.5168.3173.0176.8173.9180.7166.5180.0165.6179.4182.2176.3177.4183.4167.9176.1177.4183.4176.9168.0179.0178.8173.1173.2162.2179.9178.2183.0174.0180.8173.1173.2176.8171.1169.0178.3171.6181.2167.6161.1166.0190.2180.3166.2174.9175.8176.5164.2173.0176.8170.5180.5177.3175.3163.7176.8171.1168.5171.2170.2177.1169.4175.7177.3183.2168.6175.1179.4169.1169.9168.5180.2174.9171.0171.0168.8177.7168.6176.6175.9176.8179.5174.3176.0身高總體第六章樣本及抽樣分析統(tǒng)計量

--是樣本的函數(shù),用來對總體的未知參數(shù)進行推斷,故其中不含有未知的總體參數(shù)。常用的統(tǒng)計量其觀測值用小寫表示。統(tǒng)計量也是隨機變量樣本均值樣本方差k階原點矩k階中心矩標(biāo)準差第六章樣本及抽樣分析例有一組樣本觀測值為(5,4,6,5),計算其樣本均值、樣本方差、2階原點矩和3階中心矩。第六章樣本及抽樣分析統(tǒng)計量—直方圖100次刀具故障記錄(完成的零件數(shù))4593626245425095844337488155056124524349826407425657065936809266531644877346084281153593844527552513781474388824538862659775859755649697515628954771609402960885610292837473677358638699634555570844166061062484120447654564339280246687539790581621724531512577496468499544645764558378765666763217715310851124615222214842100個數(shù)分類放在等間隔的小格中統(tǒng)計落在小格中的頻數(shù):畫出頻率圖:第六章樣本及抽樣分析1.設(shè)X1,X2,X3

是總體X的一個樣本,那么當(dāng)X~N(0,1)時,樣本的聯(lián)合密度函數(shù)f(x1,x2,x3)=

;當(dāng)X~B(1,p)時,樣本的聯(lián)合分布律P{X1=k1,X2=k2,X3=k3}=

。練習(xí)第六章樣本及抽樣分析2.設(shè)總體X~N(a,b),其中a

已知,b

未知。再設(shè)X1,X2,X3

是取自總體X

的一個樣本。那么,函數(shù)(1)X1+X2+X3;(2)X2+2a;(3)X1;(4)max{X1,X2,X3};(5)∑Xi2/b中哪些是統(tǒng)計量?練習(xí)第六章樣本及抽樣分析3.設(shè)總體X~P(a),X1,X2,…Xn

取自總體X的樣本,那么,E()=

,D()=

,E()=

。練習(xí)第六章樣本及抽樣分析練習(xí)第六章樣本及抽樣分析4.設(shè)X~B(1,p),X的一組觀察值為0,1,0,1,1,那么樣本均值的觀察值=

,樣本方差的觀測值=

。練習(xí)第六章樣本及抽樣分析抽樣分布統(tǒng)計量是不含未知量的樣本函數(shù),也是隨機變量。統(tǒng)計量的分布稱抽樣分布。當(dāng)總體分布已知時,抽樣分布也確定了,但這些分布很難求出。總體樣本統(tǒng)計量概率抽樣分布估計/推斷抽樣性質(zhì):可加性:期望與方差:E(Y)=n,D(Y)=2n第六章樣本及抽樣分析幾種常用的統(tǒng)計量分布(一)分布設(shè) 來自總體X~N(0,1)

的樣本,則稱統(tǒng)計量 為服從自由度n的分布。(自由度乃獨立的隨機變量的個數(shù))即第六章樣本及抽樣分析抽樣分布期望與方差:E(Y)=n,D(Y)=2nX1,X2,……,Xn

來自標(biāo)準正態(tài)總體X

的樣本,那么是否服從卡方分布?若kY~χ2(n),求

k,n第六章樣本及抽樣分析抽樣分布(二)t-分布 相互獨立,則稱隨機變量服從自由度為n

的t-分布

T~t(n)。第六章樣本及抽樣分析抽樣分布

性質(zhì):對稱性:n→∞,密度函數(shù)趨向標(biāo)準正態(tài)分布;1-αα第六章樣本及抽樣分析抽樣分布 相互獨立,則稱隨機變量服從自由度為 的F

分布。性質(zhì):(三)F-分布:證明:分位點

查表抽樣分布往往由α制成上分位點表α分位點(0<α<1)指將密度曲線下面的面積按比例α劃分的點,有左(側(cè))分位點和右(側(cè))分位點,后者也稱上分位點。深綠面積占整個面積的5分之一,那么點x稱為5分之一右側(cè)分位點,記為x0.2對給定的α(概率值),若 則稱為f(x)的α上分位點。nα=0.9950.990.9750.95……0.050.0250.010.005……………………………102.1562.5583.2473.940……18.30720.48323.20925.188112.6033.0533.8164.575……19.67521.92024.72526.757123.0743.571.4.4045.226……21.02623.33726.21728.299133.5654.1075.0095.892……22.36224.73627.68829.819144.0754.6605.6296.571……23.68526.11929.14130.319…………………………………………………………自由度右側(cè)尾部概率上分位點如:查找自由度為12的卡方分布,關(guān)于右側(cè)尾部概率0.05的上分位點?查表練習(xí):求下列各式中的

C

值第六章樣本及抽樣分析正態(tài)總體統(tǒng)計量的分布

來自正態(tài)總體 的樣本,其樣本均值和樣本方差的分布性質(zhì):第六章樣本及抽樣分析正態(tài)總體統(tǒng)計量的分布關(guān)于統(tǒng)計量樣本均值的分布

正態(tài)總體統(tǒng)計量的分布第六章樣本及抽樣分析只有n—1個獨立的隨機變量第六章樣本及抽樣分析正態(tài)總體統(tǒng)計量的分布第六章樣本及抽樣分析1.設(shè)正態(tài)分布N(100,100)

的有一個容量為10

的樣本,其樣本均值服從______,樣本方差乘以____后服從分布。2.已知來自正態(tài)總體的樣本均值和樣本方差,(1)查什么分布表可以確定的值?(2)服從什么分布?3.設(shè)總體有兩個容量分別為10和15的兩個樣本均值比較兩個概率大小。4.X~B(1,p),求5.X~N(15,2),有兩個容量為10和15的兩個樣本,求其樣本均值差的絕對值小于0.2的概率。第六章樣本及抽樣分析正態(tài)總體統(tǒng)計量的分布例1110kV電網(wǎng)的電壓波動值V(單位:kV)

服從正態(tài)分布N(110,5.52)。隨機測試16次電壓值,試問其樣本均值與總體均值的偏差小于4kV

的概率?第六章樣本及抽樣分析正態(tài)總體統(tǒng)計量的分布例2

110kV電網(wǎng)的電壓波動值V(單位:kV)

服從正態(tài)分布。隨機測試16次電壓值,試問其樣本均值與總體均值的偏差小于4kV

的概率?若樣本標(biāo)準差S=5.5第六章樣本及抽樣分析正態(tài)總體統(tǒng)計量的分布例3

已知一批螺栓的直徑D

(單位:cm)

服從正態(tài)分布N(20,0.052)。從中任取36個,問其平均直徑落在區(qū)間(19.98,20.02)內(nèi)的概率?第六章樣本及抽樣分析正態(tài)總體統(tǒng)計量的分布例4

求證證明:第六章樣本及抽樣分析正態(tài)總體統(tǒng)計量的分布例5

求證證明:第七章參數(shù)估計參數(shù)估計區(qū)間估計點估計極大似然估計矩估計

參數(shù)估計是對已知分布類型的總體,利用樣本對其未知參數(shù)作出估計點估計

用樣本的統(tǒng)計量

來估計總體的未知參數(shù)θ,就是點估計。(一)矩估計法

用樣本矩估計總體矩的方法原點矩總體矩樣本矩一階矩二階矩第七章參數(shù)估計點估計

例1,求參數(shù)λ的矩估計。解:

例2已知總體的 存在,求這兩個參數(shù)。解:由大數(shù)定律,這說明了把樣本均值作為總體期望的一個估計的合理性.樣本均值用樣本均值估計.即EX則

.我們知道,若點估計

矩估計法步驟:(1)用未知參數(shù)列出總體矩(EX,EX2

)(2)從中解出未知參數(shù)(θ1,θ2)(3)用樣本矩(A1,A2

)代替總體矩(EX,EX2

) 第七章參數(shù)估計點估計

例3

,求θ1,θ2的矩估計量。

解:

第七章參數(shù)估計點估計

第七章參數(shù)估計點估計

例4

,取自此總體一組樣本觀測值為0,2,2,3,3。求θ的矩估計量。

解:

第七章參數(shù)估計點估計

例4設(shè)總體X的密度求θ的矩估計量。

解:

第七章參數(shù)估計點估計

(二)極大似然估計法根據(jù)發(fā)生的結(jié)果A,對最有利于

A的發(fā)生作出參數(shù)估計,即概率大的事件發(fā)生的可能性也大。

所謂結(jié)果A發(fā)生的可能性,指樣本取到觀測值X1=x1,X2=x2,……,Xn=xn

的概率(或密度函數(shù))第七章參數(shù)估計點估計

例1

X~P(λ),求λ的極大似然估計。解:已知分布律對數(shù)的似然方程樣本的似然函數(shù)(出現(xiàn)可能性)取對數(shù)第七章參數(shù)估計例2

的極大似然估計。解:樣本的似然函數(shù)(樣本觀察值被取到的概率)取對數(shù)對數(shù)的似然方程組解方程組第七章參數(shù)估計點估計

極大似然估計步驟:建立樣本的似然函數(shù)L(x,θ),包含有未知參數(shù)θ

,表示樣本發(fā)生的可能性;取對數(shù);求未知參數(shù)的導(dǎo)數(shù),并置零;解對數(shù)似然方程,得參數(shù)的極大似然估計

。例2設(shè)離散總體X的概率分布為

試由一個樣本觀測值X1=1,X2=2,X3=1,求θ的矩估計和極大似然估計。第七章參數(shù)估計練習(xí)

例1設(shè)總體X的概率密度為

X1,X2,…,Xn

為來自總體的樣本,試求θ矩估計和極大似然估計。X123p例4設(shè)每升自來水中含有大腸菌的個數(shù)服從泊松分布P(λ),為檢查自來水消毒設(shè)備效果,抽樣化驗問每升中大腸菌多少時,才能上述情況出現(xiàn)概率最大第七章參數(shù)估計練習(xí)

例3設(shè)某種電子設(shè)備的壽命T

服從參數(shù)為λ的指數(shù)分布,今隨機抽取

8件做壽命試驗,結(jié)果為:10501100108011201200104013001200求的矩估計和極大似然估計值;估計其壽命超過1000小時的概率。大腸菌個數(shù)每升01234升數(shù)17201021第七章參數(shù)估計估計量的評選標(biāo)準無偏性設(shè) 為未知參數(shù)θ的估計量,隨著樣本的不同,估計值可能不同,會有誤差。因而估計量本身也是隨機變量。若 ,就稱估計量是無偏的。有偏估計的 稱系統(tǒng)誤差。例1.設(shè) 來自總體X

的樣本,下列總體的均值的估計無偏的嗎?第七章參數(shù)估計估計量的評選標(biāo)準可見,一個未知參數(shù)可有不同的無偏估計量。證明:獨立同分布,故有第七章參數(shù)估計估計量的評選標(biāo)準例2.S2

和B2

是D(X)

是無偏估計嗎?證明:第七章參數(shù)估計估計量的評選標(biāo)準例3.設(shè) 為其一個樣本,試問

估計是無偏的嗎?證明:第七章參數(shù)估計估計量的評選標(biāo)準有效性在多個無偏估計中,以密集在真值θ附近的為好。設(shè)θ的兩個無偏估計量中, 且至少存在一個估計值使上式成為嚴格不等式,則稱前者更有效。第七章參數(shù)估計估計量的評選標(biāo)準例1.均值估計哪個更有效?T1

最有效,解:第七章參數(shù)估計估計量的評選標(biāo)準例2.比較無偏估計的有效性:練習(xí):1.如果是θ

的無偏估計,且(1)那么是

的無偏估計;(2)那么是的無偏估計。設(shè)X1,X2,……,Xn

是總體

X

的一個樣本,問k

為何值時,估計量 為總體方差DX的無偏估計。第七章參數(shù)估計估計量的評選標(biāo)準一致性對于有偏估計,隨樣本容量增加,其偏差愈來愈小。設(shè)參數(shù)θ的估計量當(dāng)容量趨向無窮時, 依概率收斂于θ,則稱之為一致估計量。例,樣本方差是總體方差的一致估計量。第七章參數(shù)估計區(qū)間估計設(shè)θ為總體的未知參數(shù),對樣本構(gòu)造的兩個統(tǒng)計量對給定的有則稱為θ的一個置信區(qū)間,1-α為置信度。第七章參數(shù)估計區(qū)間估計例1.設(shè)總體為一樣本,已知方差,求總體均值的置信區(qū)間。則μ置信度為1-α的置信區(qū)間第七章參數(shù)估計區(qū)間估計

例某廠生產(chǎn)的滾珠直徑

,隨機測得6個直徑為(mm)14.6,15.1,14.9,14.8,15.2,15.1。求期望的置信度為0.95的置信區(qū)間。解:第七章參數(shù)估計設(shè)總體為一樣本,方差未知,求總體均值的置信區(qū)間。例2.第七章參數(shù)估計區(qū)間估計

例某廠生產(chǎn)的滾珠直徑

,隨機測得6個直徑為(mm)14.6,15.1,14.9,14.8,15.2,15.1。求期望的置信度為0.95的置信區(qū)間。解:第七章參數(shù)估計區(qū)間估計設(shè)總體為一樣本,求總體方差的置信區(qū)間。例3.第七章參數(shù)估計區(qū)間估計

例某廠生產(chǎn)的滾珠直徑

,隨機測得6個直徑為(mm)14.6,15.1,14.9,14.8,15.2,15.1。求方差的置信度為0.95的置信區(qū)間。解:第八章假設(shè)檢驗基本問題在實際問題中,往往并不知道是什么樣分布,或者分布中的參數(shù)值是什么,這需要用數(shù)理統(tǒng)計的辦法來解決。從全體研究對象中抽取部分個體(有限)進行試驗,盡可能從中獲取對研究對象統(tǒng)計規(guī)律作出精確可靠的推測-統(tǒng)計推斷。中學(xué)男生身高問題設(shè)中學(xué)生的身高20年來沒有變化,即μ=168因為樣本均值是總體均值μ

的無偏、優(yōu)良估計,應(yīng)有|-168|≤k,又知道因為P{|t(49)

|>1.645}=0.05,即至少取大約平均試驗20次(每次測50人)才會發(fā)生一次現(xiàn)在只試驗了一次就有|172.7–168|=4.7>2.012,所以有理由不相信原假設(shè)是真的,于是拒絕這個假設(shè),即認為20年來學(xué)生身高有增高。由上可知,若原假設(shè)是正確的,則事件 的概率為0.95,即 的概率為0.05。小概率原則反證法思想一.u檢驗已知正態(tài)總體的方差,對總體均值作假設(shè)檢驗。設(shè)來自正態(tài)總體的一個樣本,已知現(xiàn)對提出假設(shè)關(guān)于正態(tài)總體的假設(shè)檢驗當(dāng)H0為真時,故H0

的拒絕域W為或第八章

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論