版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第六章抽樣分布與參數(shù)估計第一節(jié)頻率、概率與概率分布第二節(jié)抽樣分布第三節(jié)總體參數(shù)估計第一節(jié)頻率、概率與概率分布一、隨機事件與概率(一)隨機試驗與事件隨機現(xiàn)象的特點是:在條件不變的情況下,一系列的試驗或觀測會得到不同的結果,并且在試驗或觀測前不能預見何種結果將出現(xiàn)。對隨機現(xiàn)象的試驗或觀測稱為隨機試驗,它必須滿足以下的性質:(1)每次試驗的可能結果不是唯一的;(2)每次試驗之前不能確定何種結果會出現(xiàn);(3)試驗可在相同條件下重復進行。在隨機試驗中,可能出現(xiàn)也可能不出現(xiàn)的結果,稱之為隨機事件,簡稱事件。試驗的結果可能是一個簡單事件,也可能是一個復雜事件。簡單事件就是不可以再分解的事件,又稱為基本事件。復雜事件是由簡單事件組合而成的事件。基本事件還可稱為樣本點,設試驗有n個基本事件,分別記為(i=1,2,…,n)。集合Ω={ω1,ω2,…,ωn}稱為樣本空間,Ω中的元素就是樣本點。(二)概率1.概率的定義概率就是指隨機事件發(fā)生的可能性,或稱為機率,是對隨機事件發(fā)生可能性的度量。進行n次重復試驗,隨機事件A發(fā)生的次數(shù)是m次,發(fā)生的頻率是m/n,當試驗的次數(shù)n很大時,如果頻率在某一數(shù)值p附近擺動,而且隨著試驗次數(shù)n的不斷增加,頻率的擺動幅度越來越小,則稱p為事件A發(fā)生的概率,記為:P(A)=p。在古典概型場合,即基本事件發(fā)生的概率都一樣的場合:例:設一個袋子中裝有白球2個,黑球3個。(1)從中隨機摸出1只球,問剛好是白球的概率有多大?(2)從中隨機摸出2只球,一問2只球都是白球的概率有多大?二問2只球一白一黑的概率有多大?三問2只球都是黑球的概率有多大?解:(1)由于摸出的任何1只球都形成一個基本事件,所以樣本點總數(shù)為n=5。用A表示摸出的是白球事件,則A由兩個基本點組成,即A={白球,白球},有利場合數(shù)m=2。因此,剛好摸出白球的概率為P(A)=m/n=2/5=0.4(2)由于摸出2只球才成一個基本事件,所以樣本點總數(shù)為故P(A)=P(2只球都是白球)=1/=1/10P(B)=P(2只球一白一黑)=2×3/10=6/10P(C)=P(2只球都是黑球)=3/10NOTE:P(A+B+C)=1例:袋中裝有4只黑球和1只白球,每次從袋中隨機地摸出1只球,并換入1只黑球。連續(xù)進行,問第三次摸到黑球的概率是多少?解:記A為“第三次摸到黑球”,則為“第三次摸到白球”。先計算P()。由于袋中只有1只白球,如果某一次摸到了白球,換入了黑球,則袋中只有黑球了。所以相當于第一、第二次都是摸到黑球,第三次摸到白球。注意這是一種有放回的摸球,樣本點總數(shù)為53,有利場合數(shù)是42×1。故:P()=,
所以3.事件的獨立性定義對事件A與B,若p(AB)=p(B)p(A),則稱它們是統(tǒng)計獨立的,簡稱相互獨立。例:已知袋中有6只紅球,4只白球。從袋中有放回地取兩次球,每次都取1球。設表示第i次取到紅球。那么,因此,,也就是說,B1,B2相互獨立。從題目條件看,這一結論是顯然的。二、隨機變量隨機變量X是定義在樣本空間Ω={ω1,ω2,…,ωn}上的一個函數(shù),這個函數(shù)的取值隨試驗的結果不同而變化。這個函數(shù)還要求滿足條件:對任意的實數(shù)x,X<x是隨機事件。如果隨機變量所有可能的取值是有限的,或可排成一列的,這種隨機變量稱為離散型隨機變量;另一種情況是隨機變量的取值范圍是一個區(qū)間或整個數(shù)軸,這種隨機變量稱為連續(xù)型隨機變量。1.離散型隨機變量的概率分布設離散型隨機變量X的所有可能取值為x1,x2,…,xn,…,相應的概率為p(x1),p(x2),…,p(xn),…。用表格統(tǒng)一表示出來是:定義:離散型隨機變量X的方差為方差的平方根σ稱為標準差。方差σ2或標準差σ反映隨機變量X相對其期望值的離散程度,σ2或σ越小,說明期望值的代表性越好;σ2或σ越大,說明期望值的代表性越差。性質:對于任意的α,D(αX)=α2D(X)成立貝努里試驗與二項分布有時我們只對試驗中某事件A是否出現(xiàn)感興趣,如果A發(fā)生,我們稱“成功”,否則稱“失敗”。像這樣只有兩種結果的試驗稱為貝努里試驗。設A出現(xiàn)的概率為p,我們獨立地重復進行n次貝努里試驗,稱為n重貝努里試驗.以Bk表示n重貝努里試驗中事件A正好出現(xiàn)k次這一事件,則
(k=0,1,2,…,n)該分布稱為二項分布(q=1-p).NOTE:2.連續(xù)型隨機變量的概率分布設X是R.V.,x是一實數(shù).記F(x)=P(X<x)。該函數(shù)就是隨機變量X的分布函數(shù)。分布函數(shù)的導數(shù)稱為密度函數(shù),記作p(x)。性質(1)p(x)≥0(2)(3)
a
bxP(a≤x<b)正態(tài)分布如果連續(xù)型隨機變量X的密度函數(shù)為
則稱隨機變量X服從均值為μ,方差為σ2的正態(tài)分布,記為X~N(μ,σ2)。如果一個正態(tài)分布的μ=0,σ=1,則稱該正態(tài)布為標準正態(tài)分布,相應的隨機變量稱為標準正態(tài)隨機變量,用Z表示,即Z~N(0,1),相應的分布密度函數(shù)為一般正態(tài)分布與標準正態(tài)分布的關系:若隨機變量X服從正態(tài)分布N(μ,σ2),則隨機變量Z=服從標準正態(tài)分布,即Z~N(0,1)。例:某大學英語考試成績服從正態(tài)分布,已知平均成績?yōu)?0分,標準差為10分。求該大學英語成績在60—75分的概率。一、抽樣的基本概念抽樣涉及的基本概念有:總體與樣本(見第一章)樣本容量與樣本個數(shù)總體參數(shù)與樣本統(tǒng)計量重復抽樣與不重復抽樣這些概念是統(tǒng)計學特有的,體現(xiàn)了統(tǒng)計學的基本思想與方法??傮w和樣本(參見第1章)1.總體:又稱全及總體、母體,指所要研究對象的全體,由許多客觀存在的具有某種共同性質的單位構成??傮w單位數(shù)用N表示。2.樣本:又稱子樣,來自總體,是從總體中按隨機原則抽選出來的部分,由抽選的單位構成。樣本單位數(shù)用n表示。3.總體是唯一的、確定的,而樣本是不確定的、可變的、隨機的。樣本容量與樣本個數(shù)樣本容量:一個樣本中所包含的單位數(shù),用n表示。樣本個數(shù):又稱樣本可能數(shù)目,指從一個總體中所可能抽取的樣本的個數(shù)。對于有限總體,樣本個數(shù)可以計算出來。樣本個數(shù)的多少與抽樣方法有關。(這個概念只是對有限總體有意義,對無限總體沒有意義!)重復(置)抽樣與不重復(置)抽樣重置抽樣與不重置抽樣(各有3個特點P90)重復抽樣:例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2考慮順序時:樣本個數(shù)=Nn=52=25不考慮順序時:樣本個數(shù)=重復(置)抽樣與不重復(置)抽樣不重復抽樣:例如從A、B、C、D、E五個字母中隨機抽取兩個作為樣本。N=5,n=2考慮順序時:樣本個數(shù)不考慮順序時:樣本個數(shù)驗證了以下兩個結論:抽樣平均數(shù)的標準差反映所有的樣本平均數(shù)與總體平均數(shù)的平均誤差,稱為抽樣平均誤差,用表示。重置抽樣分布--樣本平均數(shù)的分布重置抽樣分布--樣本平均數(shù)的分布由概率論知,如果總體是正態(tài)分布的,則樣本平均數(shù)的抽樣分布是如下正態(tài)分布這是一個非常重要的結論,有廣泛的應用。(請參見中心極限定理。)重置抽樣分布--樣本成數(shù)的分布總體成數(shù)p是指具有某種特征的單位在總體中的比重。成數(shù)是一個特殊平均數(shù),設總體單位總數(shù)目是N,總體中有該特征的單位數(shù)是N1。設x是0、1變量(總體單位有該特征,則x取1,否則取0),則有:現(xiàn)從總體中抽出n個單位,如果其中有相應特征的單位數(shù)是n1,則樣本成數(shù)是:P也是一個隨機變量,利用樣本平均數(shù)的分布性質結論,即有:不重置抽樣分布樣本均值的分布性質:樣本成數(shù)的分布性質抽樣分布總結樣本平均數(shù)的分布樣本成數(shù)的分布重復抽樣不重復抽樣三、大數(shù)定理與中心極限定理大數(shù)定理當樣本容量n充分大時,可以用樣本平均估計總體平均。當試驗次數(shù)n充分大時,可以用頻率代替概率。大數(shù)定理的意義:個別現(xiàn)象受偶然因素影響,但是,對總體的大量觀察后進行平均,就能使偶然因素的影響相互抵消,從而使總體平均數(shù)穩(wěn)定下來,反映出事物變化的一般規(guī)律,這就是大數(shù)定理的意義。中心極限定理
正態(tài)分布的再生定理:相互獨立的兩個正態(tài)隨機變量相加之和仍服從正態(tài)分布。中心極限定理:大樣本的平均數(shù)近似服從正態(tài)分布。例1:求樣本平均數(shù)的概率分布設某公司1000名職工的人均年獎金為2000元,標準差500元,隨機抽取36人作為樣本進行調查,問樣本的人均年獎金在1900~2200元之間的概率有多大?例2某地區(qū)職工家庭的人均年收入平均為12000元,標準差為2000元。若知該地區(qū)家庭的人均年收入服從正態(tài)分布,現(xiàn)采用重復抽樣從總體中隨機抽取25戶進行調查,問出現(xiàn)樣本平均數(shù)等于或超過12500元的可能性有多大?例3某商場推銷一種洗發(fā)水。據統(tǒng)計,本年度購買此種洗發(fā)水的有10萬人,其中6萬是女性。如果按不重復隨機抽樣方法,從購買者中抽出100人進行調查,問樣本中女性比例超過50%的可能性有多大?第三節(jié)總體參數(shù)估計本節(jié)主要內容:總體參數(shù)估計概述總體參數(shù)的點估計參數(shù)區(qū)間估計樣本容量的確定一、總體參數(shù)估計概述設待估計的總體參數(shù)是θ,用以估計該參數(shù)的統(tǒng)計量是,抽樣估計的極限誤差是Δ,即:極限誤差是根據研究對象的變異程度和分析任務的性質來確定的在一定概率下的允許誤差范圍。參數(shù)估計的兩個要求:精度:估計誤差的最大范圍,通過極限誤差來反映。顯然,Δ越小,估計的精度要求越高,Δ越大,估計的精度要求越低。極限誤差的確定要以實際需要為基本標準??煽啃裕汗烙嬚_性的一個概率保證,通常稱為估計的置信度。二、總體參數(shù)的點估計點估計的含義:直接以樣本統(tǒng)計量作為相應總體參數(shù)的估計量。點估計的方法1、參數(shù)的點估計指在參數(shù)的估計中直接的用樣本估計量之數(shù)值作為待估總體參數(shù)的估計值。2、點估計的方法極大似然估計法、矩估計法、貝葉斯估計法、最小二乘法等等。
(1)極大似然估計法基本思想:
假設總體的分布形式已知,只是不知總體分布的某個(或某些)參數(shù)θi,抽樣后可得到一組樣本值,根據樣本與總體的關系,找出使樣本值出現(xiàn)的可能性最大的那個參數(shù)估計值,則該估計值就是待估參數(shù)的極大似然估計值。似然函數(shù)的數(shù)學表述設連續(xù)型的總體X,有密度函數(shù)f(x,θ1,θ2,…θk),其中θ1,θ2,…θk是待估參數(shù)。另有X的一個簡單隨機樣本X1,X2,…Xn,由于X1,X2,…Xn獨立且與總體同分布,所以有X1,X2,…Xn的聯(lián)合概率密為:
對于給定的一組樣本值x1,x2,…xn,我們稱L為樣本似然函數(shù),其中L為:極大似然法求解步驟-寫出極大似然函數(shù)-根據極大似然函數(shù)求偏導,得到似然組-解方程(組),其解即為所求最大似然估計
例1:英語六級未通過率<1>假設某大學的學生在畢業(yè)時尚未通過六級的比率為,現(xiàn)從中隨機抽取100人調查其檔案,發(fā)現(xiàn)其中有10人六級沒過,試用極大似然法估計總體參數(shù)。例1:英語六級未通過率<2>解:若六級通過用“0”表示,未通過用“1”表示,則總體X的分布為
則樣本觀察值的聯(lián)合分布(似然函數(shù))為兩邊取對數(shù)得對數(shù)似然函數(shù)為:解得:(2)矩估計法矩估計法的基本思路
用樣本的矩作為相應(同類、同階)總體矩的估計,通過原點矩法和中心矩法來實現(xiàn)對矩估計量的求解。矩估計法的求解過程—寫出總體K階原點距和總體K階中心距—寫出樣本K階原點距和樣本K階中心距—利用樣本原點矩去估計總體原點矩,利用樣本中心矩去估計總體中心矩,進而根據總體中參數(shù)的個數(shù)(假設為k個)來確定需要構造方程的個數(shù)(即最高階數(shù)為k,每階可構造一個方程)進行求解優(yōu)良估計量標準優(yōu)良估計標準:無偏性:要求樣本統(tǒng)計量的平均數(shù)等于被估計的總體參數(shù)本身。一致性:當樣本容量充分大時,樣本統(tǒng)計量充分靠近總體參數(shù)本身。有效性:總體方差的無偏估計量為樣本方差點估計完全正確的概率通常為0。因此,我們更多的是考慮用樣本統(tǒng)計量去估計總體參數(shù)的范圍區(qū)間估計。三、參數(shù)區(qū)間估計參數(shù)區(qū)間估計的含義:估計總體參數(shù)的區(qū)間范圍,并給出區(qū)間估計成立的概率值。其中:1-α(0<α<1)稱為置信度;α是區(qū)間估計的顯著性水平,其取值大小由實際問題確定,經常取1%、5%和10%。注間對上式的理解:例如抽取了1000個樣本,根據每一個樣本均構造了一個置信區(qū)間,,這樣,由1000個樣本構造的總體參數(shù)的1000個置信區(qū)間中,有95%的區(qū)間包含了總體參數(shù)的真值,而5%的置信區(qū)間則沒有包含。這里,95%這個值被稱為置信水平(或置信度)。一般地,將構造置區(qū)間的步驟重復很多次,置信區(qū)間包含總體參數(shù)真值的次數(shù)所占的比例稱為置信水平。樣本統(tǒng)計量
(點估計)置信區(qū)間置信下限置信上限我們用95%的置信水平得到某班學生考試成績的置信區(qū)間為60-80分,如何理解?錯誤的理解:60-80區(qū)間以95%的概率包含全班同學平均成績的真值;或以95%的概率保證全班同學平均成績的真值落在60-80分之間。正確的理解:如果做了多次抽樣(如100次),大概有95次找到的區(qū)間包含真值,有5次找到的區(qū)間不包括真值。真值只有一個,一個特定的區(qū)間“總是包含”或“絕對不包含”該真值。但是,用概率可以知道在多次抽樣得到的區(qū)間中大概有多少個區(qū)間包含了參數(shù)的真值。如果大家還是不能理解,那你們最好這樣回答有關區(qū)間估計的結果:該班同學平均成績的置信區(qū)間是60-80分,置信度為95%。區(qū)間估計的基本要素包括:樣本點估計值、抽樣極限誤差、估計的可靠程度樣本點估計值抽樣極限誤差:可允許的誤差范圍。抽樣估計的可靠程度(置信度、概率保證程度)及概率度注意:本教材所進行的區(qū)間估計僅指對總體平均數(shù)或成數(shù)的區(qū)間估計,并且在際計算過程中使用下面的式子。式中Δ是極限誤差。區(qū)間估計的內容2已知2未知均值方差比例置信區(qū)間平均數(shù)的區(qū)間估計
對總體平均數(shù)或成數(shù)的區(qū)間估計時,使用下面的式子 (式中Δ是極限誤差)有兩種模式:1、根據置信度1-α,求出極限誤差Δ,并指出總體平均數(shù)的估計區(qū)間。2、給定極限誤差,求置信度。當σ已知時,根據相關的抽樣分布定理,服從標準正態(tài)分布
N(0,1)。查正態(tài)分布概率表,
可得(一般記為),則,根據重復抽樣與不重復抽樣的求法的不同,進一步可得總體平均數(shù)的估計區(qū)間:重復抽樣時,區(qū)間的上下限為:不重復抽樣時,區(qū)間的上下限為:平均數(shù)區(qū)間估計—第1種模式(求置信區(qū)間)平均數(shù)區(qū)間估計—第1種模式(求置信區(qū)間)若總體方差未知,則在計算時,使用樣本方差代替總體方差,此時
服從自由度為n-1的t分布。查t分布表可得,并記為于是:重復抽樣時,區(qū)間的上下限為:不重復抽樣時,區(qū)間的上下限為:大樣本時,t分布與標準正態(tài)分布非常接近,可直接從標準正態(tài)分布表查臨界值例:總體平均數(shù)的區(qū)間估計1對某型號的電子元件進行耐用性能檢查,抽查資料分組如下表,要求估計該批電子元件的平均耐用時數(shù)的置信區(qū)間(置信度95%)。68.27%的樣本表示樣本均值落在…區(qū)間的概率是1-α,例對總體均值區(qū)間估計的進一步理解平均數(shù)區(qū)間估計—第2種模式(求置信度)給定極限誤差,求置信度例:總體平均數(shù)的區(qū)間估計2例:經抽樣調查計算樣本畝產糧食600公斤,并求得抽樣平均誤差為3公斤,現(xiàn)給定允許極限誤差為6公斤,求置信區(qū)間包含總體平均畝產的概率,即求置信水平。結果表明,如果多次反復抽樣,每次都可以由樣本值確定一個估計區(qū)間,每個區(qū)間或者包含總體參數(shù)的真值,或者不包含總體參數(shù)的真值,包含真值的區(qū)間占F(z),即每一萬次抽樣,就有9545個樣本區(qū)間包括總體畝產,其余455個樣本區(qū)間不包括總體平均數(shù),即若接受估計區(qū)間的判斷要冒4.55%的機會犯錯誤的風險。成數(shù)的區(qū)間估計由于總體的分布是(0,1)分布,只有在大樣本的情況下,才服從正態(tài)分布??傮w成數(shù)可以看成是一種特殊的平均數(shù),類似于總體平均數(shù)的區(qū)間估計,總體成數(shù)的區(qū)間估計的上下限是:注意:在實踐中,由于總體成數(shù)常常未知,這時,抽樣平均誤差公式中的總體成數(shù)用樣本成數(shù)代替。大樣本的條件:np≥5且n(1-p)≥5,由于總體成數(shù)p通常未知,可以用樣本成數(shù)來近似判斷。例:總體平均數(shù)的區(qū)間估計3對某型號的電子元件進行耐用性能檢查,抽查資料分組如下表,設該廠的產品質量檢驗標準規(guī)定,元件耐用時數(shù)達到1000小時以上為合格品。要求估計該批電子元件的合格率,置信水平95%。總體均值區(qū)間估計總結總體平均數(shù)估計區(qū)間的上下限總體方差已知N(0,1)重復抽樣不重復抽樣總體方差未知t(n-1)大樣本時近似服從N(0,1)重復抽樣不重復抽樣如果是正態(tài)總體如果不是正態(tài)總體,或分布未知總體方差已知且是大樣本總體方差未知且是大樣本
此時不考慮小樣本情況因此,大樣本情況下,直接用標準正態(tài)分布求置信區(qū)間即可。總體成數(shù)估計區(qū)間估計總結總體成數(shù)估計區(qū)間的上下限
只考慮大樣本情況(請記住大樣本條件)對總量指標的區(qū)間估計在對總體平均數(shù)進行區(qū)間估計的基礎上,可進一步推斷相應的總量指標,即用總體單位總數(shù)N分別乘以總體平均數(shù)的區(qū)間下限和區(qū)間上限,便得到相應總量(Nμ)的區(qū)間范圍。例1某
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 嘉興浙江嘉興市秀洲區(qū)消防安全委員會招聘筆試歷年參考題庫附帶答案詳解
- 吉林2025年吉林師范大學招聘博士人才113人筆試歷年參考題庫附帶答案詳解
- 臺州浙江臺州溫嶺市特殊教育學校招聘編外人員4人筆試歷年參考題庫附帶答案詳解
- 招聘考前自測高頻考點模擬試題及參考答案詳解(模擬題)
- 南通2025年江蘇南通啟東市人民醫(yī)院招聘事業(yè)編制工作人員21人筆試歷年參考題庫附帶答案詳解
- 安全員A證考試能力提升打印大全附參考答案詳解【典型題】
- 亳州2025年安徽亳州高新區(qū)及市直學校新任教師招聘224人筆試歷年參考題庫附帶答案詳解
- 2025年國際工程師資格考試試題及答案解析
- 公務員省考面試題及答案
- 母嬰保健助產技術試題及答案
- (正式版)DB41∕T 2987-2025 《在線教育課程資源制作規(guī)范》
- 2025至2030年中國碲化鎘行業(yè)競爭格局及市場發(fā)展?jié)摿︻A測報告
- 2026黑龍江省生態(tài)環(huán)境廳所屬事業(yè)單位招聘57人筆試備考試題及答案解析
- (2025年)(完整版)建筑工地三級安全教育試題(附答案)
- 2026新人教版七年級下冊英語知識點(生詞+詞組+語法)
- 名師工作室工作考核自評報告
- 工會法知識試題及答案
- 擒敵術課件底圖
- GB/T 38082-2025生物降解塑料購物袋
- 宴會工作流程培訓
- 黑山峽工程施工方案
評論
0/150
提交評論