版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第五章抽樣分布數(shù)學(xué)定律不能百分之百確切地用在現(xiàn)實(shí)生活里;能百分之百確切地用數(shù)學(xué)定律描述的,就不是現(xiàn)實(shí)生活--Albert
Einstein第五章抽樣分布數(shù)學(xué)定律不能百分之百確切地用在第五章概率分布重點(diǎn):理解三種不同性質(zhì)的分布,深刻理解抽樣分布的概念及中心極限定理的意義。
難點(diǎn):掌握樣本統(tǒng)計(jì)量的抽樣分布及其特征。第五章概率分布重點(diǎn):理解三種不同性質(zhì)的分布,深刻理解抽樣分第一節(jié)幾種常見(jiàn)的概率分布一、度量事件發(fā)生的可能性1.概率及概率分布概率,表征隨機(jī)事件發(fā)生可能性大小的量,是事件本身所固有的不隨人的主觀意愿而改變的一種屬性。第一節(jié)幾種常見(jiàn)的概率分布一、度量事件發(fā)生的可能性第一節(jié)幾種常見(jiàn)的概率分布一、度量事件發(fā)生的可能性1.概率及概率分布概率分布是概率論的基本概念之一,用以表述隨機(jī)變量取值的概率規(guī)律。為了使用的方便,根據(jù)隨機(jī)變量所屬類型的不同,概率分布取不同的表現(xiàn)形式。第一節(jié)幾種常見(jiàn)的概率分布一、度量事件發(fā)生的可能性二、隨機(jī)變量的概率分布1、隨機(jī)變量及其概括性度量什么是隨機(jī)變量隨機(jī)變量(randomvariable)表示隨機(jī)現(xiàn)象(在一定條件下,并不總是出現(xiàn)相同結(jié)果的現(xiàn)象稱為隨機(jī)現(xiàn)象)各種結(jié)果的變量(一切可能的樣本點(diǎn))。離散型隨機(jī)變量(discrete
random
variable)連續(xù)型隨機(jī)變量(continuous
random
variable)二、隨機(jī)變量的概率分布1、隨機(jī)變量及其概括性度量1、隨機(jī)變量及其概括性度量什么是隨機(jī)變量隨機(jī)變量的概括性度量期望值方差二、隨機(jī)變量的概率分布1、隨機(jī)變量及其概括性度量二、隨機(jī)變量的概率分布2、離散型概率分布
定義
設(shè)離散型隨機(jī)變量X所有可能的取值為
x1,x2,…,xn,…X取各個(gè)值的概率,即事件{X=xi}的概率為
P{X=xi}=pi
(i=1,2,…)則稱之為離散型隨機(jī)變量X的概率分布或分布列(律)(probability
distribution)。2、離散型概率分布定義設(shè)離散型隨機(jī)變量X所有可能2、離散型概率分布(1)非負(fù)性:pi≥0(i=1,2,…)(2)規(guī)范性:
分布列具有如下性質(zhì):2、離散型概率分布(1)非負(fù)性:pi≥0(i=1.0-1分布(二項(xiàng)分布)
若隨機(jī)變量X
只可能取0和1兩個(gè)值,概率分布為(0<p<1,p+q=1)則稱X
服從0-1分布(p為參數(shù)),也稱為貝努里分布。記作
X~B(1,p).其分布可表示為1.0-1分布(二項(xiàng)分布)若隨機(jī)變量X只可能取2.二項(xiàng)分布
定義如果隨機(jī)變量X的概率分布為(k=0,1,2,…,n)
(0<p<1,q=1-p)則稱X服從參數(shù)為n,p的二項(xiàng)分布。記作X~B(n,p).當(dāng)n=1時(shí),二項(xiàng)分布為即為0-1分布。2.二項(xiàng)分布定義如果隨機(jī)變量X的概率其中λ>0是常數(shù),則稱X服從參數(shù)為λ的泊松分布,記為X~P(λ)3.泊松分布(k=0,1,2,…)
定義如果隨機(jī)變量X的概率分布為查泊松分布表,對(duì)于給定的λ,可得其中λ>0是常數(shù),則稱X服從參數(shù)為λ的泊松分布,記為X~P(5.超幾何分布若隨機(jī)變量X的概率分布為則稱X服從參數(shù)為M,N,n的超幾何分布,記作
X~H(n,N,M)(k=0,1,…,
min(n,M)).
設(shè)有N個(gè)產(chǎn)品,其中M個(gè)不合格品。若從中不放回地隨機(jī)抽取n個(gè),則其中含有的不合格品數(shù)是一個(gè)隨機(jī)變量,由古典概率計(jì)算公式有X服從參數(shù)為M、N和n的超幾何分布。5.超幾何分布若隨機(jī)變量X的概率分布為則稱X服從參數(shù)為3、連續(xù)型概率分布由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對(duì)頻數(shù)分布的模型而提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來(lái)描述可用于近似離散型隨機(jī)變量的分布例如:二項(xiàng)分布經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)(1)正態(tài)分布(normaldistribution)3、連續(xù)型概率分布由C.F.高斯(CarlFriedricf(x)=隨機(jī)變量X的頻數(shù)
=正態(tài)隨機(jī)變量X的均值=正態(tài)隨機(jī)變量X的方差
=3.1415926;e=2.71828x=隨機(jī)變量的取值(-<x<)概率密度函數(shù)f(x)=隨機(jī)變量X的頻數(shù)概率密度函數(shù)正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x=處均值和標(biāo)準(zhǔn)差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族”均值可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭當(dāng)X的取值向橫軸左右兩個(gè)方向無(wú)限延伸時(shí),曲線的兩個(gè)尾端也無(wú)限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1
正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x=
和對(duì)正態(tài)曲線的影響xf(x)CAB=1/212=1和對(duì)正態(tài)曲線的影響xf(x)CAB=1/21(2)數(shù)據(jù)的正態(tài)性評(píng)估檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布的描述性方法一是直方圖或莖葉圖二是正態(tài)概率圖(Q-Q或P-P圖)例:在一家保險(xiǎn)公司中隨機(jī)抽取10名銷售人員,他們的年銷售額(單位:萬(wàn)元)分別為176,191,214,220,205,192,201,190,183,185。繪制正態(tài)概率圖,判斷銷售額是否服從正態(tài)分布。(2)數(shù)據(jù)的正態(tài)性評(píng)估抽樣分布培訓(xùn)抽樣分布培訓(xùn)第二節(jié)由正態(tài)分布導(dǎo)出的幾個(gè)重要分布2分布(2
distribution)t分布(t-distribution)F分布(F
distribution)第二節(jié)由正態(tài)分布導(dǎo)出的幾個(gè)重要分布2分布(2dist由阿貝(Abbe)
于1863年首先給出,后來(lái)由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)
分別于1875年和1900年推導(dǎo)出來(lái)設(shè),則令,則Y服從自由度為1的2分布,即
當(dāng)總體,從中抽取容量為n的樣本,則2分布(2
distribution)由阿貝(Abbe)于1863年首先給出,后來(lái)由海爾墨特(H分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱期望為:E(2)=df,方差為:D(2)=2df(df為自由度)可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U~2(df1),V~2(df2),則U+V這一隨機(jī)變量服從自由度為df1+df2的2分布2分布(性質(zhì)和特點(diǎn))分布的變量值始終為正2分布(性質(zhì)和特點(diǎn))5、設(shè)X~N(u,σ2),x1
,x2……,xn是X的一個(gè)樣本,與分別為樣本的均值和方差,則有:5、設(shè)X~N(u,σ2),x1,x2……,xn是X的一
選擇容量為n的簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差S2計(jì)算2值2=(n-1)S2/σ2計(jì)算出所有的
2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體選擇容量為n的計(jì)算2值計(jì)算出所有的不同容量樣本的抽樣分c2分布(圖示)
不同容量樣本的抽樣分布c2n=1n=4n=10n=20c2分布(圖示)不同容量樣本的抽樣分布c2n
α分位點(diǎn)若對(duì)于給定的α,0<α<1,存在使得則稱點(diǎn)為分布上的α分位點(diǎn),如圖所示。
α分位點(diǎn)t分布(t-distribution)
t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt
分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)zt分布(t-distribution)t分布是類1、當(dāng)X~N(u,σ2),x1,x2……,xn是X的一個(gè)樣本,當(dāng)方差未知時(shí),我們用樣本方差代替,則:為服從自由度為n-1的t分布,記t~t(n-1)。t分布又稱學(xué)生(student)分布。抽樣分布培訓(xùn)2、性質(zhì)——關(guān)于y軸呈對(duì)稱分布;當(dāng)時(shí),近似于N(0,1)分布?!练治稽c(diǎn)對(duì)于給定的α,0<α<1,稱滿足的點(diǎn)為t分布的α分位點(diǎn)。2、性質(zhì)由統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)提出的,以其姓氏的第一個(gè)字母來(lái)命名設(shè)若U為服從自由度為df1的2分布,即U~2(df1),V為服從自由度為df2的2分布,即V~2(df2),且U和V相互獨(dú)立,則稱F為服從自由度df1和df2的F分布,記為F分布(F
distribution)由統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)提出的,以其姓氏的抽樣分布培訓(xùn)假設(shè)總體,總體,X,Y相互獨(dú)立,x1,x2,……,xn和y1,y2,……,yn分別是來(lái)自X和Y的樣本。S12,S22分別是它們的方差,則:假設(shè)總體,總體,X,Y相互獨(dú)立,xF分布的性質(zhì):F分布形態(tài)是一正偏分布,它的分布曲線的形式隨兩個(gè)自由度不同而不同,隨df1和df2的增加而漸趨正態(tài)分布。因F為兩個(gè)方差之比率,故F總為正值。F分布表是根據(jù)F分布函數(shù)計(jì)算得來(lái)的。F分布的性質(zhì):F分布形態(tài)是一正偏分布,它的分布曲線的形式隨兩F分布(圖示)
不同自由度的F分布F(1,10)(5,10)(10,10)F分布(圖示)不同自由度的F分布F(1,10)(5——α分位點(diǎn)對(duì)于給定的α,0<α<1,稱滿足為F分布的α分位點(diǎn)?!练治稽c(diǎn)第三節(jié)樣本統(tǒng)計(jì)量的概率分布【例】擲一枚均勻的骰子并且讓X=擲出的點(diǎn)數(shù)。則X的總體均值是μ=3.5
。(1)假設(shè)骰子被擲3次,產(chǎn)生了樣本觀察值2,2,6。(2)假設(shè)再擲骰子3次,并得到樣本觀察值3,4,6。問(wèn)樣本均值與樣本中位數(shù)哪個(gè)能更好的代表總體均值。(1)=3.33,=2(2)=4.33,=4樣本均值更接近于μ樣本中位數(shù)更接近于μ第三節(jié)樣本統(tǒng)計(jì)量的概率分布【例】擲一枚均勻的骰子并且讓X=一、三種不同性質(zhì)的分布1.總體分布2.樣本分布3.抽樣分布一、三種不同性質(zhì)的分布1.總體分布總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體分布(populationdistribution)總體總體中各元素的觀察值所形成的分布總體分布(populat一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本分布(sampledistribution)樣本一個(gè)樣本中各觀察值的分布樣本分布(sampledist抽樣分布(samplingdistribution)在重復(fù)選取容量為n的樣本時(shí),由每一個(gè)樣本算出的該統(tǒng)計(jì)量數(shù)值的相對(duì)頻數(shù)分布或概率分布,即樣本統(tǒng)計(jì)量的概率分布抽樣分布(samplingdistribution)在重復(fù)樣本統(tǒng)計(jì)量的概率分布是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)樣本統(tǒng)計(jì)量的概率分布總體計(jì)算樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差樣本抽樣分布的形成過(guò)程總體計(jì)算樣本統(tǒng)計(jì)量樣本抽樣分布的形成過(guò)程【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下:總體分布14230.1.2.3二、樣本均值的抽樣分布P(x)X【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=43.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)
現(xiàn)從總體中抽取n=2
的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))
計(jì)算出各樣本的均值,如下表:3.53.02.52.033.02.52.01.524.03X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.53.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)給出樣本均值的抽樣分布抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X=2.5σ2=1.25總體分布14230.1.2.3P(x)XX樣本均值的抽樣分布1.00.1.2.3P(X)1.533.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)3.53.02.52.033.02.52.01.524.03=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布Ⅹ~N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X
的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)1.樣本均值的抽樣分布與中心極限定理=50=10X總體分布n=4抽樣分布Xn=1中心極限定理(centrallimittheorem):設(shè)從均值為,方差為
2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí)(通常要求n≥30),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n
的正態(tài)分布中心極限定理(centrallimittheorem):XXXXXX總體分布正態(tài)分布非正態(tài)分布正態(tài)分布大樣本小樣本正態(tài)分布非正態(tài)分布抽樣分布與總體分布的關(guān)系抽樣分布總體分布正態(tài)分布非正態(tài)分布正態(tài)分布大樣本小樣本正態(tài)分布非正態(tài)【例】一個(gè)汽車電池的制造商聲稱其最好的電池壽命的分布均值為54個(gè)月,標(biāo)準(zhǔn)差為6個(gè)月。假設(shè)某一消費(fèi)組織決定購(gòu)買(mǎi)個(gè)這種電池作為樣本來(lái)檢驗(yàn)電池的壽命,以核實(shí)這一聲明。(1)假設(shè)這個(gè)制造商之所言是真實(shí)的,試描述這50個(gè)電池樣本的平均壽命的抽樣分布。(2)假設(shè)這個(gè)制造商之所言是真實(shí)的,則消費(fèi)組織的樣本壽命均值小于或等于52個(gè)月的概率是多少?【例】一個(gè)汽車電池的制造商聲稱其最好的電池壽命的分布均值為52.抽樣分布的特征X樣本均值的數(shù)學(xué)期望樣本均值的方差重復(fù)抽樣不重復(fù)抽樣2.抽樣分布的特征X樣本均值的數(shù)學(xué)期望【例】設(shè)從一個(gè)均值=10、標(biāo)準(zhǔn)差σ=0.6的總體中隨機(jī)選取容量為n=36的樣本。假定該總體不是很偏的,要求:(1)計(jì)算樣本均值小于9.9的近似概率。(2)計(jì)算樣本均值超過(guò)9.9的近似概率。(3)計(jì)算樣本均值在總體均值=10附近0.1范圍內(nèi)的近似概率?!纠吭O(shè)從一個(gè)均值=10、標(biāo)準(zhǔn)差σ=0.6的總體中隨機(jī)選取三、樣本比例的抽樣分布比例(proportion):總體(或樣本)中具有某種屬性的單位與全部單位總數(shù)之比三、樣本比例的抽樣分布比例(proportion):總體(p的抽樣分布是指樣本比例p的所有可能取值的抽樣分布。當(dāng)樣本容量很大時(shí),樣本比例p的抽樣分布可用正態(tài)分布近似。對(duì)于一個(gè)具體的樣本比例p,若np≥5和n(1-p)≥5,就可以認(rèn)為樣本容量足夠大。p的抽樣分布是指樣本比例p的所有可能取值的抽樣分布。樣本比例的數(shù)學(xué)期望樣本比例的方差重復(fù)抽樣不重復(fù)抽樣比例抽樣分布的特征樣本比例的數(shù)學(xué)期望比例抽樣分布的特征【例】假定某統(tǒng)計(jì)人員在其填寫(xiě)的報(bào)表中有2%至少會(huì)有一處錯(cuò)誤,如果我們檢查了一個(gè)由600份報(bào)表組成的隨機(jī)樣本,其中至少有一處錯(cuò)誤的報(bào)表所占的比例在0.025~0.070之間的概率有多大?解:設(shè)600份報(bào)表中至少有一處錯(cuò)誤的報(bào)表所占的比例為p,由題意可知,μp=π=0.02因?yàn)閚·p=600×0.02=12>5,所以是大樣本,則【例】假定某統(tǒng)計(jì)人員在其填寫(xiě)的報(bào)表中有2%至少會(huì)有一處錯(cuò)誤,從而所求概率為:即該統(tǒng)計(jì)人員所填寫(xiě)的報(bào)表中至少有一處錯(cuò)誤的報(bào)表所占的比例在0.025~0.070之間的概率為19.02%。從而所求概率為:即該統(tǒng)計(jì)人員所填寫(xiě)的報(bào)表中至少有一處錯(cuò)誤的報(bào)對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值
的抽樣分布服從自由度為
(n-1)的2
分布,即四、樣本方差的抽樣分布對(duì)于來(lái)自正態(tài)總體的簡(jiǎn)單隨機(jī)樣本,則比值四、樣本方差的抽樣分兩個(gè)樣本均值之差的抽樣分布
兩個(gè)樣本比率之差的抽樣分布兩個(gè)樣本方差比的抽樣分布五、兩個(gè)樣本統(tǒng)計(jì)量的抽樣分布兩個(gè)樣本均值之差的抽樣分布五、兩個(gè)樣本統(tǒng)計(jì)量的抽樣分布
兩個(gè)樣本均值之差的抽樣分布從兩個(gè)總體中分別獨(dú)立地抽取容量為n1和n2的樣本,在重復(fù)選取容量為和n1和n2的樣本時(shí),由兩個(gè)樣本均值之差的所有可能取值形成的相對(duì)頻數(shù)分布,稱為兩個(gè)樣本均值之差的抽樣分布。兩個(gè)樣本均值之差的抽樣分布從兩個(gè)總體中分別獨(dú)立地抽取容量假定有兩個(gè)總體,總體1和總體2,從總體1中抽取容量為n1的樣本,從總體2中抽取容量為n2的樣本那么當(dāng)則
假定有兩個(gè)總體,總體1和總體2,從總體1中抽取容量為n1的樣兩個(gè)樣本比率之差的抽樣分布從兩個(gè)服從二項(xiàng)分布的總體中,分別獨(dú)立地抽取容量為n1和n2的樣本,在重復(fù)選取容量為n1和n2的樣本時(shí),由兩個(gè)樣本比率之差的所有可能取值形成的相對(duì)頻數(shù)分布,稱為兩個(gè)樣本比率之差的抽樣分布。兩個(gè)樣本比率之差的抽樣分布從兩個(gè)服從二項(xiàng)分布的總體中,分設(shè)兩個(gè)總體都服從二項(xiàng)分布,分別從中抽取容量為n1和n2的獨(dú)立樣本,當(dāng)兩個(gè)樣本都是大樣本時(shí),(np≥5或n(1-p)≥5),則設(shè)兩個(gè)總體都服從二項(xiàng)分布,分別從中抽取容量為n1和n2的獨(dú)立
兩個(gè)樣本方差比的抽樣分布
從兩個(gè)正態(tài)總體中分別獨(dú)立地抽取容量為n1和n2樣本,在重復(fù)選取容量為n1和n2的樣本時(shí),由兩個(gè)樣本方差比的所有可能取值形成的相對(duì)頻數(shù)分布為兩個(gè)樣本方差比的抽樣分布。兩個(gè)樣本方差比的抽樣分布從兩個(gè)正態(tài)總體中設(shè)兩個(gè)總體都為正態(tài)分布,即,,分別從兩個(gè)總體中抽取容量為n1和n2的獨(dú)立樣本,兩個(gè)樣本的方差比服從F分布。設(shè)兩個(gè)總體都為正態(tài)分布,即,演講完畢,謝謝觀看!演講完畢,謝謝觀看!第五章抽樣分布數(shù)學(xué)定律不能百分之百確切地用在現(xiàn)實(shí)生活里;能百分之百確切地用數(shù)學(xué)定律描述的,就不是現(xiàn)實(shí)生活--Albert
Einstein第五章抽樣分布數(shù)學(xué)定律不能百分之百確切地用在第五章概率分布重點(diǎn):理解三種不同性質(zhì)的分布,深刻理解抽樣分布的概念及中心極限定理的意義。
難點(diǎn):掌握樣本統(tǒng)計(jì)量的抽樣分布及其特征。第五章概率分布重點(diǎn):理解三種不同性質(zhì)的分布,深刻理解抽樣分第一節(jié)幾種常見(jiàn)的概率分布一、度量事件發(fā)生的可能性1.概率及概率分布概率,表征隨機(jī)事件發(fā)生可能性大小的量,是事件本身所固有的不隨人的主觀意愿而改變的一種屬性。第一節(jié)幾種常見(jiàn)的概率分布一、度量事件發(fā)生的可能性第一節(jié)幾種常見(jiàn)的概率分布一、度量事件發(fā)生的可能性1.概率及概率分布概率分布是概率論的基本概念之一,用以表述隨機(jī)變量取值的概率規(guī)律。為了使用的方便,根據(jù)隨機(jī)變量所屬類型的不同,概率分布取不同的表現(xiàn)形式。第一節(jié)幾種常見(jiàn)的概率分布一、度量事件發(fā)生的可能性二、隨機(jī)變量的概率分布1、隨機(jī)變量及其概括性度量什么是隨機(jī)變量隨機(jī)變量(randomvariable)表示隨機(jī)現(xiàn)象(在一定條件下,并不總是出現(xiàn)相同結(jié)果的現(xiàn)象稱為隨機(jī)現(xiàn)象)各種結(jié)果的變量(一切可能的樣本點(diǎn))。離散型隨機(jī)變量(discrete
random
variable)連續(xù)型隨機(jī)變量(continuous
random
variable)二、隨機(jī)變量的概率分布1、隨機(jī)變量及其概括性度量1、隨機(jī)變量及其概括性度量什么是隨機(jī)變量隨機(jī)變量的概括性度量期望值方差二、隨機(jī)變量的概率分布1、隨機(jī)變量及其概括性度量二、隨機(jī)變量的概率分布2、離散型概率分布
定義
設(shè)離散型隨機(jī)變量X所有可能的取值為
x1,x2,…,xn,…X取各個(gè)值的概率,即事件{X=xi}的概率為
P{X=xi}=pi
(i=1,2,…)則稱之為離散型隨機(jī)變量X的概率分布或分布列(律)(probability
distribution)。2、離散型概率分布定義設(shè)離散型隨機(jī)變量X所有可能2、離散型概率分布(1)非負(fù)性:pi≥0(i=1,2,…)(2)規(guī)范性:
分布列具有如下性質(zhì):2、離散型概率分布(1)非負(fù)性:pi≥0(i=1.0-1分布(二項(xiàng)分布)
若隨機(jī)變量X
只可能取0和1兩個(gè)值,概率分布為(0<p<1,p+q=1)則稱X
服從0-1分布(p為參數(shù)),也稱為貝努里分布。記作
X~B(1,p).其分布可表示為1.0-1分布(二項(xiàng)分布)若隨機(jī)變量X只可能取2.二項(xiàng)分布
定義如果隨機(jī)變量X的概率分布為(k=0,1,2,…,n)
(0<p<1,q=1-p)則稱X服從參數(shù)為n,p的二項(xiàng)分布。記作X~B(n,p).當(dāng)n=1時(shí),二項(xiàng)分布為即為0-1分布。2.二項(xiàng)分布定義如果隨機(jī)變量X的概率其中λ>0是常數(shù),則稱X服從參數(shù)為λ的泊松分布,記為X~P(λ)3.泊松分布(k=0,1,2,…)
定義如果隨機(jī)變量X的概率分布為查泊松分布表,對(duì)于給定的λ,可得其中λ>0是常數(shù),則稱X服從參數(shù)為λ的泊松分布,記為X~P(5.超幾何分布若隨機(jī)變量X的概率分布為則稱X服從參數(shù)為M,N,n的超幾何分布,記作
X~H(n,N,M)(k=0,1,…,
min(n,M)).
設(shè)有N個(gè)產(chǎn)品,其中M個(gè)不合格品。若從中不放回地隨機(jī)抽取n個(gè),則其中含有的不合格品數(shù)是一個(gè)隨機(jī)變量,由古典概率計(jì)算公式有X服從參數(shù)為M、N和n的超幾何分布。5.超幾何分布若隨機(jī)變量X的概率分布為則稱X服從參數(shù)為3、連續(xù)型概率分布由C.F.高斯(CarlFriedrichGauss,1777—1855)作為描述誤差相對(duì)頻數(shù)分布的模型而提出描述連續(xù)型隨機(jī)變量的最重要的分布許多現(xiàn)象都可以由正態(tài)分布來(lái)描述可用于近似離散型隨機(jī)變量的分布例如:二項(xiàng)分布經(jīng)典統(tǒng)計(jì)推斷的基礎(chǔ)(1)正態(tài)分布(normaldistribution)3、連續(xù)型概率分布由C.F.高斯(CarlFriedricf(x)=隨機(jī)變量X的頻數(shù)
=正態(tài)隨機(jī)變量X的均值=正態(tài)隨機(jī)變量X的方差
=3.1415926;e=2.71828x=隨機(jī)變量的取值(-<x<)概率密度函數(shù)f(x)=隨機(jī)變量X的頻數(shù)概率密度函數(shù)正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x=處均值和標(biāo)準(zhǔn)差一旦確定,分布的具體形式也惟一確定,不同參數(shù)正態(tài)分布構(gòu)成一個(gè)完整的“正態(tài)分布族”均值可取實(shí)數(shù)軸上的任意數(shù)值,決定正態(tài)曲線的具體位置;標(biāo)準(zhǔn)差決定曲線的“陡峭”或“扁平”程度。越大,正態(tài)曲線扁平;越小,正態(tài)曲線越高陡峭當(dāng)X的取值向橫軸左右兩個(gè)方向無(wú)限延伸時(shí),曲線的兩個(gè)尾端也無(wú)限漸近橫軸,理論上永遠(yuǎn)不會(huì)與之相交正態(tài)隨機(jī)變量在特定區(qū)間上的取值概率由正態(tài)曲線下的面積給出,而且其曲線下的總面積等于1
正態(tài)分布函數(shù)的性質(zhì)圖形是關(guān)于x=對(duì)稱鐘形曲線,且峰值在x=
和對(duì)正態(tài)曲線的影響xf(x)CAB=1/212=1和對(duì)正態(tài)曲線的影響xf(x)CAB=1/21(2)數(shù)據(jù)的正態(tài)性評(píng)估檢驗(yàn)數(shù)據(jù)是否服從正態(tài)分布的描述性方法一是直方圖或莖葉圖二是正態(tài)概率圖(Q-Q或P-P圖)例:在一家保險(xiǎn)公司中隨機(jī)抽取10名銷售人員,他們的年銷售額(單位:萬(wàn)元)分別為176,191,214,220,205,192,201,190,183,185。繪制正態(tài)概率圖,判斷銷售額是否服從正態(tài)分布。(2)數(shù)據(jù)的正態(tài)性評(píng)估抽樣分布培訓(xùn)抽樣分布培訓(xùn)第二節(jié)由正態(tài)分布導(dǎo)出的幾個(gè)重要分布2分布(2
distribution)t分布(t-distribution)F分布(F
distribution)第二節(jié)由正態(tài)分布導(dǎo)出的幾個(gè)重要分布2分布(2dist由阿貝(Abbe)
于1863年首先給出,后來(lái)由海爾墨特(Hermert)和卡·皮爾遜(K·Pearson)
分別于1875年和1900年推導(dǎo)出來(lái)設(shè),則令,則Y服從自由度為1的2分布,即
當(dāng)總體,從中抽取容量為n的樣本,則2分布(2
distribution)由阿貝(Abbe)于1863年首先給出,后來(lái)由海爾墨特(H分布的變量值始終為正分布的形狀取決于其自由度n的大小,通常為不對(duì)稱的正偏分布,但隨著自由度的增大逐漸趨于對(duì)稱期望為:E(2)=df,方差為:D(2)=2df(df為自由度)可加性:若U和V為兩個(gè)獨(dú)立的2分布隨機(jī)變量,U~2(df1),V~2(df2),則U+V這一隨機(jī)變量服從自由度為df1+df2的2分布2分布(性質(zhì)和特點(diǎn))分布的變量值始終為正2分布(性質(zhì)和特點(diǎn))5、設(shè)X~N(u,σ2),x1
,x2……,xn是X的一個(gè)樣本,與分別為樣本的均值和方差,則有:5、設(shè)X~N(u,σ2),x1,x2……,xn是X的一
選擇容量為n的簡(jiǎn)單隨機(jī)樣本計(jì)算樣本方差S2計(jì)算2值2=(n-1)S2/σ2計(jì)算出所有的
2值不同容量樣本的抽樣分布c2n=1n=4n=10n=20ms總體選擇容量為n的計(jì)算2值計(jì)算出所有的不同容量樣本的抽樣分c2分布(圖示)
不同容量樣本的抽樣分布c2n=1n=4n=10n=20c2分布(圖示)不同容量樣本的抽樣分布c2n
α分位點(diǎn)若對(duì)于給定的α,0<α<1,存在使得則稱點(diǎn)為分布上的α分位點(diǎn),如圖所示。
α分位點(diǎn)t分布(t-distribution)
t分布是類似正態(tài)分布的一種對(duì)稱分布,它通常要比正態(tài)分布平坦和分散。一個(gè)特定的分布依賴于稱之為自由度的參數(shù)。隨著自由度的增大,分布也逐漸趨于正態(tài)分布xt
分布與標(biāo)準(zhǔn)正態(tài)分布的比較t分布標(biāo)準(zhǔn)正態(tài)分布t不同自由度的t分布標(biāo)準(zhǔn)正態(tài)分布t(df=13)t(df=5)zt分布(t-distribution)t分布是類1、當(dāng)X~N(u,σ2),x1,x2……,xn是X的一個(gè)樣本,當(dāng)方差未知時(shí),我們用樣本方差代替,則:為服從自由度為n-1的t分布,記t~t(n-1)。t分布又稱學(xué)生(student)分布。抽樣分布培訓(xùn)2、性質(zhì)——關(guān)于y軸呈對(duì)稱分布;當(dāng)時(shí),近似于N(0,1)分布。——α分位點(diǎn)對(duì)于給定的α,0<α<1,稱滿足的點(diǎn)為t分布的α分位點(diǎn)。2、性質(zhì)由統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)提出的,以其姓氏的第一個(gè)字母來(lái)命名設(shè)若U為服從自由度為df1的2分布,即U~2(df1),V為服從自由度為df2的2分布,即V~2(df2),且U和V相互獨(dú)立,則稱F為服從自由度df1和df2的F分布,記為F分布(F
distribution)由統(tǒng)計(jì)學(xué)家費(fèi)希爾(R.A.Fisher)提出的,以其姓氏的抽樣分布培訓(xùn)假設(shè)總體,總體,X,Y相互獨(dú)立,x1,x2,……,xn和y1,y2,……,yn分別是來(lái)自X和Y的樣本。S12,S22分別是它們的方差,則:假設(shè)總體,總體,X,Y相互獨(dú)立,xF分布的性質(zhì):F分布形態(tài)是一正偏分布,它的分布曲線的形式隨兩個(gè)自由度不同而不同,隨df1和df2的增加而漸趨正態(tài)分布。因F為兩個(gè)方差之比率,故F總為正值。F分布表是根據(jù)F分布函數(shù)計(jì)算得來(lái)的。F分布的性質(zhì):F分布形態(tài)是一正偏分布,它的分布曲線的形式隨兩F分布(圖示)
不同自由度的F分布F(1,10)(5,10)(10,10)F分布(圖示)不同自由度的F分布F(1,10)(5——α分位點(diǎn)對(duì)于給定的α,0<α<1,稱滿足為F分布的α分位點(diǎn)?!练治稽c(diǎn)第三節(jié)樣本統(tǒng)計(jì)量的概率分布【例】擲一枚均勻的骰子并且讓X=擲出的點(diǎn)數(shù)。則X的總體均值是μ=3.5
。(1)假設(shè)骰子被擲3次,產(chǎn)生了樣本觀察值2,2,6。(2)假設(shè)再擲骰子3次,并得到樣本觀察值3,4,6。問(wèn)樣本均值與樣本中位數(shù)哪個(gè)能更好的代表總體均值。(1)=3.33,=2(2)=4.33,=4樣本均值更接近于μ樣本中位數(shù)更接近于μ第三節(jié)樣本統(tǒng)計(jì)量的概率分布【例】擲一枚均勻的骰子并且讓X=一、三種不同性質(zhì)的分布1.總體分布2.樣本分布3.抽樣分布一、三種不同性質(zhì)的分布1.總體分布總體中各元素的觀察值所形成的分布分布通常是未知的可以假定它服從某種分布總體分布(populationdistribution)總體總體中各元素的觀察值所形成的分布總體分布(populat一個(gè)樣本中各觀察值的分布也稱經(jīng)驗(yàn)分布當(dāng)樣本容量n逐漸增大時(shí),樣本分布逐漸接近總體的分布樣本分布(sampledistribution)樣本一個(gè)樣本中各觀察值的分布樣本分布(sampledist抽樣分布(samplingdistribution)在重復(fù)選取容量為n的樣本時(shí),由每一個(gè)樣本算出的該統(tǒng)計(jì)量數(shù)值的相對(duì)頻數(shù)分布或概率分布,即樣本統(tǒng)計(jì)量的概率分布抽樣分布(samplingdistribution)在重復(fù)樣本統(tǒng)計(jì)量的概率分布是一種理論概率分布隨機(jī)變量是樣本統(tǒng)計(jì)量樣本均值,樣本比例,樣本方差等結(jié)果來(lái)自容量相同的所有可能樣本提供了樣本統(tǒng)計(jì)量長(zhǎng)遠(yuǎn)穩(wěn)定的信息,是進(jìn)行推斷的理論基礎(chǔ),也是抽樣推斷科學(xué)性的重要依據(jù)樣本統(tǒng)計(jì)量的概率分布總體計(jì)算樣本統(tǒng)計(jì)量例如:樣本均值、比例、方差樣本抽樣分布的形成過(guò)程總體計(jì)算樣本統(tǒng)計(jì)量樣本抽樣分布的形成過(guò)程【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=4。4個(gè)個(gè)體分別為X1=1、X2=2、X3=3、X4=4??傮w的均值、方差及分布如下:總體分布14230.1.2.3二、樣本均值的抽樣分布P(x)X【例】設(shè)一個(gè)總體,含有4個(gè)元素(個(gè)體),即總體單位數(shù)N=43.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)
現(xiàn)從總體中抽取n=2
的簡(jiǎn)單隨機(jī)樣本,在重復(fù)抽樣條件下,共有42=16個(gè)樣本。所有樣本的結(jié)果為:3,43,33,23,132,42,32,22,124,44,34,24,141,441,33211,21,11第二個(gè)觀察值第一個(gè)觀察值所有可能的n=2的樣本(共16個(gè))
計(jì)算出各樣本的均值,如下表:3.53.02.52.033.02.52.01.524.03X樣本均值的抽樣分布1.00.1.2.3P(X)1.53.04.03.52.02.53.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)給出樣本均值的抽樣分布抽樣分布P(X)1.00.1.2.31.53.04.03.52.02.5X=2.5σ2=1.25總體分布14230.1.2.3P(x)XX樣本均值的抽樣分布1.00.1.2.3P(X)1.533.53.02.52.033.02.52.01.524.03.53.02.542.542.03211.51.01第二個(gè)觀察值第一個(gè)觀察值16個(gè)樣本的均值(x)3.53.02.52.033.02.52.01.524.03=50
=10X總體分布n=4抽樣分布Xn=16當(dāng)總體服從正態(tài)分布Ⅹ~N(μ,σ2)時(shí),來(lái)自該總體的所有容量為n的樣本的均值X也服從正態(tài)分布,X
的數(shù)學(xué)期望為μ,方差為σ2/n。即X~N(μ,σ2/n)1.樣本均值的抽樣分布與中心極限定理=50=10X總體分布n=4抽樣分布Xn=1中心極限定理(centrallimittheorem):設(shè)從均值為,方差為
2的一個(gè)任意總體中抽取容量為n的樣本,當(dāng)n充分大時(shí)(通常要求n≥30),樣本均值的抽樣分布近似服從均值為μ、方差為σ2/n
的正態(tài)分布中心極限定理(centrallimittheorem):XXXXXX總體分布正態(tài)分布非正態(tài)分布正態(tài)分布大樣本小樣本正態(tài)分布非正態(tài)分布抽樣分布與總體分布的關(guān)系抽樣分布總體分布正態(tài)分布非正態(tài)分布正態(tài)分布大樣本小樣本正態(tài)分布非正態(tài)【例】一個(gè)汽車電池的制造商聲稱其最好的電池壽命的分布均值為54個(gè)月,標(biāo)準(zhǔn)差為6個(gè)月。假設(shè)某一消費(fèi)組織決定購(gòu)買(mǎi)個(gè)這種電池作為樣本來(lái)檢驗(yàn)電池的壽命,以核實(shí)這一聲明。(1)假設(shè)這個(gè)制造商之所言是真實(shí)的,試描述這50個(gè)電池
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年安徽國(guó)際商務(wù)職業(yè)學(xué)院?jiǎn)握新殬I(yè)技能考試參考題庫(kù)含詳細(xì)答案解析
- 2026年泉州紡織服裝職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試模擬試題及答案詳細(xì)解析
- 2026年青海交通職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)考試備考題庫(kù)含詳細(xì)答案解析
- 2026年廣西藍(lán)天航空職業(yè)學(xué)院?jiǎn)握芯C合素質(zhì)筆試參考題庫(kù)含詳細(xì)答案解析
- 2026上半年安徽事業(yè)單位聯(lián)考滁州市瑯琊區(qū)招聘10人參考考試試題及答案解析
- 2026年六安霍山縣事業(yè)單位公開(kāi)招聘工作人員43名參考考試題庫(kù)及答案解析
- 2026廣東廣州市天河區(qū)公共衛(wèi)生間管理所招聘編外人員4人參考考試試題及答案解析
- 2026年蘭州石化職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性測(cè)試模擬試題及答案詳細(xì)解析
- 2026浙江寧波海洋發(fā)展集團(tuán)有限公司招聘1人考試重點(diǎn)試題及答案解析
- 2026年廣東嶺南職業(yè)技術(shù)學(xué)院?jiǎn)握芯C合素質(zhì)筆試模擬試題含詳細(xì)答案解析
- 深圳大疆在線測(cè)評(píng)行測(cè)題庫(kù)
- 金屬?gòu)S生產(chǎn)制度
- 2026安徽淮北市特種設(shè)備監(jiān)督檢驗(yàn)中心招聘專業(yè)技術(shù)人員4人參考題庫(kù)及答案1套
- 2025年航空行業(yè)空客智能制造報(bào)告
- 蒙牛乳業(yè)股份有限公司盈利能力分析
- 2025民航西藏空管中心社會(huì)招聘14人(第1期)筆試參考題庫(kù)附帶答案詳解(3卷合一版)
- (新教材)2026年人教版八年級(jí)下冊(cè)數(shù)學(xué) 21.2.1 平行四邊形及其性質(zhì) 課件
- 設(shè)備保養(yǎng)維護(hù)規(guī)程
- 2025年?yáng)|營(yíng)中考物理真題及答案
- DL-T+5860-2023+電化學(xué)儲(chǔ)能電站可行性研究報(bào)告內(nèi)容深度規(guī)定
- GB/T 46425-2025煤矸石山生態(tài)修復(fù)技術(shù)規(guī)范
評(píng)論
0/150
提交評(píng)論