概率統(tǒng)計重修教學(xué)課件.ppt_第1頁
概率統(tǒng)計重修教學(xué)課件.ppt_第2頁
概率統(tǒng)計重修教學(xué)課件.ppt_第3頁
概率統(tǒng)計重修教學(xué)課件.ppt_第4頁
概率統(tǒng)計重修教學(xué)課件.ppt_第5頁
已閱讀5頁,還剩467頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

1、概率論與數(shù)理統(tǒng)計 Probability Theory and Statistics,黃龍生,概率論 數(shù)理統(tǒng)計 模擬試題,第一章 隨機事件及其概率 第二章 隨機變量及其分布 第三章 多維隨機變量及其分布 第四章 隨機變量的數(shù)字特征 第五章 大數(shù)定理與中心極限定理,概率論,數(shù)理統(tǒng)計,第六章 數(shù)理統(tǒng)計基礎(chǔ) 第七章 參數(shù)估計 第八章 假設(shè)檢驗 第九章 方差分析 第十章 回歸分析,(6)空集 稱為不可能事件(Impossible event ).,(5)樣本空間 稱為必然事件(Certain event) .,(4)由樣本空間中的單個元素組成的子集稱為基本事件(Basic e

2、vents) .,隨機現(xiàn)象的某些樣本點組成的集合稱為隨機事件,簡稱事件.,(2)事件A發(fā)生當且僅當A中的某個樣本點出現(xiàn).,(1)任一事件A是相應(yīng)樣本空間的一個子集.,(3)事件可用集合A表示,也可用語言描述.,第一章 隨機事件及其概率,事件運算的規(guī)則,1、交換律(Exchange law) : ABBA,ABBA 2、結(jié)合律(Combination law) : (AB)CA(BC),(AB)CA(BC) 3、分配律(Distributive law) : (AB)C(AC)(BC),(AB)C(AC)(BC) 4、 De Morgan對偶律(Dual law) :,(1)第三次未中獎,(2)

3、第三次才中獎,(3)恰有一次中獎,(4)至少有一次中獎,(5)不止一次中獎,(6)至多中獎二次,概率的公理化定義,定義:設(shè) 為一個樣本空間,如果對任一事件A,賦予一個實數(shù)P(A).如果集合函數(shù)P(.)滿足下列條件:,(1)非負性公理:對于每一事件A,有P(A)0;,(2)正則性公理:P()=1;,(3)可列可加性公理:設(shè)A1,A2,是互不相容的事件,即對于ij,AiAj=,i,j=1,2,則有,則稱P(A)為事件A的概率(Probability).,性質(zhì)1:P()=0.,概率的性質(zhì),性質(zhì)3:對于任一事件A,有,性質(zhì)4:對于任意兩事件A,B,有 P(AB)=P(A)+P(B)-P(AB) 上式稱

4、為概率的加法公式.,概率的加法公式可推廣到多個事件的情況. 設(shè)A,B,C是任意三個事件,則有 P(ABC)=P(A)+P(B)+P(C)-P(AB)-P(BC)-P(CA)+P(ABC),一般,對于任意n個事件A1,A2,An,有,具有以上兩個特點的隨機試驗稱為古典概型,也稱為等可能概型.,在概率論發(fā)展的初期主要研究具有如下兩個特點的隨機試驗:,(1)試驗的樣本空間的元素只有有限個;,(2)試驗中每個基本事件發(fā)生的可能性相同.,古典概型,若事件A=ei1ei2 eik包含k個基本事件,則有 P(A)=k/n.,排列與組合公式,乘法原理:設(shè)完成一件事需分兩步,第一步有n1種方法,第二步有n2種方

5、法,則完成這件事共有n1n2種方法,A B C,加法原理:設(shè)完成一件事可有兩種途徑,第一種途徑有n1種方法,第二種途徑有n2種方法,則完成這件事共有n1+n2種方法。,A B,組合:從含有n個元素的集合中隨機抽取k個.,共有,種取法.,解 設(shè)A=沒有相同數(shù)字的三位數(shù),B表示沒有相同數(shù)字的三位偶數(shù),則基本事件總數(shù)n=566=180,(1)事件A包含的基本事件數(shù)為mA=554,(2)事件B包含的基本事件數(shù)為mB=442+54=52,所以,所以,解 (1)由于A與B互不相容,即AB=,則,所以,(2),則有,(3),則有,解法1:把a只黑球b只白球視為可分辨的.把a+b只球摸出來依次排在一直線的a+

6、b個位置上,則可能的排列法相當于把a+b個元素進行全排列,即基本事件總數(shù)為n=(a+b)!.而有利于事件Ak的場合相當于在第k個位置上放一個黑球(共有a種選擇),而在其余的a+b-1個位置上,由其余的a+b-1個球任意排列,共有m=a(a+b-1)!種排法.所以,例:袋中有a只黑球,b只白球.它們除了顏色不同外,其它方面全同.現(xiàn)在隨機地把球一只只摸出來,求第k次摸出的一只是黑球(事件Ak)的概率.,這兩種不同的解法,主要在于選取的樣本空間不同,而最后的答案是相同的.,解:設(shè)A=指定的n個盒子各有一球, B=恰有n個盒子各有一球. 由于每個球都可以放入N個盒子中的任一個,共有N種不同的放法.于是

7、n個球放進盒子就有Nn種不同的放法.而每一放法就是一個基本事件,且發(fā)生的可能性是相同的.所以基本事件總數(shù)為Nn個,例:將n個球隨機地放入N(Nn)個盒子中去,每個球都能以同樣的概率1/N落入N個盒子中的每一個,試求: 1.指定的n個盒子各有一球的概率; 2.恰有n個盒子各有一球的概率.,指定的n個盒子各有一球,共有n(n-1)(n-2)1=n!種可能的放法,于是 P(A)=n!/Nn,恰有n個盒子各有一球,共有 可能的放法,于是,故得 P(A)=333/2000 P(B)=250/2000,因而所求的概率為,例:在1至2000的整數(shù)中隨機地取一個數(shù),問取到的整數(shù)既不能被6整除,又不能被8整除的

8、概率是多少?,解:設(shè)A=取到的數(shù)能被6整除,B=取到的數(shù)能被8整除.,由于3332000/6334 2000/8=250,又由于一個數(shù)同時能被6與8整除,就相當于能被24整除,因此由 832000/2484 得P(AB)=83/2000,=1-333/2000-250/2000+83/2000=3/4,定義:設(shè)事件A為樣本空間中的某個小區(qū)域,如果它的測度為L(A),且點落入A中的可能性大小與L(A)成正比,而與A的位置及形狀無關(guān),則事件A的概率為 P(A)=L(A)/L() 這一類概率通常稱作幾何概率.,解:以x,y分別表示甲乙兩人到達的時刻, 那末0 xT, 0yT.若以x,y表示平面上點的

9、坐標,則:,例:(會面問題)甲,乙兩人相約在0到T這段時間內(nèi), 在預(yù)定地點會面. 先到的人等候另一個人, 經(jīng)過時間t(tT)后離去. 設(shè)每人在0到T這段時間內(nèi)各時刻到達該地是等可能的, 且兩人到達的時刻互不牽連. 求甲,乙兩人能會面的概率.,(1)所有基本事件可以用一邊長為T正方形內(nèi)所有點表示.,(2)兩人能會面的條件是 |x-y|t .,由等可能性知,所求概率為,條件概率(Conditional Probability),定義:設(shè)A,B是兩個事件,且P(A)0,稱,為在事件A發(fā)生的條件下事件B發(fā)生的條件概率.,條件概率是指在事件A發(fā)生的條件下,另一事件B發(fā)生的概率,記為P(B|A).,條件概

10、率的性質(zhì),條件概率符合概率定義中的三個條件.即,(1)對于任一事件B,有P(B|A)0;,(2)P(|A)=1;,(3)可列可加性:設(shè)B1,B2,是兩兩互不相容的事件,則有,P(B1|A)(B2|A) =P(B1|A)+P(B2|A)+,因此,概率中的一些重要結(jié)果都適用于條件概率.,解 依題意 P(B)=70%,例:設(shè)100件產(chǎn)品中有5件次品,從中任取兩次,每次取一件,作不放回抽樣.設(shè)A=第一次抽到合格品,B=第二次抽到次品,求P(B|A).,解法1:在A已發(fā)生的條件下,產(chǎn)品數(shù)變?yōu)?9件,其中次品數(shù)仍為5件,所以 P(B|A)=5/99,解法2:從100件產(chǎn)品中連續(xù)抽取2件(抽后不放回),其樣

11、本空間S的基本事件總數(shù)為10099,使AB發(fā)生的基本事件數(shù)為955.,于是P(AB)=(955)/(10099),又P(A)=95/100 故有 P(B|A)=5/99,概率的乘法公式,由條件概率定義可得下面定理 乘法定理:若P(A)0,則有 P(AB)=P(B|A)P(A) 上式稱為乘法公式(Multiplication formula) . 乘法公式可以推廣到任意有限個事件的情況. 設(shè)A1,A2,An為試驗E中的n個事件,且 P(A1A2An-1)0, 則有 P(A1A2An)= P(A1)P(A2|A1)P(A3|A1A2)P(An|A1A2An-1),例: 一個盒子中有6只白球,4只黑

12、球,從中不放回地每次任取1只,連取3次,求第三次才取得白球的概率.,易知,例:設(shè)某光學(xué)儀器廠制造的透鏡,第一次落下時打破的概率為1/2;若第一次落下未打破,第二次落下時打破的概率為7/10;若前二次落下未打破,第三次落下時打破的概率為9/10.試求透鏡落下三次而未打破的概率.,解:設(shè)Ai=透鏡第i次落下未打破(i=1,2,3),B=透鏡落下三次而未打破,則B=A1A2A3,故有 P(B)=P(A1A2A3)=P(A1)P(A2|A1)P(A3|A1A2) =(1-1/2)(1-7/10)(1-9/10)=3/200,例:一個盒子中有n(n1)只晶體管,其中有一只次品,隨機地取一只測試,直到找到

13、次品為止.求在第k(1kn)次測試出次品的概率.,解:設(shè)Ai=第i次測試的是正品,Bk=第k次測試到次品,則 P(Bk)=P(A1A2.Ak-1k) =P(A1) P(A2| A1). P(Ak-1 |A1A2.Ak-2) P(k|A1A2.Ak-1) =(n-1)/n(n-2)/(n-1) (n-k+1)/(n-k+2)1/(n-k+1) =1/n (1kn),定理:設(shè)為試驗E的樣本空間,B1,B2,Bn為樣本空間的一個劃分,A為E的一個事件,且P(Bi)0(i=1,2,n),則 P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+P(Bn)P(A|Bn) 上式稱為全概率公式(Co

14、mplete probability formula) .,解 設(shè)事件A表示取出的2個球都是白球,事件Bi表示所選袋子中裝球的情況屬于第i種(i=1、2、3),易知,于是按全概率公式所求的概率,解 設(shè)事件Bi是一批產(chǎn)品中有i個次品(i=0,1,2,3,4),設(shè)事件A是這批產(chǎn)品通過檢查,即抽樣檢查的10個產(chǎn)品都是合格品,則有P(A|B0)=1,所求的概率,兩個事件的獨立性,定義:設(shè)A,B是兩事件,如果具有等式 P(AB)=P(A)P(B) 則稱A,B為相互獨立(Mutual independence)的事件.,定義: 設(shè)A,B為任意兩個隨機事件,如果 P(B|A)=P(B) 即事件B發(fā)生的可能性

15、不受事件A的影響,則稱事件B對于事件A獨立.,定理:若P(A)0,P(B)0,則A,B相互獨立與A,B互不相容不能同時成立.,例:甲、乙兩個戰(zhàn)士打靶,甲的命中率為0.9,乙的命中率為0.85,兩人同時射擊同一目標,各打一槍.求目標被擊中的概率.,解:設(shè)A=甲擊中目標,B=乙擊中目標,C=目標被擊中,則,P(C)=P(A+B)=P(A)+P(B)-P(AB),=P(A+B)=P(A)+P(B)-P(A)P(B),=0.9+0.85-0.90.85=0.985,多個事件的獨立性,定義:設(shè)A,B,C是三事件,如果具有等式 P(AB)=P(A)P(B) P(BC)=P(B)P(C) P(CA)=P(C

16、)P(A) 則稱三事件A,B,C兩兩獨立.,定義:設(shè)A,B,C是三事件,如果具有等式 P(AB)=P(A)P(B) P(BC)=P(B)P(C) P(CA)=P(C)P(A) P(ABC)=P(A)P(B)P(C) 則稱三事件A,B,C為相互獨立的事件.,例:某人有一串m把外形相同的鑰匙,其中只有一把能打開家門.有一天該人醉后回家,下意識地每次從m把鑰匙中隨便拿一把去開門.問該人在第k次才把門打開的概率是多少?,解:設(shè)Ai=第i次取的鑰匙能打開門 B=第k次才把門打開,由于 P(Ai)=1/m, P(i)=1-1/m B= 12 . k-1 Ak,所以 P(B)=(1/m)(1-1/m)k-1

17、,例:甲、乙、丙三人獨立地向同一飛機射擊.設(shè)三人射中飛機的概率分別為0.4,0.5,0.7;一人射中飛機被擊落的概率為0.2,兩人射中飛機被擊落的概率為0.6,三人射中,則飛機被擊落.求飛機被擊落的概率.,解:設(shè)Bi=有i人射中(i=1,2,3),A=飛機被擊落.則 P(B1)=0.4(1-0.5)(1-0.7)+(1-0.4)0.5(1-0.7) +(1-0.4)(1-0.5)0.7=0.36 P(B2)=0.40.5(1-0.7)+0.4(1-0.5)0.7 +(1-0.4)0.50.7=0.41 P(B3)=0.40.50.7=0.14,P(A|B1)=0.2 P(A|B2)=0.6 P

18、(A|B3)=1 且B1,B2,B3兩兩互不相容,故有由全概率公式得 P(A)=P(B1)P(A|B1)+P(B2)P(A|B2)+P(B3)P(A|B3) =0.360.2+0.410.6+0.141=0.458,第二章 隨機變量及其分布,通常,我們用大寫字母X、Y、Z等表示隨機變量.,離散型隨機變量,分布律還可以簡單地表示為:,分布律具有以下性質(zhì):,(2),從而,0-1分布(兩點分布),貝努里試驗和二項分布,0-1分布和二項分布的關(guān)系,泊松分布,解,(1),(2),(3),二項分布的泊松逼近,泊松定理:,其中,例:設(shè)隨機變量X的分布律為,求X的分布函數(shù),并求PX1/2,P3/2X 5/2,

19、P2 X 3.,解:由概率的有限可加性得,即,PX1/2=F(1/2)=1/4,P3/2X 5/2 =F(5/2)-F(3/2) =3/4 -1/4=1/2,P2 X 3 = F(3)-F(2)+PX=2 =1-1/4+1/2=3/4,-1,1,2,3,0.25,0.5,1,x,F(x),F(x)的示意圖,分布函數(shù)的性質(zhì),解,(1),(2),連續(xù)型隨機變量的定義,由微積分學(xué)知識可知,連續(xù)型隨機變量的分布函數(shù)是一個連續(xù)函數(shù).,設(shè)X為連續(xù)型隨機變量, 則對任意的實數(shù)ab,即X落在區(qū)間的概率為密度函數(shù)y=f(t)與直線t=a,t=b及t軸所圍面積.,因此, X取任意單點值a的概率,從而,密度函數(shù)的性

20、質(zhì),連續(xù)型隨機變量的密度函數(shù)有如下性質(zhì):,解,f(x)的圖形如圖,從而得,解 由密度函數(shù)性質(zhì),(1),從而,(2),解 任一晶體管使用壽命超過150小時的概率為,(1),(2),均勻分布,指數(shù)分布,解(1),(2),(3),正態(tài)分布的概念,一般正態(tài)分布概率的計算,解,解,所以,查表得,從而,解,由,知,查表得,從而,在自然現(xiàn)象中,大量隨機變量都服從或近似服從正態(tài)分布. 在概率論和數(shù)理統(tǒng)計的理論研究和實際應(yīng)用中正態(tài)分布隨機變量起著極其重要的作用.,例:設(shè)X的分布律如下表,試求Y=(X-1)2的分布律.,解 Y所有可能取的值為0,1,4.由 PY=0=P(X-1)2 =0=PX=1=0.1,PY=

21、1=P(X-1)2 =1=PX=0+X=2 =PX=0+PX=2=0.7,PY=4=P(X-1)2 =4=PX=-1=0.2 即得Y的分布律為,求隨機變量Y=2X+8的概率密度.,解 先求Y=2X+8的分布函數(shù)FY(y).,于是得Y=2X+8的概率密度為,例:設(shè)隨機變量X具有概率密度,例:設(shè)隨機變量X具有概率密度pX(x),-x求Y=X2的概率密度.,解 先求Y 的分布函數(shù) FY(y) 由于Y=X2 ,故當y0時 FY(y)=0,當y0時有,于是得Y的概率密度為,解 X的取值范圍為(0,1), 從而Y的取值范圍為(1,3),當1y3時,Y的分布函數(shù)為,由于x0時,,從而,因此當1y3時,,圖示

22、,定義,第三章 多維隨機變量及其分布,1.3邊緣分布函數(shù),證明,解 (X,Y)關(guān)于X的邊緣分布函數(shù),解 (X,Y)關(guān)于Y的邊緣分布函數(shù),2二維離散型隨機變量,2.1二維離散型隨機變量,解,(2),(3),2.2二維離散型隨機變量邊緣分布律,因此得離散型隨機變量關(guān)于X 和Y 的邊緣分布函數(shù)分別為,解,3二維連續(xù)型隨機變量,3.1二維連續(xù)型隨機變量,解 (1)由,k=6,(2),解 由,所以(X,Y)的聯(lián)合分布函數(shù),(1),(2),3.2二維連續(xù)型隨機變量邊緣概率密度,證明,例 設(shè)隨機變量X和Y具有聯(lián)合概率密度,求邊緣概率密度pX(x)和pY(y).,解,5隨機變量的獨立性,在多維隨機變量中,各分

23、量的取值有時會相互影響,有時則毫不相干沒有影響的隨機變量被稱為相互獨立的隨機變量隨機變量相互獨立是概率論中非常重要的概念,它是隨機事件相互獨立的推廣.,證明,解,6二維隨機變量函數(shù)的分布,6.1二維離散型隨機變量函數(shù)的分布,解根據(jù)所求問題列出下表,6.2連續(xù)型隨機變量函數(shù)的分布,解,證明,解,如果,則稱隨機變量X的數(shù)學(xué)期望不存在.,第四章 隨機變量的數(shù)字特征,為連續(xù)型隨機變量X的數(shù)學(xué)期望,記為E(X).,定義:設(shè)連續(xù)型隨機變量X的密度函數(shù)為p(x),若,則稱,如果,則稱連續(xù)型隨機變量X的數(shù)學(xué)期望不存在.,例:設(shè)隨機變量X的概率密度函數(shù)為,試求X的數(shù)學(xué)期望,解,定理:設(shè)Y是隨機變量X的函數(shù):Y=

24、f(X)(f是連續(xù)函數(shù)).,(1)設(shè)離散型隨機變量X的概率分布為 PX=xk=pk, k=1,2,.,若,則,(2)設(shè)連續(xù)型隨機變量X的密度函數(shù)為p(x),若,則有,定理:設(shè)Y是隨機變量X的函數(shù):Y=f(X)(f是連續(xù)函數(shù)).,定理:設(shè)Z是隨機變量X,Y的函數(shù)Z=f(X,Y) (f是連續(xù)函數(shù)).,(1)設(shè)二維隨機向量(X,Y)的分布律為,(2)設(shè)二維隨機向量(X,Y)的分布密度為p(x,y),若,若,則,則,例: 設(shè)(X,Y)的聯(lián)合分布律如下,Z=XY,求E(Z).,解,例:設(shè)二維隨機變量(X,Y)的概率密度為,試求XY的數(shù)學(xué)期望.,解,數(shù)學(xué)期望的性質(zhì),1.若aXb,則E(X)存在,且有aE(

25、X)b.特別,若C是常數(shù),則E(C)=C.,2.設(shè)X,Y是兩個隨機變量,若E(X),E(Y)存在,則對任意的實數(shù)a、b, E(aX+bY)存在,且有 E(aX+bY)=aE(X)+bE(Y) 此性質(zhì)可推廣到有限個隨機變量的線性組合的情況.,3.設(shè)X,Y是互相獨立的隨機變量,則有 E(XY)=E(X)E(Y) 此性質(zhì)可推廣到有限個互相獨立的隨機變量之積的情況.,解,例,注:本題的特點是將X分解為數(shù)個隨機變量的和,再求數(shù)學(xué)期望.此種方法具有普遍意義.,解,因此,有,又當-1x1時,,故得,同理可得,由于,所以X與Y不相互獨立,例: 拋擲6顆骰子,X表示出現(xiàn)的點數(shù)之和,求E(X).,從而由期望的性質(zhì)

26、可得,定義:設(shè)X是一個隨機變量,若EX-E(X)2存在,則稱EX-E(X)2為X的方差.記為D(X)或Var(X),即,稱為X的標準差或均方差.,定理:,D(X)= Var(X)= EX-E(X)2,方差的意義 方差是一個常用來體現(xiàn)隨機變量 X 取值分散程度的量. 如果 D(X) 值大, 表示 X 取值分散程度大, E(X) 的代表性差; 而如果 D(X) 值小, 則表示X 的取值比較集中, 以 E(X) 作為隨機變量的代表性好.,方差實際上是隨機變量X的函數(shù)f(X)=X-E(X)2的數(shù)學(xué)期望.于是,(1)對于離散型隨機變量X,若 PX=xk=pk,k=1,2, 則,(2)對于連續(xù)型隨機變量X

27、,若其概率密度為p(x),則,例:設(shè)隨機變量X概率密度為p(x),求D(X).,解,于是,D(X)=E(X2)-E(X)2=1/6,常見分布的期望和方差表,解法1,X的邊緣密度函數(shù)是,故,解法2,于是,解,由于,所以,隨機變量方差的性質(zhì),(1)設(shè)C是常數(shù),則D(C)=0,(2)設(shè)C是常數(shù),X是隨機變量,則有 D(CX)=C2D(X),(3)設(shè)X,Y是兩個相互獨立的隨機變量,則有 D(X+Y)=D(X)+D(Y),(5)D(X)=0的充要條件是X以概率1取常數(shù)C,即 PX=C=1,(4)對于任意常數(shù)CE(X),有 D(X)E(X-C)2,例:設(shè)X服從二項分布XB(n,p),求E(X)和D(X).

28、,解 令X1,X2,Xn相互獨立,且它們的分布律為PXi=0=1-p,PXi=1=p,i=1,2,n.則有 X= X1 + X2 +.+ Xn,從而有,E(X)=E(X1 + X2 +.+ Xn) = E(X1)+E( X2 )+.+ E(Xn)=np,D(X)=D (X1 + X2 +.+ Xn) = D(X1)+D( X2 )+.+ D(Xn)=npq,定義:設(shè)二維隨機向量(X,Y)的數(shù)學(xué)期望(E(X),E(Y)存在,若E(X-E(X)(Y-E(Y)存在,則稱它為隨機變量X與Y的協(xié)方差,記為Cov(X,Y),即 Cov(X,Y)= E(X-E(X)(Y-E(Y),協(xié)方差有計算公式 Cov(

29、X,Y)= E(XY)-E(X)E(Y),任意兩個隨機變量X與Y的和的方差為 D(X+Y)=D(X)+D(Y)+2Cov(X,Y),協(xié)方差的性質(zhì),1.,2.,4.,定義:設(shè)二維隨機變量(X,Y)的方差D(X)0,D(Y)0,協(xié)方差Cov(X,Y)均存在,則稱,為隨機變量X與Y的相關(guān)系數(shù)或標準協(xié)方差.,相關(guān)系數(shù)的性質(zhì),性質(zhì)1:隨機變量X和Y的相關(guān)系數(shù)滿足|XY|1.,性質(zhì)2: |XY|=1 的充要條件是,存在常數(shù)a,b使得 PY=a+bX=1.,性質(zhì)3:若X與Y相互獨立,則XY=0.,定義:(1) 當XY=1 時,稱X與Y正線性相關(guān); (2)當XY=-1 時,稱X與Y負線性相關(guān); (3)當XY=

30、0時,稱X與Y不相關(guān).,注:(1) X與Y不相關(guān),只是意味著X與Y不線性相關(guān),但可能存在著別的函數(shù)關(guān)系; (2)若XY存在,則當X與Y獨立時, X與Y一定不相關(guān);但X與Y不相關(guān)時, X與Y不一定獨立.,o,X,Y,o,o,o,X,X,X,Y,Y,Y,01,-10, =1, =-1,相關(guān)情況示意圖,解 X與Y的分布律分別為,于是,解,則,于是,解,所以,因此,例:設(shè)隨機變量在-,上服從均勻分布,又 X=sin, Y=cos 試求X與Y的相關(guān)系數(shù).,解 這時有,這時有Cov(X,Y)=E(XY)-E(X)E(Y)=0,即=0.,從而X與Y不相關(guān),沒有線性關(guān)系;但是X與Y存在另一個函數(shù)關(guān)X2+Y2=

31、1,從而X與Y是不獨立的.,定理: 隨機變量X與Y不相關(guān)與下列結(jié)論之一等價.,1.,2.,3.,解,同理可得 E(Y)=0,于是,即X與Y相關(guān),從而X與Y不獨立.,解 X與Y的分布律分別為,則有,于是,即,亦即X與Y相關(guān).,而,故X與Y不相互獨立.,例:設(shè)(X,Y)N(1,2,12,22,),求X和Y的相關(guān)系數(shù),并分析X與Y的相關(guān)性和獨立性.,解,設(shè)(X,Y)的概率密度為f(x,y),則,因此,X和Y的相關(guān)系數(shù),當=0時,X與Y不相關(guān) .,二維正態(tài)分布的聯(lián)合密度函數(shù)為:,X與Y的邊緣密度函數(shù)為:,定義:設(shè)X和Y是隨機變量, (1)若E(Xk)(k=1,2,)存在,則稱它為X的k階原點矩,簡稱k

32、階矩. (2)若EX-E(X) k (k=1,2,)存在,則稱它為X的k階中心矩. 更一般地,若a是一常數(shù),p是一正數(shù),如果E(X-a)p存在,則稱它是關(guān)于a點的p階矩. (3)若E(XkYl) (k,l=1,2,)存在,則稱它為X和Y的k+l階混合矩. (4)若EX-E(X) kY-E(Y) l (k,l=1,2,)存在,則稱它為X和Y的k+l階混合中心矩.,隨機變量X與Y的二階中心矩共有四個,分別記為:,定義:設(shè)n維隨機變量(X1,X2,Xn)的二階混合中心矩 cij=Cov(Xi,Xj)=EXi -E(Xi)Xj -E(Xj ), i,j=1,2,n,都存在,則稱矩陣,為n維隨機變量(X

33、1,X2,Xn)的協(xié)方差矩陣.,例:設(shè)X,Y的聯(lián)合分布列如表所示試求X和Y的協(xié)方差矩陣.,解 因為E(X)=0(1-p)+00+10+1p=p, 同樣E(Y)=p.,所以,c11=D(X)=(0-p)2(1-p)+(1-p)2p=p(1-p), 同樣c22=p(1-p),c12= c21= EX-E(X)Y-E(Y) =(0-p)(0-p)(1-p)+(0-p)(1-p)0+(1-p)(0-p)0+(1-p)(1-p)p=p(1-p),故協(xié)方差矩陣為,例:設(shè)(X,Y)N(1,2,12,22,),求X和Y的協(xié)方差矩陣.,解 因為,定理(契比雪夫(Chebyshev)不等式) 設(shè)隨機變量X具有數(shù)學(xué)

34、期望E(X)=,方差D(X)=2 ,則對于任意正數(shù),有,當 2 D(X) 無實際意義,第五章 大數(shù)定理與中心極限定理,定義 設(shè)Xk是隨機變量序列,數(shù)學(xué)期望E(Xk)(k=1,2,.)存在,若對于任意 0,有,則稱隨機變量序列Xn服從大數(shù)定律.,隨機變量Y,Y的數(shù)學(xué)期望E(Y),定理(契比雪夫(Chebyshev)大數(shù)定律) 設(shè)Xk是兩兩不相關(guān)的隨機變量序列,具有數(shù)學(xué)期望E(Xk)和方差D(Xk)k=1,2,.若存在常數(shù)C,使得D(Xk) C(k=1,2,),則對于任意給定的0,恒有,解,所以,滿足切比雪夫大數(shù)定理的條件,可使用大數(shù)定理.,定理(伯努里大數(shù)定律) 設(shè)進行n次獨立重復(fù)試驗,每次試驗

35、中事件A發(fā)生的概率為p,記n為n次試驗中事件A發(fā)生的頻率,則對任意的0,有,貝努里,伯努利大數(shù)定律表明,當重復(fù)試驗次數(shù)n充分大時,事件A發(fā)生的頻率n與事件A的概率p有較大偏差的概率很小.,伯努利大數(shù)定律提供了通過試驗來確定事件概率的方法.(理論保障),定義 設(shè)Xk為相互獨立的隨機變量序列,有有限的數(shù)學(xué)期望E(Xk)=k和方差D(Xk)=k2,令,若對于一切實數(shù)x,有,則稱隨機變量序列Xk服從中心極限定理.,應(yīng)用中心極限定理解問題的一般步驟,例 將一顆骰子連擲100次,則點數(shù)之和不少于500的概率是多少?,解 設(shè)Xk為第k 次擲出的點數(shù),k=1,2,100,則 X1,X100獨立同分布.,由中心

36、極限定理,定理(林德貝爾格-勒維(Lindeberg-Levy)定理) 設(shè)Xk為相互獨立的隨機變量序列,服從同一分布,且具有數(shù)學(xué)期望E(Xk)=和方差D(Xk)=2 ,則隨機變量,的分布函數(shù)Fn(x),對于任意x,滿足,總體: 試驗的全部可能的觀察值稱為總體.,個體: 總體中的每個可能觀察值稱為個體.,第六章 數(shù)理統(tǒng)計基礎(chǔ),若(X1,X2,Xn) 為X的一個樣本,則(X1,X2,Xn) 的聯(lián)合分布函數(shù)為,若X具有概率密度p(x),則(X1,X2,Xn )的聯(lián)合概率密度函數(shù)為,解,例,(1)樣本平均值,(2)樣本方差,其觀察值,常用統(tǒng)計量,若總體均值E(X)存在,總體方差D(X)存在,則由X1,

37、X2,Xn的獨立性及同分布性,有,證明,定理: 設(shè)總體X的均值為,方差為2,(X1,X2,Xn)是X的一個樣本,則有,定理: 設(shè)總體X的均值為E(X)=,方差D(X)=2, (X1,X2,Xn)是X的一個樣本,則有,證明,解,因為,定理: 設(shè)X1,X2,Xn是相互獨立的隨機變量,且XiN(0,1),則統(tǒng)計量,性質(zhì)1,( 此性質(zhì)可以推廣到多個隨機變量的情形. ),性質(zhì)2,2分布的上分位點,T分布的性質(zhì),(1) f(t)關(guān)于t=0(縱軸)對稱,且 E(T)=0,D(T)0,(2) f(t)的極限為N(0,1)的密度函數(shù),即,T分布的上分位點,由分布的對稱性知,附表3-1,附表3-2,例,定理:設(shè)X

38、 2(n1),Y 2(n2),且X,Y獨立,則隨機變量,F分布的上分位點,設(shè)F (n1,n2) ,對于給定的a,0a1, 稱滿足條件,的點F (n1,n2)為F分布的上分位點.,附表5-1,附表5-2,例,解,因此有,試確定Z的分布.,解,由樣本的同分布性知:,由此得:,由t分布的構(gòu)造知:,定理: 設(shè)(X1,X2,Xn)是來自總體XN(,2)的一個樣本,則,且它們表示的隨機變量是相互獨立的,故,證明,解,由分布表得,解,所以,解,查表得,則有,由于,兩個正態(tài)總體下的統(tǒng)計量的分布,定理:,其中,注:此定理只有在兩個總體的方差相等時才成立.,特別,當X2 = Y2時,有,證,由F分布的構(gòu)造知,即,

39、由于,且相互獨立,解,解,其中,則,解,因為,所以,查表得,三、典型例題,例,解,根據(jù)正態(tài)分布的性質(zhì),解,例,查標準正態(tài)分布表知,解,例,第七章 參數(shù)估計,矩估計法的具體做法:,得到含有未知參數(shù)(1,k)的k個方程.,解這k個聯(lián)立方程組就可以得到(1,k)的一組解:,矩法估計量,解,總體X的期望為,從而得到方程,所以的矩估計量為,解,其概率密度函數(shù)為,總體X的期望為,從而得到方程,所以的矩估計量為,解,由于,故令,極大似然估計法,極大似然原理的直觀想法是:一個隨機試驗如有若干個可能的結(jié)果A,B,C,.若在一次試驗中,結(jié)果A出現(xiàn), 則一般認為A出現(xiàn)的概率最大,也即試驗條件對A出現(xiàn)有利.或者說在試

40、驗的很多可能條件中,認為應(yīng)該是使事件A發(fā)生的概率為最大的那種條件存在.,求極大似然估計的一般步驟歸納如下:,例:設(shè)隨機變量X服從泊松分布:,其中0是一未知參數(shù),求的極大似然估計.,解 設(shè)(x1,x2,xn)是樣本 (X1,X2,Xn)的一組觀測值.于是似然函數(shù),兩邊取對數(shù)得,從而得出的極大似然估計量為,解這一方程得,解,總體X服從參數(shù)為的指數(shù)分布,則有,所以似然函數(shù)為,取對數(shù),令,解得的極大似然估計值為,極大似然估計量為,例:設(shè)(X1,X2,Xn)是來自正態(tài)總體N(,2)的一個樣本,其中,2是未知參數(shù),參數(shù)空間=-0.求與2的極大似然估計.,解 正態(tài)分布的似 然函數(shù)為,兩邊取對數(shù)得,可驗證以上

41、所求為與2的極大似然估計.,分別求關(guān)于與2的偏導(dǎo)數(shù),得似然方程組,解這一方程組得,例:設(shè)總體X具有均勻分布,其概率密度函數(shù)為,求未知參數(shù)的極大似然估計.,解 似然函數(shù),要使L(; x1,x2,xn)達到最大,就要使達到最小,由于,所以的極大似然估計值為:,參數(shù)的極大似然估計量為:,無偏性,例:設(shè)總體X具有均勻分布,其密度函數(shù)為,解,用矩法估計得,求的無偏估計.,總體X的均值,有效性,證明,由于總體服從泊松分布,故,于是有,同理,但是,例:設(shè)(X1,X2, X3)是來自總體X的一個樣本,證明下面的三個估計量都是總體均值E(X)的無偏估計量,證明,一致性,例: 設(shè)x1, x2 , , x10是來自

42、N(, 2)的樣本,則 的置信水平為1- 的置信區(qū)間為,其中, ,s 分別為樣本均值和樣本標準差。這個置信區(qū)間的由來將在后面加以說明,這里用它來說明置信區(qū)間的含義。,若取 =0.10,則t0.95(9)=1.8331,上式化為,現(xiàn)假定 =15, 2 =4,則我們可以用隨機模擬方法由N(15,4)產(chǎn)生一個容量為10的樣本,如下即是這樣一個樣本:14.85 13.01 13.50 14.93 16.97 13.80 17.9533 13.37 16.29 12.38 由該樣本可以算得 從而得到 的一個區(qū)間估計為 該區(qū)間包含 的真值-15?,F(xiàn)重復(fù)這樣的方法100次,可以得到100個樣本,也就得到10

43、0個區(qū) 間,我們將這100個區(qū)間畫在圖上。,由圖可以看出,這100個區(qū)間中有91個包含參數(shù)真值15,另外9個不包含參數(shù)真值。,圖 的置信水平為0.90的置信區(qū)間,取=0.50,我們也可以給出100個這樣的區(qū)間,見圖??梢钥闯?,這100個區(qū)間中有50個包含參數(shù)真值15,另外50個不包含參數(shù)真值。,圖 的置信水平為0.50的置信區(qū)間,這時必有,正態(tài)總體均值的區(qū)間估計,方差已知時均值的區(qū)間估計,由總體服從正態(tài)分布可得,得到,從而,例:設(shè)軸承內(nèi)環(huán)的鍛壓零件的平均高度X服從正態(tài)分布N(,0.42).現(xiàn)在從中抽取20只內(nèi)環(huán),其平均高度為32.3毫米.求內(nèi)環(huán)平均高度的置信度為95%的置信區(qū)間.,解,方差未知

44、時均值的區(qū)間估計,解,經(jīng)計算得,查表可得,從而,所以的置信度為0.99置信區(qū)間是,均值已知時方差的區(qū)間估計,均值未知時方差的區(qū)間估計,解,由題意得,查表得,算 得,所求置信區(qū)間為,(0.038,0.506),兩個正態(tài)總體均值差的區(qū)間估計,由于樣本函數(shù),其中,對于給定的置信度1-有,即,置信區(qū)間為,解,求得,由于樣本函數(shù),解,求得,兩個正態(tài)總體方差之比的區(qū)間估計,解,求得,查表得,計算得,解,此時,于是,假設(shè)檢驗的兩類錯誤,P拒絕H0|H0為真=,P接受H0|H0不真=,犯兩類錯誤的概率:,顯著性水平 為犯第一類錯誤的概率.,第八章 假設(shè)檢驗,(1) 根據(jù)問題的要求建立原假設(shè)H0和備擇假設(shè)H1;

45、,假設(shè)檢驗的方法步驟,(2) 選取一個適當?shù)慕y(tǒng)計量T(X1,X2,.,Xn),要求T不含任何參數(shù),以便計算H0為真時的條件概率;,(3) 給定顯著性水平,求出使PTC|H0的臨界域C;,(4) 若樣本觀察值T(x1,x2,.,xn)C,則拒絕原假設(shè)H0,否則接受H0.,例:設(shè)某廠一車間生產(chǎn)的鈕扣,其直徑據(jù)經(jīng)驗服從正態(tài)分布N(,5.22).為了檢驗這一車間生產(chǎn)是否正常,現(xiàn)抽取容量n=100的樣本,得樣本均值為26.56,要求在顯著性水平=0.05下檢驗假設(shè)H0:0=26.,解,解,需檢驗假設(shè)為,由樣本得,因而,在顯著性水平=0.05下,應(yīng)拒絕原假設(shè),即不能認為這批產(chǎn)品的平均抗斷強度為32.5(k

46、g/cm2),查表得,拒絕域為,解,建立假設(shè),取統(tǒng)計量,分布未知,但由題設(shè),因而事件,故,在H0真實的前提下,由,可知,因而拒絕域,查正態(tài)分布函數(shù)表知,由于,解,建立假設(shè),拒絕域應(yīng)取作,故應(yīng)拒絕H0,不能接受這批玻璃紙.,解,由觀測值得,故樣本沒有落入拒絕域,應(yīng)接受H0,即可以認為打包機工作正常,解,建立假設(shè),故此問題的拒絕域為,例 :某廠生產(chǎn)一種工業(yè)用繩,其質(zhì)量指標是繩子所承受的最大拉力.假定該指標服從正態(tài)分布. 原來該廠生產(chǎn)的這種繩子平均最大拉力0 =15公斤.現(xiàn)在采用了一種新的原材料,廠方稱這種原材料提高了繩子的質(zhì)量,也就是說繩子所承受的最大拉力比15公斤大了. 為了檢驗該廠的結(jié)論是否真

47、實,從其新產(chǎn)品中隨機抽取50件,測得它們承受的最大拉力的平均值為15.8公斤,樣本標準差S=0.5公斤.取顯著性水平 =0.01. 問從這些樣本看,我們能否接受廠方的結(jié)論,即新原材料是否確實提高了繩子的質(zhì)量?,問題歸結(jié)為檢驗如下假設(shè) H0:=15 H1:15 (方差2未知) 此處n=50, =0.01,標準差S=0.5.,解,查不到t0.01(49),利用性質(zhì): 給定 ,t(n)關(guān)于自由度n是單調(diào)下降的. 我們查t0.01(45)=2.41, 則 t0.01(49)t0.01(45)= 2.41,我們拒絕原假設(shè),認為新的原材料確實提高了繩子所能承受的最大拉力.,檢驗H0:0 H1:0,取統(tǒng)計量

48、,但在H0成立的條件下,且有,故,拒絕域為,分布未知,解,提出假設(shè),查表得,故拒絕域為,再根據(jù)樣本求得,從而有,表: 一個正態(tài)總體均值的假設(shè)檢驗(顯著性水平為),解,需檢驗的假設(shè)為,拒絕域為,現(xiàn)由樣本求得,故拒絕H0,即認為這一天纖度的分布不正常.,解,建立假設(shè),查表得,拒絕域為,現(xiàn)由樣本求得,故可接受原假設(shè), 認為這批導(dǎo)線的電阻波動合格,表: 一個正態(tài)總體方差的假設(shè)檢驗(顯著性水平為),兩個正態(tài)總體的假設(shè)檢驗,解,設(shè)第一教學(xué)班的數(shù)學(xué)成績,第二教學(xué)班的數(shù)學(xué)成績,建立假設(shè),查正態(tài)分布表,求出臨界值,接受H0,認為兩個教學(xué)班的數(shù)學(xué)成績無顯著差異.,解,設(shè)X為甲方案的關(guān)鍵指標值則,問題可以歸結(jié)為假設(shè)

49、,正態(tài)分布表得,由于,因此拒絕H0,接受H1,即認為甲方案的關(guān)鍵指標值比乙方案的關(guān)鍵指標值要高一些 .,設(shè)Y為乙方案的關(guān)鍵指標值則,解,解,設(shè)羊毛品在處理前后其含脂率分別為X與Y,且,檢驗的假設(shè)為,查表得,拒絕域的形式為,計算得,故拒絕H0,認為處理前后含脂率的平均值有顯著變化.,解,城市考生平均成績,農(nóng)村考生平均成績,且,建立假設(shè),檢驗統(tǒng)計量為,查分布表得,由于,故接受H0,表示不能認為來自城市的中學(xué)考生的平均成績比來自農(nóng)村的中學(xué)考生的平均成績要高一些 .,表: 兩個正態(tài)總體均值的假設(shè)檢驗(顯著性水平為),解,解,檢驗的假設(shè)為,故拒絕域為,由樣本計算得,顯然沒有落在拒絕域中,為此認為處理前后

50、的含脂率的方差相等.,解,設(shè)舊工藝的精度,設(shè)新工藝的精度,且X、Y相互獨立,檢驗的假設(shè),查表及計算得,故拒絕H0,新工藝的精度比老工藝的精度顯著地好.,表: 兩個正態(tài)總體方差的假設(shè)檢驗(顯著性水平為),1 單因子方差分析,第九章 方差分析,由于XijN(i,2) ,故Xij與i的差可以看成一個隨機誤差ijN(0,2) .這樣一來,可以假定Xij具有下述數(shù)據(jù)結(jié)構(gòu)式:,Xij= i+ ij,i=1,2,.,r;j=1,2,.,ni 其中諸ijN(0,2),且相互獨立.要檢驗的假設(shè)是 H0:1=2=r,引起諸Xij 波動的原因有兩個: 一個是假設(shè)H0為真時,諸Xij的波動純粹是隨機性引起的; 另一個

51、可能是假設(shè)H0不真而引起的.,下面我們來看各式的意義,一般,當FF0.01時,稱因子的影響高度顯著,記為“*”;當F0.01FF0.05時,稱因子的影響顯著,記為“*”; 當FF0.05時,稱因子無顯著影響,即認為因子各水平間無差異.,例:為尋求適應(yīng)本地區(qū)的高產(chǎn)油菜品種,今選了五種不同品種進行試驗,每一品種在四塊試驗田上得到在每一塊田上的畝產(chǎn)量如下:,我們要研究的問題是諸不同品種的平均畝產(chǎn)量是否有顯著差異.,解:先列表計算,例: 下面給出了隨機選取的, 用于計算器的四種類型的電路的響應(yīng)時間(以毫秒計).表: 電路的響應(yīng)時間,這里試驗的指標是電路的響應(yīng)時間. 電路類型為因素. 這一因素有四個水平

52、, 試驗的目的是要考察各類型電路對響應(yīng)時間的影響.,設(shè)四種類型電路的響應(yīng)時間的總體均為正態(tài), 且各總體方差相同, 但參數(shù)均未知. 又設(shè)各樣本相互獨立.,解,分別以m1,m2,m3,m4記類型I,II,III,IV四種電路響應(yīng)時間總體的平均值. 我們需檢驗(a=0.05)H0:m1=m2=m3=m4,H1:m1,m2,m3,m4不全相等.現(xiàn)在n=18, s=4, n1=n2=n3=5, n4=3,ST,SA,SE的自由度依次為17,3,14,因F0.05(3, 14)=3.343.76 F0.01(3, 14)=5.56, 故認為各類型電路的響應(yīng)時間有顯著差異.,2 雙因子方差分析,SE表示試驗

53、的隨機波動引起的誤差,稱為誤差平方和; SA除了反映了試驗的隨機波動引起的誤差外,還反映了因子A的效應(yīng)間的差異,稱為因子A的偏差平方和; SB除了反映了試驗的隨機波動引起的誤差外,還反映了因子B的效應(yīng)間的差異,稱為因子B的偏差平方和.,具體計算時可用計算表和方差分析表:,一般,當FF0.01時,稱因子的影響高度顯著,記為“*”;當F0.01FF0.05時,稱因子的影響顯著,記為“*”; 當FF0.05時,稱因子無顯著影響,即認為因子各水平間無差異.,例:為了考察蒸餾水的pH值和硫酸銅溶液濃度對化驗血清中白蛋白與球蛋白的影響,對蒸餾水的pH值(A)取了4個不同水平,對硫酸銅溶液濃度(B)取了3個

54、不同水平,在不同水平組合(Ai,Bj)下各測一次白蛋白與球蛋白之比,其結(jié)果列于計算表的左上角.試檢驗兩因子對化驗結(jié)果有無顯著差異.,解,查F-分布表得:F0.05(3,6)= 4.76, F0.05(2,6)= 5.14 , F0.01(3,6)=9.78, F0.01(2,6)=10.9, 由此可知FA F0.01(3,6); FB F0.01(2,6).所以因子A及因子B的不同水平對化驗結(jié)果有高度顯著影響.,3 有交互作用的雙因子方差分析,總的偏差平方和可作如下的分解:,其中各偏差平方和表達式如下:,各偏差平方和的意義,SE表示試驗的隨機波動引起的誤差,稱為誤差平方和;,SA除了反映了試驗

55、的隨機波動引起的誤差外,還反映了因子A的效應(yīng)間的差異,稱為因子A的偏差平方和;,SB除了反映了試驗的隨機波動引起的誤差外,還反映了因子B的效應(yīng)間的差異,稱為因子B的偏差平方和;,SAB除了反映了試驗的隨機波動引起的誤差外,還反映了交互效應(yīng)的差異所引起的波動,稱為交互作用的偏差平方和.,這就是用來檢驗假設(shè)H01,H02,H03,的統(tǒng)計量.按照顯著性假設(shè)檢驗程序,對給定的顯著性水平, 當FAF(r-1,rs(t-1)時拒絕H01; 當FBF(s-1,rs(t-1)時拒絕H02; 當 FABF(r-1)(s-1),rs(t-1)時拒絕H03.,具體的計算過程,各偏差平方和的計算也可用下面簡化的表達式,且可列成一張計算表和方差分析表.,一般,當FF0.01時,稱

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論