概率論與數(shù)理統(tǒng)計(jì)第15講.ppt_第1頁
概率論與數(shù)理統(tǒng)計(jì)第15講.ppt_第2頁
概率論與數(shù)理統(tǒng)計(jì)第15講.ppt_第3頁
概率論與數(shù)理統(tǒng)計(jì)第15講.ppt_第4頁
概率論與數(shù)理統(tǒng)計(jì)第15講.ppt_第5頁
已閱讀5頁,還剩55頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1,概率論與數(shù)理統(tǒng)計(jì)第15講,本文件可從網(wǎng)址 上下載,2,協(xié)方差與相關(guān)系數(shù),3,定性的思考,通常人們?cè)谘芯繂蝹€(gè)的隨機(jī)變量的時(shí)候, 并不關(guān)心它們的分布, 而是關(guān)心它們的數(shù)學(xué)期望和方差, 這也是因?yàn)榉植紨y帶了太多的信息, 很難給人們一個(gè)快捷的印象.,4,而人們?cè)谘芯績(jī)蓚€(gè)隨機(jī)變量的關(guān)系的時(shí)候, 也不關(guān)心它們的聯(lián)合分布, 這是攜帶了更多信息的內(nèi)容. 人們關(guān)心的是, 這兩個(gè)隨機(jī)變量是聯(lián)系非常緊密呢? 還是毫無關(guān)系?即相互獨(dú)立? 人們希望用一個(gè)數(shù)字就能夠在相當(dāng)程度上描述兩個(gè)隨機(jī)變量的聯(lián)系程度.,5,當(dāng)然, 從數(shù)學(xué)上看, 這是不可能的,因?yàn)槁?lián)合分布的信息量為許多個(gè)數(shù), 甚至無窮多個(gè)數(shù), 因此一個(gè)數(shù)不可能反映

2、出無窮多個(gè)數(shù)攜帶的信息.,6,但是我們?nèi)匀幌M軌蛘业矫枋鏊鼈冎g相互關(guān)系的一個(gè)數(shù), 至少在大多數(shù)實(shí)際情況下能夠描繪兩個(gè)隨機(jī)變量聯(lián)系的緊密程度, 例如, 如果這個(gè)數(shù)字越接近于零, 說明這兩個(gè)隨機(jī)變量的聯(lián)系越差, 越接近于相互獨(dú)立, 反之則聯(lián)系越緊密, 越接近于相互之間有關(guān)系.,7,例如,一個(gè)人的身高和體重是非常有關(guān)系的, 但是又并不完全是嚴(yán)格的函數(shù)關(guān)系, 那么關(guān)系程度究竟有多大呢? 一個(gè)人的吸煙量和他的平均壽命是有關(guān)系的, 這個(gè)關(guān)系量又有多大呢?,8,一種化肥的施用量和農(nóng)作物的產(chǎn)量是有關(guān)系的, 這個(gè)關(guān)系的大小又是如何呢? 這樣一些問題都希望能夠用一個(gè)數(shù)字就表示出來, 這就是人們想到要用協(xié)方差和

3、相關(guān)系數(shù)的原因.,9,對(duì)于兩個(gè)隨機(jī)變量X和Y,當(dāng)它們是完全相等的時(shí)候, 聯(lián)系是最緊密的了.而當(dāng)它們相互獨(dú)立的時(shí)候, 聯(lián)系是最差的了. 我們先研究它們的和X+Y的方差:,10,D(X+Y)=EX+Y-E(X+Y)2 =EX-E(X)+Y-E(Y)2 =EX-E(X)2+Y-E(Y)2+2X-E(X)Y-E(Y) =EX-E(X)2+EY-E(Y)2+2EX-E(X)Y-E(Y) =D(X)+D(Y)+2EX-E(X)Y-E(Y),11,D(X+Y)=D(X)+D(Y)+2EX-E(X)Y-E(Y) 關(guān)鍵在后一項(xiàng)2EX-E(X)Y-E(Y), 我們定義EX-E(X)Y-E(Y)為X和Y的協(xié)方差,

4、用cov(X,Y)表示. 則 D(X+Y)=D(X)+D(Y)+2cov(X,Y),12,D(X+Y)=D(X)+D(Y)+2cov(X,Y) 當(dāng)X和Y相互獨(dú)立時(shí), 聯(lián)系最不緊密, 這時(shí)候 cov(X,Y)=0, 因此D(X+Y)=D(X)+D(Y) 而當(dāng)X=Y時(shí), 聯(lián)系最緊密, 這時(shí)候D(X)=D(Y)=cov(X,Y), 因此D(X+Y)=D(2X)=4D(X),13,因此,協(xié)方差cov(X,Y)的大小可以反映X和Y之間聯(lián)系緊密程度的大小. 當(dāng)cov(X,Y)=0的時(shí)候, X和Y聯(lián)系最不緊密, 而當(dāng)cov(X,Y)的絕對(duì)值較大的時(shí)候, X和Y的聯(lián)系較為緊密,但緊密的程度, 卻和X與Y的方差

5、D(X)和D(Y)有關(guān).,14,為去除這個(gè)因素, 因此定義,15,現(xiàn)證明|1,令X=X-E(X),Y=Y-E(Y), 則X,Y都是期望值為0的隨機(jī)變量. 對(duì)于任給的實(shí)數(shù)t, 相信E(X+tY)20, 即E(X2)+2tE(XY)+t2E(Y2)0, 即是說關(guān)于t的一元二次方程E(X2)+2tE(XY)+t2E(Y2)=0最多只有單個(gè)實(shí)根或者沒有實(shí)根, 也就說明判別式 b2-4ac0,16,E(X2)+2tE(XY)+t2E(Y2)=0 b2-4ac0,17,再考慮當(dāng)|=1時(shí)會(huì)是什么情況, 這時(shí)方程,E(X2)+2tE(XY)+t2E(Y2)=0存在著一個(gè)單根, 假設(shè)這單根為t0, 則有 E(X

6、2)+2t0E(XY)+t02E(Y2)=0 即E(X+t0Y)2=0,18,E(X+t0Y)2=0, 而當(dāng)一個(gè)總是取非負(fù)值的隨機(jī)變量的期望值為0時(shí), 答案只能是此隨機(jī)變量就是常數(shù)0, 即存在著實(shí)數(shù)t0使得X+t0Y=0, 即X和Y的離差是正好成比例的, 我們將這種情況稱作X與Y呈線性關(guān)系, 因此就有定理(接后頁),19,定理,兩個(gè)隨機(jī)變量X和Y呈線性關(guān)系的充分必要條件, 是它們的相關(guān)系數(shù)的絕對(duì)值為1, 即 |=1 而另一方面, 如果X與Y相互獨(dú)立, 則它們的相關(guān)系數(shù)必為0, 即=0.,20,當(dāng)然, 數(shù)學(xué)家們會(huì)喋喋不休地宣傳當(dāng)=0時(shí)未見得X與Y相互獨(dú)立, 并在作業(yè)或者例子中經(jīng)常給出反例. 但是

7、, 作為經(jīng)驗(yàn)之談, 當(dāng)=0時(shí), 兩個(gè)隨機(jī)變量確實(shí)關(guān)系不大了.這也是相關(guān)系數(shù)被廣泛使用的原因.,21,協(xié)方差的統(tǒng)計(jì),對(duì)協(xié)方差EX-E(X)Y-E(Y)的統(tǒng)計(jì)是這樣, 先是通過試驗(yàn)獲得了X和Y的n對(duì)數(shù)據(jù)(x1,y1),(x2,y2),.,(xn,yn)然后令,22,23,幾種重要的分布,二項(xiàng)分布,24,在第一章介紹過獨(dú)立試驗(yàn)概型,作n次相互獨(dú)立的試驗(yàn), 每次試驗(yàn)事件A出現(xiàn)的概率為p, 不出現(xiàn)的概率為q=1-p, 事件A出現(xiàn)的次數(shù)X為一離散型隨機(jī)變量, 則我們已經(jīng)知道,25,如假設(shè)第i次試驗(yàn)時(shí)事件A發(fā)生的次數(shù)為隨機(jī)變量Xi, 則Xi服從0-1分布, PXi=1=p, PXi=0=q=1-p, (i=

8、1,2,.,n) 因此有X=X1+X2+.+Xn,26,定義 如果隨機(jī)變量X有概率函數(shù),其中0p1, q=1-p, 則稱X服從參數(shù)為n,p的二項(xiàng)分布. 簡(jiǎn)記作Xb(n,p)或XB(n,p),27,在這里PX=k的值恰好是二項(xiàng)式(q+px)n展開式中第k+1項(xiàng)xk的系數(shù).,28,如果Xb(n,p), 則X可看作是由n個(gè)取1概率為p的相互獨(dú)立的0-1分布的隨機(jī)變量Xi,i=1,2,.,n的和, X=X1+X2+.+Xn,29,X的分布函數(shù)為,30,31,例 某工廠每天用水量保持正常的概率為3/4, 求最近6天內(nèi)用水量正常的天數(shù)的分布.,32,解 設(shè)最近6天內(nèi)用水量保持正常的天數(shù)為X, 則Xb(6,

9、0.75), 因此,33,其分布表如下表所示,34,分布圖:,35,例 10部機(jī)器各自獨(dú)立工作, 因修理調(diào)整的原因, 每部機(jī)器停車的概率為0.2. 求同時(shí)停車數(shù)目X的分布.,36,解 Xb(10,0.2), 用貝努里公式計(jì)算pk如下表所示,37,概率分布圖如下圖所示,38,例 一批產(chǎn)品的廢品率p=0.03, 進(jìn)行20次重復(fù)抽樣(每次抽一個(gè), 觀察后放回去再抽下一個(gè)), 求出現(xiàn)廢品的頻率為0.1的概率.,39,解 令X表示20次重復(fù)抽取中廢品出現(xiàn)的次數(shù), Xb(20, 0.03),40,二項(xiàng)分布的期望和方差如Xb(n,p), 則X可看作n個(gè)相互獨(dú)立的0-1分布的隨機(jī)變量X1,X2,.,Xn之和,

10、X=X1+X2+.+Xn,41,而且我們知道0-1分布的期望為p, 方差為pq,其中q=1-p. 因此易得E(X)=E(X1)+E(X2)+.+E(Xn)=npD(X)=D(X1)+D(X2)+.+D(Xn)=npq即,42,也可根據(jù)定義直接計(jì)算二項(xiàng)分布的數(shù)學(xué)期望和方差,43,44,考慮EX(X-1)=E(X2)-E(X),45,令i=k-2,46,即E(X2)-E(X)=n2p2-np2, 因此E(X2)=n2p2-np2+np D(X)=E(X2)-E(X)2 =np-np2=np(1-p)=npq,47,二項(xiàng)分布的最可能值使概率PX=k取最大值的k記作k0, 稱k0為二項(xiàng)分布的最可能值,

11、 如圖示意,由上圖可知P(X=k0)P(X=k0+1) 且P(X=k0)P(X=k0-1),48,49,50,分析np+p-1k0np+p,知道np+p比np+p-1大了1, 因此擠在這兩個(gè)數(shù)中間的整數(shù)有1個(gè)還是2個(gè)取決于np+p是否正好是整數(shù).,51,如果正好是整數(shù), 則無論是np+p還是np+p-1都滿足上面的不等式, 這個(gè)時(shí)候就有兩個(gè)最可能值np+p-1和np+p.,52,如果np+p不是整數(shù), 則k0取被np+p-1和np+p夾在中間的整數(shù)才能夠滿足上面的不等式. 因此可以看作是不大于np+p的最大整數(shù), 記作np+p,53,一些例子,如果是反復(fù)地?cái)S硬幣試驗(yàn)擲了100次, 則Xb(100, 0.5), 最可能值是 1000.5+0.5=50+0.5=50 如果Xb(1000,0.3), 則最可能值是 10000.3+0.3=300,54,例4 某批產(chǎn)品有80%的一等品, 對(duì)它們進(jìn)行重復(fù)抽樣檢驗(yàn), 共取出4個(gè)樣品, 求其中一等品數(shù)X的最可能值k0, 并用貝努里公式驗(yàn)證.,55,解 Xb(4, 0.8), 因np+p=40.8+0.8=4是整數(shù), 所以k0=4和k0=3時(shí)PX=k為最大, 即3和4為最可能值.,56,一般說來, 在n很大時(shí), 不等式,57,58

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論