常用概率分布(nxpowerlite)_第1頁
常用概率分布(nxpowerlite)_第2頁
常用概率分布(nxpowerlite)_第3頁
常用概率分布(nxpowerlite)_第4頁
常用概率分布(nxpowerlite)_第5頁
已閱讀5頁,還剩59頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

2019/5/12,1,中山大學(xué)醫(yī)學(xué)統(tǒng)計與流行病學(xué)系 張晉昕 2008.09.16,第五章 常用概率分布,2019/5/12,2,2019/5/12,3,一、正態(tài)分布的概念,第五章 常用概率分布 第一節(jié) 正態(tài)分布,正態(tài)分布是自然界最常見的一種分布,若指標 X的頻率分布曲線對應(yīng)于數(shù)學(xué)上的正態(tài)分布曲線, 則稱該指標服從正態(tài)分布。,2019/5/12,4,2019/5/12,5,2019/5/12,6,正態(tài)分布的概率密度函數(shù)(即縱軸的高度),-X+,2019/5/12,9,3. 正態(tài)分布有兩個參數(shù),即均數(shù)和標準差。 是位置參數(shù),是變異度參數(shù)(形狀參數(shù))。常用N(,2)表示均數(shù)為 ,標準差為的正態(tài)分布;用N(0,1)表示標準正態(tài)分布。 4. 正態(tài)曲線下面積分布有一定規(guī)律。橫軸上 正態(tài)曲線下的面積等于1( 也常寫作100% ) 。,2019/5/12,10,二、正態(tài)曲線下面積的分布規(guī)律 正態(tài)方程的積分式(分布函數(shù)):,F(X)為正態(tài)變量X的累計分布函數(shù),反映正態(tài)曲線下,橫軸尺度自到X的面積,即下側(cè)累計面積 。,標準正態(tài)分布方程積分式(分布函數(shù)):,(Z)為標準正態(tài)變量 Z的累計分布函數(shù),反映標準正態(tài)曲線下,橫軸尺度自到Z的面積,即下側(cè)累計面積 。,2019/5/12,11,2019/5/12,12,用查表代替計算必須注意: 1)表中曲線下面積為到Z的面積。 2)當,和X已知時,先求出Z值, 再用Z值查表,得所求區(qū)間占總面積的比例。 當和未知時,要用樣本均數(shù)和樣本標準差S來估計Z值。 3)曲線下對稱于0的區(qū)間,面積相等。 4)曲線下橫軸上的面積為1 (即100% )。,三、標準正態(tài)分布表,2019/5/12,13,正態(tài)分布是一種對稱分布,其對稱軸為直線X=,即均數(shù)位置,理論上: 1范圍內(nèi)曲線下的面積占總面積的68.27% 1.96范圍內(nèi)曲線下的面積占總面積的95% 2.58范圍內(nèi)曲線下的面積占總面積的99% 實際應(yīng)用中: 1 S范圍內(nèi)曲線下的面積占總面積的68.27% 1.96 S范圍內(nèi)曲線下的面積占總面積的95% 2.58 S范圍內(nèi)曲線下的面積占總面積的99%,2019/5/12,14,2019/5/12,15,標準正態(tài)分布的=0,=1,則 相當于區(qū)間(-1,1), 1.96相當于區(qū)間(-1.96,1.96), 2.58的區(qū)間相當于區(qū)間(-2.58,2.58)。 區(qū)間(-1,1)的面積:1-2(-1)=1-20.1587=0.6826=68.26% 區(qū)間(-1.96,1.96)的面積:1-2(-1.96)=1-20.0250=0.9500=95.00% 區(qū)間(-2.58,2.58)的面積:1-2(-2.58)=1-20.0049=0.9902=99.02%,2019/5/12,16,正態(tài)曲線下面積對稱,則區(qū)間(1.96,)的面積也是0.025。Z取值于(-1.96,1.96)的概率為1-20.025=0.95,即X取值在區(qū)間 上的概率為95%。,例 5-11 X服從均數(shù)為 ,標準差為 的正態(tài)分布,試估計(1)X取值在區(qū)間 上的概率;(2)X取值在區(qū)間 上的概率;,先做標準化變換:,2019/5/12,17,例 5-12 已知某地1986年120名8歲男童身高均數(shù) ,S=4.79 cm ,估計(1)該地8歲男孩身高在130 cm以上者占該地8歲男孩總數(shù)的百分比;(2)身高界于120cm128cm者占該地8歲男孩總數(shù)的比例;(3)該地80%男孩身高集中在哪個范圍? 先做標準化變化:,理論上該地8歲男孩身高在130 cm以上者占該地8歲男孩 總數(shù)的7.21%。,2019/5/12,18,(2),2019/5/12,19,(3),查附表1,標準正態(tài)分布曲線下左側(cè)面積為0.10所對應(yīng)的Z值為-1.28,所以80%的8歲男孩身高值集中在 區(qū)間內(nèi),即116.9cm129.2cm,2019/5/12,20,(一)制定醫(yī)學(xué)參考值范圍 參考值范圍:指特定的“正?!比巳旱慕馄省⑸?、生化、免疫等各種數(shù)據(jù)的波動范圍。 制定參考值范圍的步驟: 1. 選擇足夠數(shù)量的正常人作為調(diào)查對象。 2. 樣本含量足夠大。 3. 確定取單側(cè)還是取雙側(cè)正常值范圍。 4. 選擇適當?shù)陌俜纸缦蕖?5. 選擇適當?shù)挠嬎惴椒ā?四、 正態(tài)分布的應(yīng)用,2019/5/12,21,估計醫(yī)學(xué)參考值范圍的方法: 1. 正態(tài)近似法:適用于正態(tài)分布或近似正態(tài)分布的資料。 2. 百分位數(shù)法:適用于偏態(tài)分布資料。,2019/5/12,22,例5-13 某地調(diào)查120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態(tài)分布,得均數(shù)為117.4g/L,標準差為10.2g/L ,試估計該地正常女性血紅蛋白的95%醫(yī)學(xué)參考值范圍。,分析:正常人的血紅蛋白過高過低均為異常,要制定雙側(cè)正常值范圍。,該指標的95%醫(yī)學(xué)參考值范圍為,2019/5/12,23,例5.14 某地調(diào)查110名正常成年男子的第一秒肺通氣量,得均數(shù)為4.2 L,標準差為0.7 L ,試估計該地正常成年男子第一秒肺通氣量的95%參考值范圍。,該地正常成年男子第一秒肺通氣量的95%參考值范圍為:不低于3.052L。,分析:正常人的第一秒肺通氣量近似正態(tài)分布,且只以過低為異常,要制定單側(cè)下限。,2019/5/12,24,例 5.15 某年某市調(diào)查了 200例正常成人血鉛含量(g/100g)如下,試估計該市成人血鉛含量的95%醫(yī)學(xué)參考值范圍。,2019/5/12,25,分析:血鉛的分布為偏峰分布,且血鉛含量只以過高為異常,要用百分位數(shù)法制定單側(cè)上限。,2019/5/12,26,二、質(zhì)量控制 為了控制實驗中的檢測誤差,常用 2S作上下警戒線,以 3S作為上下控制線。這里的2S和3S可視為1.96S 和2.58S的約數(shù)。其依據(jù)是正常情況下檢測誤差是服從正態(tài)分布的。,2019/5/12,27,第三節(jié) 正態(tài)分布及其應(yīng)用,判斷異常的8種情況是: 有一個點距中心線的距離超過3個標準差(控制限以外) 在中心線的一側(cè)連續(xù)有9個點 連續(xù)6個點穩(wěn)定地增加或減少 連續(xù)14個點交替上下 連續(xù)3個點中有兩個點距中心線距離超過2個標準差(警戒限以外),2019/5/12,28,第三節(jié) 正態(tài)分布及其應(yīng)用,連續(xù)5個點中有4個點距中心線距離超過1個標準差 中心線一側(cè)或兩側(cè)連續(xù)15個點距中心線距離都在1個標準差以內(nèi) 中心線一側(cè)或兩側(cè)連續(xù)8個點距中心線距離都超出1個標準差范圍。,2019/5/12,29,三、統(tǒng)計處理方法的理論基礎(chǔ),如 統(tǒng)計描述中計算算術(shù)平均數(shù)、標準差、 統(tǒng)計推斷中進行總體均數(shù)置信區(qū)間估計、 t 檢驗、F 檢驗、相關(guān)與回歸等分析,2019/5/12,30,(一)成敗型實驗(Bernoulli實驗) 在醫(yī)學(xué)衛(wèi)生領(lǐng)域的許多實驗或觀察中,人們感興趣的是某事件是否發(fā)生。如用白鼠做某藥物的毒性實驗,關(guān)心的是白鼠是否死亡;某種新療法臨床實驗觀察患者是否治愈;觀察某指標的化驗結(jié)果是否呈陽性等。將我們關(guān)心的事件A出現(xiàn)稱為成功,不出現(xiàn)稱為失敗,這類試驗就稱為成-敗型實驗。指定性資料中的二項分類實驗。,第二節(jié) 二項分布,一、二項分布的概念與特征,2019/5/12,31,成-敗型(Bernoulli)實驗序列: 滿足以下三個條件的n次實驗構(gòu)成的序列稱為成-敗型實驗序列。 1)每次實驗結(jié)果,只能是兩個互斥的結(jié)果之一(A或非A)。 2) 相同的實驗條件下,每次實驗中事件A的發(fā)生具有相同的概率。(非A的概率為1-)。 實際工作中要求是從大量觀察中獲得的較穩(wěn)定的數(shù)值。 3) 各次實驗獨立。各次的實驗結(jié)果互不影響。,2019/5/12,32,(二)二項分布的概率函數(shù) 二項分布是指在只能產(chǎn)生兩種可能結(jié)果(如“陽性”或“陰性”)之一的n次獨立重復(fù)實驗中,當每次試驗的“陽性”概率保持不變時,出現(xiàn)“陽性”的次數(shù)X=0,1,2,n的一種概率分布。 若從陽性率為的總體中隨機抽取大小為n的樣本,則出現(xiàn)“陽性”數(shù)為X的概率分布即呈現(xiàn)二項分布,記作 B(n,)。,2019/5/12,33,舉例 設(shè)實驗白鼠共3只,要求它們同種屬、同性別、體重相近,且他們有相同的死亡概率,即事件“白鼠用藥后死亡”為A,相應(yīng)死亡概率為。記事件“白鼠用藥后不死亡”為 ,相應(yīng)不死亡概率為1-。設(shè)實驗后3只白鼠中死亡的白鼠數(shù)為X,則X的可能取值為0,1,2和3,則死亡鼠數(shù)為X的概率分布即表現(xiàn)為二項分布。,2019/5/12,34,互不相容事件的加法定理,2019/5/12,35,2019/5/12,36,構(gòu)成成-敗型實驗序列的n次實驗中,事件A出現(xiàn) 的次數(shù)X的概率分布為:,其中X=0,1,2,n。 n,是二項分布的兩個參數(shù) 。,對于任何二項分布,總有,2019/5/12,37,例5-2 臨床上用針灸治療某型頭疼,有效的概率為60%,現(xiàn)以該療法治療3例,其中2例有效的概率是多大? 分析:治療結(jié)果為有限和無效兩類,每個患者是否有效不受其他病例的影響,有效概率均為0.6,符合二項分布的條件。,2例有效的概率是0.432,2019/5/12,38,一例以上有效的概率為:,或,2019/5/12,39,(三)二項分布的特征 1. 二項分布的圖形特征 n,是二項分布的兩個參數(shù),所以二項分布的形狀取決于n,??梢钥闯觯?=0.5時分布對稱,近似對稱分布。當 0.5時,分布呈偏態(tài),特別是n較小時, 偏離0.5越遠,分布的對稱性越差,但只要不接近1和0時,隨著n 的增大,分布逐漸逼近正態(tài)。因此, 或1- 不太小,而n足夠大,我們常用正態(tài)近似的原理來處理二項分布的問題。,2019/5/12,40,2019/5/12,41,2019/5/12,42,2019/5/12,43,例 實驗白鼠3只,白鼠用藥后死亡的死亡概率=0.6,則3只白鼠中死亡鼠數(shù)X的總體均數(shù) =30.6=1.8(只) 方差為 標準差為,2019/5/12,44,如果以率表示,將陽性結(jié)果的頻率記為 , 則p的總體均數(shù) 總體方差為 總體標準差為 式中 是頻率p的標準誤,反映陽性頻率的抽樣誤差的大小。,2019/5/12,45,例5-4 如果某地鉤蟲感染率為6.7%,隨機觀察當?shù)?50人,樣本鉤蟲感染率為p,求p的抽樣誤差 。,2019/5/12,46,二、二項分布的應(yīng)用 (一) 概率估計,例5-5 如果某地鉤蟲感染率為13%,隨機觀察當?shù)?50人,其中有10人感染鉤蟲的概率有多大?,2019/5/12,47,(二)單側(cè)累計概率計算 二項分布出現(xiàn)陽性次數(shù)至少為k次的概率為 陽性次數(shù)至多為k次的概率為,2019/5/12,48,例5-6 如果某地鉤蟲感染率為13%,隨機觀察當?shù)?50人,其中至多有2人感染鉤蟲的概率有多大?至少有2人感染鉤蟲的概率有多大?至少有20人感染鉤蟲的概率有多大?,至多有2名感染的概率為:,2019/5/12,49,至少有2名感染的概率為:,至少有20名感染的概率為:,2019/5/12,50,第二節(jié) Poisson分布的概念與特征 一、Poisson分布的概念 Poisson分布也是一種離散型分布,用以描述罕見事件發(fā)生次數(shù)的概率分布。Poisson分布也可用于研究單位時間內(nèi)(或單位空間、容積內(nèi))某罕見事件發(fā)生次數(shù)的分布,如分析在單位面積或容積內(nèi)細菌數(shù)的分布,在單位空間中某種昆蟲或野生動物數(shù)的分布,粉塵在觀察容積內(nèi)的分布,放射性物質(zhì)在單位時間內(nèi)放射出質(zhì)點數(shù)的分布等。Poisson分布一般記作 。,2019/5/12,51,Poisson分布可以看作是發(fā)生的概率 很小,而觀察例數(shù)很大時的二項分布。除要符合二項分布的三個基本條件外,Poisson分布還要求或1-接近于0和1。有些情況和n都難以確定,只能以觀察單位(時間、空間、容積、面積)內(nèi)某種稀有事件的發(fā)生數(shù)X等來表示,如每毫升水中大腸桿菌數(shù),每個觀察單位中粉塵的計數(shù),單位時間內(nèi)放射性質(zhì)點數(shù)等,只要細菌、粉塵、放射性脈沖在觀察時間內(nèi)滿足以上條件,就可以近似看為Poisson分布。,Poisson分布作為二項分布的一種極限情況,2019/5/12,52,二、Poisson分布的特征 1.Poisson分布的概率函數(shù)為: 式中 為Poisson分布的總體均數(shù),X為觀察單位時間內(nèi)某稀有事件的發(fā)生次數(shù);e為自然對數(shù)的底,為常數(shù),約等于2.71828。,2019/5/12,53,如某地20年間共出生短肢畸形兒10名,平均每年0.5名。就可用 代入Poisson分布的概率函數(shù)來估計該地每年出生此類短肢畸形兒的人數(shù)為0,1,2的概率P(X)。,2019/5/12,54,2019/5/12,55,2.Poisson分布的特性: (1)Poisson分布的的總體均數(shù)與總體方差相等,均為 。 (2)Poisson分布的觀察結(jié)果有可加性。即對于服從Poisson分布的m個互相獨立的隨機變量X1,X2Xm,它們之和也服從Poisson分布,其均數(shù)為這m個隨機變量的均數(shù)之和。,2019/5/12,56,從總體均數(shù)為 的服從Poisson分布總體中隨機抽出一份樣本,其中稀有事件的發(fā)生次數(shù)為X1,再獨立地從總體均數(shù)為 的Poisson分布總體中隨機抽出另一份樣本,其中稀有事件的發(fā)生次數(shù)為X2,則他們的合計發(fā)生數(shù)T=X1+X2也服從Poisson分布,總體均數(shù)為 。,2019/5/12,57,Poisson分布的這些性質(zhì)還可以推廣到多個Poisson分布的情形。例如,從同一水源獨立地取水樣5次,進行細菌培養(yǎng),每次水樣中的菌落數(shù)分別為 ,均服從Poisson分布,分別記 為 ,把5份水樣混合,其合計菌落 數(shù) 也服從Poisson分布,記為 ,其均數(shù)為 。 醫(yī)學(xué)研究中常利用Poisson分布的可加性,將小的觀察單位合并以增大發(fā)生次數(shù)X,以便用正態(tài)近似法進行統(tǒng)計

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論