衛(wèi)生統計學常用概率分布課件_第1頁
衛(wèi)生統計學常用概率分布課件_第2頁
衛(wèi)生統計學常用概率分布課件_第3頁
衛(wèi)生統計學常用概率分布課件_第4頁
衛(wèi)生統計學常用概率分布課件_第5頁
已閱讀5頁,還剩54頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

常用概率分布第一節(jié)二項分布一、二項分布的概念與特征(一)摸球模型與二項分布

一個袋子里有5個乒乓球,其中2個黃球,3個白球,我們進行摸球游戲,每一次摸到黃球的概率是0.4,摸到白球的概率是0.6,這個實驗有三個特點:一是各次摸球是彼此獨立的;二是每次摸球只有二種可能的結果,或黃球或白球;三是每次摸到黃球(或摸到白球)的概率是固定的。具備這三點,n次中有X次摸到黃球(或白球)的概率分布就是二項分布。例題例5-1:用針灸治療頭痛,假定結果不是有效就是無效,每一例有效的概率為π。某醫(yī)生用此方法治療頭痛患者5例,3例有效的概率是多少?

因為每例有效的概率相同,且各例的治療結果彼此獨立,5例患者中可以是其中的任意3例有效。概念:

醫(yī)學研究中很多現象觀察結果是以兩分類變量來表示的,如陽性與陰性、治愈與未愈、生存與死亡等等。如果每個觀察對象陽性結果的發(fā)生概率均為,陰性結果的發(fā)生概率均為(1-);而且各個觀察對象的結果是相互獨立的,那么,重復觀察n個人,發(fā)生陽性結果的人次數X的概率分布為二項分布,記作B(X;n,π)。二項分布應用的先決條件:

(1)一個實驗有兩種對立的可能結果,如“陽性”與“陰性”;(2)n次獨立的實驗;(3)產生一種結果(如陽性)的概率不變;(4)求在n次實驗中有X陽性的概率.(二)二項分布的概率函數二項分布的概率函數P(X)可用公式(5-1)來計算。例題例5-2:臨床上用針灸治療某型頭痛,有效的概率為60%,現以該法治療3例,其中兩例有效的概率是多大?表5-1治療3例可能的有效例數及其概率

有效人數(x)x(1-)n-x出現該結果概率P(X)010.60=10.4×0.4×0.40.064130.60.4×0.40.288230.6×0.60.40.432310.6×0.6×0.60.400.216

由表4-1可知,各種可能結果出現的概率合計為1,即P(X)=1(X=0,1,…,n)。因此,如果欲求1例以上有效的概率可以是:P(x≥1)=P(1)+P(2)+P(3)=0.288+0.432+0.216=0.936也可以是P(x≥1)=1-P(0)=1-0.064=0.936(三)二項分布的特征1、二項分布的圖形特征

接近0.5時,圖形是對稱的,如圖4-1。離0.5愈遠,對稱性愈差,但隨著n的增大,分布趨于對稱,如圖4-2。

當n→∞時,只要不太靠近0或1,當nP和n(1-P)都大于5時,二項分布近似于正態(tài)分布。

二項分布圖形取決于與n,高峰=n處。圖5-1π=0.5時,不同n值對應的二項分布圖5-2π=0.3時,不同n值對應的二項分布2、二項分布的均數和標準差總體均數:方差:標準差:如果將出現陽性結果的頻率記為:P的總體均數:P的總體標準差:例題例5-4

研究者隨機抽查某地150人,其中有10人感染了鉤蟲,鉤蟲感染率為6.7%,求此率的抽樣誤差。二、二項分布的應用(一)概率估計例5-5

如果某地鉤蟲感染率為13%,隨機觀察當地150人,其中有10人感染鉤蟲的概率有多大?從n=150,π=0.13的二項分布,由公式(5-1)和(5-2)可以得出150人中有10人感染鉤蟲的概率為:(二)單側累積概率計算二項分布出現陽性的次數至多為k次的概率為:出現陽性的次數至少為k次的概率為:例題例5-6

例4-5中某地鉤蟲感染率為13%,隨機抽查當地150人,其中至多有2名感染鉤蟲的概率有多大?至少有2名感染鉤蟲的概率有多大?至少有20名感染鉤蟲的概率有多大?根據公式(5-10)至多有2名感染鉤蟲的概率為:至少有2名感染鉤蟲的概率為:至少有20名感染鉤蟲的概率為:

第二節(jié)Poisson分布一、Poisson分布的概念

Poisson分布也是一種離散型分布,用以描述罕見事件發(fā)生次數的概率分布。常用于研究單位時間內(或單位空間內)某事件發(fā)生不同次數的分布。醫(yī)學上人群中出生缺陷、多胞胎、染色體異常等事件等都是罕見的,可能發(fā)生這些事件的觀察例數n常常很大,但實際上發(fā)生類似事件的數目卻很小很小。

Poisson分布可以看作是發(fā)生的概率(或未發(fā)生的概率1-)很小,而觀察例數n很大時的二項分布。除二項分布的三個基本條以外,Poisson分布還要求或(1-)接近于0或1(例如<0.001或>0.999)。二、Poisson分布的特征Poisson分布的概率函數為:式中為Poisson分布的總體均數,X為觀察單位內某稀有事件的發(fā)生次數;e為自然對數的底,為常數,約等于2.71828。

由圖5-3可以看到Poisson分布當總體均數λ值小于5時為偏峰,λ愈小分布愈偏,隨著λ增大,分布趨向對稱。Poisson分布有以下特性:(1)Poisson分布的總體均數與總體方差相等,均為λ。

(2)Poisson分布的觀察結果有可加性。

當λ增大時,Poisson分布逐漸逼近正態(tài)分布。一般來說λ≥20時,Poisson分布的資料可按正態(tài)分布處理。當n很大,p很小,np=λ為一常數時,二項分布近似Poisson分布,p越小,近似程度越好。Poisson分布圖圖5-3λ取不同值時的Poisson分布圖

(一)概率估計例5-7

實驗顯示某100cm2的培養(yǎng)皿平均菌落數為6個,試估計該培養(yǎng)皿菌落數等于3個的概率。該培養(yǎng)皿菌落數等于3個的概率:三、Poisson分布的應用例5-8

如果某地居民腦血管疾病的患病率為150/10萬,那么調查該地1000名居民中有2人患腦血管疾病的概率有多大?

λ=n=1000×0.0015=1.5

即調查該地1000名居民中有2人患腦血管疾病的概率為25.1%。

例5-9

實驗顯示某100cm2的培養(yǎng)皿平均菌落數為6個,試估計該培養(yǎng)皿菌落數等于3個的概率。

該培養(yǎng)皿菌落數小于3個的概率:

(二)單側累計概率計算如果稀有事件發(fā)生次數的總體均數為λ,那么該稀有事件發(fā)生次數至多為k次的概率

發(fā)生次數至少為k次的概率:

例5-9

實驗顯示某100cm2的培養(yǎng)皿平均菌落數為6個,試估計該培養(yǎng)皿菌落數小于3個的概率,大于1個的概率。該培養(yǎng)皿菌落數小于3個的概率:菌落數大于1個的概率為:例題

例5-10

例5-8中,至多有2人患腦血管疾病的概率有多大?至少有3人患腦血管疾病的概率有多大?至多有2人患腦血管疾病的概率:至少有3人患腦血管疾病的概率:第三節(jié)正態(tài)分布一、正態(tài)分布的概念

正態(tài)曲線(normalcurve)是一條高峰位于中央,兩側逐漸下降并完全對稱,曲線兩端永遠不與橫軸相交的“鐘型”曲線,該曲線表現為中間高,兩邊低,左右對稱。因為頻率的總和等于1,故橫軸上曲線下的面積等于1。正態(tài)分布是一種重要的連續(xù)型分布。醫(yī)學研究中許多正常人生理、生化指標變量的分布呈正態(tài)或近似正態(tài)分布。正態(tài)分布是數理統計中發(fā)展得最為完善的一種分布,很多統計推斷都是在正態(tài)分布條件下進行的。許多非正態(tài)分布的資料,當觀察例數足夠多時,也可以用正態(tài)分布作為它的極限分布形式。有時也將一些非正態(tài)分布資料轉化為正態(tài)分布來處理。表5-4骨密度測量值的頻數分布組段頻數1.228~21.234~21.240~71.246~171.252~251.258~371.264~251.270~161.276~41.282~1.2881正態(tài)分布圖5-4體模“骨密度”測量值的分布接近正態(tài)分布示意圖(頻率密度=頻率/組距)正態(tài)分布

正態(tài)概率密度曲線的位置與形狀具有如下特點:

(1)關于x=μ

對稱。(2)在x=μ處取得該概率密度函數的最大值,在處有拐點,表現為鐘形曲線。(3)曲線下面積為1。(4)μ決定曲線在橫軸上的位置,μ增大,曲線沿橫軸向右移;反之,μ減小,曲線沿橫軸向左移。(5)σ決定曲線的形狀,當μ恒定時,σ越大,數據越分散,曲線越“矮胖”;σ越小,數據越集中,曲線越“瘦高”。見圖4-5。正態(tài)分布u1u2u3不同均數正態(tài)分布不同標準差正態(tài)分布對任意一個服從正態(tài)分布的隨機變量,可作如下的標準化變換,也稱Z變換:Z服從總體均數為0、總體標準差為1的正態(tài)分布。我們稱此正態(tài)分布為標準正態(tài)分布(standardnormaldistribution),用N(0,1)表示。正態(tài)分布統計學家編制了標準正態(tài)分布曲線下面積分布表(附表1),因為正態(tài)分布兩邊對稱,所以只給出Z取負值的情況。表內所列數據表示Z取不同值時標準正態(tài)分布的分布函數值,此值大小相當于Z值左側標準正態(tài)曲線下面積,記作Φ(z)。正態(tài)分布

例5-9已知X服從均數為μ、標準差為σ的正態(tài)分布,試估計:

X取值在區(qū)間上的概率;

X取值在區(qū)間上的概率。正態(tài)分布查附表1,,因為曲線下兩側面積對稱,區(qū)間(1.96,∞)相應面積也是0.025,故Z取值于(-1.96,1.96)的概率為1-2×0.025=0.95,即取值在區(qū)間上的概率為0.95。同理,我們可以求出X取值在區(qū)間上的概率為0.99。二、正態(tài)曲線下面積的分布規(guī)律μ-3σμ-2σμ-σμμ-σμ-2σμ-3σ68.27%95.44%99.74%正態(tài)分布曲線下面積分布有一定規(guī)律:μ±σ

包含面積占曲線下總面積的68.27%μ±1.96σ

包含面積占曲線下總面積的95.00%μ±2.58σ

包含面積占曲線下總面積的99.00%正態(tài)分布zΦ(z)正態(tài)分布-1.961.960.0250.025正態(tài)分布1.46-1.460.070.07圖5-9例4-10示意圖正態(tài)分布例5-11

某地1986年120名8歲男孩身高均數為=123.02cm,標準差為S=4.79cm,試估計:(1)該地8歲男孩身高在130cm以上者占該地8歲男孩總數的百分比;(2)身高在120cm~128cm者占該地8歲男孩總數的百分比;(3)該地80%的男孩身高集中在哪個范圍?求Z值:查表:理論上該地8歲男孩身高在130cm以上者占該地8歲男孩總數的7.21%。正態(tài)分布先計算120和128所對應的Z值:正態(tài)曲線下區(qū)間(-0.63,1.04)上的面積等于:查附表1,標準正態(tài)分布曲線下左側面積為0.10所對應的Z值為-1.28,80%的8歲男孩身高集中在區(qū)間內,即116.9cm與129.2cm之間。三、正態(tài)分布的應用(一)估計頻數分布(二)確定醫(yī)學參考值范圍1、醫(yī)學參考值范圍(referenceranges)意義:指特定健康人群的解剖、生理、生化等各種數據的波動范圍。是“正常”人群數據中大多數個體的取值所在的范圍。人們習慣用該人群95%的個體某項醫(yī)學指標的取值范圍作為該指標的醫(yī)學參考值范圍。2.制定參考值的基本步驟

(1)從正常人總體中抽樣所謂正常人,是指排除了影響被研究指標的疾病或因素的人。具體抽樣時要注意:

1)隨機化原則和方法進行抽樣研究。

2)取樣本含量要足夠大。(2)控制測量誤差

測量的方法、儀器、試劑、精密度、操作熟練程度都要統一,以便將測量誤差控制在一定的范圍內。(3)判定是否需要分組確定參考值范圍原則上組間差別明顯,且差別有實際意義則應分開,否則應當合并確定。(4)決定取單側還是雙側單側或雙側是根據指標的實際用途而定,指標(如紅細胞、白細胞)過高與過低均為異常則取雙側,正常值范圍要分別確定下限和上限;指標僅過高或過低為異常,則取單側。雙側---過高、過低均異常單側下限異常正常單側上限異常正常異常正常雙側下限雙側上限異常單側上限---過高異常單側下限---過低異常(5)選定合適的百分界限參考值范圍是指絕大多數正常人的測定值應該所在的范圍。這個“絕大多數”習慣上95%或99%。(6)對資料的分布進行正態(tài)性檢驗。(7)根據資料的分布類型選定適當的方法進行參考值范圍的估計。3.參考值范圍的估計方法估計參考值范圍的方法很多,在此以制定95%的參考值范圍為例,介紹正態(tài)分布法(適用正態(tài)分布資料或能夠轉化為正態(tài)分布的資料)、百分位數法(適用于任何分布型的資料)的適用對象和界限值的計算公式,見下表。參考值范圍所對應的正態(tài)分布區(qū)間百分范圍(%)單側雙側下限上限下限上限9599百分范圍(%)單側雙側下限上限下限上限95P5P95P25P97.599P1P99P0.5P99.5參考值范圍所對應的百分位數例5-11調查某地120名健康女性血紅蛋白,直方圖顯示,其分布近似于正態(tài)分布,(g/L),(g/L),試估計該地健康女性血紅蛋白的95%參考值范圍。因血紅蛋白過高、過低均為異常,所以按雙側估計95%醫(yī)學參考值范圍:例題

即該地健康女性血紅蛋白的95%的參考值范圍為97.41g/L~137.39g/L

例題:見下表資料,為該地區(qū)50歲~60歲的女性高血脂診斷與治療提供參考依據,試估計其血清甘油三

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論