版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
概率與數(shù)理統(tǒng)計(jì)常見分布規(guī)程一、概述
概率與數(shù)理統(tǒng)計(jì)是現(xiàn)代科學(xué)研究的重要基礎(chǔ),常見分布是描述隨機(jī)變量統(tǒng)計(jì)特性的核心工具。本規(guī)程旨在系統(tǒng)梳理常用概率分布的定義、性質(zhì)、應(yīng)用場(chǎng)景及計(jì)算方法,為相關(guān)領(lǐng)域的學(xué)習(xí)與研究提供參考。
二、常見概率分布的定義與性質(zhì)
(一)離散型分布
1.伯努利分布
(1)定義:描述單次試驗(yàn)中事件成功或失敗的概率分布。
(2)參數(shù):成功概率p(0≤p≤1)。
(3)特性:期望值為p,方差為p(1-p)。
(4)應(yīng)用:二項(xiàng)試驗(yàn)、質(zhì)量控制等。
2.二項(xiàng)分布
(1)定義:n次獨(dú)立伯努利試驗(yàn)中成功次數(shù)的概率分布。
(2)參數(shù):試驗(yàn)次數(shù)n(n≥1),成功概率p。
(3)公式:P(X=k)=C(n,k)p^k(1-p)^(n-k)。
(4)示例:拋擲10次硬幣正面朝上的次數(shù)分布(n=10,p=0.5)。
3.泊松分布
(1)定義:描述單位時(shí)間內(nèi)隨機(jī)事件發(fā)生次數(shù)的概率分布。
(2)參數(shù):平均發(fā)生率λ(λ>0)。
(3)公式:P(X=k)=λ^k/k!e^(-λ)。
(4)應(yīng)用:電話呼叫量、缺陷產(chǎn)品數(shù)統(tǒng)計(jì)。
(二)連續(xù)型分布
1.均勻分布
(1)定義:在區(qū)間[a,b]上取值的概率密度相等。
(2)參數(shù):區(qū)間端點(diǎn)a(a<b),b。
(3)公式:f(x)=1/(b-a),a≤x≤b。
(4)應(yīng)用:隨機(jī)數(shù)生成、系統(tǒng)等待時(shí)間模擬。
2.指數(shù)分布
(1)定義:描述事件發(fā)生間隔時(shí)間的概率分布。
(2)參數(shù):速率參數(shù)λ(λ>0)。
(3)公式:f(x)=λe^(-λx),x≥0。
(4)應(yīng)用:設(shè)備無故障運(yùn)行時(shí)間、排隊(duì)系統(tǒng)分析。
3.正態(tài)分布
(1)定義:呈鐘形曲線的連續(xù)型分布。
(2)參數(shù):均值μ,標(biāo)準(zhǔn)差σ(σ>0)。
(3)特性:對(duì)稱性、經(jīng)驗(yàn)法則(約68.27%數(shù)據(jù)在μ±σ內(nèi))。
(4)公式:f(x)=1/(σ√(2π))e^(-(x-μ)^2/(2σ^2))。
(5)應(yīng)用:測(cè)量誤差、自然生長(zhǎng)數(shù)據(jù)。
三、分布的統(tǒng)計(jì)推斷方法
(一)參數(shù)估計(jì)
1.點(diǎn)估計(jì)
(1)方法:用樣本統(tǒng)計(jì)量(如樣本均值)替代總體參數(shù)。
(2)例子:正態(tài)分布中用樣本均值估計(jì)μ。
2.區(qū)間估計(jì)
(1)步驟:
(a)確定置信水平(如95%)。
(b)計(jì)算臨界值(基于t分布或Z分布)。
(c)構(gòu)建置信區(qū)間(μ±臨界值×標(biāo)準(zhǔn)誤)。
(2)示例:根據(jù)樣本數(shù)據(jù)計(jì)算正態(tài)分布均值的95%置信區(qū)間。
(二)假設(shè)檢驗(yàn)
1.基本流程
(1)提出原假設(shè)H?與備擇假設(shè)H?。
(2)選擇檢驗(yàn)統(tǒng)計(jì)量(如Z、t統(tǒng)計(jì)量)。
(3)計(jì)算p值或設(shè)定臨界值。
(4)做出拒絕或不拒絕H?的決策。
2.常見檢驗(yàn)
(1)Z檢驗(yàn):大樣本(n≥30)均值的檢驗(yàn)。
(2)t檢驗(yàn):小樣本均值的檢驗(yàn)。
(3)χ2檢驗(yàn):方差或頻率數(shù)據(jù)的擬合優(yōu)度檢驗(yàn)。
四、計(jì)算與軟件應(yīng)用
(一)手工計(jì)算
1.條件:分布參數(shù)明確時(shí)可直接應(yīng)用公式。
2.例子:二項(xiàng)分布P(X≥2)=1-P(X=0)-P(X=1)。
(二)軟件工具
1.R語言
(1)代碼示例:
```
生成正態(tài)分布隨機(jī)數(shù)
rnorm(100,mean=50,sd=10)
計(jì)算二項(xiàng)分布概率
dbinom(3,size=10,prob=0.3)
```
2.Python(SciPy庫)
(1)代碼示例:
```
fromscipy.statsimportnorm,poisson
正態(tài)分布累積分布函數(shù)
norm.cdf(60,loc=50,scale=10)
泊松分布概率質(zhì)量函數(shù)
poisson.pmf(5,mu=3)
```
五、注意事項(xiàng)
1.分布選擇需基于實(shí)際數(shù)據(jù)特征(如對(duì)稱性、離散性)。
2.參數(shù)估計(jì)與檢驗(yàn)需注意樣本量足夠大(一般n>30)。
3.軟件計(jì)算時(shí)需確認(rèn)分布參數(shù)輸入正確。
一、概述
概率與數(shù)理統(tǒng)計(jì)是現(xiàn)代科學(xué)研究的重要基礎(chǔ),常見分布是描述隨機(jī)變量統(tǒng)計(jì)特性的核心工具。本規(guī)程旨在系統(tǒng)梳理常用概率分布的定義、性質(zhì)、應(yīng)用場(chǎng)景及計(jì)算方法,為相關(guān)領(lǐng)域的學(xué)習(xí)與研究提供參考。通過對(duì)這些分布的深入理解,可以更準(zhǔn)確地建模、分析數(shù)據(jù),并做出科學(xué)決策。本規(guī)程將涵蓋離散型分布和連續(xù)型分布兩大類,并介紹相關(guān)的統(tǒng)計(jì)推斷方法,最后探討計(jì)算工具的應(yīng)用。
二、常見概率分布的定義與性質(zhì)
(一)離散型分布
1.伯努利分布
(1)定義:描述單次試驗(yàn)中事件成功或失敗的概率分布。伯努利試驗(yàn)是指只有兩種可能結(jié)果的試驗(yàn),通常記為“成功”和“失敗”。例如,拋擲一枚硬幣(結(jié)果為正面或反面)、檢測(cè)一個(gè)產(chǎn)品是否合格(合格或不合格)等都是伯努利試驗(yàn)。伯努利分布只包含一個(gè)隨機(jī)變量,即試驗(yàn)的結(jié)果。
(2)參數(shù):成功概率p(0≤p≤1)。p是伯努利試驗(yàn)中“成功”結(jié)果出現(xiàn)的概率,而“失敗”結(jié)果出現(xiàn)的概率為1-p。
(3)特性:
-期望值(數(shù)學(xué)期望):E[X]=p。這意味著如果進(jìn)行大量伯努利試驗(yàn),成功次數(shù)的平均值將趨近于p。
-方差:Var(X)=p(1-p)。方差衡量了成功結(jié)果的離散程度,當(dāng)p=0.5時(shí),方差達(dá)到最大值0.25。
-僅包含兩個(gè)可能取值:0(失敗)和1(成功)。
(4)應(yīng)用:
-質(zhì)量控制:檢測(cè)單個(gè)產(chǎn)品是否合格,合格記為1,不合格記為0。
-醫(yī)學(xué)試驗(yàn):記錄單個(gè)病人治療是否有效,有效記為1,無效記為0。
-市場(chǎng)營(yíng)銷:調(diào)查單個(gè)消費(fèi)者對(duì)某產(chǎn)品的購買意愿,購買記為1,不購買記為0。
2.二項(xiàng)分布
(1)定義:n次獨(dú)立伯努利試驗(yàn)中成功次數(shù)的概率分布。二項(xiàng)分布描述了在固定次數(shù)的重復(fù)試驗(yàn)中,成功事件發(fā)生的總次數(shù)的概率分布。這些試驗(yàn)必須滿足獨(dú)立性的條件,即每次試驗(yàn)的結(jié)果不會(huì)影響其他試驗(yàn)的結(jié)果。
(2)參數(shù):
-試驗(yàn)次數(shù)n(n≥1):指進(jìn)行伯努利試驗(yàn)的總次數(shù)。
-成功概率p(0≤p≤1):每次試驗(yàn)中成功結(jié)果出現(xiàn)的概率。
(3)公式:P(X=k)=C(n,k)p^k(1-p)^(n-k),其中:
-k是n次試驗(yàn)中成功的次數(shù),k的取值范圍是0到n。
-C(n,k)是組合數(shù),表示從n次試驗(yàn)中選出k次成功的組合方式數(shù)量,計(jì)算公式為C(n,k)=n!/(k!(n-k)!)。
-p^k是k次成功發(fā)生的概率。
-(1-p)^(n-k)是n-k次失敗發(fā)生的概率。
(4)應(yīng)用:
-質(zhì)量控制:檢測(cè)一批產(chǎn)品中的合格品數(shù)量。例如,從100件產(chǎn)品中隨機(jī)抽取10件進(jìn)行檢測(cè),計(jì)算其中恰好有3件合格品的概率。
-醫(yī)學(xué)試驗(yàn):進(jìn)行n次獨(dú)立重復(fù)的病毒檢測(cè),計(jì)算其中恰好有k次檢測(cè)呈陽性的概率。
-民意調(diào)查:在n名受訪者中,計(jì)算恰好有k名受訪者支持某個(gè)觀點(diǎn)的概率。
3.泊松分布
(1)定義:描述單位時(shí)間內(nèi)或單位面積內(nèi)隨機(jī)事件發(fā)生次數(shù)的概率分布。泊松分布通常用于描述在固定時(shí)間間隔或固定空間內(nèi)發(fā)生的事件的數(shù)量,這些事件發(fā)生的時(shí)間或空間是均勻分布的,并且事件之間是相互獨(dú)立的。
(2)參數(shù):平均發(fā)生率λ(λ>0)。λ表示在單位時(shí)間內(nèi)或單位面積內(nèi)事件平均發(fā)生的次數(shù)。
(3)公式:P(X=k)=λ^k/k!e^(-λ),其中:
-k是單位時(shí)間內(nèi)或單位面積內(nèi)事件發(fā)生的次數(shù),k的取值范圍是0,1,2,...。
-λ是單位時(shí)間內(nèi)或單位面積內(nèi)事件平均發(fā)生的次數(shù)。
-k!是k的階乘,表示k個(gè)不同元素的所有排列組合的數(shù)量。
-e是自然對(duì)數(shù)的底數(shù),約等于2.71828。
(4)應(yīng)用:
-電話系統(tǒng):計(jì)算單位時(shí)間內(nèi)接到的電話呼叫次數(shù)。
-交通流量:計(jì)算單位時(shí)間內(nèi)通過某個(gè)交叉口的車輛數(shù)量。
-質(zhì)量控制:計(jì)算單位面積布料上的疵點(diǎn)數(shù)量。
-生物學(xué):計(jì)算單位體積水中的細(xì)菌數(shù)量。
(二)連續(xù)型分布
1.均勻分布
(1)定義:在區(qū)間[a,b]上取值的概率密度相等的連續(xù)型分布。均勻分布是一種簡(jiǎn)單的連續(xù)型分布,它描述了在某個(gè)區(qū)間內(nèi)每個(gè)值出現(xiàn)的概率都是相同的。
(2)參數(shù):區(qū)間端點(diǎn)a(a<b),b。a和b分別表示區(qū)間的下限和上限。
(3)公式:f(x)=1/(b-a),a≤x≤b。
-f(x)是概率密度函數(shù),表示在x處事件發(fā)生的概率密度。
-在區(qū)間[a,b]內(nèi),f(x)的值恒為1/(b-a)。
-在區(qū)間外,f(x)的值為0。
(4)應(yīng)用:
-隨機(jī)數(shù)生成:在計(jì)算機(jī)中,均勻分布常用于生成隨機(jī)數(shù)。例如,生成一個(gè)在[0,1]區(qū)間內(nèi)均勻分布的隨機(jī)數(shù)。
-模擬:在模擬實(shí)驗(yàn)中,均勻分布可以用于模擬具有相等發(fā)生概率的事件。
-測(cè)量誤差:在某些情況下,測(cè)量誤差可以近似為均勻分布。
2.指數(shù)分布
(1)定義:描述事件發(fā)生間隔時(shí)間的概率分布。指數(shù)分布是連續(xù)型分布中的一種,它描述了在給定時(shí)間間隔內(nèi)事件發(fā)生的概率。指數(shù)分布具有無記憶性,即過去發(fā)生的事件不會(huì)影響未來事件的發(fā)生概率。
(2)參數(shù):速率參數(shù)λ(λ>0)。λ表示單位時(shí)間內(nèi)事件發(fā)生的平均次數(shù)。
(3)公式:f(x)=λe^(-λx),x≥0。
-f(x)是概率密度函數(shù),表示在x處事件發(fā)生的概率密度。
-λ是速率參數(shù),表示單位時(shí)間內(nèi)事件發(fā)生的平均次數(shù)。
-e是自然對(duì)數(shù)的底數(shù),約等于2.71828。
(4)應(yīng)用:
-可靠性工程:計(jì)算設(shè)備無故障運(yùn)行的時(shí)間。
-排隊(duì)論:計(jì)算顧客到達(dá)的時(shí)間間隔。
-保險(xiǎn)精算:計(jì)算索賠發(fā)生的時(shí)間間隔。
3.正態(tài)分布
(1)定義:呈鐘形曲線的連續(xù)型分布。正態(tài)分布是最常見的連續(xù)型分布之一,其概率密度函數(shù)呈鐘形曲線,對(duì)稱于均值μ。正態(tài)分布廣泛應(yīng)用于自然科學(xué)、社會(huì)科學(xué)和工程等領(lǐng)域。
(2)參數(shù):均值μ,標(biāo)準(zhǔn)差σ(σ>0)。
-均值μ:表示分布的中心位置,即大部分?jǐn)?shù)據(jù)集中在這個(gè)值附近。
-標(biāo)準(zhǔn)差σ:表示數(shù)據(jù)的離散程度,σ越大,數(shù)據(jù)越分散;σ越小,數(shù)據(jù)越集中。
(3)特性:
-對(duì)稱性:正態(tài)分布的概率密度函數(shù)關(guān)于均值μ對(duì)稱。
-單峰性:正態(tài)分布只有一個(gè)峰值,即眾數(shù)、中位數(shù)和均值都相等。
-均值、中位數(shù)和眾數(shù)相等。
-經(jīng)驗(yàn)法則(68-95-99.7法則):約68.27%的數(shù)據(jù)在μ±σ范圍內(nèi),約95.45%的數(shù)據(jù)在μ±2σ范圍內(nèi),約99.73%的數(shù)據(jù)在μ±3σ范圍內(nèi)。
(4)公式:f(x)=1/(σ√(2π))e^(-(x-μ)^2/(2σ^2))。
-f(x)是概率密度函數(shù),表示在x處事件發(fā)生的概率密度。
-μ是均值。
-σ是標(biāo)準(zhǔn)差。
-π是圓周率,約等于3.14159。
-e是自然對(duì)數(shù)的底數(shù),約等于2.71828。
(5)應(yīng)用:
-自然科學(xué):測(cè)量誤差、身高、體重等。
-社會(huì)科學(xué):考試成績(jī)、IQ分?jǐn)?shù)等。
-工程學(xué):零件尺寸、材料強(qiáng)度等。
-經(jīng)濟(jì)學(xué):股票價(jià)格、經(jīng)濟(jì)指數(shù)等。
三、分布的統(tǒng)計(jì)推斷方法
(一)參數(shù)估計(jì)
1.點(diǎn)估計(jì)
(1)方法:用樣本統(tǒng)計(jì)量(如樣本均值)替代總體參數(shù)。點(diǎn)估計(jì)是指用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù)的值。點(diǎn)估計(jì)的優(yōu)點(diǎn)是簡(jiǎn)單易行,缺點(diǎn)是估計(jì)結(jié)果可能存在偏差。
(2)例子:
-正態(tài)分布中用樣本均值估計(jì)μ:假設(shè)從正態(tài)分布總體中抽取一個(gè)樣本,樣本均值為x?,則可以用x?來估計(jì)μ。
-泊松分布中用樣本均值估計(jì)λ:假設(shè)從泊松分布總體中抽取一個(gè)樣本,樣本均值為x?,則可以用x?來估計(jì)λ。
2.區(qū)間估計(jì)
(1)步驟:
(a)確定置信水平(如95%)。置信水平是指估計(jì)區(qū)間包含總體參數(shù)真值的概率。常見的置信水平有90%、95%和99%。
(b)計(jì)算臨界值(基于t分布或Z分布)。臨界值取決于置信水平和樣本量,通常使用t分布或Z分布表來查找。例如,對(duì)于95%的置信水平和自由度為n-1的t分布,臨界值約為2.064(當(dāng)n>30時(shí),可以使用Z分布,臨界值約為1.96)。
(c)構(gòu)建置信區(qū)間(μ±臨界值×標(biāo)準(zhǔn)誤)。標(biāo)準(zhǔn)誤是樣本統(tǒng)計(jì)量標(biāo)準(zhǔn)差的無偏估計(jì),對(duì)于均值的標(biāo)準(zhǔn)誤公式為s/√n,其中s是樣本標(biāo)準(zhǔn)差,n是樣本量。
(2)示例:根據(jù)樣本數(shù)據(jù)計(jì)算正態(tài)分布均值的95%置信區(qū)間。
-假設(shè)從正態(tài)分布總體中抽取一個(gè)樣本,樣本均值為x?=50,樣本標(biāo)準(zhǔn)差為s=10,樣本量為n=36。
-由于n>30,可以使用Z分布,臨界值為1.96。
-標(biāo)準(zhǔn)誤為s/√n=10/√36=1.67。
-置信區(qū)間為50±1.96×1.67,即(46.63,53.37)。
-這意味著我們有95%的信心認(rèn)為總體均值μ在46.63到53.37之間。
(二)假設(shè)檢驗(yàn)
1.基本流程
(1)提出原假設(shè)H?與備擇假設(shè)H?。原假設(shè)通常是研究者想要推翻的假設(shè),備擇假設(shè)是研究者想要證明的假設(shè)。
(2)選擇檢驗(yàn)統(tǒng)計(jì)量(如Z、t統(tǒng)計(jì)量)。檢驗(yàn)統(tǒng)計(jì)量是用于檢驗(yàn)原假設(shè)的統(tǒng)計(jì)量,其值取決于樣本數(shù)據(jù)和總體參數(shù)。常見的檢驗(yàn)統(tǒng)計(jì)量有Z統(tǒng)計(jì)量、t統(tǒng)計(jì)量和χ2統(tǒng)計(jì)量。
(3)計(jì)算p值或設(shè)定臨界值。p值是檢驗(yàn)統(tǒng)計(jì)量超過觀測(cè)值的概率,如果p值小于顯著性水平,則拒絕原假設(shè)。臨界值是檢驗(yàn)統(tǒng)計(jì)量拒絕原假設(shè)的臨界值,如果檢驗(yàn)統(tǒng)計(jì)量的值超過臨界值,則拒絕原假設(shè)。
(4)做出拒絕或不拒絕H?的決策。根據(jù)p值或臨界值,判斷是否拒絕原假設(shè)。
2.常見檢驗(yàn)
(1)Z檢驗(yàn):大樣本(n≥30)均值的檢驗(yàn)。Z檢驗(yàn)用于檢驗(yàn)總體均值是否等于某個(gè)特定值,當(dāng)樣本量較大時(shí),可以使用Z檢驗(yàn)。Z檢驗(yàn)的公式為:
Z=(x?-μ)/(σ/√n),
其中x?是樣本均值,μ是總體均值,σ是總體標(biāo)準(zhǔn)差,n是樣本量。
(2)t檢驗(yàn):小樣本均值的檢驗(yàn)。t檢驗(yàn)用于檢驗(yàn)總體均值是否等于某個(gè)特定值,當(dāng)樣本量較小時(shí),使用t檢驗(yàn)更合適。t檢驗(yàn)的公式為:
t=(x?-μ)/(s/√n),
其中x?是樣本均值,μ是總體均值,s是樣本標(biāo)準(zhǔn)差,n是樣本量。
(3)χ2檢驗(yàn):方差或頻率數(shù)據(jù)的擬合優(yōu)度檢驗(yàn)。χ2檢驗(yàn)用于檢驗(yàn)樣本數(shù)據(jù)是否來自某個(gè)特定的分布,或者檢驗(yàn)兩個(gè)分類變量之間是否存在關(guān)聯(lián)。χ2檢驗(yàn)的公式為:
χ2=Σ((O-E)2/E),
其中O是觀測(cè)頻數(shù),E是期望頻數(shù)。
四、計(jì)算與軟件應(yīng)用
(一)手工計(jì)算
1.條件:分布參數(shù)明確時(shí)可直接應(yīng)用公式。手工計(jì)算適用于簡(jiǎn)單的分布和樣本量較小的情況。
2.例子:
-二項(xiàng)分布P(X≥2)=1-P(X=0)-P(X=1):假設(shè)n=10,p=0.3,計(jì)算P(X≥2)。
P(X=0)=C(10,0)0.3^0(1-0.3)^(10-0)=0.0282。
P(X=1)=C(10,1)0.3^1(1-0.3)^(10-1)=0.1211。
P(X≥2)=1-0.0282-0.1211=0.8507。
-正態(tài)分布計(jì)算累積概率:假設(shè)μ=50,σ=10,計(jì)算P(X≤60)。
首先將X轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布:Z=(60-50)/10=1。
查標(biāo)準(zhǔn)正態(tài)分布表,P(Z≤1)=0.8413。
因此,P(X≤60)=0.8413。
(二)軟件工具
1.R語言
(1)代碼示例:
```
生成正態(tài)分布隨機(jī)數(shù)
set.seed(123)設(shè)置隨機(jī)數(shù)種子,確保結(jié)果可重復(fù)
rnorm(100,mean=50,sd=10)生成100個(gè)均值為50,標(biāo)準(zhǔn)差為10的正態(tài)分布隨機(jī)數(shù)
計(jì)算二項(xiàng)分布概率
dbinom(3,size=10,prob=0.3)計(jì)算10次試驗(yàn)中恰好有3次成功的概率,成功概率為0.3
pbinom(3,size=10,prob=0.3)計(jì)算10次試驗(yàn)中成功次數(shù)不超過3次的概率
計(jì)算泊松分布概率
dpois(5,lambda=3)計(jì)算單位時(shí)間內(nèi)恰好有5次事件發(fā)生的概率,平均發(fā)生率為3
ppois(5,lambda=3)計(jì)算單位時(shí)間內(nèi)事件發(fā)生次數(shù)不超過5次的概率
正態(tài)分布累積分布函數(shù)
norm_cdf<-function(x,mean,sd){
(1/(sdsqrt(2pi)))sum(exp(-((x-mean)^2)/(2sd^2)))/length(x)
}
norm_cdf(60,mean=50,sd=10)計(jì)算正態(tài)分布下,x=60的累積概率密度
```
2.Python(SciPy庫)
(1)代碼示例:
```
importnumpyasnp
fromscipy.statsimportbinom,poisson,norm,t,chi2
生成二項(xiàng)分布隨機(jī)數(shù)
np.random.binomial(n=10,p=0.3,size=1000)
計(jì)算二項(xiàng)分布概率
binom.pmf(k=3,n=10,p=0.3)10次試驗(yàn)中恰好3次成功的概率
binom.cdf(k=3,n=10,p=0.3)10次試驗(yàn)中成功次數(shù)不超過3次的概率
生成泊松分布隨機(jī)數(shù)
np.random.poisson(lam=3,size=1000)
計(jì)算泊松分布概率
poisson.pmf(k=5,mu=3)單位時(shí)間內(nèi)恰好5次事件發(fā)生的概率
poisson.cdf(k=5,mu=3)單位時(shí)間內(nèi)事件發(fā)生次數(shù)不超過5次的概率
正態(tài)分布操作
norm.pdf(x=60,loc=50,scale=10)計(jì)算x=60的概率密度
norm.cdf(x=60,loc=50,scale=10)計(jì)算x=60的累積分布函數(shù)值
norm.ppf(q=0.95,loc=50,scale=10)計(jì)算95%分位數(shù)
t檢驗(yàn)示例
t_stat=(60-50)/(10/np.sqrt(36))
t.p_value=2(1-t.cdf(t_stat,df=35))雙尾檢驗(yàn)的p值
χ2檢驗(yàn)示例
observed=[10,20,30]
expected=[15,15,20]
chi2_stat=chi2.chi2_contingency(observed=observed,expected=expected)[0]
```
五、注意事項(xiàng)
1.分布選擇需基于實(shí)際數(shù)據(jù)特征(如對(duì)稱性、離散性)。選擇合適的概率分布對(duì)于建模和分析至關(guān)重要。例如,如果數(shù)據(jù)呈對(duì)稱分布且數(shù)據(jù)量較大,則可以選擇正態(tài)分布;如果數(shù)據(jù)是離散的且事件發(fā)生的概率相同,則可以選擇二項(xiàng)分布或泊松分布。
2.參數(shù)估計(jì)與檢驗(yàn)需注意樣本量足夠大(一般n>30)。樣本量的大小會(huì)影響統(tǒng)計(jì)推斷的準(zhǔn)確性。一般來說,樣本量越大,估計(jì)的精度越高,檢驗(yàn)的效力也越強(qiáng)。
3.軟件計(jì)算時(shí)需確認(rèn)分布參數(shù)輸入正確。在使用軟件進(jìn)行計(jì)算時(shí),需要確保輸入的分布參數(shù)(如均值、標(biāo)準(zhǔn)差、樣本量等)是正確的,否則計(jì)算結(jié)果將不準(zhǔn)確。
4.統(tǒng)計(jì)推斷結(jié)果的解釋需結(jié)合實(shí)際情況。統(tǒng)計(jì)推斷的結(jié)果需要結(jié)合實(shí)際情況進(jìn)行解釋,不能脫離實(shí)際情況進(jìn)行空泛的討論。例如,在解釋置信區(qū)間時(shí),需要說明該區(qū)間在實(shí)際應(yīng)用中的意義。
5.注意數(shù)據(jù)清洗和預(yù)處理。在進(jìn)行統(tǒng)計(jì)推斷之前,需要對(duì)數(shù)據(jù)進(jìn)行清洗和預(yù)處理,去除異常值、缺失值等,確保數(shù)據(jù)的質(zhì)量。
6.理解分布的局限性。每種概率分布都有其適用的范圍和局限性,在使用時(shí)需要了解其適用條件和局限性,避免誤用。例如,泊松分布適用于描述單位時(shí)間內(nèi)事件發(fā)生的次數(shù),但不適用于描述連續(xù)變量。
7.注意假設(shè)檢驗(yàn)的假設(shè)條件。在進(jìn)行假設(shè)檢驗(yàn)時(shí),需要滿足相應(yīng)的假設(shè)條件,如正態(tài)性、獨(dú)立性、方差齊性等。如果不滿足假設(shè)條件,則需要進(jìn)行數(shù)據(jù)轉(zhuǎn)換或使用非參數(shù)檢驗(yàn)方法。
希望這份擴(kuò)寫后的文檔內(nèi)容能夠滿足您的要求,提供更詳細(xì)和實(shí)用的信息。如果您還有其他問題或需要進(jìn)一步的幫助,請(qǐng)隨時(shí)告訴我。
一、概述
概率與數(shù)理統(tǒng)計(jì)是現(xiàn)代科學(xué)研究的重要基礎(chǔ),常見分布是描述隨機(jī)變量統(tǒng)計(jì)特性的核心工具。本規(guī)程旨在系統(tǒng)梳理常用概率分布的定義、性質(zhì)、應(yīng)用場(chǎng)景及計(jì)算方法,為相關(guān)領(lǐng)域的學(xué)習(xí)與研究提供參考。
二、常見概率分布的定義與性質(zhì)
(一)離散型分布
1.伯努利分布
(1)定義:描述單次試驗(yàn)中事件成功或失敗的概率分布。
(2)參數(shù):成功概率p(0≤p≤1)。
(3)特性:期望值為p,方差為p(1-p)。
(4)應(yīng)用:二項(xiàng)試驗(yàn)、質(zhì)量控制等。
2.二項(xiàng)分布
(1)定義:n次獨(dú)立伯努利試驗(yàn)中成功次數(shù)的概率分布。
(2)參數(shù):試驗(yàn)次數(shù)n(n≥1),成功概率p。
(3)公式:P(X=k)=C(n,k)p^k(1-p)^(n-k)。
(4)示例:拋擲10次硬幣正面朝上的次數(shù)分布(n=10,p=0.5)。
3.泊松分布
(1)定義:描述單位時(shí)間內(nèi)隨機(jī)事件發(fā)生次數(shù)的概率分布。
(2)參數(shù):平均發(fā)生率λ(λ>0)。
(3)公式:P(X=k)=λ^k/k!e^(-λ)。
(4)應(yīng)用:電話呼叫量、缺陷產(chǎn)品數(shù)統(tǒng)計(jì)。
(二)連續(xù)型分布
1.均勻分布
(1)定義:在區(qū)間[a,b]上取值的概率密度相等。
(2)參數(shù):區(qū)間端點(diǎn)a(a<b),b。
(3)公式:f(x)=1/(b-a),a≤x≤b。
(4)應(yīng)用:隨機(jī)數(shù)生成、系統(tǒng)等待時(shí)間模擬。
2.指數(shù)分布
(1)定義:描述事件發(fā)生間隔時(shí)間的概率分布。
(2)參數(shù):速率參數(shù)λ(λ>0)。
(3)公式:f(x)=λe^(-λx),x≥0。
(4)應(yīng)用:設(shè)備無故障運(yùn)行時(shí)間、排隊(duì)系統(tǒng)分析。
3.正態(tài)分布
(1)定義:呈鐘形曲線的連續(xù)型分布。
(2)參數(shù):均值μ,標(biāo)準(zhǔn)差σ(σ>0)。
(3)特性:對(duì)稱性、經(jīng)驗(yàn)法則(約68.27%數(shù)據(jù)在μ±σ內(nèi))。
(4)公式:f(x)=1/(σ√(2π))e^(-(x-μ)^2/(2σ^2))。
(5)應(yīng)用:測(cè)量誤差、自然生長(zhǎng)數(shù)據(jù)。
三、分布的統(tǒng)計(jì)推斷方法
(一)參數(shù)估計(jì)
1.點(diǎn)估計(jì)
(1)方法:用樣本統(tǒng)計(jì)量(如樣本均值)替代總體參數(shù)。
(2)例子:正態(tài)分布中用樣本均值估計(jì)μ。
2.區(qū)間估計(jì)
(1)步驟:
(a)確定置信水平(如95%)。
(b)計(jì)算臨界值(基于t分布或Z分布)。
(c)構(gòu)建置信區(qū)間(μ±臨界值×標(biāo)準(zhǔn)誤)。
(2)示例:根據(jù)樣本數(shù)據(jù)計(jì)算正態(tài)分布均值的95%置信區(qū)間。
(二)假設(shè)檢驗(yàn)
1.基本流程
(1)提出原假設(shè)H?與備擇假設(shè)H?。
(2)選擇檢驗(yàn)統(tǒng)計(jì)量(如Z、t統(tǒng)計(jì)量)。
(3)計(jì)算p值或設(shè)定臨界值。
(4)做出拒絕或不拒絕H?的決策。
2.常見檢驗(yàn)
(1)Z檢驗(yàn):大樣本(n≥30)均值的檢驗(yàn)。
(2)t檢驗(yàn):小樣本均值的檢驗(yàn)。
(3)χ2檢驗(yàn):方差或頻率數(shù)據(jù)的擬合優(yōu)度檢驗(yàn)。
四、計(jì)算與軟件應(yīng)用
(一)手工計(jì)算
1.條件:分布參數(shù)明確時(shí)可直接應(yīng)用公式。
2.例子:二項(xiàng)分布P(X≥2)=1-P(X=0)-P(X=1)。
(二)軟件工具
1.R語言
(1)代碼示例:
```
生成正態(tài)分布隨機(jī)數(shù)
rnorm(100,mean=50,sd=10)
計(jì)算二項(xiàng)分布概率
dbinom(3,size=10,prob=0.3)
```
2.Python(SciPy庫)
(1)代碼示例:
```
fromscipy.statsimportnorm,poisson
正態(tài)分布累積分布函數(shù)
norm.cdf(60,loc=50,scale=10)
泊松分布概率質(zhì)量函數(shù)
poisson.pmf(5,mu=3)
```
五、注意事項(xiàng)
1.分布選擇需基于實(shí)際數(shù)據(jù)特征(如對(duì)稱性、離散性)。
2.參數(shù)估計(jì)與檢驗(yàn)需注意樣本量足夠大(一般n>30)。
3.軟件計(jì)算時(shí)需確認(rèn)分布參數(shù)輸入正確。
一、概述
概率與數(shù)理統(tǒng)計(jì)是現(xiàn)代科學(xué)研究的重要基礎(chǔ),常見分布是描述隨機(jī)變量統(tǒng)計(jì)特性的核心工具。本規(guī)程旨在系統(tǒng)梳理常用概率分布的定義、性質(zhì)、應(yīng)用場(chǎng)景及計(jì)算方法,為相關(guān)領(lǐng)域的學(xué)習(xí)與研究提供參考。通過對(duì)這些分布的深入理解,可以更準(zhǔn)確地建模、分析數(shù)據(jù),并做出科學(xué)決策。本規(guī)程將涵蓋離散型分布和連續(xù)型分布兩大類,并介紹相關(guān)的統(tǒng)計(jì)推斷方法,最后探討計(jì)算工具的應(yīng)用。
二、常見概率分布的定義與性質(zhì)
(一)離散型分布
1.伯努利分布
(1)定義:描述單次試驗(yàn)中事件成功或失敗的概率分布。伯努利試驗(yàn)是指只有兩種可能結(jié)果的試驗(yàn),通常記為“成功”和“失敗”。例如,拋擲一枚硬幣(結(jié)果為正面或反面)、檢測(cè)一個(gè)產(chǎn)品是否合格(合格或不合格)等都是伯努利試驗(yàn)。伯努利分布只包含一個(gè)隨機(jī)變量,即試驗(yàn)的結(jié)果。
(2)參數(shù):成功概率p(0≤p≤1)。p是伯努利試驗(yàn)中“成功”結(jié)果出現(xiàn)的概率,而“失敗”結(jié)果出現(xiàn)的概率為1-p。
(3)特性:
-期望值(數(shù)學(xué)期望):E[X]=p。這意味著如果進(jìn)行大量伯努利試驗(yàn),成功次數(shù)的平均值將趨近于p。
-方差:Var(X)=p(1-p)。方差衡量了成功結(jié)果的離散程度,當(dāng)p=0.5時(shí),方差達(dá)到最大值0.25。
-僅包含兩個(gè)可能取值:0(失?。┖?(成功)。
(4)應(yīng)用:
-質(zhì)量控制:檢測(cè)單個(gè)產(chǎn)品是否合格,合格記為1,不合格記為0。
-醫(yī)學(xué)試驗(yàn):記錄單個(gè)病人治療是否有效,有效記為1,無效記為0。
-市場(chǎng)營(yíng)銷:調(diào)查單個(gè)消費(fèi)者對(duì)某產(chǎn)品的購買意愿,購買記為1,不購買記為0。
2.二項(xiàng)分布
(1)定義:n次獨(dú)立伯努利試驗(yàn)中成功次數(shù)的概率分布。二項(xiàng)分布描述了在固定次數(shù)的重復(fù)試驗(yàn)中,成功事件發(fā)生的總次數(shù)的概率分布。這些試驗(yàn)必須滿足獨(dú)立性的條件,即每次試驗(yàn)的結(jié)果不會(huì)影響其他試驗(yàn)的結(jié)果。
(2)參數(shù):
-試驗(yàn)次數(shù)n(n≥1):指進(jìn)行伯努利試驗(yàn)的總次數(shù)。
-成功概率p(0≤p≤1):每次試驗(yàn)中成功結(jié)果出現(xiàn)的概率。
(3)公式:P(X=k)=C(n,k)p^k(1-p)^(n-k),其中:
-k是n次試驗(yàn)中成功的次數(shù),k的取值范圍是0到n。
-C(n,k)是組合數(shù),表示從n次試驗(yàn)中選出k次成功的組合方式數(shù)量,計(jì)算公式為C(n,k)=n!/(k!(n-k)!)。
-p^k是k次成功發(fā)生的概率。
-(1-p)^(n-k)是n-k次失敗發(fā)生的概率。
(4)應(yīng)用:
-質(zhì)量控制:檢測(cè)一批產(chǎn)品中的合格品數(shù)量。例如,從100件產(chǎn)品中隨機(jī)抽取10件進(jìn)行檢測(cè),計(jì)算其中恰好有3件合格品的概率。
-醫(yī)學(xué)試驗(yàn):進(jìn)行n次獨(dú)立重復(fù)的病毒檢測(cè),計(jì)算其中恰好有k次檢測(cè)呈陽性的概率。
-民意調(diào)查:在n名受訪者中,計(jì)算恰好有k名受訪者支持某個(gè)觀點(diǎn)的概率。
3.泊松分布
(1)定義:描述單位時(shí)間內(nèi)或單位面積內(nèi)隨機(jī)事件發(fā)生次數(shù)的概率分布。泊松分布通常用于描述在固定時(shí)間間隔或固定空間內(nèi)發(fā)生的事件的數(shù)量,這些事件發(fā)生的時(shí)間或空間是均勻分布的,并且事件之間是相互獨(dú)立的。
(2)參數(shù):平均發(fā)生率λ(λ>0)。λ表示在單位時(shí)間內(nèi)或單位面積內(nèi)事件平均發(fā)生的次數(shù)。
(3)公式:P(X=k)=λ^k/k!e^(-λ),其中:
-k是單位時(shí)間內(nèi)或單位面積內(nèi)事件發(fā)生的次數(shù),k的取值范圍是0,1,2,...。
-λ是單位時(shí)間內(nèi)或單位面積內(nèi)事件平均發(fā)生的次數(shù)。
-k!是k的階乘,表示k個(gè)不同元素的所有排列組合的數(shù)量。
-e是自然對(duì)數(shù)的底數(shù),約等于2.71828。
(4)應(yīng)用:
-電話系統(tǒng):計(jì)算單位時(shí)間內(nèi)接到的電話呼叫次數(shù)。
-交通流量:計(jì)算單位時(shí)間內(nèi)通過某個(gè)交叉口的車輛數(shù)量。
-質(zhì)量控制:計(jì)算單位面積布料上的疵點(diǎn)數(shù)量。
-生物學(xué):計(jì)算單位體積水中的細(xì)菌數(shù)量。
(二)連續(xù)型分布
1.均勻分布
(1)定義:在區(qū)間[a,b]上取值的概率密度相等的連續(xù)型分布。均勻分布是一種簡(jiǎn)單的連續(xù)型分布,它描述了在某個(gè)區(qū)間內(nèi)每個(gè)值出現(xiàn)的概率都是相同的。
(2)參數(shù):區(qū)間端點(diǎn)a(a<b),b。a和b分別表示區(qū)間的下限和上限。
(3)公式:f(x)=1/(b-a),a≤x≤b。
-f(x)是概率密度函數(shù),表示在x處事件發(fā)生的概率密度。
-在區(qū)間[a,b]內(nèi),f(x)的值恒為1/(b-a)。
-在區(qū)間外,f(x)的值為0。
(4)應(yīng)用:
-隨機(jī)數(shù)生成:在計(jì)算機(jī)中,均勻分布常用于生成隨機(jī)數(shù)。例如,生成一個(gè)在[0,1]區(qū)間內(nèi)均勻分布的隨機(jī)數(shù)。
-模擬:在模擬實(shí)驗(yàn)中,均勻分布可以用于模擬具有相等發(fā)生概率的事件。
-測(cè)量誤差:在某些情況下,測(cè)量誤差可以近似為均勻分布。
2.指數(shù)分布
(1)定義:描述事件發(fā)生間隔時(shí)間的概率分布。指數(shù)分布是連續(xù)型分布中的一種,它描述了在給定時(shí)間間隔內(nèi)事件發(fā)生的概率。指數(shù)分布具有無記憶性,即過去發(fā)生的事件不會(huì)影響未來事件的發(fā)生概率。
(2)參數(shù):速率參數(shù)λ(λ>0)。λ表示單位時(shí)間內(nèi)事件發(fā)生的平均次數(shù)。
(3)公式:f(x)=λe^(-λx),x≥0。
-f(x)是概率密度函數(shù),表示在x處事件發(fā)生的概率密度。
-λ是速率參數(shù),表示單位時(shí)間內(nèi)事件發(fā)生的平均次數(shù)。
-e是自然對(duì)數(shù)的底數(shù),約等于2.71828。
(4)應(yīng)用:
-可靠性工程:計(jì)算設(shè)備無故障運(yùn)行的時(shí)間。
-排隊(duì)論:計(jì)算顧客到達(dá)的時(shí)間間隔。
-保險(xiǎn)精算:計(jì)算索賠發(fā)生的時(shí)間間隔。
3.正態(tài)分布
(1)定義:呈鐘形曲線的連續(xù)型分布。正態(tài)分布是最常見的連續(xù)型分布之一,其概率密度函數(shù)呈鐘形曲線,對(duì)稱于均值μ。正態(tài)分布廣泛應(yīng)用于自然科學(xué)、社會(huì)科學(xué)和工程等領(lǐng)域。
(2)參數(shù):均值μ,標(biāo)準(zhǔn)差σ(σ>0)。
-均值μ:表示分布的中心位置,即大部分?jǐn)?shù)據(jù)集中在這個(gè)值附近。
-標(biāo)準(zhǔn)差σ:表示數(shù)據(jù)的離散程度,σ越大,數(shù)據(jù)越分散;σ越小,數(shù)據(jù)越集中。
(3)特性:
-對(duì)稱性:正態(tài)分布的概率密度函數(shù)關(guān)于均值μ對(duì)稱。
-單峰性:正態(tài)分布只有一個(gè)峰值,即眾數(shù)、中位數(shù)和均值都相等。
-均值、中位數(shù)和眾數(shù)相等。
-經(jīng)驗(yàn)法則(68-95-99.7法則):約68.27%的數(shù)據(jù)在μ±σ范圍內(nèi),約95.45%的數(shù)據(jù)在μ±2σ范圍內(nèi),約99.73%的數(shù)據(jù)在μ±3σ范圍內(nèi)。
(4)公式:f(x)=1/(σ√(2π))e^(-(x-μ)^2/(2σ^2))。
-f(x)是概率密度函數(shù),表示在x處事件發(fā)生的概率密度。
-μ是均值。
-σ是標(biāo)準(zhǔn)差。
-π是圓周率,約等于3.14159。
-e是自然對(duì)數(shù)的底數(shù),約等于2.71828。
(5)應(yīng)用:
-自然科學(xué):測(cè)量誤差、身高、體重等。
-社會(huì)科學(xué):考試成績(jī)、IQ分?jǐn)?shù)等。
-工程學(xué):零件尺寸、材料強(qiáng)度等。
-經(jīng)濟(jì)學(xué):股票價(jià)格、經(jīng)濟(jì)指數(shù)等。
三、分布的統(tǒng)計(jì)推斷方法
(一)參數(shù)估計(jì)
1.點(diǎn)估計(jì)
(1)方法:用樣本統(tǒng)計(jì)量(如樣本均值)替代總體參數(shù)。點(diǎn)估計(jì)是指用樣本統(tǒng)計(jì)量來估計(jì)總體參數(shù)的值。點(diǎn)估計(jì)的優(yōu)點(diǎn)是簡(jiǎn)單易行,缺點(diǎn)是估計(jì)結(jié)果可能存在偏差。
(2)例子:
-正態(tài)分布中用樣本均值估計(jì)μ:假設(shè)從正態(tài)分布總體中抽取一個(gè)樣本,樣本均值為x?,則可以用x?來估計(jì)μ。
-泊松分布中用樣本均值估計(jì)λ:假設(shè)從泊松分布總體中抽取一個(gè)樣本,樣本均值為x?,則可以用x?來估計(jì)λ。
2.區(qū)間估計(jì)
(1)步驟:
(a)確定置信水平(如95%)。置信水平是指估計(jì)區(qū)間包含總體參數(shù)真值的概率。常見的置信水平有90%、95%和99%。
(b)計(jì)算臨界值(基于t分布或Z分布)。臨界值取決于置信水平和樣本量,通常使用t分布或Z分布表來查找。例如,對(duì)于95%的置信水平和自由度為n-1的t分布,臨界值約為2.064(當(dāng)n>30時(shí),可以使用Z分布,臨界值約為1.96)。
(c)構(gòu)建置信區(qū)間(μ±臨界值×標(biāo)準(zhǔn)誤)。標(biāo)準(zhǔn)誤是樣本統(tǒng)計(jì)量標(biāo)準(zhǔn)差的無偏估計(jì),對(duì)于均值的標(biāo)準(zhǔn)誤公式為s/√n,其中s是樣本標(biāo)準(zhǔn)差,n是樣本量。
(2)示例:根據(jù)樣本數(shù)據(jù)計(jì)算正態(tài)分布均值的95%置信區(qū)間。
-假設(shè)從正態(tài)分布總體中抽取一個(gè)樣本,樣本均值為x?=50,樣本標(biāo)準(zhǔn)差為s=10,樣本量為n=36。
-由于n>30,可以使用Z分布,臨界值為1.96。
-標(biāo)準(zhǔn)誤為s/√n=10/√36=1.67。
-置信區(qū)間為50±1.96×1.67,即(46.63,53.37)。
-這意味著我們有95%的信心認(rèn)為總體均值μ在46.63到53.37之間。
(二)假設(shè)檢驗(yàn)
1.基本流程
(1)提出原假設(shè)H?與備擇假設(shè)H?。原假設(shè)通常是研究者想要推翻的假設(shè),備擇假設(shè)是研究者想要證明的假設(shè)。
(2)選擇檢驗(yàn)統(tǒng)計(jì)量(如Z、t統(tǒng)計(jì)量)。檢驗(yàn)統(tǒng)計(jì)量是用于檢驗(yàn)原假設(shè)的統(tǒng)計(jì)量,其值取決于樣本數(shù)據(jù)和總體參數(shù)。常見的檢驗(yàn)統(tǒng)計(jì)量有Z統(tǒng)計(jì)量、t統(tǒng)計(jì)量和χ2統(tǒng)計(jì)量。
(3)計(jì)算p值或設(shè)定臨界值。p值是檢驗(yàn)統(tǒng)計(jì)量超過觀測(cè)值的概率,如果p值小于顯著性水平,則拒絕原假設(shè)。臨界值是檢驗(yàn)統(tǒng)計(jì)量拒絕原假設(shè)的臨界值,如果檢驗(yàn)統(tǒng)計(jì)量的值超過臨界值,則拒絕原假設(shè)。
(4)做出拒絕或不拒絕H?的決策。根據(jù)p值或臨界值,判斷是否拒絕原假設(shè)。
2.常見檢驗(yàn)
(1)Z檢驗(yàn):大樣本(n≥30)均值的檢驗(yàn)。Z檢驗(yàn)用于檢驗(yàn)總體均值是否等于某個(gè)特定值,當(dāng)樣本量較大時(shí),可以使用Z檢驗(yàn)。Z檢驗(yàn)的公式為:
Z=(x?-μ)/(σ/√n),
其中x?是樣本均值,μ是總體均值,σ是總體標(biāo)準(zhǔn)差,n是樣本量。
(2)t檢驗(yàn):小樣本均值的檢驗(yàn)。t檢驗(yàn)用于檢驗(yàn)總體均值是否等于某個(gè)特定值,當(dāng)樣本量較小時(shí),使用t檢驗(yàn)更合適。t檢驗(yàn)的公式為:
t=(x?-μ)/(s/√n),
其中x?是樣本均值,μ是總體均值,s是樣本標(biāo)準(zhǔn)差,n是樣本量。
(3)χ2檢驗(yàn):方差或頻率數(shù)據(jù)的擬合優(yōu)度檢驗(yàn)。χ2檢驗(yàn)用于檢驗(yàn)樣本數(shù)據(jù)是否來自某個(gè)特定的分布,或者檢驗(yàn)兩個(gè)分類變量之間是否存在關(guān)聯(lián)。χ2檢驗(yàn)的公式為:
χ2=Σ((O-E)2/E),
其中O是觀測(cè)頻數(shù),E是期望頻數(shù)。
四、計(jì)算與軟件應(yīng)用
(一)手工計(jì)算
1.條件:分布參數(shù)明確時(shí)可直接應(yīng)用公式。手工計(jì)算適用于簡(jiǎn)單的分布和樣本量較小的情況。
2.例子:
-二項(xiàng)分布P(X≥2)=1-P(X=0)-P(X=1):假設(shè)n=10,p=0.3,計(jì)算P(X≥2)。
P(X=0)=C(10,0)0.3^0(1-0.3)^(10-0)=0.0282。
P(X=1)=C(10,1)0.3^1(1-0.3)^(10-1)=0.1211。
P(X≥2)=1-0.0282-0.1211=0.8507。
-正態(tài)分布計(jì)算累積概率:假設(shè)μ=50,σ=10,計(jì)算P(X≤60)。
首先將X轉(zhuǎn)換為標(biāo)準(zhǔn)正態(tài)分布:Z=(60-50)/10=1。
查標(biāo)準(zhǔn)正態(tài)分布表,P(Z≤1)=0.8413。
因此,P(X≤60)=0.8413。
(二)軟件工具
1.R語言
(1)代碼示例:
```
生成正態(tài)分布隨機(jī)數(shù)
set.seed(123)設(shè)置隨機(jī)數(shù)種子,確保結(jié)果可重復(fù)
rnorm(100,mean=50,sd=10)生成100個(gè)均值為50,標(biāo)準(zhǔn)差為10的正態(tài)分布隨機(jī)數(shù)
計(jì)算二項(xiàng)分布概率
dbinom(3,size=10,prob=0.3)計(jì)算10次試驗(yàn)中恰好有3次成功的概率,成功概率為0.3
pbinom(3,size=10,prob=0.3)計(jì)算10次試驗(yàn)中成功次數(shù)不超過3次的概率
計(jì)算泊松分布概率
dpois(5,lambda=3)計(jì)算單位時(shí)間內(nèi)恰好有5次事件發(fā)生的概率,平均發(fā)生率為3
ppois(5,lambda=3)計(jì)算單位時(shí)間內(nèi)事件發(fā)生次數(shù)不超過5次的概率
正態(tài)分布累積分布函數(shù)
norm_cdf<-fun
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 二手車交易財(cái)務(wù)制度
- 三資資金財(cái)務(wù)制度
- 上海地區(qū)餐飲財(cái)務(wù)制度
- 對(duì)賬財(cái)務(wù)制度規(guī)定
- 基層自治組織財(cái)務(wù)制度
- 公路工程質(zhì)量檢查、評(píng)定與驗(yàn)收制度
- 公司員工制度
- 工地樣品封存管理制度文庫(3篇)
- 服務(wù)外包人員保密管理制度(3篇)
- 液氨回收施工方案(3篇)
- 電力系統(tǒng)調(diào)頻輔助服務(wù)市場(chǎng)交易實(shí)施細(xì)則
- 風(fēng)電、光伏項(xiàng)目前期及建設(shè)手續(xù)辦理流程匯編
- DB41T 1522-2018 可燃?xì)怏w和有毒氣體報(bào)警儀檢查檢測(cè)技術(shù)規(guī)范
- QBT 1815-2002 指甲鉗行業(yè)標(biāo)準(zhǔn)
- 醫(yī)療機(jī)構(gòu)崗位聘用合同
- DZ∕T 0219-2006 滑坡防治工程設(shè)計(jì)與施工技術(shù)規(guī)范(正式版)
- 2021修訂《城市規(guī)劃設(shè)計(jì)計(jì)費(fèi)指導(dǎo)意見》
- 《建筑施工模板安全技術(shù)規(guī)范》JGJ162-2024解析
- 呂梁職業(yè)技術(shù)學(xué)院?jiǎn)握小队⒄Z》考試復(fù)習(xí)題庫(含答案)
- 服裝店股權(quán)眾籌項(xiàng)目計(jì)劃書
- 西班牙語專業(yè)本科論文模板
評(píng)論
0/150
提交評(píng)論