版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
關(guān)于概率統(tǒng)計建模的理論與方法1第1頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五2一、隨機(jī)變量及其分布
1.二項(xiàng)分布例1.能量供應(yīng)問題
假定有
個工人間歇性地使用電力,估計所需要的總負(fù)荷。
首先我們要知道,或者是假定,每個工人彼此獨(dú)立工作,而每一時刻每個工人都以相同的概率p需要一個單位的電力。那么,同時使用電力的人數(shù)就是一個隨機(jī)變量,它服從所謂的二項(xiàng)分布。用X表示這個隨機(jī)變量,記做,且
這是非常重要的一類概率分布。其中E(X)=np,D(X)=np(1-p)。
第2頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五3
其次,要根據(jù)經(jīng)驗(yàn)來估計出,p值是多少?例如,一個工人在一個小時里有12分鐘在使用電力,那么應(yīng)該有最后,利用公式我們求出隨機(jī)變量X的概率分布表如下:X012345678910P0.1073740.2684350.301990.2013270.088080.0264240.0055050.0007860.0000740.0000040.000000累積概率0.1073740.375810.67780.8791260.9672070.9936310.9991360.9999220.99999611為直觀計,我們給出如下概率分布圖:第3頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五4可以看出,
也就是說,如果供應(yīng)6個單位的電力,則超負(fù)荷工作的概率只有0.000864,即每中,才可能有一分鐘電力不夠用。還可以算出,八個或八個以上工人同時使用電力的概率就更小了,比上面概率的1/11還要小。
問題:二項(xiàng)分布是一個重要的用來計數(shù)的分布。什么樣的隨機(jī)變量會服從二項(xiàng)分布?
進(jìn)行n次獨(dú)立觀測,在每次觀測中所關(guān)心的事件出現(xiàn)的概率都是p,那么在這n次觀測中事件A出現(xiàn)的總次數(shù)是一個服從二項(xiàng)分布B(n,p)。第4頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五5
練習(xí):用MATLAB計算本題binopdf(x,n,p)計算x中每個值對應(yīng)的二項(xiàng)分布概率binocdf(x,n,p)
計算x中每個值對應(yīng)的分布函數(shù)值
例如binopdf(0:10,10,0.2)第5頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五62.Poisson分布例2.Rutherford對裂變物質(zhì)的觀測
英國著名物理學(xué)家Rutherford(1871-1937)在其放射性物質(zhì)試驗(yàn)中,觀測在時間間隔ΔT內(nèi)放射性物質(zhì)放射出的α粒子數(shù)。實(shí)際試驗(yàn)時,取時間間隔為ΔT=7.5秒,觀測了N=2608次,將每次觀測到的粒子數(shù)記錄下來,列在下表中第1,2行:粒子數(shù)X0123456789>=10頻數(shù)n57203383525532408273139452716頻率f0.0218560.0778370.1468560.2013040.2039880.1564420.1046780.0532980.0172550.0103530.006135概率p0.0208580.0807220.1561970.2014940.1949450.1508880.0973230.0538050.0260280.0111920.006547第6頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五7
我們用X表示ΔT=7.5秒內(nèi)觀測到的α粒子數(shù),它是一個隨機(jī)變量,服從什么分布呢?在2608次觀測中,共觀測到10094個α粒子數(shù),平均每次觀測到λ=M÷N=10094÷2608≈3.87個α粒子數(shù),用參數(shù)為λ=3.87的Poisson分布P計算一下:
將計算結(jié)果列在上表中最后一行,與列在第3行的實(shí)際頻率比較,比較的圖示在下圖中。(Excel)第7頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五8
可以看出,認(rèn)為X服從參數(shù)為3.87的Poisson分布還是非常合理的。在后面統(tǒng)計部分,我們會用Pearson-擬合檢驗(yàn)法來證明這種合理性第8頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五9
問題:Poisson分布是又一類非常重要的用來計數(shù)的離散型分布,它依賴于一個參數(shù)。什么樣的隨機(jī)變量會服從Poisson分布呢?練習(xí):用MATLAB計算本題poisspdf(x,λ),計算poisson概率,例如,poisspdf(0:9,3.87)第9頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五10
在給定的觀測范圍內(nèi)(例如給定時間內(nèi),給定區(qū)域內(nèi)等等),事件會發(fā)生多少次?把觀測范圍分成n個小范圍:給定事件在每個小范圍內(nèi)可能發(fā)生,也可能不發(fā)生,發(fā)生多少次取決于小范圍的大??;2.在不同的小范圍內(nèi)發(fā)生多少事件相互獨(dú)立;3.在小范圍里發(fā)生的事件數(shù)多于一個的概率,和小范圍的大小相比可以忽略不計,用表示在小范圍內(nèi)事件發(fā)生一次的概率。
那么在給定范圍內(nèi)發(fā)生的總事件數(shù)X近似服從,
為給定范圍內(nèi)事件發(fā)生次數(shù)的近似平均值。令,則為給定范圍內(nèi)事件發(fā)生次數(shù)的準(zhǔn)確平均值,這時這正是Poisson分布,其中參數(shù)
第10頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五113.正態(tài)分布則稱此隨機(jī)變量服從參數(shù)為的正態(tài)分布,記做
,其中都是給定的參數(shù),
。稱為標(biāo)準(zhǔn)正態(tài)分布,用表示其分布函數(shù),其密度函數(shù)為時,我們有
隨機(jī)變量X如果有密度函數(shù)第11頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五12
大量連續(xù)型隨機(jī)變量服從正態(tài)分布,所以正態(tài)分布在處理數(shù)據(jù)時是非常有用處的。我們在統(tǒng)計部分會大量用到它。下面是正態(tài)分布的密度函數(shù)圖像:第12頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五134.指數(shù)分布
稱隨機(jī)變量X服從參數(shù)為1的指數(shù)分布或標(biāo)準(zhǔn)指數(shù)分布,若它有密度函數(shù)它的分布函數(shù)為第13頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五14設(shè)是給定常數(shù),則Y的分布函數(shù)為其密度函數(shù)為這是一般的指數(shù)分布。第14頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五15b=0的指數(shù)分布的密度函數(shù)圖像如下所示(指數(shù)密度):可見,隨著的減小,隨機(jī)變量取到較大值的概率增加事實(shí)上,隨機(jī)變量的數(shù)學(xué)期望。
指數(shù)隨機(jī)變量經(jīng)常用來刻畫壽命。
第15頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五165.
多維隨機(jī)變量
我們經(jīng)常需要考慮量與量之間的關(guān)系,如果這些量是隨機(jī)變量,那么就需要把多個隨機(jī)變量放在一起,考慮多元隨機(jī)變量。設(shè)是n元隨機(jī)變量,它的分布函數(shù)是一個n元函數(shù):
利用這個分布函數(shù)就可以討論這n個隨機(jī)變量之間各種各樣的關(guān)系。第16頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五17(1)邊際分布與獨(dú)立性相互獨(dú)立當(dāng)且僅當(dāng)(2)相關(guān)系數(shù)
兩個隨機(jī)變量X,Y之間的相關(guān)系數(shù)定義為其中
相關(guān)系數(shù)刻畫了隨機(jī)變量之間的線性相關(guān)程度,越接近于0,線性相關(guān)關(guān)系越弱。第17頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五18
第18頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五19
綜上所述,我們知道在概率論里學(xué)過許多分布,當(dāng)然,還有許多分布我們沒有學(xué)過。但是,在實(shí)踐中我們可能會遇到各種各樣的分布,甚至還有沒被發(fā)現(xiàn)的分布。在處理數(shù)據(jù)的時候,我們要搞清楚:1.數(shù)據(jù)是哪個或哪些指標(biāo)的取值?2.這個或這些指標(biāo)是不是隨機(jī)變量或隨機(jī)向量?3.如果是,那么它服從什么分布?4.用統(tǒng)計方法確定分布?5.分布確定后,用概率方法求出問題的解。下面我們就討論用統(tǒng)計方法確定分布的問題。第19頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五20二、數(shù)據(jù)的統(tǒng)計描述與分析1.經(jīng)驗(yàn)分布函數(shù)和頻率直方圖當(dāng)我們確定討論的指標(biāo)的確是隨機(jī)變量后,剩下的關(guān)鍵任務(wù)就是確定它的分布。那么它的觀測數(shù)據(jù)就是我們賴以解決問題的基本資料,叫做樣本,而這個隨機(jī)變量就叫做總體。這些數(shù)據(jù)反映了該隨機(jī)變量分布的基本特征。我們可以利用這些數(shù)據(jù)構(gòu)造一個分布函數(shù),理論上可以證明它很接近于那個未知分布。這個分布函數(shù)就叫做經(jīng)驗(yàn)分布函數(shù)。第20頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五21
在例2,我們確定所討論的指標(biāo)—在時間間隔ΔT秒內(nèi)放射出的α粒子數(shù)X,是一個隨機(jī)變量。且有該隨機(jī)變量的n=2608個觀測值,這就是一個容量為2608的樣本。在沒有其他信息的情況下,首先應(yīng)該給出該樣本的經(jīng)驗(yàn)分布函數(shù):例6.例2續(xù)(經(jīng)驗(yàn)分布函數(shù))在這里我們可求出這個經(jīng)驗(yàn)分布函數(shù)如下:第21頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五22第22頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五23這個函數(shù)的圖像如下(Poisson2):
如果熟悉Poisson分布的分布函數(shù)圖像的話,就可以從這個圖像判斷出,X可能服從參數(shù)為3.87的Poisson分布。從這個經(jīng)驗(yàn)分布函數(shù)容易解決概率計算問題:第23頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五24
當(dāng)然,由于是離散型的隨機(jī)變量,我們可能更熟悉如下頻率分布圖像:也就是說,對于離散型隨機(jī)變量,我們更常用的方法是繪制這種頻率分布圖。為了判斷分布的類型,對于離散型隨機(jī)變量,要繪制頻率分布圖!作業(yè):用MATLAB計算本例。第24頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五25例7、超市問題(頻率直方圖)隨機(jī)抽取某大學(xué)超市137位顧客的購買金額的實(shí)際記錄(單位:元),數(shù)據(jù)如下。請問購買金額服從什么分布?65.209.9029.7261.1016.9214.3824.1316.9929.334.399.8085.9622.5037.1932.318.4035.0341.706.084.906.2820.401.807.902.5015.0529.2711.1011.0826.1017.5023.0523.123.0012.8813.189.0044.094.0045.4533.6921.9217.003.4016.306.6011.3642.308.007.4014.986.0544.9440.1460.051.5029.5818.306.0031.104.8016.343.2024.536.677.7249.4010.0316.3023.6012.705.0025.357.9264.801.393.0013.600.9020.2027.2021.9313.280.9010.095.0027.4535.604.222.0020.902.0011.078.974.158.703.5017.2460.343.3027.4832.0055.4815.125.6112.400.9511.8018.6037.342.0034.079.1011.590.7028.0013.202.004.503.973.666.253.9019.6016.882.002.8025.162.865.7010.254.059.004.203.501.902.76第25頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五26
用X表示顧客的購買金額,那么它應(yīng)該是一個連續(xù)型的隨機(jī)變量。對于連續(xù)型的隨機(jī)變量,我們一般就不作它的經(jīng)驗(yàn)分布函數(shù)了,而是改作它的頻率直方圖。一般認(rèn)為,X應(yīng)該服從正態(tài)分布,數(shù)學(xué)期望為其實(shí)不然,其頻率直方圖如下圖所示:(超市)第26頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五27它很像參數(shù)為的指數(shù)分布密度函數(shù),如圖中紅色曲線所示。所以我們就認(rèn)為X的分布是這樣的一個指數(shù)分布。例如,給定可以求出
表明該店顧客一次消費(fèi)金額在20元以下的人數(shù)占到近七成。這是什么原因呢?原來這是一家小型社區(qū)超市,人們只來買日用品,不在這里買大件。這對超市的經(jīng)營管理是一個重要信息。對于連續(xù)型隨機(jī)變量,要繪制頻率直方圖!作業(yè):1、用Excel完成本例;2、經(jīng)驗(yàn)分布函數(shù)。第27頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五28
經(jīng)驗(yàn)分布函數(shù)、頻率分布圖和頻率直方圖可以幫助我們了解隨機(jī)變量的類型。當(dāng)我們已經(jīng)了解到隨機(jī)變量的分布類型后,該隨機(jī)變量的分布一般就取決于一個或幾個參數(shù)了。如果知道了這些參數(shù),就可以把分布完全確定下來。那么,如何確定這未知參數(shù)呢?(參數(shù)估計)第28頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五2.常用統(tǒng)計量及其分布第29頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五第30頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五3.幾個在統(tǒng)計中常用的概率分布-4-2024600.050.10.150.20.250.30.350.4(1)正態(tài)分布),(2smN密度函數(shù):222)(21)(smsp--=xexp分布函數(shù):dyexFyx222)(21)(smsp--¥-ò=其中m為均值,2s為方差,+¥<<¥-x.標(biāo)準(zhǔn)正態(tài)分布:N(0,1)密度函數(shù)2221)(xex-=pjdyexyx2221)(-¥-ò=Fp
分布函數(shù)第31頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五第32頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五第33頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五返回F分布F(10,50)的密度函數(shù)曲線第34頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五三、參數(shù)估計第35頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五1.點(diǎn)估計的求法(一)矩估計法第36頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(二)極大似然估計法第37頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五2.區(qū)間估計的求法第38頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五1、已知DX,求EX的置信區(qū)間2.未知方差DX,求EX的置信區(qū)間(一)數(shù)學(xué)期望的置信區(qū)間(二)方差的區(qū)間估計返回第39頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五1.參數(shù)檢驗(yàn):如果觀測的分布函數(shù)類型已知,這時構(gòu)造出的統(tǒng)計量依賴于總體的分布函數(shù),這種檢驗(yàn)稱為參數(shù)檢驗(yàn).
參數(shù)檢驗(yàn)的目的往往是對總體的參數(shù)及其有關(guān)性質(zhì)作出明確的判斷.
對總體X的分布律或分布參數(shù)作某種假設(shè),根據(jù)抽取的樣本觀察值,運(yùn)用數(shù)理統(tǒng)計的分析方法,檢驗(yàn)這種假設(shè)是否正確,從而決定接受假設(shè)或拒絕假設(shè).2.非參數(shù)檢驗(yàn):如果所檢驗(yàn)的假設(shè)并非是對某個參數(shù)作出明確的判斷,因而必須要求構(gòu)造出的檢驗(yàn)統(tǒng)計量的分布函數(shù)不依賴于觀測值的分布函數(shù)類型,這種檢驗(yàn)叫非參數(shù)檢驗(yàn).
如要求判斷總體分布類型的檢驗(yàn)就是非參數(shù)檢驗(yàn).四、假設(shè)檢驗(yàn)第40頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五假設(shè)檢驗(yàn)的一般步驟是:第41頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(一)單個正態(tài)總體均值檢驗(yàn)1、參數(shù)檢驗(yàn)第42頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五第43頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(二)單個正態(tài)總體方差檢驗(yàn)第44頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(三)兩個正態(tài)總體均值檢驗(yàn)第45頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(四)兩個正態(tài)總體方差檢驗(yàn)第46頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五47例9、續(xù)例2(離散型)
例2中認(rèn)為在時間間隔內(nèi)放射性物質(zhì)放射出的α粒子數(shù)X服從Poisson分布,是否合理?我們現(xiàn)在解決這個問題。這是一個非參數(shù)假設(shè)檢驗(yàn)問題,原假設(shè)為
H0:X服從Poisson分布當(dāng)然其對立假設(shè)就是X不服從Poisson分布。2.非參數(shù)檢驗(yàn)第47頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五48檢驗(yàn)的第一步要解決的問題是,如果H0成立,那么它服從參數(shù)為多少的Poisson分布?要先估計未知參數(shù)。因?yàn)檫@時所以用點(diǎn)估計法有,可知如果H0成立,那么
檢驗(yàn)的第二步要解決的問題是,觀測數(shù)據(jù)是否支持原假設(shè)?如果原假設(shè)成立,
那么X的分布如表中1、4行所示,我們可以計算出在總共N=2608次觀測中X取每個值的理論頻數(shù)Npk:粒子數(shù)X012345678910頻數(shù)n57203383525532408273139452716頻率f0.0218560.0778370.1468560.2013040.2039880.1564420.1046780.0532980.0172550.0103530.006135理論概率pk0.0208580.0807220.1561970.2014940.1949450.1508880.0973230.0538050.0260280.0111920.006547理論頻數(shù)Npk54.39863210.5227407.3614525.4962508.4176393.5152253.8173140.324767.8820829.1892917.07489第48頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五49第49頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五50第50頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五51第51頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五52(二)概率紙檢驗(yàn)法
概率紙是一種判斷總體分布的簡便工具.使用它們,可以很快地判斷總體分布的類型.概率紙的種類很多.返回第52頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五五、MATLAB統(tǒng)計工具箱中的基本統(tǒng)計命令1.數(shù)據(jù)的錄入、保存和調(diào)用2.基本統(tǒng)計量3.常見概率分布的函數(shù)4.頻數(shù)直方圖的描繪5.參數(shù)估計6.假設(shè)檢驗(yàn)7.綜合實(shí)例返回第53頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五1.數(shù)據(jù)的錄入、保存和調(diào)用
例1
上海市區(qū)社會商品零售總額和全民所有制職工工資總額的數(shù)據(jù)如下統(tǒng)計工具箱中的基本統(tǒng)計命令第54頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(1)年份數(shù)據(jù)以1為增量,用產(chǎn)生向量的方法輸入。命令格式:x=a:h:bt=78:87(2)分別以x和y代表變量職工工資總額和商品零售總額。
x=[23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4]y=[41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0](3)將變量t、x、y的數(shù)據(jù)保存在文件data中。
savedatatxy
(4)進(jìn)行統(tǒng)計分析時,調(diào)用數(shù)據(jù)文件data中的數(shù)據(jù)。
loaddataToMATLAB(txy)方法1第55頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(1)輸入矩陣:data=[78,79,80,81,82,83,84,85,86,87,88;23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4;41.4,51.8,61.7,67.9,68.7,77.5,95.9,137.4,155.0,175.0](2)將矩陣data的數(shù)據(jù)保存在文件data1中:savedata1data(3)進(jìn)行統(tǒng)計分析時,先用命令:loaddata1
調(diào)用數(shù)據(jù)文件data1中的數(shù)據(jù),再用以下命令分別將矩陣data的第一、二、三行的數(shù)據(jù)賦給變量t、x、y:
t=data(1,:)x=data(2,:)y=data(3,:)若要調(diào)用矩陣data的第j列的數(shù)據(jù),可用命令:
data(:,j)方法2ToMATLAB(data)返回第56頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五2.基本統(tǒng)計量對隨機(jī)變量x,計算其基本統(tǒng)計量的命令如下:均值:mean(x)中位數(shù):median(x)標(biāo)準(zhǔn)差:std(x)
方差:var(x)偏度:skewness(x)
峰度:kurtosis(x)例對例1中的職工工資總額x,可計算上述基本統(tǒng)計量。ToMATLAB(tjl)返回第57頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五3.常見概率分布的函數(shù)Matlab工具箱對每一種分布都提供五類函數(shù),其命令字符為:概率密度:pdf概率分布:cdf逆概率分布:inv均值與方差:stat隨機(jī)數(shù)生成:rnd
(當(dāng)需要一種分布的某一類函數(shù)時,將以上所列的分布命令字符與函數(shù)命令字符接起來,并輸入自變量(可以是標(biāo)量、數(shù)組或矩陣)和參數(shù)即可.)第58頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五在Matlab中輸入以下命令:x=-6:0.01:6;y=normpdf(x);z=normpdf(x,0,2);plot(x,y,x,z)(1)密度函數(shù):p=normpdf(x,mu,sigma)(當(dāng)mu=0,sigma=1時可缺省)ToMATLAB(liti2)如對均值為mu、標(biāo)準(zhǔn)差為sigma的正態(tài)分布,舉例如下:第59頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五ToMATLAB(liti3)(3)逆概率分布:x=norminv(P,mu,sigma).即求出x,使得P{X<x}=P.此命令可用來求分位數(shù).(2)概率分布:P=normcdf(x,mu,sigma)ToMATLAB(liti4)第60頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五ToMATLAB(liti5)(4)均值與方差:[m,v]=normstat(mu,sigma)例5求正態(tài)分布N(3,52)的均值與方差.
命令為:[m,v]=normstat(3,5)
結(jié)果為:m=3,v=25(5)隨機(jī)數(shù)生成:normrnd(mu,sigma,m,n).產(chǎn)生mn階的正態(tài)分布隨機(jī)數(shù)矩陣.例6
命令:M=normrnd([123;456],0.1,2,3)
結(jié)果為:M=0.95672.01252.88543.83345.02886.1191ToMATLAB(liti6)
此命令產(chǎn)生了23的正態(tài)分布隨機(jī)數(shù)矩陣,各數(shù)分別服從N(1,0.12),N(2,22),N(3,32),N(4,0.12),N(5,22),N(6,32)返回第61頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(1)給出數(shù)組data的頻數(shù)表的命令為:
[N,X]=hist(data,k)
此命令將區(qū)間[min(data),max(data)]分為k個小區(qū)間(缺省為10),返回數(shù)組data落在每一個小區(qū)間的頻數(shù)N和每一個小區(qū)間的中點(diǎn)X.(2)描繪數(shù)組data的頻數(shù)直方圖的命令為:
hist(data,k)4.頻數(shù)直方圖的描繪返回第62頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五5.參數(shù)估計(1)正態(tài)總體的參數(shù)估計
設(shè)總體服從正態(tài)分布,則其點(diǎn)估計和區(qū)間估計可同時由以下命令獲得:
[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha)
此命令在顯著性水平alpha下估計數(shù)據(jù)X的參數(shù)(alpha缺省時設(shè)定為0.05),返回值muhat是X的均值的點(diǎn)估計值,sigmahat是標(biāo)準(zhǔn)差的點(diǎn)估計值,muci是均值的區(qū)間估計,sigmaci是標(biāo)準(zhǔn)差的區(qū)間估計.第63頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(2)其它分布的參數(shù)估計
有兩種處理辦法:a.取容量充分大的樣本(n>50),按中心極限定理,它近似地服從正態(tài)分布;b.使用Matlab工具箱中具有特定分布總體的估計命令.(1)[muhat,muci]=expfit(X,alpha)-----
在顯著性水平alpha下,求指數(shù)分布的數(shù)據(jù)X的均值的點(diǎn)估計及其區(qū)間估計.(2)[lambdahat,lambdaci]=poissfit(X,alpha)-----
在顯著性水平alpha下,求泊松分布的數(shù)據(jù)X
的參數(shù)的點(diǎn)估計及其區(qū)間估計.(3)[phat,pci]=weibfit(X,alpha)-----
在顯著性水平alpha下,求Weibull分布的數(shù)據(jù)X
的參數(shù)的點(diǎn)估計及其區(qū)間估計.返回第64頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五6.假設(shè)檢驗(yàn)
在總體服從正態(tài)分布的情況下,可用以下命令進(jìn)行假設(shè)檢驗(yàn).(1)總體方差sigma2已知時,總體均值的檢驗(yàn)使用z-檢驗(yàn)
[h,sig,ci]=ztest(x,m,sigma,alpha,tail)檢驗(yàn)數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中sigma為已知方差,alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于m”tail=1,檢驗(yàn)假設(shè)“x的均值大于m”tail=-1,檢驗(yàn)假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.
返回值h為一個布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci為均值的1-alpha置信區(qū)間.第65頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五
例7Matlab統(tǒng)計工具箱中的數(shù)據(jù)文件gas.mat.中提供了美國1993年一月份和二月份的汽油平均價格(price1,price2分別是一,二月份的油價,單位為美分),它是容量為20的雙樣本.假設(shè)一月份油價的標(biāo)準(zhǔn)偏差是一加侖四分幣(=4),試檢驗(yàn)一月份油價的均值是否等于115.解作假設(shè):m=115.首先取出數(shù)據(jù),用以下命令:
loadgas然后用以下命令檢驗(yàn)
[h,sig,ci]=ztest(price1,115,4)返回:h=0,sig=0.8668,ci=[113.3970116.9030].檢驗(yàn)結(jié)果:1.布爾變量h=0,表示不拒絕零假設(shè).說明提出的假設(shè)均值115
是合理的.2.sig-值為0.8668,遠(yuǎn)超過0.5,不能拒絕零假設(shè)
3.95%的置信區(qū)間為[113.4,116.9],它完全包括115,且精度很高..
ToMATLAB(liti7)第66頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(2)總體方差sigma2未知時,總體均值的檢驗(yàn)使用t-檢驗(yàn)[h,sig,ci]=ttest(x,m,alpha,tail)檢驗(yàn)數(shù)據(jù)x的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于m”tail=1,檢驗(yàn)假設(shè)“x的均值大于m”tail=-1,檢驗(yàn)假設(shè)“x的均值小于m”tail的缺省值為0,alpha的缺省值為0.05.
返回值h為一個布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci為均值的1-alpha置信區(qū)間.第67頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五返回:h=1,sig=4.9517e-004,ci=[116.8120.2].檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)油價均值115是不合理的.2.95%的置信區(qū)間為[116.8120.2],它不包括
115,故不能接受假設(shè).3.sig-值為4.9517e-004,遠(yuǎn)小于0.5,不能接受零假設(shè).ToMATLAB(liti8)例8試檢驗(yàn)例8中二月份油價Price2的均值是否等于115.解作假設(shè):m=115,price2為二月份的油價,不知其方差,故用以下命令檢驗(yàn)[h,sig,ci]=ttest(price2,115)第68頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(3)兩總體均值的假設(shè)檢驗(yàn)使用t-檢驗(yàn)
[h,sig,ci]=ttest2(x,y,alpha,tail)檢驗(yàn)數(shù)據(jù)x,y的關(guān)于均值的某一假設(shè)是否成立,其中alpha為顯著性水平,究竟檢驗(yàn)什么假設(shè)取決于tail的取值:tail=0,檢驗(yàn)假設(shè)“x的均值等于y的均值”tail=1,檢驗(yàn)假設(shè)“x的均值大于y的均值”tail=-1,檢驗(yàn)假設(shè)“x的均值小于y的均值”tail的缺省值為0,alpha的缺省值為0.05.
返回值h為一個布爾值,h=1表示可以拒絕假設(shè),h=0表示不可以拒絕假設(shè),sig為假設(shè)成立的概率,ci為與x與y均值差的的1-alpha置信區(qū)間.第69頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五返回:h=1,sig=0.0083,ci=[-5.8,-0.9].檢驗(yàn)結(jié)果:1.布爾變量h=1,表示拒絕零假設(shè).說明提出的假設(shè)“油價均值相同”是不合理的.2.95%的置信區(qū)間為[-5.8,-0.9],說明一月份油價比二月份油價約低1至6分.3.sig-值為0.0083,遠(yuǎn)小于0.5,不能接受“油價均相同”假設(shè).ToMATLAB(liti9)例9試檢驗(yàn)例8中一月份油價Price1與二月份的油價Price2均值是否相同.解用以下命令檢驗(yàn)[h,sig,ci]=ttest2(price1,price2)第70頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五(4)非參數(shù)檢驗(yàn):總體分布的檢驗(yàn)Matlab工具箱提供了兩個對總體分布進(jìn)行檢驗(yàn)的命令:(1)h=normplot(x)(2)h=weibplot(x)
此命令顯示數(shù)據(jù)矩陣x的正態(tài)概率圖.如果數(shù)據(jù)來自于正態(tài)分布,則圖形顯示出直線性形態(tài).而其它概率分布函數(shù)顯示出曲線形態(tài).
此命令顯示數(shù)據(jù)矩陣x的Weibull概率圖.如果數(shù)據(jù)來自于Weibull分布,則圖形將顯示出直線性形態(tài).而其它概率分布函數(shù)將顯示出曲線形態(tài).返回第71頁,共77頁,2022年,5月20日,3點(diǎn)59分,星期五例10
一道工序用自動化車床連續(xù)加工某種零件,由于刀具損壞等會出現(xiàn)故障.故障是完全隨機(jī)的,并假定生產(chǎn)任一零件時出現(xiàn)故障機(jī)會均相同.工作人員是通過檢查零件來確定工序是否出現(xiàn)故障的.現(xiàn)積累有100次故障紀(jì)錄,故障出現(xiàn)時該刀具完成的零件數(shù)如下:
45936262454250958443374881550561245243498264074256570659368092665316448773460842811535938445275525137814743888245388626597758597554969751562895477160940296088561029283747367735863869963455557084416
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 養(yǎng)老院防疫培訓(xùn)考核制度
- 2026年生化檢驗(yàn)技師面試問題及答案
- 干部培訓(xùn)獎勵制度規(guī)定
- 工會聯(lián)合會干部培訓(xùn)制度
- 家長學(xué)校培訓(xùn)服務(wù)制度
- 科室年度業(yè)務(wù)培訓(xùn)制度
- 鑄造企業(yè)安全培訓(xùn)制度
- 2026年餐飲業(yè)經(jīng)營與管理餐飲部經(jīng)理面試題集
- 技術(shù)培訓(xùn)交底制度
- 學(xué)校培訓(xùn)經(jīng)費(fèi)制度
- 2025年6月大學(xué)英語四級閱讀試題及答案
- 信訪工作系列知識培訓(xùn)課件
- 壓力變送器拆校課件
- 2025年高考真題分類匯編必修二 《經(jīng)濟(jì)與社會》(全國)(原卷版)
- 支撐粱施工方案
- 2026屆高考英語二輪復(fù)習(xí):2025浙江1月卷讀后續(xù)寫 課件
- 2.3.2 中國第一大河-長江 課件 湘教版地理八年級上冊
- 2025貴州省某大型國有企業(yè)招聘光伏、風(fēng)電項(xiàng)目工作人員筆試備考題庫及答案解析
- 導(dǎo)致老年人跌倒的用藥風(fēng)險研究
- GB 21256-2025粗鋼生產(chǎn)主要工序單位產(chǎn)品能源消耗限額
- 經(jīng)顱磁刺激在神經(jīng)疾病治療中的應(yīng)用
評論
0/150
提交評論