項(xiàng)目七概率論,數(shù)據(jù)統(tǒng)計(jì)與區(qū)間估計(jì)_第1頁(yè)
項(xiàng)目七概率論,數(shù)據(jù)統(tǒng)計(jì)與區(qū)間估計(jì)_第2頁(yè)
項(xiàng)目七概率論,數(shù)據(jù)統(tǒng)計(jì)與區(qū)間估計(jì)_第3頁(yè)
項(xiàng)目七概率論,數(shù)據(jù)統(tǒng)計(jì)與區(qū)間估計(jì)_第4頁(yè)
項(xiàng)目七概率論,數(shù)據(jù)統(tǒng)計(jì)與區(qū)間估計(jì)_第5頁(yè)
已閱讀5頁(yè),還剩18頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、項(xiàng)目七 概率論、數(shù)據(jù)統(tǒng)計(jì)與區(qū)間估計(jì)實(shí)驗(yàn)1 概率模型實(shí)驗(yàn)?zāi)康?通過(guò)將隨機(jī)試驗(yàn)可視化, 直觀地理解概率論中的一些基本概念, 從頻率與概率的關(guān)系來(lái)體會(huì)概率的統(tǒng)計(jì)定義, 并初步體驗(yàn)隨機(jī)模擬方法. 通過(guò)圖形直觀理解隨機(jī)變量及其概率分布的特點(diǎn).基本命令1.調(diào)用統(tǒng)計(jì)軟包的命令進(jìn)行統(tǒng)計(jì)數(shù)據(jù)的處理, 必須調(diào)用相應(yīng)的軟件包, 首先要輸入并執(zhí)行命令<<statistics以完成數(shù)據(jù)統(tǒng)計(jì)的準(zhǔn)備工作.2.調(diào)用作圖軟件包的命令<<GraphicsGraphics.m用Mathematica作直方圖, 必須調(diào)用相應(yīng)的作圖軟件包, 輸入并執(zhí)行<<Graphics這時(shí)可以查詢這個(gè)軟件包中的一

2、些作圖命令的用法. 如輸入?BarChart則得到命令BarChart的用法說(shuō)明; 如果沒(méi)有, 則說(shuō)明調(diào)用軟件包不成功, 必須重新啟動(dòng)計(jì)算機(jī), 再次調(diào)用軟件包.實(shí)驗(yàn)舉例頻率與概率例1.1(高爾頓釘板實(shí)驗(yàn))自高爾頓釘板上端放一個(gè)小球, 任其自由下落. 在其下落過(guò)程中, 當(dāng)小球碰到釘子時(shí)從左邊落下的概率為p, 從右邊落下的概率為碰到下一排釘子又是如此, 最后落到底板中的某一格子. 因此任意放入一球, 則此球落入哪個(gè)格子事先難以確定. 設(shè)橫排共有排釘子, 下面進(jìn)行模擬實(shí)驗(yàn):(1) 取自板上端放入一個(gè)小球, 觀察小球落下的位置; 將該實(shí)驗(yàn)重復(fù)作5次, 觀察5次實(shí)驗(yàn)結(jié)果的共性及每次實(shí)驗(yàn)結(jié)果的偶然性;(2

3、) 分別取自板上端放入n個(gè)小球, 取 觀察n個(gè)小球落下后呈現(xiàn)的曲線.作出不同p值下5000個(gè)小球落入各個(gè)格子的頻數(shù)的直方圖, 輸入<<Statistics<<GraphicsGraphicsGaltonn_Integer,m_Integer,p_:=Module,dist=;Forl=1,l<=n,l+,k=0;t=TableRandomBernoulliDistributionp,i,1,m;DoIfti=1,k+,k-,i,1,m;dist=Appenddist,k;pp=Frequenciesdist;Histogramdist,BarStyle->R

4、GBColor0,0,1;p=0.15;n=5000;m=20;Galtonn,m,pp=0.5;n=5000;m=20;Galtonn,m,pp=0.85;n=5000;m=20;Galtonn,m,p則輸出p=0.15p=0.5p=0.85圖1-1 由圖1-1可見(jiàn): 若小球碰釘子后從兩邊落下的概率發(fā)生變化, 則高爾頓釘板實(shí)驗(yàn)中小球落入各個(gè)格子的頻數(shù)發(fā)生變化, 從而頻率也相應(yīng)地發(fā)生變化. 而且, 當(dāng)曲線峰值的格子位置向右偏; 當(dāng)曲線峰值的格子位置向左偏.幾何概型例1.2 甲、乙二人約定八點(diǎn)到九點(diǎn)在某地會(huì)面, 先到者等20分鐘離去, 試求兩人能會(huì)面的概率.由于甲、乙二人在0,60時(shí)間區(qū)間中任何

5、時(shí)刻到達(dá)是等可能的, 若以X,Y分別代表甲乙二人到達(dá)的時(shí)刻, 則每次試驗(yàn)相當(dāng)于在邊長(zhǎng)為60的正方形區(qū)域中取一點(diǎn).設(shè)到達(dá)時(shí)刻互不影響, 因此在區(qū)域內(nèi)取點(diǎn)的可能性只與區(qū)域的面積大小成正比, 而與其形狀、位置無(wú)關(guān). 于是, 會(huì)面問(wèn)題可化為向區(qū)域隨機(jī)投點(diǎn)的問(wèn)題. 所關(guān)心的事件“二人能會(huì)面”可表示為 (圖1-2)于是, 所求概率的理論值為(A的面積)/(的面積)圖1-2下面, 我們作如下模擬試驗(yàn):(1) 模擬向有界區(qū)域投點(diǎn)n次的隨機(jī)試驗(yàn), 取, 統(tǒng)計(jì)每次投點(diǎn)是否落在圖1-2所示區(qū)域A中, 若是則計(jì)數(shù)1次.(2) 改變投點(diǎn)數(shù)統(tǒng)計(jì)落入?yún)^(qū)域A的次數(shù).輸入meetn_Integer:=Modulex,xk_:=

6、xk=AbsRandomInteger,0,60-RandomInteger,0,60;pile=Tablexk,k,1,n;times=Countpile,x_/;0<=x<=20;Printtimes;frequence=Ntimes/nn=100;meetnn=1000;meetnn=5000;meetnn=10000;meetn則輸出所求結(jié)果, 為方便比較, 將輸出結(jié)果列于表1-1中表1-1約會(huì)次數(shù)約會(huì)成功次數(shù)約會(huì)成功頻率理論約會(huì)成功概率100580.5810005570.5570.556500028420.56841000055290.5529 從上表結(jié)果可見(jiàn), 當(dāng)約會(huì)次

7、數(shù)越來(lái)越大時(shí), 試驗(yàn)約會(huì)成功頻率與理論約會(huì)成功概率越來(lái)越接近.離散型隨機(jī)變量及其概率分布例1.3(二項(xiàng)分布)利用Mathematica繪出二項(xiàng)分布的概率分布與分布函數(shù)的圖形, 通過(guò)觀察圖形, 進(jìn)一步理解二項(xiàng)分布的概率分布與分布函數(shù)的性質(zhì).設(shè), 輸入<<Statistics<<GraphicsGraphicsn=20;p=0.2;dist=BinomialDistributionn,p;t=TablePDFdist,x+1,x,x,0,20;g1=BarChartt,PlotRange->All;g2=PlotEvaluateCDFdist,x,x,0,20,Plo

8、tStyle->Thickness0.008,RGBColor0,0,1;t=Tablex,PDFdist,x,x,0,20;gg1=ListPlott,PlotStyle->PointSize0.03,DisplayFunction->Identity;gg2=ListPlott,PlotJoined->True,DisplayFunction->Identity;p1=Showgg1,gg2,g1,DisplayFunction->$DisplayFunction,PlotRange->All;則分別輸出二項(xiàng)分布概率分布圖形(圖1-3)與分布函數(shù)圖

9、形(圖1-4).圖1-3 圖1-4從圖1-3可見(jiàn), 概率隨著的增加,先是隨之增加, 直到達(dá)到最大值, 隨后單調(diào)減少. 而從圖1-4可見(jiàn), 分布函數(shù)的值實(shí)際上是的累積概率值.通過(guò)改變與的值, 讀者可以利用上述程序觀察二項(xiàng)分布的概率分布與分布函數(shù)隨著與而變化的各種情況, 從而進(jìn)一步加深對(duì)二項(xiàng)分布及其性質(zhì)的理解.連續(xù)型隨機(jī)變量及其概率密度函數(shù)例1.4 (正態(tài)分布)利用Mathematica繪出正態(tài)分布的概率密度曲線以及分布函數(shù)曲線, 通過(guò)觀察圖形, 進(jìn)一步理解正態(tài)分布的概率分布與分布函數(shù)的性質(zhì). (1) 固定 取 觀察參數(shù)對(duì)圖形的影響, 輸入<<Statistics<<Gra

10、phicsGraphicsdist=NormalDistribution0,1;dist1=NormalDistribution-2,1;dist2=NormalDistribution2,1;PlotPDFdist1,x,PDFdist2,x,PDFdist,x,x,-6,6,PlotStyle->Thickness0.008,RGBColor0,0,1,PlotRange->All;PlotCDFdist1,x,CDFdist2,x,CDFdist,x,x,-6,6,PlotStyle->Thickness0.008,RGBColor1,0,0;則分別輸出相應(yīng)參數(shù)的正態(tài)分

11、布的概率密度曲線(圖1-5)及分布函數(shù)曲線(圖1-6).圖1-5 圖1-6從圖1-5可見(jiàn):(a) 概率密度曲線是關(guān)于對(duì)稱的鐘形曲線, 即呈現(xiàn)“兩頭小, 中間大, 左右對(duì)稱”的特點(diǎn).(b) 當(dāng)時(shí), 取得最大值, 向左右伸展時(shí), 越來(lái)越貼近x軸.(c) 當(dāng)變化時(shí), 圖形沿著水平軸平移, 而不改變形狀, 可見(jiàn)正態(tài)分布概率密度曲線的位置完全由參數(shù)決定, 所以稱為位置參數(shù).(2) 固定, 取觀察參數(shù)對(duì)圖形的影響, 輸入dist=NormalDistribution0,0.52; dist1=NormalDistribution0,1; dist2=NormalDistribution0,1.52; Pl

12、otPDFdist1,x,PDFdist2,x,PDFdist,x,x,-6,6, PlotStyle->Thickness0.008,RGBColor0,0,1,PlotRange->All; PlotCDFdist1,x,CDFdist2,x,CDFdist,x,x,-6,6, PlotStyle->Thickness0.008,RGBColor1,0,0,PlotRange->All;則分別輸出相應(yīng)參數(shù)的正態(tài)分布的概率密度曲線(圖1-7)及分布函數(shù)曲線(圖1-8)圖1-7 圖1-8 從圖1-7與圖1-8可見(jiàn): 固定, 改變時(shí), 越小, 在0附近的概率密度圖形就變得

13、越尖, 分布函數(shù)在0的附近增值越快; 越大, 概率密度圖形就越平坦, 分布函數(shù)在0附近的增值也越慢, 故決定了概率密度圖形中峰的陡峭程度; 另外, 不管如何變化, 分布函數(shù)在0點(diǎn)的值總是0.5, 這是因?yàn)楦怕拭芏葓D形關(guān)于對(duì)稱.通過(guò)改變與的值, 讀者可以利用上述程序觀察正態(tài)分布的概率分布與分布函數(shù)隨著與而變化的各種情況, 從而進(jìn)一步加深對(duì)正態(tài)分布及其性質(zhì)的理解.隨機(jī)變量函數(shù)的分布例1.5 設(shè)X,Y相互獨(dú)立, 都服從(0,1)上的均勻分布, 求的概率密度.理論上, 我們可用卷積公式直接求出的密度函數(shù):下面, 我們作如下模擬試驗(yàn):(1) 產(chǎn)生兩組服從(0,1)上均勻分布的相互獨(dú)立的隨機(jī)數(shù) 取計(jì)算(2

14、) 用數(shù)據(jù)作頻率直方圖, 并在同一坐標(biāo)系內(nèi)畫出用卷積公式求得的密度函數(shù)圖形作比較.輸入<<StatisticsClearg1,t,t1,t2;t=;n=1000;g1x_:=50*Which0<=x<=1,x,1<=x<=2,2-x,True,0;pic1=Plotg1x,x,0,2,PlotStyle->Thickness0.01,RGBColor0,0,1;t1=RandomArrayUniformDistribution0,1,n;t2=RandomArrayUniformDistribution0,1,n;Dot=Appendt,t1i+t2i

15、,i,n;p1=Histogramt;Showpic1,p1,DisplayFunction->$DisplayFunction;則在同一坐標(biāo)系中輸出所求頻率直方圖與密度函數(shù)的圖形(圖1-9). 圖1-9中心極限定理的直觀演示例1.6 本例旨在直觀演示中心極限定理的基本結(jié)論: “大量獨(dú)立同分布隨機(jī)變量的和的分布近似服從正態(tài)分布”. 按以下步驟設(shè)計(jì)程序:(1) 產(chǎn)生服從二項(xiàng)分布的個(gè)隨機(jī)數(shù), 取, , 計(jì)算個(gè)隨機(jī)數(shù)之和以及; (2) 將(1)重復(fù)組, 并用這組的數(shù)據(jù)作頻率直方圖進(jìn)行觀察. 輸入<<statistics<<GraphicsGraphicsm=1000;n

16、=50;p=0.2;t=;dist=;Fori=1,i<=m,i+,dist=RandomArrayBinomialDistribution10,p,n;ysum=CumulativeSumsdist;nasum=(ysumn-10*n*p)/Sqrtn*10*p*(1-p);t=Appendt,nasum;Histogramt,FrequencyData->False;則輸出圖1-10. 圖1-10從圖1-10可見(jiàn), 當(dāng)原始分布是二項(xiàng)分布, 比較大時(shí), 個(gè)獨(dú)立同分布的的隨機(jī)變量之和的分布近似于正態(tài)分布.實(shí)驗(yàn)習(xí)題1. (拋硬幣實(shí)驗(yàn)) 模擬拋擲一枚均勻硬幣的隨機(jī)實(shí)驗(yàn)(可用0-1隨機(jī)數(shù)

17、來(lái)模擬實(shí)驗(yàn)結(jié)果), 取模擬n次擲硬幣的隨機(jī)實(shí)驗(yàn). 記錄實(shí)驗(yàn)結(jié)果, 觀察樣本空間的確定性及每次實(shí)驗(yàn)結(jié)果的偶然性, 統(tǒng)計(jì)正面出現(xiàn)的次數(shù), 并計(jì)算正面出現(xiàn)的頻率. 對(duì)不同的實(shí)驗(yàn)次數(shù)n進(jìn)行實(shí)驗(yàn), 記錄下實(shí)驗(yàn)結(jié)果,通過(guò)比較實(shí)驗(yàn)的結(jié)果, 你能得出什么結(jié)論?2. (抽簽實(shí)驗(yàn)) 有十張外觀相同的撲克牌, 其中有一張是大王, 讓十人按順序每人隨機(jī)抽取一張, 討論誰(shuí)先抽出大王.甲方認(rèn)為: 先抽的人比后抽的人機(jī)會(huì)大.乙方認(rèn)為: 不論先后, 他們抽到大王的機(jī)會(huì)是一樣的. 究竟他們誰(shuí)說(shuō)的對(duì)?3. (泊松分布) 利用Mathematica在同一坐標(biāo)系下繪出取不同值時(shí)泊松分布的概率分布曲線, 通過(guò)觀察輸出的圖形, 進(jìn)一步理

18、解泊松分布的概率分布的性質(zhì).4. (二項(xiàng)分布的正態(tài)分布逼近) 用正態(tài)分布逼近給出二項(xiàng)分布 , 并將得到的近似值與它的精確值比較.實(shí)驗(yàn)2 數(shù)據(jù)統(tǒng)計(jì)實(shí)驗(yàn)?zāi)康?掌握利用Mathematica求來(lái)自某個(gè)總體的一個(gè)樣本的樣本均值、中位數(shù)、樣本方差、偏度、峰度、樣本分位數(shù)和其它數(shù)字特征, 并能由樣本作出直方圖.基本命令1.求樣本數(shù)字特征的命令(1) 求樣本list均值的命令Meanlist;(2) 求樣本list的中位數(shù)的命令Medianlist;(3) 求樣本list的最小值的命令Minlist;(4) 求樣本list的最大值的命令Maxlist;(5) 求樣本list方差的命令Variance lis

19、t;(6) 求樣本list的標(biāo)準(zhǔn)差的命令StandardDeviationlist;(7) 求樣本list的分位數(shù)的命令Quantilelist,;(8) 求樣本list的階中心矩的命令CentralMomentlist,n.2.求分組后各組內(nèi)含有的數(shù)據(jù)個(gè)數(shù)的命令BinCounts基本格式為BinCounts數(shù)據(jù),最小值,最大值,增量例如,輸入BinCounts1,1,2,3,4,4,5,15,6,7,8,8,8,9,10,13,0,15,3則輸出4,4,5,1,2它表示落入?yún)^(qū)間的數(shù)據(jù)個(gè)數(shù)分別是4, 4, 5, 1, 2.注: 每個(gè)區(qū)間是左開右閉的.3.作條形圖的命令BarChart基本格式為

20、BarChart數(shù)據(jù),選項(xiàng)1,選項(xiàng)2,其中數(shù)據(jù)是,或的形式.而為條形的高度,為條形的中心.在數(shù)據(jù)為的形式時(shí)默認(rèn)條形的中心是.常用選項(xiàng)有BarSpacing數(shù)值1,BarGroupSpacing數(shù)值2.例如, 輸入BarChart4,1.5,4,4.5,5,7.5,1.10,5,2,13.5,BarGroupSpacing->0.1則輸出如圖2-1的條形圖. 圖2-1實(shí)驗(yàn)舉例樣本的數(shù)據(jù)統(tǒng)計(jì)例2.1 在某工廠生產(chǎn)的某種型號(hào)的圓軸中任取20個(gè),測(cè)得其直徑數(shù)據(jù)如下:15.28,15.63,15.13,15.46,15.40,15.56,15.35,15.56,15.38,15.21,15.48,

21、15.58,15.57,15.36,15.48,15.46.15.52,15.29,15.42,15.69求上述數(shù)據(jù)的樣本均值,中位數(shù),四分位數(shù);樣本方差,極差,變異系數(shù),二階、三階和四階中心矩;求偏度,峰度,并把數(shù)據(jù)中心化和標(biāo)準(zhǔn)化.輸入<<Statisticsdata1=15.28,15.63,15.13,15.46,15.40,15.56,15.35,15.56,15.38,15.21,15.48,15.58,15.57,15.36,15.48,15.46, 15.52,15.29,15.42,15.69; (*數(shù)據(jù)集記為datal*)Meandata1 (*求樣本均值*)Me

22、diandata1 (*求樣本中位數(shù)*)Quartilesdata1 (*求樣本的0.25分位數(shù), 中位數(shù), 0.75分位數(shù)*)Quantiledata1,0.05 (*求樣本的0.05分位數(shù)*)Quantiledata1,0.95 (*求樣本的0.95分位數(shù)*)則輸出15.440515.4615.355,15.46,15.5615.1315.63即樣本均值為15.4405,樣本中位數(shù)為15.46,樣本的0.25分位數(shù)為15.355,樣本的0.75分位數(shù)15.56, 樣本的0.05分位數(shù)是15.13, 樣本的0.95分位數(shù)是15.63.輸入Variancedata1 (*求樣本方差*)Stan

23、dardDeviationdata1 (*求樣本標(biāo)準(zhǔn)差*)VarianceMLEdata1 (*求樣本方差*)StandardDeviationMLEdata1 (*求樣本標(biāo)準(zhǔn)差*)SampleRangedata1 (*求樣本極差*)則輸出0.0206050.1435440.01957480.139910.56即樣本方差為0.020605, 樣本標(biāo)準(zhǔn)差為0.143544, 樣本方差為0.0195748 樣本標(biāo)準(zhǔn)差為0.13991, 極差為0.56.注: Variance給出的是無(wú)偏估計(jì)時(shí)的方差, 其計(jì)算公式為, 而VarianceMLE給出的是總體方差的極大似然估計(jì), 其計(jì)算公式為,它比前者稍

24、微小些. 輸入CoefficientOfVariationdata1(*求變異系數(shù).變異系數(shù)的定義是樣本標(biāo)準(zhǔn)差與樣本均值之比*)則輸出0.00929662輸入CentralMomentdata1,2(*求樣本二階中心矩*)CentralMomentdata1,3 (*求樣本三階中心矩*)CentralMomentdata1,4 (*求樣本四階中心矩*)輸出為0.0195748-0.001000410.000984863 輸入Skewnessdata1(*求偏度,偏度的定義是三階中心矩除以標(biāo)準(zhǔn)差的立方*)Kurtosisdata1(*求峰度,峰度的定義是四階中心矩除以方差的平方*)則輸出-0.3

25、652872.5703上述結(jié)果表明:數(shù)據(jù)(data1)的偏度(Skewness)是-0.365287,負(fù)的偏度表明總體分布密度有較長(zhǎng)的右尾,即分布向左偏斜.數(shù)據(jù)(data1)的峰度(Kurtosis)為2.5703. 峰度大于3時(shí)表明總體的分布密度比有相同方差的正態(tài)分布的密度更尖銳和有更重的尾部. 峰度小于3時(shí)表明總體的分布密度比正態(tài)分布的密度更平坦或者有更粗的腰部.輸入ZeroMeandata1(*把數(shù)據(jù)中心化,即每個(gè)數(shù)據(jù)減去均值*)則輸出-0.1605,0.1895,-0.3105,0.0195,-0.0405,0.1195,-0.0905,0.1195,-0.0605,-0.2305,0

26、.0395,0.1395,0.1295,-0.0805,0.0395,0.0195,0.0795,-0.1505,-0.0205,0.2495輸入Standardizedata1(*把數(shù)據(jù)標(biāo)準(zhǔn)化,即每個(gè)數(shù)據(jù)減去均值,再除以標(biāo)準(zhǔn)差,從而使新的數(shù)據(jù)的均值為0,方差為1*)則輸出-1.11812,1.32015,-2.16309,0.135846,-0.282143,0.832495,-0.630467,0.832495,-0.421472,-1.60577,0.275176, 0.971825,0.90216,-0.560802,0.275176,0.135846, 0.553836,-1.048

27、46,-0.142813,1.73814讀者可驗(yàn)算上述新數(shù)據(jù)的均值為0,標(biāo)準(zhǔn)差為1.作樣本的直方圖例2.2 從某廠生產(chǎn)的某種零件中隨機(jī)抽取120個(gè), 測(cè)得其質(zhì)量(單位:g)如表2-1所示.列出分組表, 并作頻率直方圖. 表2-1 200 202 203 208 216 206 222 213 209 219 216 203 197 208 206 209 206 208 202 203 206 213 218 207 208 202 194 203 213 211 193 213 208 208 204 206 204 206 208 209213 203 206 207 196 201 20

28、8 207 213 208 210 208 211 211 214 220 211 203 216 221 211 209 218 214 219 211 208 221 211 218 218 190 219 211 208 199 214 207 207 214 206 217 214 201 212 213 211 212 216 206 210 216 204 221 208 209 214 214 199 204 211 201 216 211 209 208 209 202 211 207 220 205 206 216 213 206 206 207 200 198輸入<&

29、lt;Statistics<<Graphicsdata2=200, 202, 203, 208, 216, 206, 222, 213, 209, 219, 216, 203, 197, 208, 206, 209, 206, 208, 202, 203, 206, 213, 218, 207, 208, 202, 194, 203, 213, 211, 193, 213, 208, 208, 204, 206, 204, 206, 208, 209,213, 203, 206, 207, 196, 201, 208, 207, 213, 208, 210, 208, 211, 2

30、11, 214, 220, 211, 203, 216, 221, 211, 209, 218, 214, 219, 211, 208, 221, 211, 218, 218, 190, 219, 211, 208, 199, 214, 207, 207, 214, 206, 217, 214, 201, 212, 213, 211, 212, 216, 206, 210, 216, 204, 221, 208, 209, 214, 214, 199, 204, 211, 201, 216, 211, 209, 208, 209, 202, 211, 207,220, 205, 206, 21

31、6, 213, 206, 206, 207, 200, 198;先求數(shù)據(jù)的最小和最大值.輸入Mindata2Maxdata2得到最小值190,最大值222.取區(qū)間189.5,222.5,它能覆蓋所有數(shù)據(jù).將189.5,222.5等分為11個(gè)小區(qū)間,設(shè)小區(qū)間的長(zhǎng)度為3.0.數(shù)出落在每個(gè)小區(qū)內(nèi)的數(shù)據(jù)個(gè)數(shù),即頻數(shù),這可以由BinCount命令來(lái)完成. 輸入f1=BinCountsdata2,189.5,222.5,3則輸出1,2,3,7,14,20,23,22,14,8,6輸入gc=Table189.5+j*3-1.5,j,1,11(*產(chǎn)生11個(gè)小區(qū)間的中心的集合gc*)bc=Transposef1

32、/Lengthdata2,gc(*Lengthdata2為數(shù)據(jù)data2的總個(gè)數(shù)即樣本的容量n, f1/Lengthdata2為頻率fi/n,Transpose是求矩陣轉(zhuǎn)置的命令,這里bc為數(shù)據(jù)對(duì),第一個(gè)數(shù)是頻率,第二個(gè)是組中心*)則輸出結(jié)果輸入作頻率對(duì)組中心的條形圖命令BarChartbc則輸出所求條形圖(圖2-2).圖2-2實(shí)驗(yàn)習(xí)題1.在某省一“夫妻對(duì)電視傳播媒介觀念的研究”項(xiàng)目中,訪問(wèn)了30對(duì)夫妻,其中丈夫所受教育(單位:年)的數(shù)據(jù)如下:18,20,16,6,16,17,12,14,16,18,14,14,16,9,20,18,12,15,13,16,16,21,21,9,16,20,1

33、4,14,16,16(1) 求樣本均值、中位數(shù)、四分位數(shù);樣本方差、樣本標(biāo)準(zhǔn)差、極差、變異系數(shù),二階、三階和四階中心矩;求偏度、峰度。(2) 將數(shù)據(jù)分組,使組中值分別為6,9,12,15,18,21作出的頻數(shù)分布表; 作出頻率分布的直方圖.2.下面列出84個(gè)伊特拉斯坎男子頭顱的最大寬度(單位:mm),對(duì)數(shù)據(jù)分組,并作直方圖.141 148 132 138 154 142 150 146 155 158 150 140 147 148 144 150 149 145 149 158 143 141 144 144 126 140 144 142 141 140 145 135 147 146 1

34、41 136 140 146 142 137 148 154 137 139 143 140 131 143 141 149 148 135 148 152 143 144 141 143 147 146 150 132 142 142 143 153 149 146 149 138 142 149 142 137 134 144 146 147 140 142140 137 152 1453.下面的數(shù)據(jù)是某大學(xué)某專業(yè)50名新生在數(shù)學(xué)素質(zhì)測(cè)驗(yàn)中所得到的分?jǐn)?shù):88,74,67,49,69,38,86,77,66,75,94,67,78,69,84,50,39,58,79,70,90,79,97,

35、75,98,77,64,69,82,71,65,68,84,73,58,78,75,89,91,62,72,74,81,79,81,86,78,90,81,62將這組數(shù)據(jù)分成68個(gè)組,畫出頻率直方圖,并求出樣本均值、樣本方差,以及偏度、峰度.實(shí)驗(yàn)3 區(qū)間估計(jì)實(shí)驗(yàn)?zāi)康?掌握利用Mathematica軟件求一個(gè)正態(tài)總體的均值、方差的置信區(qū)間的方法;求兩個(gè)正態(tài)總體的均值差和方差比的置信區(qū)間的方法. 通過(guò)實(shí)驗(yàn)加深對(duì)統(tǒng)計(jì)推斷的基本概念的和基本思想的理解.基本命令1.調(diào)用區(qū)間估計(jì)軟件包的命令<<StatisticsConfidenceIntervals.m用Mathematica作區(qū)間估計(jì),

36、必須先調(diào)用相應(yīng)的軟件包. 要輸入并執(zhí)行命令<<Statistics或<<StatisticsConfidenceIntervals.m2.求單正態(tài)總體求均值的置信區(qū)間的命令MeanCi命令的基本格式為MeanCI樣本觀察值, 選項(xiàng)1, 選項(xiàng)2,其中選項(xiàng)1用于選定置信度, 形式為ConfidenceLevel->, 缺省默認(rèn)值為ConfidenceLeve1->0.95. 選項(xiàng)2用于說(shuō)明方差是已知還是未知,其形式為knownVariance->None或, 缺省默認(rèn)值為knownVariance->None. 也可以用說(shuō)明標(biāo)準(zhǔn)差的選項(xiàng)knownSt

37、andardDeviation->None或來(lái)代替這個(gè)選項(xiàng).3. 求雙正態(tài)總體求均值差的置信區(qū)間的命令MeanDifferenceCI命令的基本格式為MeanDifferenceCI樣本1的觀察值, 樣本2的觀察值,選項(xiàng)1,選項(xiàng)2,選項(xiàng)3,其中選項(xiàng)1用于選定置信度, 規(guī)定同2中的說(shuō)明. 選項(xiàng)2用于說(shuō)明兩個(gè)總體的方差是已知還是未知, 其形式為knownVariance->或或None, 缺省默認(rèn)值為knownVariance->None. 選項(xiàng)3用于說(shuō)明兩個(gè)總體的方差是否相等, 形式為EqualVariance->False或True. 缺省默認(rèn)值為EqualVarian

38、ce->False, 即默認(rèn)方差不相等.4. 求單正態(tài)總體方差的置信區(qū)間的命令VarianceCI命令的基本格式為VarianceCI樣本觀察值, 選項(xiàng)其中選項(xiàng)1用于選定置信度, 規(guī)定同2中的說(shuō)明.5. 求雙正態(tài)總體方差比的置信區(qū)間的命令VarianceRatioCI命令的基本格式為VarianceRatioCI樣本1的觀察值,樣本2的觀察值,選項(xiàng)其中選項(xiàng)1用于選定置信度, 規(guī)定同2中的說(shuō)明.6. 當(dāng)數(shù)據(jù)為概括數(shù)據(jù)時(shí)求置信區(qū)間的命令(1) 求正態(tài)總體方差已知時(shí)總體均值的置信區(qū)間的命令NormalCI樣本均值, 樣本均值的標(biāo)準(zhǔn)差, 置信度選項(xiàng)(2) 求正態(tài)總體方差未知時(shí)總體均值的置信區(qū)間的

39、命令StudentTCI樣本均值, 樣本均值的標(biāo)準(zhǔn)差的估計(jì), 自由度, 置信度選項(xiàng)(3) 求總體方差的置信區(qū)間的命令ChiSquareCI樣本方差, 自由度, 置信度選項(xiàng)(4) 求方差比的置信區(qū)間的命令FRatioCI方差比的值, 分子自由度, 分母自由度,置信度選項(xiàng)實(shí)驗(yàn)舉例單正態(tài)總體的均值的置信區(qū)間(方差已知情形)例3.1 某車間生產(chǎn)滾珠, 從長(zhǎng)期實(shí)踐中知道, 滾珠直徑可以認(rèn)為服從正態(tài)分布. 從某天產(chǎn)品中任取6個(gè)測(cè)得直徑如下(單位:mm):15.616.315.915.816.216.1若已知直徑的方差是0.06, 試求總體均值的置信度為0.95的置信區(qū)間與置信度為0.90的置信區(qū)間.輸入&

40、lt;<StatisticsConfidenceIntervals.mdata1=15.6,16.3,15.9,15.8,16.2,16.1;MeanCIdata1,KnownVariance->0.06 (*置信度采取缺省值*)則輸出15.7873,16.1793即均值的置信度為0.95的置信區(qū)間是(15.7063,16.2603). 為求出置信度為0.90的置信區(qū)間, 輸入MeanCIdata1,ConfidenceLevel->0.90,KnownVariance->0.06則輸出15.8188,16.1478即均值的置信度為0.90的置信區(qū)間是(15.7873,

41、16.1793). 比較兩個(gè)不同置信度所對(duì)應(yīng)的置信區(qū)間可以看出置信度越大所作出的置信區(qū)間越大.例3.2(教材§6.4 例1)某旅行社為調(diào)查當(dāng)?shù)芈糜握叩钠骄M(fèi)額, 隨機(jī)訪問(wèn)了100名旅游者, 得知平均消費(fèi)額元, 根據(jù)經(jīng)驗(yàn), 已知旅游者消費(fèi)服從正態(tài)分布, 且標(biāo)準(zhǔn)差元, 求該地旅游者平均消費(fèi)額的置信度為的置信區(qū)間.輸入NormalCI80,12/25輸出為77.648,82.352單正態(tài)總體的均值的置信區(qū)間(方差未知情形)例3.3 (教材§6.4 例4)有一大批袋裝糖果, 現(xiàn)從中隨機(jī)地取出16袋, 稱得重量(以克計(jì))如下:5065084995035045104975125145

42、05493496506502509496設(shè)袋裝糖果的重量近似地服從正態(tài)分布, 試求置信度分別為0.95與0.90的總體均值的置信區(qū)間.輸入data2=506,508,499,503,504,510,497,512,514,505,493,496,506,502,509,496;MeanCIdata2 (*因?yàn)橹眯哦仁?.95, 省略選項(xiàng)ConfidenceLeve1->0.95;又方差未知, 選項(xiàng)knownVariance->None也可以省略*)則輸出500.445,507.055即的置信度為0.95的置信區(qū)間是(500.445,507.055).再輸入MeanCIdata2,C

43、onfidenceLevel->0.90則輸出501.032,506.468即的置信度為0.90的置信區(qū)間是(501.032,506.468).例3.4 從一批袋裝食品中抽取16袋, 重量的平均值為樣本標(biāo)準(zhǔn)差為 假設(shè)袋裝重量近似服從正態(tài)分布, 求總體均值的置信區(qū)間().這里, 樣本均值為503.75, 樣本均值的標(biāo)準(zhǔn)差的估計(jì)為自由度為15, 因此關(guān)于置信度的選項(xiàng)可省略. 輸入StudentTCI503.75,6.2002/Sqrt16,15則輸出置信區(qū)間為500.446,507.054兩個(gè)正態(tài)總體均值差的置信區(qū)間例3.5(教材§6.4 例7)A, B兩個(gè)地區(qū)種植同一型號(hào)的小麥,

44、 現(xiàn)抽取了19塊面積相同的麥田, 其中9塊屬于地區(qū)A, 另外10塊屬于地區(qū)B, 測(cè)得它們的小麥產(chǎn)量(以kg計(jì)) 分別如下:地區(qū)A: 100 105 110 125 110 98 105 116 112地區(qū)B: 101 100 105 115 111 107 106 121 102 92設(shè)地區(qū)A的小麥產(chǎn)量,地區(qū)B的小麥產(chǎn)量,均未知, 試求這兩個(gè)地區(qū)小麥的平均產(chǎn)量之差的95%和90%的置信區(qū)間.輸入list1=100,105,110,125,110,98,105,116,112;list2=101,100,105,115,111,107,106,121,102,92;MeanDifferenceC

45、Ilist1,list2 (*默認(rèn)定方差相等*)則輸出-5.00755,11.0075即的置信度為95%的置信區(qū)間是(-5.00755, 11.0075). 輸入MeanDifferenceCIlist1,list2,EqualVariances->True (*假定方差相等*)則輸出-4.99382,10.9938 這時(shí)的置信度為0.95的置信區(qū)間是(-4.99382, 10.9938). 兩種情況得到的結(jié)果基本一致.輸入MeanDifferenceCIlist1,list2,ConfidenceLevel->0.90,EqualVariances->True則輸出-3.5

46、9115, 9.59115 即的置信度為90%的置信區(qū)間是(-3.59115, 9.59115). 這與教材結(jié)果是一致的.例3.6 比較A、B兩種燈泡的壽命, 從A種取80只作為樣本,計(jì)算出樣本均值樣本標(biāo)準(zhǔn)差從B種取100只作為樣本, 計(jì)算出樣本均值樣本標(biāo)準(zhǔn)差假設(shè)燈泡壽命服從正態(tài)分布, 方差相同且相互獨(dú)立, 求均值差的置信區(qū)間().根據(jù)命令StudentTCI的使用格式, 第一項(xiàng)為兩個(gè)正態(tài)總體的均值差; 第二項(xiàng)為兩個(gè)正態(tài)總體的均值差的標(biāo)準(zhǔn)差的估計(jì), 由方差相等的假定, 通常取為,其中; 第三項(xiàng)為自由度第四項(xiàng)為關(guān)于置信度的選項(xiàng). 正確輸入第二個(gè)和第三個(gè)對(duì)象是計(jì)算的關(guān)鍵.輸入sp=Sqrt(79*

47、802+99*1002)/(80+100-2);StudentTCI2000-1900,sp*Sqrt1/80+1/100,80+100-2則輸出72.8669,127.133即所求均值差的置信區(qū)間為(72.8669,127.133).單正態(tài)總體的方差的置信區(qū)間例3.7 有一大批袋裝糖果, 現(xiàn)從中隨機(jī)地取出16袋, 稱得重量(單位:g)如下506508499503504510497512514505493496506502509496設(shè)袋裝糖果的重量近似地服從正態(tài)分布, 試求置信度分別為0.95與0.90的總體方差的置信區(qū)間.輸入data7=506.0,508,499,503,504,510,

48、497,512,514,505,493,496,506, 502,509,496;VarianceCIdata7則輸出20.9907,92.1411即總體方差的置信度為0.95的置信區(qū)間是(20.9907,92.1411).又輸入VarianceCIdata7,ConfidenceLevel->0.90則可以得到的置信度為0.90的置信區(qū)間(23.0839,79.4663).例3.8 假設(shè)導(dǎo)線電阻近似服從正態(tài)分布, 取9根, 得樣本標(biāo)準(zhǔn)差求電阻標(biāo)準(zhǔn)差的置信區(qū)間().輸入ChiSquareCI0.0072,8輸出置信區(qū)間0.0000223559,0.000179839雙正態(tài)總體方差比的置信區(qū)間例3.9 設(shè)兩個(gè)工廠生產(chǎn)的燈泡壽命近似服從正態(tài)分布

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論