版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、.引言一般統(tǒng)計分析分為參數(shù)分析與非參數(shù)分析,參數(shù)分析是指,知道總體分布,但其中幾個參數(shù)的值未知,用統(tǒng)計量來估計參數(shù)值,但大部分情況,總體是未知的,這時候就不能用參數(shù)分析,如果強行用可能會出現(xiàn)錯誤的結(jié)果。 例如:分析下面的供應(yīng)商的產(chǎn)品是否合格?合格產(chǎn)品的標準長度為(8.50.1),隨即抽取n=100件零件,數(shù)據(jù)如下: 表1.18.503 8.508 8.498 8.347 8.494 8.500 8.498 8.500 8.502 8.501 8.491 8.5048.502 8.503 8.501 8.505 8.492 8.497 8.150 8.496 8.501 8.489 8.506
2、8.4978.505 8.501 8.500 8.499 8.490 8.493 8.501 8.497 8.501 8.498 8.503 8.5058.510 8.499 8.489 8.496 8.500 8.503 8.497 8.504 8.503 8.506 8.497 8.5078.346 8.310 8.489 8.499 8.492 8.497 8.506 8.502 8.505 8.489 8.503 8.4928.501 8.499 8.804 8.505 8.504 8.499 8.506 8.499 8.493 8.494 8.490 8.5058.511 8.502
3、 8.505 8.503 8.782 8.502 8.509 8.499 8.498 8.493 8.897 8.5048.493 8.494 7.780 8.509 8.499 8.503 8.494 8.511 8.501 8.497 8.493 8.5018.495 8.461 8.504 8.691 經(jīng)計算,平均長度為,非常接近中心位置8.5cm,樣本標準差為cm.一般產(chǎn)品的質(zhì)量服從正態(tài)分布,。這說明產(chǎn)品有接近三分之一不合格,三分之二合格,所以需要更換供應(yīng)廠 商,而用非參數(shù)分析卻是另外一個結(jié)果。以下是100個零件長度的分布表:長度(cm)頻率(%)8.4058.408.4608.468
4、.4818.488.50458.508.52458.528.6008.604合計100這說明有90%的零件長度在cm之間,有9%的零件不合格,所以工廠不需要換供應(yīng)商。例2 哪一個企業(yè)職工的工資高? 表1.3兩個企業(yè)職工的工資企業(yè)1 11 12 13 14 15 16 17 18 19 20 40 60 企業(yè)2 3 4 5 6 7 8 9 10 30 50顯然,企業(yè)1職工的工資高,倘若假設(shè)企業(yè)1與企業(yè)2的職工工資分別服從正態(tài)分布,則這兩個企業(yè)職工的工資比較問題就可以轉(zhuǎn)化為一個參數(shù)的假設(shè)檢驗問題,原假設(shè)為,備擇假設(shè)為則 若為真,則其中拒絕域為:檢測值為:故不能拒絕原假設(shè),認為兩企業(yè)的工資水平無差異
5、。也可以用檢驗由于故不能拒絕原假設(shè),認為兩企業(yè)的工資水平無差異。這里我們采用的顯著性水平為0.1.但這個統(tǒng)計結(jié)論與實際數(shù)據(jù)不相符合。主要是因為假設(shè)工資服從正態(tài)分布,這個假設(shè)是錯誤的,用錯誤的假設(shè)結(jié)合參數(shù)分析自然得出的結(jié)論不可靠。這時候有兩種方法處理,一種更換其他分布的假設(shè),二是用非參數(shù)數(shù)據(jù)的方法的分析。非參數(shù)統(tǒng)計如同光譜抗生素,應(yīng)用范圍十分廣泛。參數(shù)統(tǒng)計與非參數(shù)統(tǒng)計針對不同的情況提出的統(tǒng)計方法,它們各有優(yōu)缺點,互為補充。第2章 描述性統(tǒng)計 §2.1 表格法和圖形法 表格法主要有列頻數(shù)分布表和頻率分布表例2.1 某公司測試新燈絲的壽命,列表如下:107 73 68 97 76 79 9
6、4 59 98 57 73 81 54 65 71 80 84 79 98 63 65 66 79 86 68 74 61 82 65 98 63 71 62 11664 79 78 79 77 86 89 76 74 85 73 80 68 78 89 72 58 92 78 88 77 103 88 63 68 88 81 64 73 75 90 62 89 71 74 70 85 61 65 61 75 62 94 71 85 84 83 63 92 68 81 (1) 找到最小值43,最大值116;(2) 將組數(shù)分為520組,分16組,組距為5 表2.2 燈絲壽命的頻率分布表燈絲壽命(
7、小時)個數(shù)頻率(%)40-4410.545-4910.550-5421.055-5984.060-642412.065-692814.070-743015.075-793417.080-842311.585-892211.090-94147.095-9984.0100-10431.5105-10910.5110-11400.0115-11910.5總和200100 對應(yīng)的直方圖為: §2.2 表格法和圖形法 數(shù)值方法主要是用數(shù)值來表示數(shù)據(jù)的中心位置(或者平均大?。┖碗x散程度等。1 3 5 3 3 1 3 2 3 2 4 4 列1平均2.833333標準誤差0.34451中位數(shù)3眾數(shù)3
8、標準差1.193416方差1.424242峰度-0.20317偏度-0.00713區(qū)域4最小值1最大值5求和34觀測數(shù)12它的平均數(shù),中位數(shù),眾數(shù)差不多大。但大部分情況不是這樣的,例如: §表2.3 某保險公司賠款樣本數(shù)據(jù)頻率分布表 賠款數(shù) 賠款次數(shù)0-400 2400-800 32800-1200 241200-1600 191600-2000 102000-2400 62400-2800 32800-3200 23200-3600 13600-4000 1 合計 100平均數(shù),中位數(shù),眾數(shù)分別為:1224,1000,600,這三者相差較大。左峰的時候:眾數(shù)中位數(shù)平均數(shù),右峰的時候
9、:平均數(shù)中位數(shù)眾數(shù)。平均數(shù)容易受到異常值的影響,故不能很好地代表中心位。例如某地農(nóng)戶收入增長了2.9%,但減收的農(nóng)戶卻是60%,為了更好地反映中心位,所以很多情況采用的切尾平均數(shù)。人們熟知的去掉最大值與最小值的平均數(shù)也是切尾平均數(shù)。 §2.4 經(jīng)濟專業(yè)畢業(yè)生的月收入數(shù)據(jù)畢業(yè)生 月收入畢業(yè)生 月收入1 18502 19503 20504 18805 17506 17007 18908 21309 194010 234011 192012 1880去掉最大值2340,最小值1700,的切尾平均數(shù)比總體平均數(shù)要小,它為1924,而總體平均數(shù)為1940.但中位數(shù)都一樣,均為1905,中位數(shù)表
10、現(xiàn)了穩(wěn)定性。因此我們不僅用平均數(shù)表示中心位置,有時候也用中位數(shù)描述數(shù)據(jù)的中心位置。另外,眾數(shù)也能用來描述數(shù)據(jù)的中心位置,尤其是定性數(shù)據(jù)的中心位置,例如: §2.5 有缺陷的小巧克力不合格品問題的頻數(shù)頻率分布表代碼問題頻數(shù)頻率(%)1外層不夠48652.832兩個粘在一起434.673被壓扁29532.074外層太多849.135破裂121.30這種情況下計算平均數(shù)和中位數(shù)沒有多大意義,相反眾數(shù)為1,眾數(shù)值得關(guān)注。 一般情況,平均數(shù),中位數(shù),眾數(shù)應(yīng)該綜合考量,這三個數(shù)目,使得我們可以從不同角度表達數(shù)據(jù)的中心位置,給評估對象一個全面的評價,例如:某企業(yè)的職工收入的平均數(shù)為5700,元,中
11、位數(shù)為3000元,眾數(shù)為2000元,這說明收入2000元的人最多,有一半職工低于3000元,有一半職工高于3000元,平均數(shù)5700大于中位數(shù),說明有些員工工資特別高。 平均數(shù)與中位數(shù)為何可以表示數(shù)據(jù)的中心位置呢?主要是因為: (2.1) (2.2)這說明用不同的距離標準衡量,平均數(shù)與中位數(shù)到各點的距離最近。另外平均數(shù)的物理意義還有重心的意義,在重心位置,系統(tǒng)可以平衡,在圖2.8處,平均數(shù)為4,中位數(shù)為3,就意味著把樹木集中在3這點,所走的路最短。 * * * * * * * * * * * 1 2 3 4 5 6 7 8 9 中位數(shù) 平均數(shù)§2.2.2 表示離散程度的數(shù)值表示離散程
12、度的數(shù)值一般有方差,四分位數(shù),而四分位數(shù)又分上四分位數(shù)與下四分位數(shù)。為表示數(shù)據(jù)的離散程度,我們一般用五個數(shù)概括,即最小值,下四分位數(shù),中位數(shù),上四分位數(shù),最大值,分別記為例如:將12名經(jīng)濟專業(yè)畢業(yè)生月收入數(shù)據(jù)處理結(jié)果如下:(用Minitab)數(shù)據(jù)容量N12平均數(shù)Mean1940中位數(shù)Median1905切尾平均數(shù)TrMean1924標準差StDev170.6標準誤SEMean49.3最小值Minimum1700最大值Maximum2340下四分位數(shù)1857.5上四分位數(shù)2025用統(tǒng)計軟件Minitab畫箱線圖(見圖2.9) 圖2.9四分位數(shù)的計算分位數(shù)是將總體的全部數(shù)據(jù)按大小順序排列后,處于各
13、等分位置的變量值.如果將全部數(shù)據(jù)分成相等的兩部分,它就是中位數(shù);如果分成四等分,就是四分位數(shù);八等分就是八分位數(shù)等.四分位數(shù)也稱為四分位點,它是將全部數(shù)據(jù)分成相等的四部分,其中每部分包括25%的數(shù)據(jù),處在各分位點的數(shù)值就是四分位數(shù).四分位數(shù)有三個,第一個四分位數(shù)就是通常所說的四分位數(shù),稱為下四分位數(shù),第二個四分位數(shù)就是中位數(shù),第三個四分位數(shù)稱為上四分位數(shù),分別用Q1、Q2、Q3表示.四分位數(shù)作為分位數(shù)的一種形式,在統(tǒng)計中有著十分重要的作用和意義,現(xiàn)就四分位數(shù)的計算做一詳細闡述.一、資料未分組四分位數(shù)計算第一步:確定四分位數(shù)的位置.Qi 所在的位置=i(n+1)/4,其中i=1,2,3.n表示資
14、料項數(shù).第二步:根據(jù)第一步四分位數(shù)的位置,計算相應(yīng)四分位數(shù).例1:某數(shù)學(xué)補習(xí)小組11人年齡(歲)為:17,19,22,24,25,28,34,35,36,37,38.則三個四分位數(shù)的位置分別為:Q1所在的位置=(11+1)/4=3,Q2所在的位置=2(11+1)/4=6,Q3所在的位置=3(11+1)/4=9.變量中的第三個、第六個和第九個人的歲數(shù)分別為下四分位數(shù)、中位數(shù)和上四分位數(shù),即:Q1=22(歲)、Q2=28(歲)、Q3=36(歲)我們不難發(fā)現(xiàn),在上例中(n+1)恰好是4的整數(shù)倍,但在很多實際工作中不一定都是整數(shù)倍.這樣四分位數(shù)的位置就帶有小數(shù),需要進一步研究.帶有小數(shù)的位置與位置前后
15、標志值有一定的關(guān)系:四分位數(shù)是與該小數(shù)相鄰的兩個整數(shù)位置上的標志值的平均數(shù),權(quán)數(shù)的大小取決于兩個整數(shù)位置的遠近,距離越近,權(quán)數(shù)越大,距離越遠,權(quán)數(shù)越小,權(quán)數(shù)之和應(yīng)等于1.例2:設(shè)有一組經(jīng)過排序的數(shù)據(jù)為12,15,17,19,20,23,25,28,30,33,34,35,36,37,則三個四分位數(shù)的位置分別為:Q1所在的位置=(14+1)/4=3.75,Q2所在的位置=2(14+1)/4=7.5,Q3所在的位置=3(14+1)/4=11.25.變量中的第3.75項、第7.5項和第11.25項分別為下四分位數(shù)、中位數(shù)和上四分位數(shù),即:Q1=0.25×第三項+0.75×第四項=
16、0.25×17+0.75×19=18.5;Q2=0.5×第七項+0.5×第八項=0.5×25+0.5×28=26.5;Q3=0.75×第十一項+0.25×第十二項=0.75×34+0.25×35=34.25.二、資料已整理分組的組距式數(shù)列四分位數(shù)計算第一步:向上或向下累計次數(shù)(因篇幅限制,以下均采取向上累計次數(shù)方式計算);第二步:根據(jù)累計次數(shù)確定四分位數(shù)的位置:Q1的位置 = (f+1)/4,Q2的位置 = 2(f +1)/4,Q3的位置 = 3(f +1)/4式中:f表示資料的總次數(shù);第三步:
17、根據(jù)四分位數(shù)的位置計算各四分位數(shù)(向上累計次數(shù),按照下限公式計算四分位數(shù)):Qi=Li+fi×di式中:LiQi所在組的下限,fiQi所在組的次數(shù),diQi所在組的組距;Qi-1Qi所在組以前一組的累積次數(shù),f總次數(shù).例3:某企業(yè)工人日產(chǎn)量的分組資料如下:根據(jù)上述資料確定四分位數(shù)步驟如下:(1)向上累計方式獲得四分位數(shù)位置:Q1的位置=(f +1)/4=(164+1)/4=41.25Q2的位置=2(f +1)/4=2(164+1)/4=82.5Q3的位置=3(f +1)/4=3(164+1)/4=123.75(2)可知Q1,Q2,Q3分別位于向上累計工人數(shù)的第三組、第四組和第五組,日
18、產(chǎn)量四分位數(shù)具體為:Q1=L1+×d1=70+×10=72.49(千克)Q2=L2+×d2=80+×10=80.83(千克)Q3=L3+×d3=90+×10=90.96(千克) shitouwa4320 2014-10-23 §2.2.3 標準誤假設(shè)產(chǎn)生數(shù)據(jù)的總體的均值為,方差為。它們的估計分別為樣本平均值,樣本方差和樣本標準差,由于平均數(shù)的標準差為,所以它的估計取為,稱為標準誤。由得在顯著性水平0.95的條件下,得置信區(qū)間的端點即得 .用Mintab計算得到:Variable N N* Mean SE Mean StDev
19、 Minimum Q1 Median Q3 MaximumC1 12 0 1940.0 49.3 170.6 1700.0 1857.5 1905.0 2025.0 2340.0算得到所求置信區(qū)間為:用Excel計算得到:平均1940標準誤差49.25198中位數(shù)1905眾數(shù)1880標準差170.6139方差29109.09峰度1.874516偏度1.102987區(qū)域640最小值1700最大值2340求和23280觀測數(shù)12置信度(95.0%)108.4029所求置信區(qū)間為:兩款軟件計算結(jié)果相差不大。§2.2.4 偏度偏度(Skewness)反應(yīng)單峰分布的對誠性,總體偏度用表示 樣本
20、偏見度用表示,國家標準的計算公式為: 其中在Excel中的計算公式為: 一般數(shù)據(jù)的分布是右偏的,數(shù)據(jù)的分布是左偏的,我們傾向于認為總體的分布是對稱的。§2.2.4 峰度峰度(Kurtosis)反映峰的尖峭程度,總體峰度用表示,總體的峰度的定義為(國家標準) 樣本峰度用,國家標準的計算公式為 由于正態(tài)分布的峰度系數(shù)為3,當 時為尖峰分布,當 時為扁平分布。 第三章 符號檢驗法 符號檢驗是一種較為簡單的非參數(shù)檢驗,中位數(shù)檢驗是符號檢驗的一個重要應(yīng)用。例3.1 某市勞動和社會保障部門的資料說明,1998年高級技師的年收入的中位數(shù)為21700元,該市某個行業(yè)有一個由50名高級技師組成的樣本,
21、數(shù)據(jù)如下:23072 24370 20327 24296 22256 19140 25669 22404 26744 26744 23406 20439 24890 24815 24556 18472 24514 22516 25112 23480 26552 24074 18064 22590 原假設(shè)與備擇假設(shè)為:選擇統(tǒng)計量 ,即為大于中位數(shù)的的個數(shù),表示計數(shù),也可表示為: 若為真,則而檢測值計算P值即檢測值落入拒絕域。故拒絕原假設(shè),接受備擇假設(shè)在excel中如何使用BINOMDIST函數(shù)返回一元二項式分布的概率值BINOMDIST函數(shù)用于返回一元二項式分布的概率值。函數(shù)語法 語法形式BIN
22、OMDIST(number_s,trials,probability_s,cumulative)number_s:表示實驗成功的次救。 trials:表示獨立實驗的次數(shù)。probability_s:表示一次實驗中成功的概率。cumulative:表示一邏輯值,決定函數(shù)的形式,如果cumulative為TRUE,函數(shù)BINOMDIST返回積累 分布函數(shù),即至多number_s次成功的概率;如果為FALSE,返回概率密度函數(shù),即number_s次成功 的概率。例如,拋硬幣正反面的概率是0.5若要計算出拋10次硬幣6次是正面的概率??梢允褂肂INOMDIST函數(shù) 來實現(xiàn)。Step01選中C4單元格,
23、在公式編輯欄中輸入公式: =BINOMDIST(A2,B2.C2,TRUE)按Enter鍵即可計算出積累分布函數(shù),即至多6次成功概率,如圖8-73所示。Step02 選中C5單元格,在公式編輯欄中輸入公式: =BINOMDIST(A2,B2.C2.FALSE)按Enter鍵即可計算出概率密度函數(shù),即6次成功的概率,如圖8-74所示。§3.2 符號檢驗在定性數(shù)據(jù)分析中的應(yīng)用 有的時候,觀察值是一些定性數(shù)據(jù),如果定性數(shù)據(jù)僅取兩個值,就可以使用符號檢驗對它進行統(tǒng)計分析。例3.2 某項調(diào)查詢問了2000名年輕人。問題是:你認為我們的生活環(huán)境是比過去更好,更差,還是沒有變化?有800人覺得”越
24、來越好”,有720人感覺一天不如一天,有400人表示沒有變化,還有80人說不知道,根據(jù)調(diào)查結(jié)果,你是否相信,在總體認為我們的生活比過去更好的人,比認為我們的生活比過去差的人多?解:原假設(shè)與備擇假設(shè)為 選擇統(tǒng)計量 ,也可表示為: 則 由于n很大,所以可以近似認為 其中 利用正態(tài)分布的計算結(jié)果修正后由于P值較小,所以我們認為我們的生活環(huán)境變好了。§3.3 成對數(shù)據(jù)的比較問題由于同一塊田的生長環(huán)境相同,不同的地生長環(huán)境各不相同,所以將這批數(shù)據(jù)寫成成對的形式。 ,為品種差,為隨機差。關(guān)于原點對稱的分布。 由于都服從關(guān)于原點對稱的分布,(同分布)則 所以關(guān)于原點對稱。 其它分位點的檢驗茆詩松老
25、師教材P414,例7.6.3以往的資料表明,某種圓鋼的90%的產(chǎn)品的硬度不小于103(),為了檢驗這個結(jié)論是否屬實,現(xiàn)在隨機挑選20根圓鋼進行硬度實驗,測得其硬度分別是:14213411998131102154122931378611916114415816581117128113問這批鋼材是否達標?解:原假設(shè)與備擇假設(shè)為: 選取統(tǒng)計量,若原假設(shè)成立,則 檢測值,檢驗的P值為 即檢測值落入拒絕域,故拒絕原假設(shè),接受備擇假設(shè)即產(chǎn)品不達標。例7.6.4 工廠有兩個化驗室,每天同時從工廠的冷卻水中取樣,測量水中的含氯量()一次,記錄如下:i(實驗室A)(實驗室B)差11.0310.0321.851.
26、89-0.0430.740.9-0.1641.821.810.0151.141.2-0.0661.651.7-0.0571.921.94-0.0281.011.11-0.191.121.23-0.11100.90.97-0.07111.41.52-0.12問兩個化驗室測定的結(jié)果之間有無顯著性差異?解:設(shè)A,B實驗室的測量誤差分別為:并設(shè)的分布函數(shù)分別為。由于 選取統(tǒng)計量 原假設(shè)與備擇假設(shè)為:若為真,則在Z的分布關(guān)于原點對稱選取統(tǒng)計量即表示中正數(shù)的個數(shù)。 檢驗值,檢驗的P值為: 在顯著性水平為,檢測值未落入拒絕域,故接受原假設(shè),認為兩個化驗室的檢測結(jié)果之間無顯著性差異。例7.6.5在某保險類中,
27、一次2008年索賠數(shù)額的隨機抽樣為(按照升序排列):4632472850525064548469727596948014760150121872021240228365278867200已知2007年索賠數(shù)額的中位數(shù)為5063元,問2008年索賠的中位數(shù)較上一年是否有所變化?解:這是一個雙側(cè)檢驗問題:原假設(shè)與備擇假設(shè)為:選取統(tǒng)計量 顯著性水平。計算得:所以雙側(cè)拒絕域為:而檢測值,落入拒絕域.故拒絕原假設(shè),接受備擇假設(shè),即可以認為2008年索賠的中位數(shù)較上一年有所變化。方法二:也可采用值檢驗檢驗的值為:故檢測值落入拒絕域,所以拒絕原假設(shè),接受備擇假設(shè),即可以認為2008年索賠的中位數(shù)較上一年有所
28、變化。例7.6.6.1984年一些國家每平方公里可開發(fā)的水資源數(shù)據(jù)如下表所示(萬度/年)國家每平方可開發(fā)水資源國家每平方可開發(fā)水資源蘇聯(lián)4.9印度8.5巴西4.1哥倫比亞26.3美國7.5日本34.9加拿大5.4阿根廷6.9扎伊爾28.1印度尼西亞7.9墨西哥4.9瑞士78.0瑞典22.3羅馬利亞10.1意大利16.8西德8.8奧地利58.6英國1.7南斯拉夫24.8法國11.5挪威37.4西班牙13.4而當年中國的該項指標為20萬度/年。請用符號檢驗方法檢驗:這22個國家每平方公里可開發(fā)的水資源的中位數(shù)不高于中國,求檢驗的P值,并寫出結(jié)論。解:原假設(shè)與備擇假設(shè)為:選取統(tǒng)計量,若原假設(shè)成立,則
29、顯著性水平,查表得:右側(cè)拒絕域為:又檢測值或者檢測的P值為故接受,拒絕。即可認為這22個國家可開發(fā)的水資源的中位數(shù)不高于中國。例7.6.7.下面是亞洲十個國家1996年的每1000個新生兒中的死亡數(shù)(按從小到大的次序排列)日本 以色列 韓國 斯里蘭卡 中國 敘利亞 伊朗 印度 孟加拉 巴基斯坦4 6 9 15 23 31 36 65 77 88以M表示1996年1000個新生兒中死亡數(shù)的中位數(shù),試檢驗:,求檢驗的P值,并寫完出結(jié)論。解:原假設(shè)與備擇假設(shè)為:選取統(tǒng)計量,若原假設(shè)成立,則顯著性水平,查表得:左側(cè)拒絕域為:又檢測值或者檢測的P值為故接受,拒絕。即可認為1996年1000個新生兒中死亡
30、數(shù)的中位數(shù)不低于34。例7.6.8.某煙廠稱其生產(chǎn)的每支香煙的尼古丁含量在12mg以下,實驗室測定的該煙廠的12支香煙的尼古丁含量(單位:mg)分別為:16.7 17.7 14.1 11.4 13.4 10.513.6 11.6 12.0 12.6 11.7 13.7問是否該廠所說的尼古丁含量比實際要少?求檢驗的P值,并寫出結(jié)論。由于對于非正態(tài)總體,小樣本場合不能用樣本均值檢驗,所以下面采用中位數(shù)檢驗。解:原假設(shè)與備擇假設(shè)為:選取統(tǒng)計量,若原假設(shè)成立,則顯著性水平,查表得:右側(cè)拒絕域為:又檢測值或者檢測的P值為故接受,拒絕。即可認為該廠的尼古丁含量比實際含量要少。第四章 符號秩和檢驗法
31、7;4.1 對稱中心為原點的檢驗問題設(shè)對稱中心為,則原假設(shè)與備擇假設(shè)分別為: 引入符號檢驗統(tǒng)計量為: 將排序。設(shè)的秩為 引入符號秩和檢驗統(tǒng)計量為: 表4.1 10個觀察值和它們的符號,絕對值和絕對值的秩 觀察值-7.6-5.54.32.7-4.82.1-1.2-6.6-3.3-8.5符號絕對值7.65.54.32.74.82.11.26.63.38.5絕對值的秩97536218410 ,下面討論符號秩和檢驗的檢驗方法,原假設(shè)與備擇假設(shè)為:如果,則對于任意的正數(shù)a,即 此時較大,為檢驗的臨界值為 原假設(shè)與備擇假設(shè)為:此時此時較小,為檢驗的臨界值為原假設(shè)與備擇假設(shè)為:我們在較大或者較小的時候拒絕原
32、假設(shè),檢驗的臨界值,為§4.2 符號秩和檢驗統(tǒng)計量的性質(zhì)性質(zhì)4.1 令,則在總體的分布關(guān)于原點0對稱時,與同分布: 表4.1 10個觀察值和它們的符號,絕對值和絕對值的秩 觀察值-7.6-5.54.32.7-4.82.1-1.2-6.6-3.3-8.5符號絕對值7.65.54.32.74.82.11.26.63.38.5絕對值的秩97536218410 表4.3 10個觀察值和它們的符號,絕對值和絕對值的秩 觀察值-1.22.12.7-3.34.3-4.8-5.5-6.6-7.6-8.5符號絕對值1.22.12.73.34.34.85.56.67.68.5絕對值的秩975362184
33、10 ,這樣就初步說明了性質(zhì)4.1的概率分布,在總體關(guān)于原點0分布時,相互獨立,同分布,且所以是離散的分布,它的取值范圍是,且(4.1)其中表示從中取若干個,其和恰好為d的取法數(shù),例如:。,性質(zhì)4.2 在總體的分布關(guān)于原點0對稱時,與同分布:所以的分布 (4.2) 于是 這說明的密度是以中心對稱的。性質(zhì)4.3 在總體的分布關(guān)于原點0對稱時,的分布的對稱中心為:例4.1 有12個工人,每個工人用兩種生產(chǎn)方式完成一項生產(chǎn)任務(wù),所用時間對比如下表所示: 表4.4 用兩種方式完成一項生產(chǎn)任務(wù)的完工時間及其差值工人方式1方式2差值工人方式1方式2差值120.318.02.3716.117.2-1.122
34、3.521.71.8818.514.93.6322.022.5-0.5921.920.01.9419.117.02.11024.221.13.1521.021.2-0.21123.422.70.7624.724.8-0.11225.023.71.3 表4.5 差值的符號,絕對值及絕對值的秩工人 差值符號差的絕對值絕對值的秩工人差值符號差的絕對值絕對值的秩12.32.3107-1.11.1521.81.8783.63.6123-0.50.5391.91.9842.12.19103.13.1115-0.20.22110.70.746-0.10.11121.31.36符號秩和統(tǒng)計量 原假設(shè)與備擇假設(shè)
35、為我們在較大或者較小的時候拒絕原假設(shè)由于而檢測值既有 故檢測值落入拒絕域所以拒絕原假設(shè),接受備擇假設(shè)即認為兩種生產(chǎn)方法有差異,方法1不如方法2,方法1需要更多的時間。例:7.6.9 9名學(xué)生到英語培訓(xùn)學(xué)習(xí),培訓(xùn)前后各進行了一次水平測驗,成績?nèi)缦拢簩W(xué)生編號i123456789入學(xué)前成績767170574969652659入學(xué)后成績818570525263833362-5-1405-36-18-7-3(1) 假設(shè)測驗成績服從正態(tài)分布,問學(xué)生的培訓(xùn)效果是否顯著?(2) 不假定總體分布,采用符號檢驗的方法檢驗學(xué)生的培訓(xùn)效果是否顯著?(3) 采用符號秩和檢驗方法檢驗學(xué)生的培訓(xùn)效果是否顯著,三種檢驗方法結(jié)
36、論 是否相同?解:(1)由于測驗成績符合正態(tài)分布,而未知,所以我們采用 原假設(shè)與備擇假設(shè)為: 由于未知,所以我們選取統(tǒng)計量 顯著性水平左側(cè)拒絕域為.而檢測值另一方面也可以用P-值也可判斷檢測值不在拒絕域。檢驗的P值 .故檢測值. 故接受,拒絕,即認為培訓(xùn)效果不明顯。(2)原假設(shè)與備擇假設(shè)為: 選取符號檢驗統(tǒng)計量: 則 這里顯著性水平查表得所以左側(cè)拒絕域為而檢測值.另一方面也可以用P-值也可判斷檢測值不在拒絕域。檢驗的P值 .故檢測值. 故接受,拒絕,即認為培訓(xùn)效果不明顯。(3)原假設(shè)與備擇假設(shè)為: 選取統(tǒng)計量.這里顯著性水平查表計算得:滿足 ,右側(cè)臨界點為37,由于密度的對稱中心為,所以左側(cè)臨
37、界點為左側(cè)拒絕域為.而檢測值故接受,拒絕,即認為培訓(xùn)效果不明顯.7.6.10 為了比較來做鞋子的兩種材料的質(zhì)量,選取15個男子,每人穿一雙新鞋,其中一只是以材料A做后跟,另外一只是以材料B做后跟,其厚度均為10mm,過一個月再測量厚度,數(shù)據(jù)如下:序號123456789101112131415材料A6.67.08.38.25.29.37.98.57.87.56.18.96.19.49.1材料B7.45.48.88.06.89.16.37.57.06.54.47.74.29.49.1問是否可以認為材料A制成的鞋子比材料B耐穿?(1) 設(shè)來自正態(tài)總體,結(jié)論是什么?(2) 采用符號秩和檢驗,結(jié)論是什么
38、?解:(1)由于符合正態(tài)分布,而未知,所以我們采用 原假設(shè)與備擇假設(shè)為: 由于未知,所以我們選取統(tǒng)計量 顯著性水平右側(cè)拒絕域為.而檢測值另一方面也可以用P-值也可判斷檢測值在拒絕域。檢驗的P值 .故檢測值. 故拒絕,接受,即認為材料A制成的鞋后跟比材料B耐穿。(2)原假設(shè)與備擇假設(shè)為: 選取統(tǒng)計量.這里顯著性水平查表計算得:滿足 ,右側(cè)臨界點為90。右側(cè)拒絕域為.而檢測值 故拒絕,接受,即認為材料A制成的鞋后跟比材料B耐穿。7.6.11 某飲料商用兩種不同的配方推出兩種新的飲料,現(xiàn)在調(diào)查10位消費者,他們對兩種飲料的評分如下:品嘗者12345678910A飲料10868751397B飲料652
39、2464598問兩種飲料評分是否有顯著性差異?(1) 采用符號檢驗法作檢驗;(2) 采用符號秩和檢驗法作檢驗.解:(1)解:原假設(shè)與備擇假設(shè)為: 選取統(tǒng)計量 即為更喜歡A飲料的人數(shù),若原假設(shè)成立,則計算得:所以雙側(cè)拒絕域為: 檢測值,檢驗的P值為 即檢測值未落入拒絕域,故接受,拒絕。即認為兩種飲料的評分沒有顯著性差異。(2)原假設(shè)與備擇假設(shè)為: 選取統(tǒng)計量.這里顯著性水平查表計算得:滿足 ,右側(cè)臨界點為47,則左側(cè)臨界點為雙側(cè)拒絕域為.而檢測值 故接受,拒絕,即認為兩種飲料的評分沒有顯著性差異。7.6.12 測試精神壓力和沒有精神壓力的血壓差別,10個志愿者進行了相應(yīng)的實驗,數(shù)據(jù)如下(單位:毫
40、米汞柱收縮壓):無精神壓力時107108122119116118121111114108有精神壓力時127119123113125132121131116124該數(shù)據(jù)是否表明有精神壓力的情況下的血壓是否有所增加?解:采用符號秩和檢驗 原假設(shè)與備擇假設(shè)為: 其中為總體密度函數(shù)的對稱中心,選取統(tǒng)計量.這里顯著性水平查表計算得:滿足 ,右側(cè)臨界點為45,則左側(cè)臨界點為左側(cè)拒絕域為.而檢測值 故拒絕,接受,即認為有精神壓力導(dǎo)致血壓增加。§4.3 符號秩和檢驗統(tǒng)計量的漸近正態(tài)性(1) 期望與方差 在總體的分布關(guān)于原點o對稱時,相互獨立,每一個的分布都是。而,則它的期望與方差分別為: 由于與有相
41、同的分布,所以 (2)漸近正態(tài)性 性質(zhì)4.5 如果總體關(guān)于原點對稱,則在樣本容量n趨于無窮大時,有漸近正態(tài)性: 或者簡記為 .§4.4 平均秩法 平均秩的基本定義:即對于相同的樣本取平均秩。每個元素賦予平均秩為: 平均時的秩和與平方和為 非平均的時候秩和與平方和為(4.8)與(4.10)結(jié)果一樣。由(4.11) 減去(4.9)得到于是由(4.11)與(4.12)得: 性質(zhì)4.6 在總體的分布關(guān)于原點o對稱,有結(jié)秩取平均時, 在有結(jié)的情況下,如果總體關(guān)于原點對稱,則在樣本容量n趨于無窮大時,有漸近正態(tài)性: 嚴格上以上期望與方差是在有結(jié)的情況下的計算結(jié)果,所以嚴格書寫應(yīng)該按照以下方式:
42、§4.5 對稱中心的檢驗問題有以下幾種情形:原假設(shè)與備擇假設(shè)為 例4.5:通常認為人在放松條件下入睡的時間比緊張狀態(tài)下的入睡時間要少兩分鐘,現(xiàn)在有十名男性,他們在放松下與緊張狀態(tài)下的入睡時間分別為,表4.10顯示10個差值8個小與-2,只有2個不小于-2,所以我們有理由猜測放松狀態(tài)下比非放松狀態(tài)下入睡時間要少2分鐘,這個猜測是否正確?表4.10 成年人在放松的條件下和沒有放松的條件下入睡所需的時間研究對象 i放松條件 非放松條件差值差值+2絕對值秩11015-5-3372912-3-11331222-10-88104815-7-5595910-111367702267816-6-44
43、88710-3-11391114-3-1131069-3-113符號秩和檢測值為原假設(shè)與備擇假設(shè)為 左側(cè)拒絕域為.而檢測值 故拒絕,接受,即認為成年男性在放松條件下入睡的時間比緊張狀態(tài)下入睡時間要少于2分鐘。由于樣本容量n足夠大的時候,有漸近正態(tài)性,所以也可以用正態(tài)分布作檢測。 原假設(shè)與備擇假設(shè)為 在為真的時, 即檢測值為:檢測p值為所以在顯著性水平為0.05下,檢測值落入拒絕域故拒絕,接受,即認為成年男性在放松條件下入睡的時間比緊張狀態(tài)下入睡時間要少于2分鐘。第五章 兩樣本問題§5.1 Mood中位數(shù)檢驗法例2 哪一個企業(yè)職工的工資高? 表1.3兩個企業(yè)職工的工資企業(yè)1 11 12 13 14 15 16 17 18 19 20 40 60 企業(yè)2 3 4 5 6 7 8 9 10 30 50 他們的合樣本為其中帶表示企業(yè)2的職工的工資,其他的為企業(yè)1的工資,合樣本的中位數(shù)為13.5,將以上數(shù)據(jù)轉(zhuǎn)化為四表格
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 罕見腫瘤的個體化治療長期生存數(shù)據(jù)分析與策略優(yōu)化-3
- 2026年安慶師范大學(xué)附屬龍城幼兒園招聘1名備考題庫及完整答案詳解1套
- 罕見腫瘤的個體化治療綜合治療模式構(gòu)建與療效最大化
- 2026廣東韶關(guān)市樂昌市青年就業(yè)見習(xí)基地招募見習(xí)人員10人備考題庫(含答案詳解)
- 2026中國建筑一局(集團)有限公司華中分局投資專員招聘1人備考題庫及答案詳解(易錯題)
- 財務(wù)制度規(guī)定
- 養(yǎng)生館前臺收銀財務(wù)制度
- t3更改財務(wù)制度
- 銷售類財務(wù)制度
- 公司上墻財務(wù)制度
- 2026年公共部門人力資源管理試題含答案
- 2026年中國數(shù)聯(lián)物流備考題庫有限公司招聘備考題庫有答案詳解
- 2025年大學(xué)醫(yī)學(xué)(人體解剖學(xué))試題及答案
- 2026年中央網(wǎng)信辦直屬事業(yè)單位-國家計算機網(wǎng)絡(luò)應(yīng)急技術(shù)處理協(xié)調(diào)中心校園招聘備考題庫參考答案詳解
- DB32/T+5311-2025+港口與道路工程+固化土施工技術(shù)規(guī)范
- 2025年河南農(nóng)業(yè)大學(xué)輔導(dǎo)員考試真題
- 2025鄭州餐飲行業(yè)市場深度調(diào)研及發(fā)展前景與投資前景研究報告
- 早產(chǎn)的臨床診斷與治療指南(2025年)
- 2025年黑龍江省大慶市檢察官逐級遴選筆試題目及答案
- JBP計劃培訓(xùn)課件
- 寵物民宿創(chuàng)業(yè)規(guī)劃
評論
0/150
提交評論