卡方檢驗與非參數(shù)檢驗_第1頁
卡方檢驗與非參數(shù)檢驗_第2頁
卡方檢驗與非參數(shù)檢驗_第3頁
卡方檢驗與非參數(shù)檢驗_第4頁
卡方檢驗與非參數(shù)檢驗_第5頁
已閱讀5頁,還剩43頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

卡方檢驗和非參數(shù)檢驗在總體分布形式已知條件下未知參數(shù)檢驗問題。但實際問題中總體的分布形式往往是未知的,雖然根據(jù)中心極限定理可以有相當?shù)陌盐照J為大多數(shù)經(jīng)濟變量服從或近似服從正態(tài)分布,但有時為了使所做的統(tǒng)計推斷更具說服力,就需要對總體的分布形式進行檢驗。1

本章主要內(nèi)容:(1)總體分布的卡方()檢驗;(2)兩個比例差異的卡方()檢驗(獨立樣本);(3)兩個以上比例差異的卡方()檢驗(獨立樣本);(4)獨立性的卡方()檢驗;(5)兩個比例差異的McNEMAR檢驗(相關(guān)樣本);(6)兩個獨立總體的非參數(shù)檢驗(Wilcoxon秩和檢驗);(7)單因素方差分析的非參數(shù)檢驗(Kruskal-Wallis秩檢驗)2檢驗的基本原理(1)設(shè)x1,x2,,xn為總體X的一組樣本觀察值,F(xiàn)(x)為某一已知分布的分布函數(shù),1,

2,,

r是的r個待定參數(shù),分別是r個參數(shù)的點估計,以分別代替1,

2,….,r,作原假設(shè)H0:總體X的分布函數(shù)為F(x)(2)將F(x)的定義域劃分為k個互不相交的區(qū)間(ai,ai+1,i=1,2,…,k;記fi為樣本觀察值x1,x2,…,xn落在第個區(qū)間(ai,ai+1

內(nèi)的頻數(shù),并記Pi=P{ai<X≤ai+1}=F(ai+1)-F(ai)

3§.1總體分布的檢驗為以F(x)為分布函數(shù)的隨機變量在區(qū)間(ai,ai+1

上取值的概率,i=1,2,…,k。則當H0為真時,由貝努里定理,當n充分大時,n次獨立重復(fù)試驗結(jié)果的實際頻率與其概率Pi之間的差異并不顯著,于是顯然可以用統(tǒng)計量來刻畫它們間總的差異的大小。其中nPi為理論頻數(shù)。當H0為真時,下式的值就應(yīng)當較小

4(3)可以證明,當n充分大時(n≥50),若H0為真,則統(tǒng)計量近似服從(k-r-1)分布。其中r為分布F(x)中待定參數(shù)的個數(shù)于是在給定顯著性水平下,若就拒絕H0,說明總體X的真實分布函數(shù)與F(x)間存在顯著差異;否則接受H0,即可以認為兩者在水平下并無顯著差異。5

某廠有一臺經(jīng)常需要維修的設(shè)備,該設(shè)備中有一個易損壞的重負荷軸承,設(shè)備故障的主要原因是軸承損壞。為了制定該設(shè)備的維修計劃和維修預(yù)算,需要了解該軸承的壽命分布。表10.1給出了100個軸承壽命的觀察數(shù)據(jù),問:該軸承壽命是否服從正態(tài)分布?6

解:由表中數(shù)據(jù),用Excel可求得=120.95,S2=40.582,故可作原假設(shè)H0:X~N(120,402)將實軸劃分為如下7個互不相交的區(qū)間。用Excel的FREQUENCY函數(shù)計算數(shù)據(jù)落在各區(qū)間內(nèi)的頻數(shù),用NORMDIST函數(shù)求出各理論頻數(shù)nPi,統(tǒng)計量的計算如表所示。78取顯著性水平

=0.25(由于原假設(shè)H0是我們希望得到的結(jié)果,為使檢驗結(jié)論更具說服力,控制的重點應(yīng)是與原假設(shè)H0不真而接受H0的概率,故

應(yīng)取的稍大些)。本例中k=7,r=2,k–r-1=4。故在水平

=0.25下接受原假設(shè)H0,即可認為該軸承的使用壽命服從N(120,402)分布。9§.2比例差異的檢驗(獨立樣本)§10.2.1兩個比例差異的檢驗前面,我們研究了兩個比例的Z檢驗。這部分從不同角度檢驗數(shù)據(jù)。假設(shè)檢驗過程使用近似卡方()分布的檢驗數(shù)據(jù)。如果想要比較兩個獨立樣本組的分類變量,可以做兩維的列聯(lián)表,顯示每組的第1類(正向類,如“成功”,“是”等)和第2類(反向類,如“失敗”,“否”等)出現(xiàn)的頻數(shù),如表所示10為了檢驗組一樣本有關(guān)類1的比例是否等于第二組樣本有關(guān)類1的比例,即假設(shè)檢驗為:原假設(shè)為兩比例之間無顯著差異:備擇假設(shè)為兩比例之間有差異:使用卡方()檢驗的基本思路為:(1).確定統(tǒng)計量為

(10.2.1)其中為列聯(lián)表中特定單元的觀測頻數(shù),為列聯(lián)表中特定單元的期望頻數(shù),因此這里的統(tǒng)計量是觀測頻數(shù)和期望頻數(shù)差的平方除以每單元的期望頻數(shù),并對表中的所有單元格取和求得;11(2)可以證明上述統(tǒng)計量近似服從自由度為1的分布,因此在顯著性水平下,決策規(guī)則為:如果,拒絕否則,接受。1213應(yīng)用案例

有兩家酒店,為了確定服務(wù)質(zhì)量,要求顧客離開時做滿意度調(diào)查,顧客可能會再次入??;根據(jù)調(diào)查數(shù)據(jù)得到的列聯(lián)表如表10.5所示。問在顯著性水平的情況下,顧客會回到酒店一和酒店二的比例是否相同。

141516171810.2.2兩個以上比例差異的檢驗

統(tǒng)計量是觀測頻數(shù)和期望頻數(shù)差的平方除以每單元的期望頻數(shù),并對表中的2×c個所有單元格取和求得因此統(tǒng)計量的自由度為1920應(yīng)用案例如果有四家酒店,根據(jù)調(diào)查數(shù)據(jù)得到的列聯(lián)表如表10.10所示。問在顯著性水平的情況下,顧客會回到這四家酒店的比例是否相同。212223獨立性檢驗24假設(shè)在上面例子中的酒店顧客滿意度的調(diào)查中,向表明不會再次入住酒店的顧客問第二個問題。即不會再次入住的原因是什么,包括價格、位置、客房服務(wù)和其他等。調(diào)查結(jié)果的列聯(lián)表如表10.14所示。試問在顯著性水平的情況下,不會再次入住理由與酒店之間是否有聯(lián)系?25262728§10.3兩個相關(guān)樣本比例差異檢驗293031應(yīng)用案例3233如果樣本容量很小,并且無法確定樣本數(shù)據(jù)是否來自正態(tài)分布總體,此時可以選擇以下兩種方法來分析兩獨立總體均值間的區(qū)別:(1)用不依賴于正態(tài)總體假設(shè)的Wilcoxon秩和檢驗;(2)對于數(shù)據(jù)進行正態(tài)轉(zhuǎn)換后使用合并方差的t檢驗。本節(jié)介紹用Wilcoxon秩和檢驗來檢驗兩組值間是否有差別。在合乎這些檢驗的條件下,Wilcoxon秩和檢驗和合并方差及獨立方差的t檢驗一樣有效;當t檢驗假設(shè)不符合時,Wilcoxon秩和檢驗更有效。3410.4兩個獨立總體的非參數(shù)分析:Wilcoxon秩和檢驗3536應(yīng)用案例37383940§10.5單因素方差分析的非參數(shù)分析:Kruskal-Wallis秩檢驗

如果第9章中單因素方差分析的F檢驗的正態(tài)分布假設(shè)條件不符合時,可以使用Kruskal-Wallis秩

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論