版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第十一章非參數統(tǒng)計方法
第一節(jié)非參數統(tǒng)計的一般問題第二節(jié)單樣本非參數統(tǒng)計檢驗方法第三節(jié)兩個相關樣本的非參數統(tǒng)計方法第四節(jié)兩個獨立樣本的非參數統(tǒng)計方法第五節(jié)多個相關樣本的非參數檢驗方法第六節(jié)多個獨立樣本的非參數檢驗方法
第一節(jié)非參數統(tǒng)計的一般問題一、參數統(tǒng)計與非參數統(tǒng)計
二、非參數統(tǒng)計方法的種類
在統(tǒng)計學中,如果總體的精確率分布形式已知,而只是其中的某些參數未知時,通常是從總體中隨機取樣本,根據樣本信息對總體參數進行估計或假設檢驗,這就是一般所說的參數統(tǒng)計方法。
但在許多實際問題中,我們對總體分布的具體形式是未知或知之甚少的,只知道總體為連續(xù)分布還是離散分布,也不能對總體的分布形式作進一步的假定(如假定總體為近似正態(tài)分布等),這時要對總體的某些性質進行統(tǒng)計估計或假設檢驗,就要采用非參數統(tǒng)計方法。非參數統(tǒng)計的特點:
一、在利用樣本資料對總體進行估計或檢驗時,不必依賴于總體的分布形式。
二、它與總體分布所具有的參數無關,所以通常不必對總體所特有的參數(如均值、標準差)進行估計或檢驗。三、它對變量的量化要求很低,不論是品質標志還是數量標志,均可以采用非參數統(tǒng)計方法進行估計或檢驗;而參數統(tǒng)計卻要求是數量標志,對于品質標志是不適用的。非參數統(tǒng)計方法的種類
:
(一)單樣本非參數統(tǒng)計方法(二)兩個相關樣本非參數統(tǒng)計方法
(三)兩個獨立樣本非參數統(tǒng)計方法
(四)多個相關樣本非參數統(tǒng)計方法(五)多個獨立樣本的非參數統(tǒng)計方法
表12-1各種非參數統(tǒng)計檢驗方法樣本對變量要求單樣本雙樣本多樣本相關樣本獨立樣本相關樣本獨立樣本定類變量二項分布檢驗、卡方擬合優(yōu)度檢驗、K-S擬合優(yōu)度麥克勒瑪檢驗檢驗、K-S檢驗柯克倫Q檢驗列聯(lián)表檢驗定序變量游程檢驗符號檢驗、威爾克遜t檢驗中位數檢驗、U或W檢驗、W-W游程檢驗費里德曼雙向評秩方差分析、肯德爾協(xié)和系數檢驗推廣中位數檢驗、K-W
的H檢驗注:表中“對變量要求”是指變量的量化最低要求
費雪精確概率第二節(jié)單樣本非參數統(tǒng)計檢驗方法一、適應性檢驗二、柯爾莫哥洛夫檢驗三、單樣本游程檢驗
適應性檢驗的基本原理
分布在參數統(tǒng)計中可用于方差估計檢驗,但在非參數統(tǒng)計領域,它有更加廣泛的應用。在單樣本情況之下,它主要用于檢驗客觀現象是否服從于某種理論分布(稱為吻合性或擬合優(yōu)度檢驗),或者檢驗某種理論分布是否正確(稱一致性檢驗或同質性檢驗)。我們將兩者合稱為“適應性檢驗”。原假設及備擇假設為:H0:觀察值的頻數Oi與期望(理論)頻數Ei相吻合Hi:觀察值的頻數Oi與期望(理論)頻數Ei不相吻合
適應性檢驗的檢驗步驟
(1)計算樣本每一類的理論頻數Ei與期望頻數Oi。
(2)計算統(tǒng)計量。根據皮爾遜定理,當樣本容量n充分大時,若將樣本分成互斥的K個類,則每類理論(期望)次數與實際次數之差的平方值與期望值之比服從卡方分布。按卡方分布可加性,可得如下的統(tǒng)計量:(3)作出檢驗結論。若在給定顯著性水平之下,,則拒絕H0,認為實際觀測到的頻數與理論(期望)頻數之間有顯著差異??聽柲缏宸驒z驗基本原理
柯爾莫哥洛夫——斯米爾諾夫檢驗(簡記為K-S檢驗)也是一種擬合優(yōu)度檢驗,且比檢驗更為精確。嚴格地講,K-S檢驗中兩種檢驗:即檢驗單一樣本是否服從某種理論分布的“柯爾莫哥洛夫檢驗”和用于比較兩個樣本是否有相同總體分布的“斯米爾諾夫檢驗”。
設樣本的累積分布函數為,總體的分布函數為,則柯爾莫哥洛夫檢驗的原假設及備擇假設為::,即樣本是來自分布函數為的總體。
:,即樣本分布并不是。
柯爾莫哥洛夫檢驗的檢驗步驟
(1)計算樣本累積分布函數(通常是離散化處理,即若是連續(xù)變量,通常按分段處理)。
(2)計算D統(tǒng)計量:
(3)查D的臨界值表。若,則拒絕,即認為樣本的分布并非理論分布。單樣本游程檢驗的基本原理
如果一個變量的取值只有兩種情況(如記為M與F),即是非標志(若不是“是非標志”,我們可以將之轉化成“是非標志”)。變量值按一定次序出現(即有順序的),則就可能有如下形式的序列:
MMM
FFF
M
FF
MM
FF
M
FFF
MMM
FFFF
單樣本游程檢驗的基本原理
所謂游程,就是由同類事物(符號,如M)連續(xù)構成的一個子序列,它的前面和后面有另外的事物(符號,如F),或前后根本沒有別的事物。游程檢驗中最常用的方法是游程個數檢驗。其原假設及備擇假設為:H0:現象(序列)是隨機的H1:序列是非隨機的單樣本游程檢驗的步驟
(1)將樣本觀察值按抽樣時,出現的先后順序排成序列。(2)將序列轉化成是“是非標志”。(3)計算序列中的“+”號個數、“-”號個數及游程個數R。(4)對于給定的及和查游程個數檢驗臨界值表。有些序列的游程總數雖然“適中”,但若個別游程特別長,如股票價格持續(xù)很長一段時間上升,又持續(xù)很長一段時間下跌,則這種序列恐怕也很難認為是隨機的,因此游程理論中還包括了游程長度的檢驗。若將游程總數檢驗與游程長度檢驗結合起來,則效果更佳。游程長度檢驗主要有“最長游程檢驗”、“游程長度平方和檢驗”、“游程數分布檢驗”、“基于上、下游程的檢驗”等四種。
第三節(jié)兩個相關樣本的非參數統(tǒng)計方法一、麥克勒瑪檢驗二、符號檢驗三、威爾克遜配對符秩檢驗麥克勒瑪檢驗的基本原理
麥克勒瑪(McNemar)檢驗是適用于研究現象“前后”情況有無顯著變化的一種非參數統(tǒng)計方法。設n個樣本單位在某一條件下(即變化前)的觀察值為第一個樣本(觀察值為“是非標志”),在另一個條件下(即變化后)的觀察值為第二個樣本,則可以得到如表12-4所示的頻數統(tǒng)計表。表12-4麥克勒瑪檢驗頻數表變化后變化前010AB1CD麥克勒瑪檢驗的基本原理
這里,A是前后均為“非”的次數。D為前后均為“是”的次數,B是從“非”變?yōu)椤笆恰钡拇螖?,C是從“是”變?yōu)椤胺恰钡拇螖怠o@然,前后情況有無變化,就是指C、B兩格子內次數的變動情況。麥克勒瑪檢驗關心的也正是這一點,故統(tǒng)計假設為:
H0:事件在兩個方向上的變化可能性相同
H1:事件在兩個方向上的變化可能性不同
麥克勒瑪檢驗的步驟
(1)作如表12-4形式的四格頻數表。(2)計算統(tǒng)計量:(3)查分布表,在給定的顯著性水平之下,若,拒絕H0,認為前后情況有顯著不同。
符號檢驗的基本原理
在工商企業(yè)、公共管理及社會科學研究中,若我們要研究兩個變量之間有無顯著差異,但只能確信“有無差異”而不能確信“差異大小”時,可采用符號檢驗。符號檢驗的步驟
(1)確定配對的兩個樣本觀察值(可以是數量標志值,也可以是能分辯大小方向的品質標志值)之間差異的“符號”。設第一、二樣本觀察值分別為x1與y1,若x1
>y1
,則記為“+”號,若x1
<y1,則記為“-”號(反過來記也一樣),若x1
=y1
,則舍去該觀察點(稱為“結點”)。(2)計算“+”號個數與“-”號個數,分別記為n+與n-。則有n=n++n-
符號檢驗的步驟
(3)采用二項分布,對下列假設進行檢驗:
H0:“+”號個數與“-”號個數相等,即p=0.5
H1:“+”號個數與“-”號個數不等,即p≠0.5(4)計算二項分布概率(也可查二項累積概率分布p=0.5表):式中,l=min{n+
,n-}若P為一“小概率”(P≤),則拒絕H0,認為兩個變量之間有顯著差異,若P>,則不拒絕H0
。
威爾克遜配對符秩檢驗的基本原理
前面講到的符號檢驗是用配對觀察值(兩個相關樣本)之間差別的符號進行檢驗的,它只注重樣本之間的差別方向而不在乎樣本之間差別的大小,因此有人提出了另一種同時考慮樣本之間差異方向與大小的非參數檢驗方法,即威爾克遜配對符秩檢驗(Wilcoxon)。威爾克遜配對符秩檢驗的檢驗步驟
(1)計算配對的兩個樣本值之間的差異值di。設第一樣本值為xi,第二樣本值為yi,則di=xi-yi。若為零,則去掉該觀察點。
(2)對進行評秩,可以升序,也可以降序。但通常是取升序,得到每個觀察點(配對點)的秩次。若多個觀察點的數值相等,則應取其平均秩次。(3)對秩次的符號進行還原,即若為正,則也為正,若為負,則也為負。威爾克遜配對符秩檢驗的檢驗步驟
(4)計算正的秩次和與負的秩次和,即:(對于Rj>0),(對于Rj<0)(5)計算威爾克遜T統(tǒng)計量:(6)查Wilcoxon表,在給定的顯著性水平之下,得臨界值。若T≥,則不能拒絕H0,即認為兩個個樣本來自同一總體。否則,接受H1認為兩個樣本來自不同的總體。第四節(jié)兩個獨立樣本的非參數統(tǒng)計方法一、曼—惠特尼U檢驗二、中位數檢驗
三、斯米爾諾夫檢驗四、雙樣本游程檢驗五、獨立雙樣本卡方檢驗曼—惠特尼U檢驗的基本原理
這是檢驗兩個獨立樣本是否來自具有相同均值的總體的非參數檢驗方法,又稱秩和檢驗法。它與配對Wilcoxon檢驗相類似,要考慮到每一個樣本中各觀察值所處的次序(秩),故為一種功效較強的檢驗方法。曼—惠特尼U檢驗的檢驗步驟
(1)將兩個樣本合并成一個樣本再評秩??梢园瓷蛟u秩,也可按降序評秩。若多個觀察點數值相同,則取其平均秩次。
(2)計算每個樣本觀察點所得的秩和。記為TR1與TR2。(3)計算U統(tǒng)計量。定義統(tǒng)計量U為:
其中(4)查U統(tǒng)計量分布表。若,則拒絕H0,認為兩個樣本的均值有顯著差異,即抽自不同的總體。中位數檢驗的基本原理
這是檢驗兩個彼此獨立樣本是否來自有相同中位數的總體。由于在社會經濟統(tǒng)計中,我們遇到的變量可能是“定序變量”,若檢驗兩個樣本在該變量值上的“一般水平”(統(tǒng)計平均數)是否相同,采用參數統(tǒng)計中“兩個均值差異性”的檢驗可能行不通,這時可采用中位數檢驗法,因為中位數也是一種平均數。中位數檢驗的原假設及備擇假設為:H0:兩個獨立樣本來自有相同中位數的總體
H1:兩個獨立樣本來自的有不同中位數的總體中位數檢驗的檢驗步驟
(1)將兩個彼此獨立的樣本混合,計算出混合樣本的中位數M。(2)計算每個樣本中的變量值實際落在混合中位數之上的個數。(3)計算伴隨概率(累積)。在假設成立的條件之下,該抽樣分布是超幾何分布:
(4)作出檢驗結論。若P<α,即小概率事件不可能發(fā)生,從而拒絕H0,接受H1,認為兩個樣本來自不同中位數的總體。斯米爾諾夫檢驗的基本原理
這是在柯爾莫洛夫檢驗(單樣本,見第二節(jié))的基礎之上推廣到兩個獨立樣本之間的比較,判斷兩個總體分布是否相等的方法。有時也稱K-S雙樣本檢驗。第一個樣本有n1個觀察值,隨機抽自某一分布函數為F(x)(但未知具體形式)的總體,第二個樣本有n2個觀察值,隨機抽自另一分布函數為G(y)(也未知其具體形式)的總體?,F要通過兩個樣本的比較,對以下假設進行檢驗:H0:F(x)=G(y),即兩總體分布相同(-∞<x,y<∞)
H1:F(x)≠G(y),即兩總體分布不同(-∞<x,y<∞)斯米爾諾夫檢驗的檢驗步驟
(1)將兩個樣本的觀察值()與()進行混合,按從小到大次序排列,編制單項式次數分布表。(2)計算經驗分布函數(累積頻率)與。(3)計算統(tǒng)計量即:(4)在給定的顯著性水平α之下,查K-S雙樣本臨界值表,若,則拒絕H0,即認為兩個樣本來自不同分布的總體,或者說,兩個總體的分布函數不等。其實就是兩個經驗分布的最大絕對偏離量。
雙樣本游程檢驗的基本原理
這是單樣本游程檢驗的推廣,用來檢驗兩個獨立樣本是否有相同的總體分布,也稱“瓦爾德-沃夫維茨”的檢驗(Wals-Wolflwitz檢驗,簡記W-W游程檢驗)。雙樣本游程檢驗的檢驗步驟
(1)將兩個樣本的觀察值混合,并按大小順序從小到大排列。并以符號表示第一樣本的元素,以符號y表示第二樣本的元素。(2)計算x,y序列中的游程總數,方法與單樣本游程檢驗完全相同。
雙樣本游程檢驗的檢驗步驟
(3)查游程總數檢驗臨界值表。在單樣本情況下,游程個數太多太少都表示不成立。但在雙樣本情況之下,游程個數越多,表示兩個樣本值的混合越理想,越不能拒絕。故此時要查游程總數檢驗的下限臨界值。若,則拒絕H0,認為游程個數太少,從而兩個樣本來自不同的總體。值得指出的是,當n1或n2超過20時,可用正態(tài)分布來檢驗。獨立雙樣本卡方檢驗的基本原理
該法是單樣本卡方檢驗的推廣,也是列聯(lián)表分析的應用。主要用于檢驗兩個彼此獨立的樣本的頻率分布是否有差異,或是行變量與列變量之間是否具有相關性。
獨立雙樣本卡方檢驗的檢驗步驟
(1)獨立隨機抽取兩個樣本,將全部可能觀察值進行分組(2)計算期望頻數。若兩個樣本對應于具體觀察值的出現概率是相同的(即H0為真,兩個總體無差異),則在實際的調查中,全部n個樣本單位中屬于第i樣品的估計概率為,全部n個樣本單位中,出現第j個觀察結果的估計概率應為。按聯(lián)合概率,即可推知在全部的n個單位中,出現上述表格每一格子中的期望次數Eij為:
(3)計算卡方統(tǒng)計量:(4)作檢驗。若,則拒絕H0,認為兩個總體有顯著差異。第五節(jié)多個相關樣本的非參數檢驗方法一、柯克倫Q檢驗
二、費里德曼雙向評秩方差分析柯克倫Q檢驗的基本原理
將麥克勒瑪檢驗推廣到兩個以上樣本,就得到K個相關樣本的柯克倫(Cochran)Q檢驗,它是用來檢驗配對的三組或三組以上的頻率彼此之間有無顯著差異的一種方法。
柯克倫Q檢驗的原假設及備擇假設一般為:
H0:k個樣本的頻率沒有差異
H1
:k個樣本的頻率有顯著差異柯克倫Q檢驗的檢驗步驟
(1)取得如表12-15所示的原始資料。表12-15柯克倫Q檢驗調查表
…
樣本觀察點樣本1樣本2…樣本k合計123…n合計G1G2…Gk…柯克倫Q檢驗的檢驗步驟
(2)計算D統(tǒng)計量:可以證明,Q~(k-1)
(3)查分布表,作出檢驗。若Q>(k-1),則拒絕H0。認為k個樣本的反應有顯著差異。費里德曼雙向評秩方差分析的基本原理
這也是檢驗K個相關樣本之間差異性的一種非參數統(tǒng)計方法。但它與Q檢驗不同,它要求變量值至少是有順序的。費里德曼(Friedman)雙向評秩方差分析則不同,它更關心分數的高低。其待檢假設為:H0:k個樣本的頻率沒有差異H1:k個樣本的頻率有顯著差異費里德曼雙向評秩方差分析的檢驗步驟
(1)與Q檢驗相類似,取得如表12-17形式的調查表。但此時表中的數值不是0~1變量值,而是秩次或具體數值。若是具體數值,則將之評秩。表12-17費里德曼檢驗調查表
觀察點樣本1樣本2…樣本k12…n合計R1R2…Rk費里德曼雙向評秩方差分析的檢驗步驟
(2)計算統(tǒng)計量:
其中S1,可以證明。
(3)作出檢驗結論。在給定的顯著性水平α之下,查分布表。若>(k-1)則拒絕H0。第六節(jié)多個獨立樣本的非參數檢驗方法一、多個獨立樣本的卡方檢驗二、克魯斯卡爾—瓦利斯H檢驗多個獨立樣本的卡方檢驗的基本原理
將獨立雙樣本檢驗進一步推廣,可得到多個總體的檢驗,或稱“k個總體齊一性檢驗”。它與獨立雙樣本檢驗之下的做法基本相同,也是列聯(lián)表分析技術的應用。它可用來檢驗k個總體的分布是否相等的原假設。多個獨立樣本的卡方檢驗的步驟
(1)將調查數據按樣本及觀察點取值情況進行分組,得如表12-19所示的二維列聯(lián)表,表內為實際觀察頻數Oij。表12-19樣本實際觀察頻數表觀察值樣本1樣本2…樣本k合計X1X
1…XRO11O
21OR1O
12O
22OR2………O
1kO
2k
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年國能生物發(fā)電集團有限公司招聘備考題庫有答案詳解
- 2026年上海外國語大學附屬外國語學校松江云間中學校園招聘備考題庫完整參考答案詳解
- 2026年中國安能集團第一工程局有限公司湖南分公司招聘備考題庫及參考答案詳解
- 2026年慈溪市橋頭初級中學公開招聘派遣制工作人員備考題庫及答案詳解1套
- 2026年中國能源建設集團沈陽電力機械總廠有限公司招聘備考題庫及答案詳解一套
- 2026年同濟大學繼續(xù)教育學院招生專員崗位招聘備考題庫參考答案詳解
- 2026年內江市市中區(qū)中醫(yī)醫(yī)院招聘員額人員備考題庫及答案詳解1套
- 1中山市第一職業(yè)技術學校2026年臨聘教師招聘備考題庫完整參考答案詳解
- 2026年個舊市醫(yī)共體卡房分院招聘備考題庫參考答案詳解
- 2026年山東核電設備制造有限公司招聘備考題庫及完整答案詳解1套
- 2026長治日報社工作人員招聘勞務派遣人員5人備考題庫附答案
- 四省天一聯(lián)考2025-2026學年高三上學期1月月考物理試題
- 2026年【招聘備考題庫】黑龍江省生態(tài)環(huán)保集團有限公司面向社會公開招聘管理人員備考題庫及1套完整答案詳解
- 2026國企綜合基礎知識題庫(附答案)
- 王昭君課件教學課件
- 2025年福建泉州惠安縣宏福殯儀服務有限公司招聘5人筆試考試參考題庫及答案解析
- 2026年教師資格之中學教育知識與能力考試題庫300道含答案(a卷)
- 肝硬化頑固性腹水個案護理
- 2026年上半年西藏省中小學教師資格考試(筆試)備考題庫附答案(培優(yōu)a卷)
- 《短視頻制作與運營》教案 項目5 短視頻剪輯 (剪映)
- 2025年11月5日更新的REACH第35批251項高度關注物質SVHC清單
評論
0/150
提交評論