版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
非參數(shù)假設檢驗遼寧工程技術大學L.NTECHNICALUNIVERSITY追求
非參數(shù)檢驗是相對于參數(shù)檢驗而言的,這兩種檢驗方法在實際中都有廣泛的應用,但它們有著不同的數(shù)理統(tǒng)計原理和應用場合。在統(tǒng)計學的發(fā)展過程中,最先出現(xiàn)的推斷統(tǒng)計方法都對樣本所屬總體的性質作出若干假設,即對總體的分布形狀作某些限定,例如Z檢驗、t檢驗,假設樣本的總體分布加以某些限定,把所要推斷的總體數(shù)字特征看作未知的“參數(shù)”進行推斷,稱之為參數(shù)統(tǒng)計方法(Parameterstatisticalmethods)或限定分布統(tǒng)計方法(distribution-specifiedstatistical
methods),基于此所做的假設檢驗就稱為參數(shù)檢驗(Parametrictest)。常用的檢驗如t檢驗、Z檢驗、F檢驗等都是參數(shù)檢驗。參數(shù)檢驗只有在關于總體分布的假設成立時,所得出的結論才是正確的,所以它在很多場合不便應用,于是統(tǒng)計學家發(fā)展了許多對總體不作太多或嚴格限定的統(tǒng)計推斷方法,這些方法一般不涉及總體參數(shù)的假設,與之相對應的統(tǒng)計方法通常稱為非參數(shù)統(tǒng)計(Nonparametricstatistics)或自由分布統(tǒng)計方法(Distribution-freestatiscalmethods),基于此所做的假設檢驗則稱為非參數(shù)檢驗(Nonparametrictest)或自由分布統(tǒng)計檢驗(Distribution-freestatisticaltest)。非參數(shù)檢驗的前提假設比參數(shù)檢驗方法少很多,也容易滿足,適用于已知信息相對較少的數(shù)據(jù)資料,而且它的計算方法也簡便易行。與參數(shù)檢驗方法對比,非參數(shù)檢驗方法具有以下優(yōu)點:檢驗條件寬松,適應性強。參數(shù)檢驗假定總體分布為正態(tài)、近似正態(tài)或以正態(tài)分布為基礎而構造的t分布或分布;非參數(shù)檢驗不受這些條件的限制,彌補了參數(shù)檢驗的不足,對于非正態(tài)的、方差不等的以及分布形狀未知的數(shù)據(jù)都適用。檢驗方法靈活,用途廣泛。非參數(shù)檢驗不但可以應用與定距、定比等連續(xù)變量的檢驗,而且適用于定類、定序等分類變量的檢驗。對于那些不能直接進行四則運算的定類數(shù)據(jù)和定序數(shù)據(jù),運用符號檢驗、符號秩檢驗都能起到好的效果。非參數(shù)檢驗的計算相對簡單,易于理解。由于非參數(shù)檢驗更多地采用計數(shù)的方法,其過程及結果都可以被直觀地理解,為使用者所接受。非參數(shù)檢驗的優(yōu)點非參數(shù)檢驗的缺點非參數(shù)檢驗也有一些不可避免的缺點:非參數(shù)檢驗方法對總體分布的假定不多,適應性強,但方法本身也就缺乏針對性,其功效不如參數(shù)檢驗。非參數(shù)檢驗使用的是等級或符號秩,而不是實際數(shù)值,方法雖簡單,但會失去許多信息,因而檢驗的有效性也就比較差。例如對于一批適用于t檢驗的配對資料,如果采用符號秩檢驗處理,其功效將低于t檢驗,如果用符號檢驗處理則效率更低,因為它對信息的利用更不充分。當然,如果假定的分布不成立,那么非參數(shù)檢驗就是更值得信賴的。一個總體分布的非參數(shù)假設檢驗(2)兩個總體的分布未知,它們是否相同;非參數(shù)假設檢驗需要處理的問題:(1)猜出總體的分布(假設),用另一組樣本檢驗。兩個總體分布的非參數(shù)假設檢驗內(nèi)容多個總體分布的非參數(shù)假設檢驗一個總體分布的檢驗檢驗總體的卡方分布檢驗總體的二項分布單樣本變量值的隨機性檢驗(游程檢驗)單樣本的Kolmogorov—Smirnov檢驗檢驗總體的正態(tài)分布
P-P正態(tài)概率分布圖(GraphsP-P)
Q-Q正態(tài)概率單位分布圖(GraphsQ-Q)檢驗總體的正態(tài)分布的圖示法
是根據(jù)變量的累計比例對所指定的理論分布累計比例繪制的圖形。
是根據(jù)變量分布的分位數(shù)對所指定的理論分布分位數(shù)繪制的圖形。Blom’s方法:使用公式:Tukey方法:使用公式:Rankit方法:使用公式:VanderWaerden方法:使用公式:n:個案的數(shù)目r:從1到n的秩次式中:選擇比率估測的公式,每次只能選擇一項。
若與某個概率分布的統(tǒng)計圖一致,即被檢驗的數(shù)據(jù)符合所指定的分布,則代表個案的點簇在一條直線上。
總體分布的卡方檢驗的原理:如果從一個隨機變量X中隨機抽取若干個觀察樣本,這些觀察樣本落在X的K個互不相交的子集中的觀察頻數(shù)服從一個多項分布,該多項分布當K趨于無窮時,就近似服從X的總體分布。
因此,假設樣本來自的總體服從某個期望分布或理論分布,同時獲得樣本數(shù)據(jù)各子集的實際觀察頻數(shù),則可依據(jù)下面統(tǒng)計量作出推斷:例題檢驗總體的卡方分布
用于選擇計算非參數(shù)檢驗統(tǒng)計量對應的P值的方法。SPSS提供了3種計算P值的方法:Asymptoticonly:漸進性的顯著性檢驗,適合于樣本服從漸進分布或較大樣本。MonteCarlo:不依賴漸進性方法估測精確顯著性,這種方法在數(shù)據(jù)不滿足漸進性分布,而且樣本數(shù)據(jù)過大以致不能計算精確顯著性時特別有效。Exact:精確計算法,即準確計算觀測結果的統(tǒng)計概率。計算量較大,適用于小樣本。
練習:賽馬比賽時,任一馬的起點位置是起跑線上所指定的標桿位置?,F(xiàn)有8匹馬的比賽,位置1是內(nèi)側最靠近欄桿的跑道,位置8是外側離欄桿最遠的跑道,下表是某賽馬在一個月內(nèi)某特定圓形跑道上的紀錄,并且按照起點的標桿位置分類。試檢驗起點標桿位置對賽馬結果的影響。起點標桿位置總數(shù)12345678獲勝頻數(shù)2919182517101511144馬在8個圓形跑道的起點標桿位置上獲勝的紀錄均勻分布檢驗
二項分布檢驗的基本思想:根據(jù)搜集到的樣本數(shù)據(jù),推斷總體分布是否服從某個指定的二項分布。SPSS中的二項分布檢驗,在樣本小于等于30時,按照計算二項分布概率的公式進行計算;樣本數(shù)大于30時,計算的是Z統(tǒng)計量,認為在零假設下,Z統(tǒng)計量服從正態(tài)分布。
其零假設:樣本來自的總體與所指定的某個二項分布不存在顯著的差異。K:觀察變量取值的樣本個數(shù),當K小于n/2時,取加號;p為檢驗概率。練習檢驗總體的二項分布
練習:某地某一時期內(nèi)出生35名嬰兒,其中女孩兒19名(Sex=0),男孩兒16名(Sex=1)。問,該地區(qū)出生嬰兒的性別比例與通常的男女性別比例(總體概率約為0.5)是否不同?數(shù)據(jù)如下表所示:續(xù)35家住戶的發(fā)病情況住戶發(fā)病情況住戶發(fā)病情況住戶發(fā)病情況111312512014126131151270411612815117029061180300701913118020132090210330100220340111231350121241單樣本的Kolmogorov—Smirnov檢驗
單樣本K—S檢驗是一種擬合優(yōu)度的非參數(shù)檢驗,是利用樣本數(shù)據(jù)推斷總體是否服從某一理論分布的方法,適用于探索連續(xù)性隨機變量的分布形態(tài)。進行Kolmogorov-SmirnovZ檢驗,是將一個變量的實際頻數(shù)分布與正態(tài)分布(Normal)、均勻分布(Uniform)、泊松分布(Poisson)進行比較。
SPSS實現(xiàn)K—S檢驗的過程如下:(1)根據(jù)樣本數(shù)據(jù)和用戶的指定構造出理論分布,查分布表得到相應的理論累計概率分布函數(shù)。(2)利用樣本數(shù)據(jù)計算各樣本數(shù)據(jù)點的累積概率,得到檢驗累計概率分布函數(shù)
。(3)計算和在相應的變量值點X上的差,得到差值序列。單樣本K—S檢驗主要對差值序列進行研究。例題
例題:某地144個周歲兒童身的高數(shù)據(jù)如下表,問該地區(qū)周歲兒童身高頻數(shù)是否成正態(tài)分布?身高區(qū)間人數(shù)64—268—469—770—1671—2072—2573—2474—2276—1678—279—683—1
練習:某報刊亭為研究每天報刊的銷售量,為以后每天報刊進量提供依據(jù),統(tǒng)計其在140天的銷售中,某日報的日銷售量的頻數(shù)資料如下表,問該資料的頻數(shù)是否服從正態(tài)分布?日銷售量(份)天數(shù)日銷售量(份)天數(shù)<1592210~21924160~1694220~22922170~1797230~23916180~18916240~2492190~19920250~2596200~20925>2601兩個總體獨立樣本的非參數(shù)檢驗檢驗兩個總體的分布是否相同:方差相同分布函數(shù)形式相同兩個總體的分布若相同參數(shù)相同均值相同(2)兩個總體的分布未知,它們是否相同;Wald-wolfowitzRuns游程檢驗Mann-WhitneyU秩和檢驗Kolmogorov—Smirnov檢驗MosesExtremeReactions極端反應檢驗兩個總體獨立樣本的非參數(shù)檢驗方法兩個總體獨立樣本非參數(shù)檢驗方法的SPSS操作零假設:樣本來自的兩獨立總體分布無顯著差異
K-S檢驗實現(xiàn)的方法:將兩組樣本數(shù)據(jù)混合并升序排列,分別計算兩組樣本秩的累計頻率和每個點上的累積頻率,然后將兩個累計頻率相減,得到差值序列數(shù)據(jù)。K-S檢驗將關注差值序列,并計算K-S的Z統(tǒng)計量,依據(jù)正態(tài)分布表給出相應的相伴概率值。(1)Kolmogorov—Smirnov檢驗兩組樣本是可以各自獨立顛倒順序的(2)Mann-WhitneyU秩和檢驗法檢驗這兩組樣本是否來自同一個總體(或兩組樣本的總體分布是否相同)。問題:有兩個總體的樣本為:與可能。。Mann-WhitneyU檢驗的統(tǒng)計量是:式中對給定,查值表,得若,則總體分布相同。
兩樣本W(wǎng)ald-wolfowitz游程檢驗中,計算游程的方法與觀察值的秩有關。首先,將兩組樣本混合并升序排列。在數(shù)據(jù)排序時,兩組樣本的每個觀察值對應的樣本組標志值序列也隨之重新排列,然后對標志值序列求游程。
如果計算出的游程數(shù)相對比較小,則說明樣本來自的兩總體分布形態(tài)存在較大差距。SPSS將自動計算游程數(shù)得到Z統(tǒng)計量,并依據(jù)正態(tài)分布表給出對應的相伴概率值。(3)Wald-wolfowitz游程檢驗
如果跨度或截頭跨度很小,說明兩個樣本數(shù)據(jù)無法充分混合,認為實驗樣本存在極端反應。
兩獨立樣本的極端反應檢驗,將一個樣本作為控制樣本,另一個樣本作為實驗樣本。以控制樣本做對照,檢驗實驗樣本是否存在極端反應。
首先,將兩組樣本混合并升序排列;然后計算控制樣本最低秩和最高秩之間的觀察值個數(shù),即:Span(跨度)。
為控制極端值對分析結果的影響,可先去掉樣本兩個最極端的觀察值后,再求跨度,這個跨度稱為截頭跨度。零假設:樣本來自的兩獨立總體分布沒有顯著差異。(4)Moses極端反應檢驗兩組獨立樣本的總體分布是否相同的檢驗例如:用兩種激勵方法對同樣工種的兩個班組進行激勵,每個班組都有7個人,測得激勵后的業(yè)績增長率如下表所示,問:兩種激勵方法的激勵效果的分布有無顯著差異?兩種激勵方法分別用于兩個班組的效果(%)激勵法A16.1017.0016.8016.5017.5018.0017.20激勵法B17.0016.4015.8016.4016.0017.1016.90SPSS的實現(xiàn)過程:
點擊進入Analyze菜單的NonparametricTests子菜單,選擇2IndependentSample命令。
MosesExtremeReactions(極端檢驗):檢驗兩個獨立樣本觀察值的散布范圍是否有差異存在,以檢驗兩個樣本是否來自具有同一分布的總體。
Mann-WhitneyU:檢驗兩個獨立樣本所屬的總體均值是否相同。
Kolmogorov-SmirnovZ(K—S):推測兩個樣本是否來自具有相同分布的總體。
Wald-Wolfowitzruns(游程檢驗):考察兩個獨立樣本是否來自具有相同分布的總體。
練習:研究兩個不同廠家生產(chǎn)的燈泡使用壽命是否存在顯著性差異,隨機抽取兩個廠家生產(chǎn)的燈泡,試驗得到的使用壽命數(shù)據(jù)如下表:燈泡壽命廠家編號67516821691167016501693165016492680263026502646265126202兩個總體配對樣本的非參數(shù)檢驗方法McNemar檢驗Sign符號檢驗法(正負號檢驗法)Wilcoxon秩和檢驗(1)Wilcoxon秩和檢驗法
設有兩個總體的樣本為:把兩組樣本放在一起,按樣本觀察值較多地集中在左段。w太大,說明樣本較多地集中在右段。。兩組樣本是可以各自獨立顛倒順序的??赡芘cw太小,說明樣本(秩)加總起來,記為w。如果兩個總體的分布相同,則樣本應當是均勻混合的,即w不能太小,也不能太大。的序號為秩。把樣本個數(shù)少的這組樣本那么每個觀察值就有一個序號,稱的大小重新排序,不妨設續(xù)顯著性水平,則接受
由于,∴w應在某兩個數(shù)字之間:,可以由威爾可可遜表,依據(jù)是由所決定的。對于給定的查出。若,或,則拒絕反之,若。McNemar變化顯著性檢驗,以研究對象自身為對照,檢驗其兩組樣本“前后”變化是否顯著。該檢驗要求待檢驗的兩組樣本的觀察值是二值數(shù)據(jù)。即該法適用于相關的二分變量數(shù)據(jù)。零假設:樣本來自的兩配對總體分布無顯著差異McNemar變化顯著性檢驗基本方法:二項分布檢驗。例題(2)McNemar檢驗
例題:分析學生接受某種方法進行訓練的效果,收集到10個學生在訓練前、訓練后的成績?nèi)缦卤硭?,問訓練前后學生的成績是否存在顯著性差異?訓練前訓練后訓練前成績訓練后成績0158.0070.001170.0071.000145.0065.000156.0068.000045.0050.000050.0055.001161.0075.001170.0070.000155.0065.001160.0070.00不能各自獨立地顛倒順序。要求樣本發(fā)生的概率為(3)符號檢驗法(正負號檢驗法)復習二項分布:或在次重復努力試驗中,事件,在次試驗中出現(xiàn)的次數(shù)為,則如果隨機變量的分布如下:則稱服從參數(shù)為的二項分布,記為且二項分布的均值為,方差為。若隨機變量X~分布,則統(tǒng)計量且,定理一:~定理二:函數(shù)的均值定理三:
當充分大時,近似地服從均值、的正態(tài)分布,即標準差為
按照經(jīng)驗,只要,同時,,就可以認為足夠大了,用正態(tài)分布來近似它。符號檢驗法的思路:若兩個總體的分布相同,即,則令::的個數(shù)的個數(shù):的個數(shù):的個數(shù):則設∴式中用容量相同的兩個配對樣本來檢驗,即所以問題轉化為:求從小到大的累積概率:正負號個數(shù)檢驗法的處理①小樣本情況下:對對求從大到小的累積概率:即若則接受是拒絕的最高界限。是拒絕的最低界限。小樣本情況下大樣本情況下S統(tǒng)計量對于顯著性水平假設:(即式中用(即))絕還是接受。所謂“大樣本”,就是要檢驗統(tǒng)計量為:代替,得出拒是否大于判斷,同時
②大樣本情況下,正負號個數(shù)檢驗法的處理例一個賣襯衣的郵購店從過去的經(jīng)驗中得知有15%的購買者說襯衣的大小不合身,要求退貨。現(xiàn)這家郵購店改進了郵購定單的設計,結果在以后售出的500件襯衣中,有60件要求退貨。問:在5%的a水平上,改進后的退貨比例(母體比例)與原來的退貨比例有無顯著差異?
由于=500×0.15=75>25,已經(jīng)足夠大,故由中心極限定理,近似地服從均值為、的正態(tài)分布。于是取顯著性水平,方差為解::與可從“符號檢在顯著性水平之下,依據(jù)S=min(,)③處理正負號個數(shù)檢驗法的S統(tǒng)計量方法
,選統(tǒng)計量:記,若則拒絕假設認為則接受假設若,認為。這一檢驗法的重要的前提與前兩個方法相同,驗表”中查出
:與就越接近。S越小,的差別就越大與即按照問題本來的屬性,天然地配對。不能各自獨立地顛倒順序?;驑颖咀⒁猓篠越大,多獨立樣本的K—W檢驗多獨立樣本的Median檢驗多個總體獨立樣本的非參數(shù)檢驗多獨立樣本的K—T檢驗SPSS實現(xiàn)的過程中,將多組樣本數(shù)據(jù)混合并升序排列,求出混合樣本數(shù)據(jù)的中位數(shù),并假設是共同的中位數(shù)。
如果多組獨立樣本的中位數(shù)無顯著差異,則說明多組獨立樣本有共同的中位數(shù)。如果每組中大于該中位數(shù)的中位數(shù)大致等于每組中小于該中位數(shù)的樣本數(shù),則可以認為該多個獨立總體的中位數(shù)沒有顯著差異。多獨立樣本的中位數(shù)檢驗
通過對多組數(shù)據(jù)的分析,推斷多個獨立總體分布是否存在顯著差異。
零假設:樣本來自的多個獨立總體的中位數(shù)無顯著差異。多獨立樣本的K—W檢驗
零假設:樣本來自的多個獨立總體的分布無顯著差異。SPSS的實現(xiàn),將多組樣本數(shù)據(jù)混合并升序排列,求出求出每個觀察值的秩,然后對多組樣本的值分別求平均值。如果各組樣本的平均秩大致相等,則認為多個獨立總體的分布無顯著差異。n第i組樣本的觀察值個數(shù);R平均秩。例題
例題:隨機抽取3個班級學生的21個成績樣本,問3個班級學生總體成績是否存在顯著差異?學生成績所屬班級學生成績所屬班級60.00190.00270.00196.00271.00170.00280.00185.00375.00192.00365.00197.00390.00196.00380.00288.00385.00289.00381.00280.00383.002多個總體配對樣本的非參數(shù)檢驗多配對樣本的Friendman檢驗多配對樣本的Kendall檢驗多配對樣本的CochranQ檢驗多配對樣本的Friendman檢驗要求:數(shù)據(jù)是定距的。
實現(xiàn)原理:以樣本為單位,將各個樣本數(shù)據(jù)按照升序排列,求各個樣本數(shù)據(jù)在各自行中的秩,然后計算個樣本的秩總和及平均秩。
如果多個配對樣本的分布存在顯著性差異,則數(shù)值普遍偏大組的秩和必然偏大,各組的秩之間就會存在顯著差異。如果個樣本的平均秩大致相當,則可以認為個組的總體分布沒有顯著差異。例題
例題:為了試驗某種減肥藥物的性能,測量11個人在服用該藥以前以及服用該藥1個月后、2個月后、3個月后的體重。問:在這4個時期,11個人的體重有無發(fā)生顯著的變化?Pre-1Post-1Post-2Post-380.0080.0070.0069.0079.0075.0071.0070.0085.0080.0075.0075.0080.0075.0068.0070.0075.0075.0074.0070.0074.0074.0070.0069.0065.0065.0063.0061.0070.0070.0070.0070.0080.0070.0065.0065.0075.0072.0070.0060.0080.0080.0070.0069.00多配對樣本的Kendall檢驗
主要用于分析評判者的判別標準是否一致公平。它將每個評判對象的分數(shù)都看作是來自多個配對總體的樣本。一個評判對象對不同評判對象的分數(shù)構成一個樣本,其零假設:樣本來自的多個配對總體的分布無顯著差異,即評判者的評判標準一致。Kendall協(xié)同系數(shù)W的公式:例題R:第i個被評判者的秩和;n:被評判者人數(shù);m:評判人數(shù)。
例題:某文藝晚會有5個節(jié)目,共有5個評委參與打分。問這5個評委的判別標準是否一致,數(shù)據(jù)如下表。注意:不是檢驗這5個節(jié)目之間實際是否存在顯著的差異。節(jié)目1節(jié)目2節(jié)目3節(jié)目4節(jié)目5評委18.758.258.809.008.50評委210.009.509.508.909.50評委39.609.109.108.5
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年可持續(xù)發(fā)展目標在土木工程中的實施
- 《室外給水工程》-第十章
- 教師資格證面試現(xiàn)場答題技巧
- 小學語文階梯閱讀指導手冊
- 城市公共交通優(yōu)先發(fā)展規(guī)劃報告
- 2026屆高三生物一輪復習課件微生物的培養(yǎng)技術與應用
- 課件知識總結報告
- IT服務管理流程及制度建設參考文本
- 采購驗收流程標準化管理文檔
- 中學物理復習課教學設計方案
- 中考數(shù)學常見幾何模型簡介
- 新媒體數(shù)據(jù)分析與應用學習通課后章節(jié)答案期末考試題庫2023年
- 2022年內(nèi)蒙古交通運輸廳所屬事業(yè)單位考試真題及答案
- 第六講通量觀測方法與原理
- 海水淡化PX能量回收裝置維護說明書
- 婦產(chǎn)科學(第9版)第二章女性生殖系統(tǒng)解剖
- 中醫(yī)經(jīng)絡之-特定穴課件
- GB/T 9122-2000翻邊環(huán)板式松套鋼制管法蘭
- GB/T 5563-2013橡膠和塑料軟管及軟管組合件靜液壓試驗方法
- GB/T 4963-2007聲學標準等響度級曲線
- 金融支付清算系統(tǒng)術語大全(中英文對照)
評論
0/150
提交評論