R語言知識學(xué)習(xí)系列25-K-S分布檢驗與正態(tài)性檢驗_第1頁
R語言知識學(xué)習(xí)系列25-K-S分布檢驗與正態(tài)性檢驗_第2頁
R語言知識學(xué)習(xí)系列25-K-S分布檢驗與正態(tài)性檢驗_第3頁
R語言知識學(xué)習(xí)系列25-K-S分布檢驗與正態(tài)性檢驗_第4頁
R語言知識學(xué)習(xí)系列25-K-S分布檢驗與正態(tài)性檢驗_第5頁
已閱讀5頁,還剩9頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

.K-S分布檢驗與正態(tài)性檢驗(一)假設(shè)檢驗什么是假設(shè)檢驗?實際中,我們只能得到抽取的樣本(部分)的統(tǒng)計結(jié)果,要進(jìn)一謝謝閱讀步推斷總體(全部)的特征,但是這種推斷必然有可能犯錯,犯錯的謝謝閱讀概率為多少時應(yīng)該接受這種推斷呢?為此,統(tǒng)計學(xué)家就開發(fā)了一些統(tǒng)計方法進(jìn)行統(tǒng)計檢定,通過把所精品文檔放心下載得到的統(tǒng)計檢定值,與統(tǒng)計學(xué)家樹立了一些隨機(jī)變量的概率分布進(jìn)行謝謝閱讀對比,我們可以知道在百分之多少的機(jī)遇下會得到目前的結(jié)果。精品文檔放心下載倘若經(jīng)比較后發(fā)現(xiàn),涌現(xiàn)這結(jié)果的機(jī)率很少,即是說,是在時機(jī)感謝閱讀很少、很罕有的情況下才出現(xiàn);那我們便可以有信念地說,這不是巧謝謝閱讀合,該推斷結(jié)果是具有統(tǒng)計學(xué)上的意義的。否則,就是推斷結(jié)果不具謝謝閱讀有統(tǒng)計學(xué)意義。假設(shè)檢驗的基本思想——小概率反證法思想小概率思想是指小概率事件(P<α,α=0.05或0.01)在一次試精品文檔放心下載驗中基本上不會發(fā)生。反證法思想是先提出原假設(shè)(H0),再用適當(dāng)感謝閱讀的統(tǒng)計方法確定假設(shè)成立的可能性(P值)大小,如可能性?。≒≤α),精品文檔放心下載則認(rèn)為原假設(shè)不成立,若可能性大,則還不能認(rèn)為備擇假設(shè)(H1)成立。精品文檔放心下載原假設(shè)與備擇假設(shè)原假設(shè)與備擇假設(shè)是完備且相互獨(dú)立的事件組,一般,.原假設(shè)(H0)——研究者想收集證據(jù)予以反對的假設(shè);備擇假設(shè)(H1)——研究者想收集證據(jù)予以支持的假設(shè);感謝閱讀假設(shè)檢驗的P值,就是在H0為真時,觀察到的差異來源于抽樣謝謝閱讀誤差的可能性大小。假設(shè)檢驗判斷方法有:臨界值法、P值檢驗法。四、假設(shè)檢驗分類及步驟(以t檢驗為例)雙側(cè)檢驗I.原假設(shè)H0:μ=μ0,備擇假設(shè)H1:μ≠μ0;Ⅱ.根據(jù)樣本數(shù)據(jù)計算出統(tǒng)計量t的觀察值t0;Ⅲ.P值=P{|t|≥|t0|}=t0的雙側(cè)尾部的面積;精品文檔放心下載若P值≤α(在雙尾部分),則在顯著水平α下拒絕H0;謝謝閱讀若P值>α,則在顯著水平α下接受H0;注意:α為臨界值,看P值在不在陰影部分(拒絕域),空白部分為接受域。精品文檔放心下載.左側(cè)檢驗I.原假設(shè)H0:μ≥μ0,備擇假設(shè)H1:μ<μ0;感謝閱讀根據(jù)樣本數(shù)據(jù)計算出統(tǒng)計量t的觀察值t0(<0);Ⅲ.P值=P{t≤t0}=t0的左側(cè)尾部的面積;精品文檔放心下載若P值≤α(在左尾部分),則在顯著水平α下拒絕H0;謝謝閱讀P值>α,則在顯著水平α下接受H0;右側(cè)檢驗I.原假設(shè)H0:μ≤μ0,備擇假設(shè)H1:μ>μ0;感謝閱讀根據(jù)樣本數(shù)據(jù)計算出統(tǒng)計量t的觀察值t0(>0);Ⅲ.P值=P{t≥t0}=t0的右側(cè)尾部的面積;感謝閱讀若P值≤α(在右尾部分),則在顯著水平α下拒絕H0;感謝閱讀P值>α,則在顯著水平α下接受H0;.(二)K-S分布檢驗Kolmogorov-Smirnov檢驗,用來檢驗一組樣本數(shù)據(jù)是否服從謝謝閱讀某已知分布,或兩組樣本數(shù)據(jù)是否服從相同分布。用函數(shù)ks.test()實謝謝閱讀現(xiàn),基本格式為:ks.test(x,y,...,alternative=,exact=NULL)謝謝閱讀其中,x為樣本數(shù)據(jù);為分布名(此時…為該分布的參數(shù))或樣本數(shù)據(jù);alternative設(shè)置是"two.sided"雙側(cè)檢驗(默認(rèn))、"less"左側(cè)檢驗、"greater"右側(cè)檢驗;精品文檔放心下載exact設(shè)置是否計算精確p值,默認(rèn)NULL。精品文檔放心下載K-S單樣本總體分布檢驗用來檢驗樣本數(shù)據(jù)是否服從某已知分布。它是一種基于經(jīng)驗分布精品文檔放心下載函數(shù)的檢驗,令sup|F(x)F(x)|nn0n其中,F(xiàn)(x)F(x)為真實的分n 0.布函數(shù)。當(dāng)n時,D的極限分布滿足:nn(1)jexp(2j22),0P{nD}K()jn0,0原假設(shè)H0:FF即分布相同;備擇假設(shè)H1:二者分布不同。精品文檔放心下載n 0X=c(420,500,920,1380,1510,1650,1760,2100,2300,2350)#某設(shè)備10謝謝閱讀次無故障工作時間的數(shù)據(jù)lambda<-mean(X)lambda[1]1489ks.test(X,"pexp",1/lambda)#檢驗是否服從參數(shù)為1/1489的指數(shù)分布One-sampleKolmogorov-Smirnovtest精品文檔放心下載data: XD=0.30418,p-value=0.2563精品文檔放心下載alternativehypothesis:two-sided精品文檔放心下載值=0.2563>0.05,接受原假設(shè)H0,即服從指數(shù)分布。感謝閱讀兩獨(dú)立樣本K-S同分布檢驗假定有分別來自兩個獨(dú)立總體的兩個樣本,要檢驗是否服從同一感謝閱讀分布。設(shè)兩個樣本的樣本量分別為n和n,累積經(jīng)驗分布函數(shù)分別為感謝閱讀1 2.F(

x)

F

(

x)

,令D

F

(x

)

F

(x

)

,則統(tǒng)計量1

2

j

1

j

2

jZmax|D|nn12jjnn12近似服從正態(tài)分布。原假設(shè)H0:FF服從同一分布;備擇假設(shè)H1:不服從同一分感謝閱讀1 2布。xx=c(0.61,0.29,0.06,0.59,-1.73,-0.74,0.51,-0.56,0.39,1.64,0.05,-0.06,0.64,-0.82,0.37,1.77,1.09,-1.28,2.36,1.31,1.05,-0.32,-0.40,1.06,-2.47)感謝閱讀yy=c(2.20,1.66,1.38,0.20,0.36,0.00,0.96,1.56,0.44,1.50,-0.30,0.66,2.31,3.29,-0.27,-0.37,0.38,0.70,0.52,-0.71)謝謝閱讀ks.test(xx,yy)#檢驗兩組數(shù)據(jù)是否服從同一分布謝謝閱讀Two-sampleKolmogorov-Smirnovtest謝謝閱讀data: xxandyyD=0.23,p-value=0.5286精品文檔放心下載alternativehypothesis:two-sided感謝閱讀P值=0.5286>0.05,接受原假設(shè),即兩組數(shù)據(jù)服從同一分布。感謝閱讀1:在做K-S檢驗時,有時會有錯誤提示“Kolmogorov-Smirnov檢驗里不應(yīng)該有連結(jié)”,這是因為K-S檢驗只對連續(xù)CDF感謝閱讀有效,而連續(xù)CDF中出現(xiàn)相同值的概率為0,因此R會報錯。這也提醒我們,在做正態(tài)性檢驗之前,要先對數(shù)據(jù)進(jìn)行描述性分析,對數(shù)精品文檔放心下載.據(jù)整體要先有個大致的認(rèn)識,這也才后續(xù)才能選擇正確的檢驗方法。感謝閱讀2:K-S檢驗主要用于定量數(shù)據(jù),而卡方同質(zhì)性檢驗主要用于分類數(shù)據(jù)。精品文檔放心下載(三)正態(tài)性檢驗原假設(shè)H0:服從正態(tài)分布;備擇假設(shè)H1:不服從正態(tài)分布一、Shapiro-Wilk檢驗(W檢驗)謝謝閱讀適合在樣本量8≤n≤50時使用。W檢驗是建立在次序統(tǒng)計量的基礎(chǔ)上,對n個獨(dú)立觀測值按非降排序,記為x,x,L,x,檢驗統(tǒng)計量:精品文檔放心下載1 2 nW[na(xx)]2i1in1iii1i當(dāng)總體分布為正態(tài)分布時,W值應(yīng)該接近于1。用函數(shù)shapiro.test()實現(xiàn),基本格式為:感謝閱讀shapiro.test(x)其中,x為樣本數(shù)據(jù)。attach(mtcars)shapiro.test(mpg)Shapiro-Wilknormalitytest精品文檔放心下載data: mpgW=0.94756,p-value=0.1229精品文檔放心下載.detach(mtcars)P值=0.1229>0.05,接受原假設(shè),即服從正態(tài)分布。謝謝閱讀二、Kolmogorov-Smirnov檢驗(D檢驗)感謝閱讀適合在樣本量50≤n≤1000時使用。即將前文的K-S單樣本總體分布檢驗的已知分布,設(shè)為正態(tài)分布即可。精品文檔放心下載或者使用Lilliefor檢驗,它是Kolmogorov-Smirnov正態(tài)性檢驗修正,使用nortest包中的函數(shù)lillie.test()實現(xiàn)?;靖袷綖椋褐x謝閱讀lillie.test(x)其中x為樣本數(shù)據(jù)。library(nortest)attach(mtcars)lillie.test(mpg)Lilliefors(Kolmogorov-Smirnov)normalitytest精品文檔放心下載data: mpgD=0.1263,p-value=0.2171精品文檔放心下載detach(mtcars)P值=0.2171>0.05,接受原假設(shè),即服從正態(tài)分布。謝謝閱讀三、Jarque-Bera正態(tài)性檢驗.是基于偏度和峰度的聯(lián)合分布檢驗法。記偏度為S,峰度為K,則統(tǒng)計量:謝謝閱讀JBn6k(S2K42)~2(2)精品文檔放心下載用tseries包中的使用函數(shù)jarque.bera.test()實現(xiàn),基本格式:感謝閱讀jarque.bera.test(x)其中,x為樣本數(shù)據(jù)。library(tseries)attach(mtcars)jarque.bera.test(mpg)JarqueBeraTestdata: mpgX-squared=2.2412,df=2,p-value=0.3261感謝閱讀detach(mtcars)P值=0.2412>0.05,接受原假設(shè),即服從正態(tài)分布。精品文檔放心下載注:還可以使用nromtest包中的函數(shù)jb.norm.test()和謝謝閱讀ajb.norm.test(),前者參數(shù)除了x之外,多了一個蒙特卡羅模擬值,默謝謝閱讀認(rèn)是2000,后者是J-B檢驗的修正,主要解決JB統(tǒng)計量收斂速度慢精品文檔放心下載的缺點(diǎn)。四、其它正態(tài)性檢驗nortest包中還提供了:.AD正態(tài)性檢驗函數(shù)ad.test(x),計算統(tǒng)計量A值(越接近0越服從正態(tài)分布)和感謝閱讀值。Cramer-vonMises正態(tài)性檢驗函數(shù)cvm.test(x)Pearson卡方正態(tài)性檢驗函數(shù)pearson.test(x)精品文檔放心下載Shapiro-Francia正態(tài)性檢驗函數(shù)sf.test(x)五、多元正態(tài)性檢驗檢驗shapiro.test()可推廣到多元正態(tài)性檢驗,使用謝謝閱讀mvnormtest包中的函數(shù)mshapiro.test()感謝閱讀或者使用Q-Q圖檢驗,若有一個p×1的多元正態(tài)隨機(jī)向量x,均值為μ,協(xié)方差矩陣為Σ,那么x與μ的馬氏距離的平方服從自由度感謝閱讀p的卡方分布。Q-Q圖展示卡方分布的分位數(shù),橫縱坐標(biāo)分別是樣本量與馬氏距離平方值。如果點(diǎn)全部落在斜率為1、截距項為0的感謝閱讀直線上,則表明數(shù)據(jù)服從多元正態(tài)分布。library(MASS)attach(UScereal)y<-cbind(calories,fat,sugars)謝謝閱讀head(y).caloriesfatsugars[1,]212.12123.03030318.18182[2,]212.12123.03030315.15151[3,]100.00000.0000000.00000[4,]146.66672.66666713.33333[5,]110.00000.00000014.00000[6,]173.33332.66666710.66667#mshapiro.test()函數(shù)檢驗多元正態(tài)性library(mvnormtest)mshapiro.test(t(y))#注意要對y轉(zhuǎn)置謝謝閱讀Shapiro-Wilknormalitytest感謝閱讀data: ZW=0.6116,p-value=7.726e-12謝謝閱讀#Q-Q圖檢驗多元正態(tài)性cente

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論