非參數(shù)統(tǒng)計十道題_第1頁
非參數(shù)統(tǒng)計十道題_第2頁
非參數(shù)統(tǒng)計十道題_第3頁
非參數(shù)統(tǒng)計十道題_第4頁
非參數(shù)統(tǒng)計十道題_第5頁
已閱讀5頁,還剩13頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

非參數(shù)統(tǒng)計 十道題09統(tǒng)計學(xué)王若曦114一、Wilcoxon符號秩檢驗下面是10個歐洲城鎮(zhèn)每人每年平均消費的酒類相當(dāng)于純酒精數(shù),數(shù)據(jù)已經(jīng)按升序排列:4.125.817.639.7410.3911.9212.3212.8913.5414.45人們普遍認為歐洲各國人均年消費酒量的中位數(shù)相當(dāng)于純酒精8升,試用上述數(shù)據(jù)檢驗這種看法。數(shù)據(jù)來源:《非參數(shù)統(tǒng)計(第二版)》吳喜之手算:建立假設(shè)組:H:M=80H:M>81編號純酒精數(shù)xD=x-8|D||d|的秩D的符號14.12-3.883.885—25.81-2.192.193—37.63-0.370.371—49.741.741.742+510.392.392.394+611.923.923.926+712.324.324.327+812.894.894.898+913.545.545.549+1014.456.456.4510+T二2+4+6+7+8+9+10二46+T二5+3+1二9n=10查表得p=0.032va=0.05,因此拒絕原假設(shè),即認為歐洲各國人均年消費酒量的中位數(shù)多于8升。SPSS:操作:Analyze NonparametricTests 2-RelatedSampleTestRanksNMeanRankSumofRanksc-x NegativeRanks7a6.5746.00PositiveRanks3b3.009.00Ties0cTotal10TOC\o"1-5"\h\zc<xc>xc=xTeststatisticsbc-xZ-1.886aAsymp.Sig.(2-tailed).059ExactSig.(2-tailed).064ExactSig.(1-tailed).032PointProbability.008Basedonpositiveranks.WilcoxonSignedRanksTest由輸出結(jié)果可知,單側(cè)精確顯著性概率P=0.032va=0.05,因此拒絕原假設(shè),即認為歐洲各國人均年消費酒量的中位數(shù)多于8升。與手算結(jié)果相同。R語言:x=c(4.12,5.81,7.63,9.74,10.39,11.92,12.32,12.89,13.54,14.45)wilcox.test(x-8,alt="greater")Wilcoxonsignedranktestdata:x-8V=46,p-value=0.03223alternativehypothesis:truelocationisgreaterthan0由輸出結(jié)果可知,P=0.03223<a=0.05,因此拒絕原假設(shè),即認為歐洲各國人均年消費酒量的中位數(shù)多于8升。與以上結(jié)果一致。二、Mann-Whitney-Wilcoxon檢驗下表為8個亞洲國家和8個歐美國家2005年的人均國民收入數(shù)據(jù)。檢驗亞洲國家和歐美國家的人均國民收入是否有顯著差異(a=0.05)。亞洲國家人均國民收入(美元)歐美國家人均國民收入(美元)中國1740美國43740日本38980加拿大32600印度尼西亞1280德國34580馬來西亞4960英國37600泰國2750法國34810新加坡27490意大利30010韓國15830墨西哥7310印度720巴西3460數(shù)據(jù)來源:《統(tǒng)計學(xué)(第三版)》賈俊平手算:設(shè)亞洲國家為X,歐美國家為Y建立假設(shè)組:H:M=M0xyH:M豐M1xy數(shù)值秩組別數(shù)值秩組別7201X274909X12802X3001010Y17403X3260011Y27504X3458012Y34605Y3481013Y49606X3760014Y73107Y3898015X158308X4374016YT=1+2+3+4+6+8+9+15=48xT=5+7+10+11+12+13+14+16=88yN=m+n=16,m=n=8,U=T-m(m+1)/2=12x查表得,Tx=48的右尾概率的2倍為0.019*2=0.038<?=0.05,因此拒絕原假設(shè),即認為亞洲國家和歐美國家的人均國民收入有顯著差異。SPSS:操作:Data SortCasesAnalyze NonparametricTests 2-IndependentSamplesRanks分組NMeanRankSumofRanks收入亞洲國家86.0048.00歐美國家811.0088.00Total16TestStatisticsb收入Mann-WhitneyU12.000WilcoxonW48.000Z-2.100Asymp.Sig.(2-tailed).036ExactSig.[2*(1-tailedSig.)]?038aExactSig.(2-tailed).0383ExactSig.(1-tailed).019PointProbability.005Notcorrectedforties.GroupingVariable:分組由輸出結(jié)果可知,精確雙尾概率P=0.038v =0.05,因此拒絕原假設(shè),即認為亞洲國家和歐美國家的人均國民收入有顯著差異。與手算結(jié)果一致。R語言:x<-c(1740,38980,1280,4960,2750,27490,15830,720)y<-c(43740,32600,34580,37600,34810,30010,7310,3460)wilcox.test(x,y,exact=F,cor=F)Wilcoxonranksumtestdata:xandyW=12,p-value=0.03569alternativehypothesis:truelocationshiftisnotequalto0由輸出結(jié)果可知,P=0.03569va=0.05,因此拒絕原假設(shè),即認為亞洲國家和歐美國家的人均國民收入有顯著差異。與以上結(jié)果一致。三、 兩樣本的Kolmogorov-Smirnov檢驗下面是13個非洲地區(qū)和13個歐洲地區(qū)的人均酒精年消費量,試分析這兩個地區(qū)的酒精人均年消費量是否分布相同。非洲歐洲5.386.674.3816.219.3311.933.669.853.7210.431.6613.540.232.40.0812.892.369.31.7111.922.015.740.914.451.541.99數(shù)據(jù)來源:《非參數(shù)統(tǒng)計(第二版)》吳喜之手算:建立假設(shè)組

H:F(x)=F(x)012H:F(x)主F(x)112xf1f2工f1工f2S(x)1S(x)2D0.0810100.07692300.0769230.2310200.15384600.1538460.910300.23076900.2307691.5410400.30769200.3076921.6610500.38461500.3846151.7110600.46153800.4615381.9901610.4615380.0769230.3846152.0110710.5384620.0769230.4615382.3610810.6153850.0769230.5384622.401820.6153850.1538460.4615383.6610920.6923080.1538460.5384623.72101020.7692310.1538460.6153854.38101120.8461540.1538460.6923085.38101220.9230770.1538460.7692315.74011230.9230770.2307690.6923086.67011240.9230770.3076920.6153859.3011250.9230770.3846150.5384629.331013510.3846150.6153859.850113610.4615380.53846210.430113710.5384620.46153811.920113810.6153850.38461511.930113910.6923080.30769212.8901131010.7692310.23076913.5401131110.8461540.15384614.4501131210.9230770.07692316.21011313110D=max(|D|)=0.769231,mnD=130查表得,當(dāng)mnD=130時,雙側(cè)檢驗的概率Pv0.01,所以P"=0.05,因此拒絕原假設(shè),即認為這兩個地區(qū)的酒精人均年消費量分布有顯著差異。SPSS:操作:Analyze NonparametricTests 2-IndependentSamplesFrequencies分組N消費量非洲地區(qū)13歐洲地區(qū)13Frequencies分組N消費量非洲地區(qū)13歐洲地區(qū)13Total26TestStatisticsa消費量MostExtremeDifferencesAbsolute.769Positive.769Negative.000Kolmogorov-SmirnovZ1.961Asymp.Sig.(2-tailed).001ExactSig.(2-tailed).000PointProbability.000GroupingVariable:分組由輸出結(jié)果可知,雙側(cè)精確顯著性概率P=?=0.05,因此拒絕原假設(shè),即認為這兩個地區(qū)的酒精人均年消費量分布有顯著差異。與手算結(jié)果一致。四、CochranQ檢驗下面是某村村民對四個候選人(A,B,C,D)的贊同與否的調(diào)查“1”代表同意,“0”代表不同意);最后一列為行總和,最后一行為列總和,全部“1”的總和為42。試分析4位候選人在村民眼中有沒有區(qū)別(Q=0.05)。20個村民對A、B、C、D四個候選人的評價NA0110011111111111011116B1100011111011011000011C011110000100011010109D000011001000010110006L1321232233122333212142數(shù)據(jù)來源:《非參數(shù)統(tǒng)計(第二版)》吳喜之手算:建立假設(shè)組:H:4位候選人在村民眼中沒有差異0H:4位候選人在村民眼中有差異(k-1)Ik工x2-£)2|Q=Lj=ijj=ij」=(4-1)[4(1壓+112+92+62)-422]=9.3529k工V-》V2 4(42)-(5x12+8x22+7x32) *iii=1i=1df=4-1=3查表得X2二7.82<Q二9.3529,因此在5%的顯著性水平上拒絕原假設(shè),即認為40.05位候選人在村民眼中有顯著差異。SPSS:操作:Analyze NonparametricTests KRelatedSamplesFrequenciesVaue01A416B911C119D146TestStatisticsN20Cochran'sQ9.353adf3Asymp.Sig..025ExactSig..025PointProbability.006a.0istreatedasasuccess.由輸出結(jié)果可知,Q=9.353,精確的顯著性概率P=0.025v?=0.05,因此拒絕原假設(shè),即認為4位候選人在村民眼中有顯著差異。與手算結(jié)果一致。R語言:x=read.table("f:/CochranQ.txt")n=apply(x,2,sum)N=sum(n)L=apply(x,1,sum)k=dim(x)[2]Q=(k*(k-1)*sum((n-mean(n))人2))/(k*N-sum(L^2))Q[1]9.352941pvalue=pchisq(Q,k-1,low=F)pvalue[1]0.02494840由輸出結(jié)果可知,Q=9.352941, P=0.02494840va=0.05,因此拒絕原假設(shè),即認為4位候選人在村民眼中有顯著差異。與以上結(jié)果一致。五、Friedman檢驗一項關(guān)于銷售茶葉的研究報告說明銷售方式可能和售出率有關(guān)。三種方式為:在商店內(nèi)等待,在門口銷售和當(dāng)面表演炒制茶葉。對一組商店在一段時間的調(diào)查結(jié)果列再下表中(單位為購買者人數(shù))。試問三種不同的銷售方式是否有顯著差異(a=0.05)。銷售方式購買率(%)商店內(nèi)等待2025291817221820門口銷售2623153026322827表演炒制5347484352574956數(shù)據(jù)來源:《非參數(shù)統(tǒng)計(第二版)》吳喜之手算:建立假設(shè)組:H:三種銷售方式無差異0H:三種銷售方式有差異1三種方式購買率等級銷售方式購買率合計商店內(nèi)等待1221111110門口銷售2112222214表演炒制333333332410X2二—芳R2-3n(k+1)二— (102+142+242)-3x8(3+1)二13rnk(k+1)j 8x3(3+1)j=1df二3-1二2查表得X2二5.99<X2二13,因此在5%的顯著性水平上拒絕原假設(shè),即認為三種銷0.05 r售方式有顯著差異。SPSS:操作:Analyze NonparametricTests KRelatedSamplesRanksMeanRank商店內(nèi)等待1.25門口銷售1.75表演炒制3.00

TestStatisicsaN8Chi-Square13.000df2Asymp.Sig..002ExactSig..000PointProbability.000a.FriedmanTest由輸出結(jié)果可知,X2二13>X2二5.99,精確的顯著性概率PvO.OOl,因此在5%的r 0.05顯著性水平上拒絕原假設(shè),即認為三種銷售方式有顯著差異。與手算結(jié)果一致。R語言:d=read.table("f:/Friedman.txt")friedman.test(as.matrix(d))Friedmanranksumtestdata:as.matrix(d)Friedmanchi-squared=13,df=2,p-value=0.001503由輸出結(jié)果可知,X2二13,P=0.001503va=0.05,因此拒絕原假設(shè),即認為三種銷售方式有顯著差異。與以上結(jié)果一致。六、K個樣本的卡方檢驗在一個有三個主要百貨商場的商貿(mào)中心,調(diào)查者問479個不同年齡段的人首先去三個商場中的哪個,結(jié)果如下表,檢驗人們?nèi)ミ@三個商場的概率是否一樣。年齡段商場1商場2商場3總和<3083704519830—50918615192>5041381089總和21519470479數(shù)據(jù)來源:《非參數(shù)統(tǒng)計》王星手算:建立假設(shè)組:H:人們?nèi)ト齻€商場的概率相同0H:人們?nèi)ト齻€商場的概率不同1分組f1f2f3fie1e2e3(f-e)2/e111(f-e)2/e222(f-e)2/e3 3 3<3083704519888.87380.19228.9350.3881.2958.919

30—509130—5091861519286.18077.76228.0580.2700.8736.077>504138108939.94836.04613.0060.0280.1060.695合計21519470479215.000194.00070.0000.6852.27415.691,k\f-eJ2q=EY ijij=0.685+2.274+15.691=18.651ei=1j=1 ijdf=(k-1)(r-1)=4查表得X0J9.49'因為Q=18.651>猛5=9.49,因此拒絕原假設(shè)’即認為人們?nèi)ト齻€商場的概率不同。SPSS:操作:Data WeightCasesAnalyze DescriptiveStatistics CrosstabsChi-SquareTestsValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PointProbabilityPearsonChi-Square18.651a4.001.bLikelihoodRatio18.6914.001.001Fisher'sExactTest18.314.001Linear-by-LinearAssociation5.110c1.024.026.013.003NofValidCases4790cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis13.01.Cannotbecomputedbecausethereisinsufficientmemory.Thestandardizedstatisticis-2.260.由輸出結(jié)果可知,卡方統(tǒng)計量為18.651,精確雙尾檢驗概率P=0.01va=0.05,因此拒絕原假設(shè),即認為人們?nèi)ト齻€商場的概率不同。與手算結(jié)果一致。七、 Kruskal-Wallis檢驗?zāi)持圃焐坦陀昧藖碜匀齻€本地大學(xué)的雇員作為管理人員。最近,公司的人事部門已經(jīng)收集信息并考核了年度工作成績。從三個大學(xué)來的雇員中隨機地抽取了三個獨立樣本。制造商想知道是否來自這三個不同的大學(xué)的雇員在管理崗位上的表現(xiàn)有所不同。雇員大學(xué)A大學(xué)B大學(xué)C12560502702070360306048515805954090690357078075數(shù)據(jù)來源:百度文庫SAS講義

手算:建立假設(shè)組H:三個總體的考核成績分布相同0H:三個總體的考核成績分布不同1各雇員的成績等級雇員大學(xué)A大學(xué)B大學(xué)C13972122123949417115.5520618.5618.5512715.514秩和952788(95)2*(27)^*竺12kR2 12KW統(tǒng)計量H= fa-3(N+1)=N(N+1)nj=1j因為出現(xiàn)同分的情況,應(yīng)對H進行校正,校正系數(shù)C=1-工U3-》U=1-(33-3*33-3*23-2*23-2)=0.9925N(N2+1) 20(202+1)校正后的統(tǒng)計量H=8.9163/0.9925=8.9839df=k-1=220(21) 7-3(20+1)=8.9163查表得,在0.05的顯著性水平上,X2=5.99,由于H=8.9839>X2=5.99,因此0.05 0.05拒絕原假設(shè),即三個總體的考核成績分布不同。SPSS:操作:Analyze NonparametricTests KIndependentSamples成績Chi-Square8.984成績Chi-Square8.984Ranks分組NMeanRank成績大學(xué)A713.57大學(xué)B64.50大學(xué)c712.57Total20TestStatistcsa,bAsymp.Sig..011ExactSig..006PointProbability.000KruskalWallisTestGroupingVariable:分組由輸出結(jié)果可知,KW統(tǒng)計量為8.984,精確概率為0.006,遠遠小于顯著性水平0.05,因此拒絕原假設(shè),即三個總體的考核成績分布不同。與手算結(jié)果一致。八、列聯(lián)表卡方檢驗一種原料來自三個不同的地區(qū),原料質(zhì)量被分成三個不同等級。從這批原料中隨機抽取500件進行檢驗,得樣本數(shù)據(jù)如下表所示,要求檢驗地區(qū)與原料質(zhì)量之間有無依賴關(guān)系。一級二級三級合計地區(qū)1526424140地區(qū)2605952171地區(qū)3506574189合計162188150500數(shù)據(jù)來源:百度文庫統(tǒng)計學(xué)教程PPT手算:建立假設(shè)組:H:地區(qū)與原料質(zhì)量無關(guān)0H:地區(qū)與原料質(zhì)量相關(guān)1地區(qū)等級fijeij(f-e)2/eijij ij115245.360.97126452.642.451324427.71216055.40.38225964.30.44235251.30.01315061.242.06326571.060.52337456.75.28合計19.82Q±cfij-eij"=19.82ei=1j=1 ijdf=(r-1)(c-1)=4查表得,X2=9.49,由于Q=19.82>X2=9.49,因此拒絕原假設(shè),即認為地區(qū)與原0.05 0.05料質(zhì)量相關(guān)。

SPSS:操作:Data WeightCasesAnalyze DescriptiveStatistics Crosstabs地區(qū)*等級Crosstabulation等級Total一級二級三級地區(qū)地區(qū)1Count526424140ExpectedCount45.452.642.0140.0地區(qū)2Count605952171ExpectedCount55.464.351.3171.0地區(qū)3Count506574189ExpectedCount61.271.156.7189.0TotalCount162188150500ExpectedCount162.0188.0150.0500.0Chi-SquareTestsValuedfAsymp.Sig.(2-sided)ExactSig.(2-sided)ExactSig.(1-sided)PointProbabilityPearsonChi-Square19.822a4.001.bLikelihoodRatio20.7324.000.000Fisher'sExactTest20.510.000Linear-by-LinearAssociation13.963c1.000.000.000.000NofValidCases5000cells(.0%)haveexpectedcountlessthan5.Theminimumexpectedcountis42.00.Cannotbecomputedbecausethereisinsufficientmemory.Thestandardizedstatisticis3.737.由輸出結(jié)果可知,檢驗統(tǒng)計量為19.822,精確雙尾顯著性概率P遠遠小于顯著性水平0.05,因此拒絕原假設(shè),即認為地區(qū)與原料質(zhì)量相關(guān)。與手算結(jié)果一致。九、Kendall秩相關(guān)某研究所對10對雙胞胎兒童的智力進行調(diào)查,結(jié)果如下表兒童智力測試得分雙胞胎編號先出生兒童(X)后出生兒童(Y)197.8216.619.3316.220.1411.37.1516.213

67.14.877.88.9847.4911.210101.31.5數(shù)據(jù)來源:《非參數(shù)統(tǒng)計:方法與應(yīng)用》易丹輝董寒青手算:兒童智力測試得分評秩XYX的秩Y的秩D1.31.5110047.424-247.14.832117.88.956-1197.8550011.21067-1111.37.17341616.220.18.510-1.52.2516.2138.580.50.2516.619.310911U=9+6+7+4+4+3+3+0+1=37V=0+2+0+2+1+1+0+1+0+0=7Kendall秩相關(guān)系數(shù)丁=2(U-V)=2(37-7)=0.6667n(n-l)10(10-1)由于同分,所以T= =0.6742J(1/2)10(10-1)-(1/2)2(2-1)J(1/2)10(10-1)對T的顯著性進行檢驗,建立假設(shè)組:H:不相關(guān)0H:正相關(guān)+查表得,n=10,T=0.6667或T=0.6742相應(yīng)的概率在0.0002至0.0005之間,遠遠小于顯著性水平0.05,因此拒絕原假設(shè),即認為雙胞胎兒童的智力之間存在著正相關(guān)。SPSS:操作:Analyze Correlate BivariateCorrelations先出生兒童后出生兒童Kendall'stau_b先出生兒童CorrelationCoefficient1.000.674**Sig.(2-tailed).007N1010后出生兒童CorrelationCoefficient.674**1.000Sig.(2-tailed).007N1010**.Correlationissignificantatthe0.01level(2-tailed).由輸出結(jié)果可知,T=0.674,雙側(cè)檢驗的顯著性概率為0.007,則單側(cè)的顯著性概率為0.0035,遠遠小于顯著性水平0.05,因此拒絕原假設(shè),即認為雙胞胎兒童的智力之間存在著正相關(guān)。與手算結(jié)果一致。R語言:x=c(9.0,16.6,16.2,11.3,16.2,7.1,7.8,4.0,11.2,1.3)y=c(7.8,19.3,20.1,7.1,13.0,4.8,8.9,7.4,10.0,1.5)cor.test(x,y,method="kendall")Kendall'srankcorrelationtaudata:xandyz=2.6941,p-value=0.007058alternativehypoth

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論