版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
第六章
非參數(shù)統(tǒng)計(jì)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/20231第六章非參數(shù)統(tǒng)計(jì)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組12/12/第一節(jié)引言第二節(jié)單樣本非參數(shù)檢驗(yàn)第四節(jié)兩樣本的非參數(shù)檢驗(yàn)第四節(jié)秩相關(guān)檢驗(yàn)
第六章非參數(shù)統(tǒng)計(jì)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/20232第一節(jié)引言第六章非參數(shù)統(tǒng)計(jì)版權(quán)所有BY統(tǒng)計(jì)學(xué)本章重點(diǎn)與難點(diǎn)
重點(diǎn):了解和掌握單樣本非參數(shù)檢驗(yàn)、兩樣本的非參數(shù)檢驗(yàn)、秩相關(guān)檢驗(yàn)的基本方法。難點(diǎn):符號秩檢驗(yàn)的基本原理和秩相關(guān)檢驗(yàn)的基本原理及其計(jì)算方法。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/20233本章重點(diǎn)與難點(diǎn)重點(diǎn):了解和掌握單樣本非參數(shù)檢驗(yàn)、兩樣第一節(jié)引言
一、關(guān)于非參數(shù)統(tǒng)計(jì)二、非參數(shù)統(tǒng)計(jì)中常用統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/20234第一節(jié)引言一、關(guān)于非參數(shù)統(tǒng)計(jì)一、關(guān)于非參數(shù)統(tǒng)計(jì)
非參數(shù)統(tǒng)計(jì)方法的共同特征是與總體分布無關(guān),即總體分布未知的情況下的統(tǒng)計(jì)推斷方法。非參數(shù)檢驗(yàn)總是比傳統(tǒng)檢驗(yàn)安全。但是在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)就不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗(yàn)無法拒絕。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/20235一、關(guān)于非參數(shù)統(tǒng)計(jì)非參數(shù)統(tǒng)計(jì)方法的共同特征是與總體分布無關(guān)
注意:非參數(shù)統(tǒng)計(jì)的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關(guān)參數(shù);之所以稱和總體分布無關(guān)(distribution—free),是因?yàn)槠渫茢喾椒ú簧婕暗娇傮w分布,不應(yīng)理解為與所有分布(例如有關(guān)秩的分布)無關(guān)。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/20236注意:非參數(shù)統(tǒng)計(jì)的“非參數(shù)(nonparametri二、非參數(shù)統(tǒng)計(jì)中常用統(tǒng)計(jì)量
(一)順序統(tǒng)計(jì)量1.順序統(tǒng)計(jì)量2.基于順序統(tǒng)計(jì)量的統(tǒng)計(jì)量3.順序統(tǒng)計(jì)量的分布版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/20237二、非參數(shù)統(tǒng)計(jì)中常用統(tǒng)計(jì)量
(一)順序統(tǒng)計(jì)量版權(quán)所有B1.順序統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、順序統(tǒng)計(jì)量:對于簡單隨機(jī)樣本X1,X2,…,Xn,如果按照升冪排列,得到X(1)≤X(2)≤…≤X(n)稱X(K)為k個(gè)順序統(tǒng)計(jì)量;稱X(1),X(2),…,X(n)為一個(gè)順序樣本;1/3/202381.順序統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、順序統(tǒng)計(jì)量:對2.基于順序統(tǒng)計(jì)量的統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組中位數(shù)極差P分位數(shù)
1/3/202392.基于順序統(tǒng)計(jì)量的統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組中位數(shù)3.順序統(tǒng)計(jì)量的分布
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組分布函數(shù)為1/3/2023103.順序統(tǒng)計(jì)量的分布
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組分布函數(shù)為版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組第r個(gè)順序統(tǒng)計(jì)量的密度函數(shù)為1/3/202311版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組第r個(gè)順序統(tǒng)計(jì)量的密度函數(shù)為12(二)秩統(tǒng)計(jì)量
1.秩統(tǒng)計(jì)量2.秩統(tǒng)計(jì)量的分布和數(shù)字特征3.線性符號秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202312(二)秩統(tǒng)計(jì)量
1.秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1.秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)X1,X2,…,Xn為來自總體X的簡單隨機(jī)樣本(其中無重復(fù)數(shù)據(jù)點(diǎn))。記Ri為樣本點(diǎn)Xi的秩,即Ri等于或等于Xi的Xj的個(gè)數(shù)1/3/2023131.秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)X版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.1】表6-1原始觀測值及相應(yīng)的秩統(tǒng)計(jì)表對于【例6.1】給定的樣本,分別給出了他們相應(yīng)的秩。原始觀測值xi9.30.23.273.161.5秩Ri71463521/3/202314版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.1】原始觀測值xi9.2.秩統(tǒng)計(jì)量的分布和數(shù)字特征版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組R1,R2,…,Rn的聯(lián)合分布為:Ri的概率分布為:Ri的數(shù)學(xué)期望:Ri的方差:1/3/2023152.秩統(tǒng)計(jì)量的分布和數(shù)字特征版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組R13.線性符號秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
設(shè)Ri+在∣X1∣,∣X2∣,…,∣Xn∣中的秩,定義an+(.)為在整數(shù)1,2,…,n上的非負(fù)函數(shù),且滿足an+(1),…,an+(n)不全為0,則稱為線性符號秩統(tǒng)計(jì)量。1/3/2023163.線性符號秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)R版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
如果X1,X2,…,Xn為獨(dú)立同分布的連續(xù)隨機(jī)變量,并有關(guān)于0的對稱分布,則區(qū)別于秩統(tǒng)計(jì)量的分布,線性符號統(tǒng)計(jì)量的分布要求總體分布連續(xù)且對稱。1/3/202317版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組如果X1,X2,…,X第二節(jié)單樣本非參數(shù)檢驗(yàn)
一、單樣本擬合優(yōu)度檢驗(yàn)二、符號檢驗(yàn)三、Cox-Stuart趨勢檢驗(yàn)四、游程檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202318第二節(jié)單樣本非參數(shù)檢驗(yàn)
一、單樣本擬合優(yōu)度檢驗(yàn)版權(quán)所有一、單樣本擬合優(yōu)度檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(1)提出統(tǒng)計(jì)假設(shè)H0:F(X)=F0(X)(2)選擇適當(dāng)統(tǒng)計(jì)量1/3/202319一、單樣本擬合優(yōu)度檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(1)提出版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(3)由給定的顯著性水平α,查卡方概率分布表確定臨界值Χα2(m-1-r)(這種檢驗(yàn)是右側(cè)檢驗(yàn))。(4)利用樣本值X1,…,Xn計(jì)算實(shí)際頻數(shù)fi,再計(jì)算經(jīng)驗(yàn)概率p,據(jù)以計(jì)算的值。(5)結(jié)論,若,則拒絕原假設(shè),即認(rèn)為總體的分布函數(shù)不為F0(X);反之,則接受原假設(shè),即認(rèn)為總體的分布函數(shù)為F0(X)。1/3/202320版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(3)由給定的顯著性水平α,查卡版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.2】某公路上,交通部門觀察每15秒鐘內(nèi)路過的汽車輛數(shù),共觀察了50分鐘,得如下樣本資料:表6-2交通部門觀察每15秒內(nèi)過路的汽車輛數(shù)統(tǒng)計(jì)表試問通過的汽車輛數(shù)可否認(rèn)為服從泊松分布,顯著性水平為α=0.05?輛數(shù)01234Σ實(shí)際頻數(shù)926811102001/3/202321版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.2】某公路上,交通部門觀版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【解】由泊松分布的概率函數(shù)的估計(jì)量為:1/3/202322版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【解】由泊松分布的概率函數(shù)12/版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組由題意,要檢驗(yàn)的假設(shè)為:H1:總體部服從泊松分布將數(shù)軸分為6個(gè)區(qū)間:(-∞,0],(0,1],(1,2],(2,3],(3,4],(4,∞),由泊松分布的概率函數(shù)分別計(jì)算落在這些區(qū)間的概率1/3/202323版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組由題意,要檢驗(yàn)的假設(shè)為:12/11/3/20232412/12/202224版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組由計(jì)算表可知當(dāng)原假設(shè)為真時(shí),服從自由度為3(m-r-1=5-1-1=3)的χ2分布。由α=0.05,查χ2分布表得臨界值,因?yàn)?所以接受原假設(shè),認(rèn)為通過該地段的汽車輛數(shù)服從泊松分布。1/3/202325版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組由計(jì)算表可知12/12/2022二、符號檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
假定用總體中位數(shù)M來表示中間位置,并且X1,…,Xn獨(dú)立同分布,這意味著X1,…,Xn取大于M的概率應(yīng)該與取小于M的概率均為1/2。對于我們所研究的問題,可以看作是只有兩種可能“成功”或“失敗”。成功為“+”,即大于中位數(shù);失敗為“-”,即小于中位數(shù)M。令:S+=得正負(fù)號的數(shù)目S-=得負(fù)負(fù)號的數(shù)目1/3/202326二、符號檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組假定用總體中位版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組可以知道S+和S-均服從二項(xiàng)分布B(n,0.5),n=S++S-。則S+或S-可以用來做檢驗(yàn)的統(tǒng)計(jì)量,給定顯著性水平α。
1/3/202327版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組可以知道S+和S-均服從二版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
對于左側(cè)檢驗(yàn)H0:M=M0;H1:M<M0,當(dāng)零假設(shè)為真時(shí),S+應(yīng)該不大不小。當(dāng)S+過小,即只有少數(shù)的觀測值大于M0,則M0可能太大,總體的中位數(shù)可能較M0小一些。如果P(S+<s+/H0)<α,則拒絕原假設(shè)。1/3/202328版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組對于左側(cè)檢驗(yàn)H0:M=M版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
對于右側(cè)檢驗(yàn)H0:M=M0;H1:M>M0,當(dāng)零假設(shè)為真時(shí),S+應(yīng)該不大不小。當(dāng)S+過大,即有多數(shù)的觀測值大于M0,則M0可能太小,目前總體的中位數(shù)可能較M0大。如果P(S+<s+/H0)<α,則拒絕原假設(shè)。雙側(cè)檢驗(yàn)對備擇假設(shè)H1來說關(guān)心的是等于正的次數(shù)是否與等于負(fù)的次數(shù)有顯著差異。所以當(dāng)P(S+<s+/H0)+P(S->s-/H0)<α則拒絕原假設(shè)。1/3/202329版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組對于右側(cè)檢驗(yàn)H0:M=M(二)Wilcoxon符號秩檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、Wilcoxon符號秩檢驗(yàn)的統(tǒng)計(jì)思想Wilcoxon符號秩檢驗(yàn)關(guān)于中位數(shù)對稱的總體的中位數(shù)是否否等于某個(gè)特定值,檢驗(yàn)假設(shè):
1/3/202330(二)Wilcoxon符號秩檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
為了對假設(shè)做出判定,需要從總體中隨機(jī)抽取n個(gè)樣本。n個(gè)樣本記作X1,…,Xn,它們與M0的差值記為Di,Di=Xi-M0(i=1,2,…,n)。如果H0為真,那么樣本圍繞M0上下浮動(dòng),即Di關(guān)于0對稱。這時(shí),對于Di來說,正的差值和負(fù)的差值應(yīng)近似地相等。為了,借助秩統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn),先忽略符號,而取絕對值∣Di∣,對n個(gè)∣Di∣按大小順序進(jìn)行排序,并找出他們分別對應(yīng)的n個(gè)秩。再按Di本身符號的正、負(fù)分別加總它們的秩,得到正秩的綜合T+與負(fù)秩T-。雖然秩本身都是正的,但這里是Di的符號計(jì)算秩和。1/3/202331版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組為了對假設(shè)做出判定,需要從版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
H0為真時(shí),正秩的總和與負(fù)秩的總和應(yīng)該近似相等。如果正秩的總和遠(yuǎn)遠(yuǎn)大于負(fù)秩的總和,表明大部分的秩是正的差值,即Di為正的秩大。這時(shí),數(shù)據(jù)支持備擇假設(shè)H1:M>M0,即實(shí)際的中位數(shù)比M0大。類似的,如果負(fù)秩的總和遠(yuǎn)遠(yuǎn)大于正秩的總和,表明大部分大的秩是負(fù)的差值,即Di為負(fù)的秩大。這時(shí),數(shù)據(jù)支持備擇假設(shè)H1:M<M0,即實(shí)際的中位數(shù)比M0小,因?yàn)檎群拓?fù)秩的總和是個(gè)恒定的值,即1+2+…+n=n(n+1)/2,因此對于雙側(cè)備擇H1:M≠M(fèi)0來說,兩個(gè)總和中無論哪一個(gè)太大,都可以被支持。1/3/202332版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組H0為真時(shí),正秩的總和與版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組檢驗(yàn)統(tǒng)計(jì)量Wilcoxon符號秩檢驗(yàn)所定義的檢驗(yàn)統(tǒng)計(jì)量為:正秩的總和T+負(fù)秩的總和T-1/3/202333版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組檢驗(yàn)統(tǒng)計(jì)量12/12/20223版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(1)計(jì)算∣Xi-M0∣,它們代表這些樣本點(diǎn)到中位數(shù)的距離;(2)把上面的n個(gè)絕對值排序,并找出它們的n個(gè)秩;如果有相同的樣本點(diǎn),每個(gè)點(diǎn)取平均秩(如1,4,4,5的秩為1,2.5,2.5,4);(3)令T+等于Xi-M0>0的∣Xi-M0∣的秩和;T-等于Xi-M0<0的∣Xi-M0∣的秩和。注意:T++T-=n(n+1)/2;1/3/202334版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(1)計(jì)算∣Xi-M0∣,它們代版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(4)對雙邊檢驗(yàn):H0:M=M0;H1:M≠M(fèi)0,在零假設(shè)下,T+與T-應(yīng)差不多,因而,當(dāng)其中之一非常小時(shí),應(yīng)懷疑零假設(shè);在此,取檢驗(yàn)統(tǒng)計(jì)量T=min(T+,T-)。類似地,對H0:M=MO;H1:M>M0,取T=T-;對H0:M=M0;H1:M<M0,取T=T+。(5)根據(jù)得到的T值,查wilcoxon符號秩檢驗(yàn)的分布表得到在零假設(shè)下P一值。如果n很大要用正態(tài)近似;得到一個(gè)與T有關(guān)的正態(tài)隨機(jī)變量Z的值,再查表得P-值?;蛑苯佑糜?jì)算機(jī)得到P-值。(6)如P-值較?。ū热缧∮诨虻扔诮o定的顯著性水平0.05)則可以拒絕零假設(shè)。1/3/202335版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(4)對雙邊檢驗(yàn):H0:M=M0三、Cox-Stuart趨勢檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.4】我國自1985年到1996年出口和進(jìn)口的差額(balance)(以億美元為單位)-149.0119.737.777.5-66.087.480.543.5122.254.0167.0122.2從這個(gè)數(shù)字,我們能否說這個(gè)差額總的趨勢是增長,還是減,還是都不明顯呢?下圖為該數(shù)據(jù)的趨勢圖。從圖可以看出,總趨勢似乎是增長,但1993年有個(gè)低谷;這個(gè)低谷能否說明總趨勢并不是增長的呢?我們希望利用統(tǒng)計(jì)方法對其是否具有趨勢性進(jìn)行檢驗(yàn)。1/3/202336三、Cox-Stuart趨勢檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202337版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組12/12/202237版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、H0:無增長趨勢H1:有增長趨勢2、H0:無減少趨勢H1:有減少趨勢3、H0:無趨勢H1:有增長或減少趨勢形式上,該檢驗(yàn)問題可以重新敘述為:假定獨(dú)立觀察值X1,…,Xn分別來自分布為F(X,Θi)的總體,這里F(.)對稱于零點(diǎn)。上面第一個(gè)單邊檢驗(yàn)為H0:Θ1=…=Θn,H1:Θi不盡相同。1/3/202338版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、H0:無增長趨勢版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組當(dāng)n為偶數(shù)時(shí)共有C對,當(dāng)n為奇數(shù)時(shí)共有C-1對。在這個(gè)例子中n=12,因而C=6。這6個(gè)對子為(X1,X7),(X2,X8),(X3,X9),(X4,X10),(X5,X11),(X6,X12)。用每一對的兩元素Di=Xi-Xi+c的符號來衡量增減。令S+為Di=Xi-Xi+c大于零的數(shù)目,而令S-為Di=Xi-Xi+c小于零的數(shù)目。顯然當(dāng)正號太多時(shí),即S+很大時(shí)(或S-很小時(shí)),有下降趨勢,反之,則有增長趨勢。在沒有趨勢的零假設(shè)下它們應(yīng)服從二項(xiàng)分布b(n,0.5),這里n’為對子的數(shù)目(不包含差為0的對子),該檢驗(yàn)在某種意義上是符號檢驗(yàn)的一個(gè)特例。1/3/202339版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組當(dāng)n為偶數(shù)時(shí)共有C對,當(dāng)n為奇數(shù)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
類似于符號檢驗(yàn),對于上面三種檢驗(yàn),分別取檢驗(yàn)統(tǒng)計(jì)量K=S+,K=S-和K=min(S+,S-)。在本例中,這6個(gè)數(shù)據(jù)對的符號為5負(fù)1正,這表明可能有增長的趨勢。因此需要檢驗(yàn):H0:無增長趨勢H1:有增長趨勢P(S+≤1)=0.1094檢驗(yàn)結(jié)果表明,我們不能拒絕原假設(shè),因此該數(shù)據(jù)無增長趨勢。1/3/202340版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組類似于符號檢驗(yàn),對于上面四、游程檢驗(yàn)
1.游程的概念
一個(gè)可以屬性總體,如,按性別區(qū)分的人群、按產(chǎn)品是否有毛病區(qū)分的總體等等,隨機(jī)從中抽取一個(gè)樣本,樣本也可以分為兩類;類型Ⅰ和類型Ⅱ。若凡屬類型Ⅰ的記為符號A,類型Ⅱ的記為符號B,則當(dāng)樣本按某種順序排列(如按抽取時(shí)間先后排列)時(shí),一個(gè)或者一個(gè)以上相同符號連續(xù)出現(xiàn)的段,就被稱作游程,也就是說,游程是在一個(gè)兩種類型的符號的有序排列中,相同符號連續(xù)出現(xiàn)的段。
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202341四、游程檢驗(yàn)
1.游程的概念版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組12版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2、游程檢驗(yàn)的基本原理
假設(shè)隨機(jī)抽取的一個(gè)樣本,其觀察值按某種順序排列,如果研究所關(guān)心的問題是:有序排列的兩類符號是否隨機(jī),則可以建立雙側(cè)備擇假設(shè)為H0:序列是隨機(jī)的H1:序列不是隨機(jī)的1/3/202342版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2、游程檢驗(yàn)的基本原理12/12版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組如果關(guān)心的是序列是否具有某種傾向,則應(yīng)建立單側(cè)備擇假設(shè)為:H0:序列是隨機(jī)的H1:序列具有混合的傾向H0:序列是隨機(jī)的H1:序列具有成群的傾向1/3/202343版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組如果關(guān)心的是序列是否具有某種傾向版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組R=游程的總數(shù)目游程R分布的證明是比較麻煩的?,F(xiàn)在m+n各抽屜里隨機(jī)選擇m個(gè),有Cm+nm種方法。如果游程數(shù)為奇數(shù)R=2K+1,這意味著:1、必定有k+1個(gè)由“1”構(gòu)成的游程和k個(gè)由“0”構(gòu)成的游程;2、或必定有k+1個(gè)由“0”構(gòu)成的游程和k個(gè)“1”構(gòu)成的游程。1/3/202344版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組R=游程的總數(shù)目12/12/20版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組這就必須在m-1個(gè)位置中插入k個(gè)“隔離元”,使有“1”有K+1個(gè)游程,可以有種,同樣可以在n-1個(gè)“0”的n-1個(gè)空位上插入k-1個(gè)“隔離元”,有種。共有有利基本事件數(shù),所以1/3/202345版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組這就必須在m-1個(gè)位置中插入k個(gè)【例6.5】從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn)瑕疵的產(chǎn)品是否是隨機(jī)出現(xiàn)的。現(xiàn)隨機(jī)抽了30件產(chǎn)品,按生產(chǎn)線抽取的順序排列:000011111111111111000111111111問瑕疵的產(chǎn)品是隨機(jī)出現(xiàn)的嗎?版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202346【例6.5】從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn)瑕疵的產(chǎn)品是否是隨機(jī)出第三節(jié)兩樣本的非參數(shù)檢驗(yàn)
一、配對符號檢驗(yàn)二、兩樣本配對Wilcoxon檢驗(yàn)三、Brown-Mood中位數(shù)檢驗(yàn)四、Wlicoxon(Mann-Whitney)秩和檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202347第三節(jié)兩樣本的非參數(shù)檢驗(yàn)
一、配對符號檢驗(yàn)版權(quán)所有BY一、配對符號檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)X和Y分別具有分布函數(shù)F(x)和F(y),從兩個(gè)總體得隨機(jī)配對樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),研究X和Y是否具有相同的分布。即檢驗(yàn);H0:F(x)=F(y)。如果兩個(gè)總體具有相同的分布,則其中位數(shù)應(yīng)該相等,所以等價(jià)檢驗(yàn)的假設(shè)為:1/3/202348一、配對符號檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)X版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組配對資料符號檢驗(yàn)的計(jì)算步驟為:與單樣本的符號檢驗(yàn)一樣,也定義S+和S-為檢驗(yàn)的統(tǒng)計(jì)量。,表示xi>yi的數(shù)目,表示xi<yi的數(shù)目在原假設(shè)成立的條件下S+和S-的分布為二項(xiàng)分布,N=S++S-。如果S+大小適中,則支持原假設(shè),如果S+太大,S-太小,則支持H1:mx>my;反之,如果S+太小,S-太大,則支持H1:mx<my1/3/202349版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組配對資料符號檢驗(yàn)的計(jì)算步驟為:1二、兩樣本配對Wilcoxon檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組Wilcoxon符號秩檢驗(yàn)的步驟:1.計(jì)算各觀察值對的差異Di=Xi-Yi;2.求差異的絕對值∣Di∣=∣Xi-Yi∣;3.按差異絕對值的大小排序;4.考慮各差異的符號,由絕對值差異秩得到符號值;5.分別計(jì)算正、負(fù)符號秩的和T+與T-;6.統(tǒng)計(jì)量T=min(T+,T-)7、結(jié)論1/3/202350二、兩樣本配對Wilcoxon檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課三、Brown-Mood中位數(shù)檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.10】我國沿海地區(qū)和非沿海地區(qū)的人均國內(nèi)生產(chǎn)總值(GDP)的1997年抽樣數(shù)據(jù)如下(單位為元)。沿海地區(qū)為(y1,…,y12):1227053457730222758447945581366834951340815500而非沿海地區(qū)的為(X1,…X18):5163422042593881371540325122413037632093371527323313290137315167人們想要知道沿海和非沿海地區(qū)的人均GDP的中位數(shù)是否一樣,這就是檢驗(yàn)兩個(gè)總體的位置參數(shù)是否相等的問題。1/3/202351三、Brown-Mood中位數(shù)檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組XY總和>MxyAba+b<Mxym-an-b(m+n)-(a+b)總和mnm+n表6-15兩個(gè)樣本和Mxy比較之后得到各個(gè)樣本中大于和小于它的數(shù)目2X2列聯(lián)表
在原假設(shè)成立的條件下,這個(gè)結(jié)果有一點(diǎn)象超幾何分布。1/3/202352版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組XY總和>MxyAba+b<MxA為樣本X中大于Mxy的樣本點(diǎn)數(shù),在零假設(shè)下A為超幾何分布,即有取A為樣本X中大于Mxy的樣本點(diǎn)數(shù)作為檢驗(yàn)的統(tǒng)計(jì)量,則A應(yīng)該不大不小,如果A太大或太小,則應(yīng)該懷疑原假設(shè)。檢驗(yàn)規(guī)則如下表所示:1/3/202353A為樣本X中大于Mxy的樣本點(diǎn)數(shù),在零假設(shè)下A為超幾何分布,版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組表6-16Brown-Wood中位數(shù)檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計(jì)量P值H0:Mx=My;H1:Mx>MyAP(A≥a)H0:Mx=My;H1:Mx<MyAP(A≤a)H0:Mx=My;H1:Mx≠M(fèi)yA2min(P(A≥a),P(A≤a))1/3/202354版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組表6-16版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組大樣本的時(shí)候,在零假設(shè)下,可以利用超幾何分布的正態(tài)近似進(jìn)行檢驗(yàn):小樣本時(shí),也可以使用連續(xù)修正為1/3/202355版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組大樣本的時(shí)候,在零假設(shè)下,可以利版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組在上例中有如下結(jié)果:總體容量:30總體中成功的次數(shù):15樣本容量:12樣本中成功的次數(shù):111/3/202356版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組在上例中有如下結(jié)果:12/12/四、Wlicoxon(Mann-Whitney)秩和檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
設(shè)(X1,…,Xn)和(Y1,…,Yn)分別為兩個(gè)連續(xù)總體F(x)和F(y)中隨機(jī)抽取的樣本,我們關(guān)心兩個(gè)總體是否有相同的分布形狀,或者他們的中位數(shù)是否相等。1/3/202357四、Wlicoxon(Mann-Whitney)秩和檢驗(yàn)
版版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
為了對假設(shè)做出判定,如果H0為真,那么將m個(gè)X、n個(gè)Y的數(shù)據(jù),按數(shù)值的相對大小升序排列,X、Y的值應(yīng)該期望被很好地混合,這m+n=N個(gè)觀察值能夠被看作來自于共同總體的一個(gè)單一的隨機(jī)樣本。若大部分的Y大于X,或大部分的X大于Y,將不能證實(shí)這個(gè)有序的序列是一個(gè)隨機(jī)的混合,將拒絕X、Y來自一個(gè)相同總體的零假設(shè)。在X、Y混合排列的序列中,X占有的位置是相對于Y的相對位置,因此秩是表示位置的一個(gè)極為方便的方法。在X、Y的混合排列中,秩1是最小的觀測值,秩N是最大的。若X的秩大部分大于Y的秩,那么數(shù)據(jù)將支持H1:Mx>My,而X的秩大部分小于Y的秩,則數(shù)據(jù)將支持H1:Mx<My。1/3/202358版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組為了對假設(shè)做出判定,如果H版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組檢驗(yàn)統(tǒng)計(jì)量。根據(jù)上面的基本原理,檢驗(yàn)統(tǒng)計(jì)量為Wx=X的秩和Wy=Y的秩和由于X、Y的混合序列的秩和為:1+2+…+N=N(N+1)/21/3/202359版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組檢驗(yàn)統(tǒng)計(jì)量。根據(jù)上面的基本原理,版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
所以與Wlicoxon提出統(tǒng)計(jì)量相等價(jià)的統(tǒng)計(jì)量為,該統(tǒng)計(jì)量由Mann-Whitney提出,其含義為:如有第一個(gè)總體的樣本:X1,…,Xm和第二個(gè)總體的樣本:Y1,…,Yn,N=m+n。令是把所有的Y樣本與X樣本做比較后,X大于Y的個(gè)數(shù),即表示(Xi,Xj)(i=1,…,m;j=1,…,n)共mn對中X大于Y的個(gè)數(shù),則有1/3/202360版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組所以版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組則當(dāng)n足夠大時(shí),1/3/202361版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組則當(dāng)n足夠大時(shí),12/12/20第四節(jié)秩相關(guān)檢驗(yàn)
一、Pearson相關(guān)系數(shù)二、Spearman秩相關(guān)檢驗(yàn)三、Kendallτ檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202362第四節(jié)秩相關(guān)檢驗(yàn)
一、Pearson相關(guān)系數(shù)版權(quán)所有B一、Pearson相關(guān)系數(shù)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組定義4.1設(shè)隨機(jī)變量X與Y具有有限非零方差,則X與Y之間的線性相關(guān)系數(shù)為:線性相關(guān)系數(shù)流行的原因有以下幾點(diǎn):(1)容易計(jì)算;(2)線性變換下容易出來。特別是嚴(yán)格遞增線性變換情況下相關(guān)系數(shù)不變。1/3/202363一、Pearson相關(guān)系數(shù)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組定義4版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組然而,Pearson相關(guān)系數(shù)具有以下幾個(gè)缺點(diǎn):(1)隨機(jī)變量X與Y具有有限非零方差,否則線性相關(guān)系數(shù)無法定義;(2)兩變量獨(dú)立意味著他們不相關(guān),但不相關(guān)通常并不獨(dú)立;只有在隨機(jī)變量X與Y具有正態(tài)分布情況下,獨(dú)立與不相關(guān)才是等價(jià)的;(3)在非線性嚴(yán)格遞增變換的情況下相關(guān)系數(shù)不是不變的;(4)對于ρ檢驗(yàn)需假設(shè)總體服從正態(tài)分布。1/3/202364版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組然而,Pearson相關(guān)系數(shù)具有二、Spearman秩相關(guān)檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組Spearman秩相關(guān)檢驗(yàn)是對Spearman秩相關(guān)系數(shù)進(jìn)行檢驗(yàn)的方法。在給定一列數(shù)對(X1,Y1),…,(Xn,Yn)之后,要檢驗(yàn)他們所代表的二元變量X和Y是否相關(guān)。我們?nèi)×慵僭O(shè)為:H0:X與Y不相關(guān)而備擇假設(shè)有三種選擇:H1:X與Y正相關(guān)H1:X與Y負(fù)相關(guān)H1:X與Y相關(guān)1/3/202365二、Spearman秩相關(guān)檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
首先找出所有Xi在X樣本中的秩Ri以及所有Yi在樣本Y中的秩Si,我們得到秩統(tǒng)計(jì)量對計(jì)算R和S的相關(guān)系數(shù),我們知道令di=Ri-Si;這可以看成某種距離的度量。顯然,如果這些距離很大,說明兩個(gè)變量可能負(fù)相關(guān),而他們很小則可能正相關(guān)。1/3/202366版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組首先找出所有Xi在X樣本中版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組Spearman秩相關(guān)系數(shù)為和經(jīng)典的樣本相關(guān)系數(shù)一樣,rs滿足-1≤rs≤1,對于n≤100rs在零假設(shè)下的分布有表可查。1/3/202367版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組Spearman秩相關(guān)系數(shù)為12版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組在大樣本的情況下有:1/3/202368版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組在大樣本的情況下有:12/12/三、Kendallτ檢驗(yàn)
Kendallτ檢驗(yàn)是從另一個(gè)角度來看相關(guān),其檢驗(yàn)的假設(shè)為:
先引進(jìn)協(xié)同的概念。
如果乘積,稱對子及為協(xié)同的(concordant)。顯然協(xié)同意味著他們具有相同的趨勢。反之,如果乘積,則稱該對子為不協(xié)同的(disconcordant).
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202369三、Kendallτ檢驗(yàn)
Kendallτ檢驗(yàn)是從另一個(gè)角度版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組定義Kendallτ相關(guān)系數(shù)為為Kendallτ相關(guān)系數(shù)。Nc是X與Y協(xié)同的對數(shù),或得+1的對數(shù)。Nd是X與Y不協(xié)同的對數(shù),或得-1的對數(shù)。1/3/202370版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組定義Kendallτ相關(guān)系數(shù)為1版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組上面定義的為概率差的一個(gè)估計(jì)值。值界于(-1,1)之間。因?yàn)槿绻袑ψ佣际菂f(xié)同的,則。反之,如果所有對子都是不協(xié)同的則。顯然,對于該檢驗(yàn)來說和K是等價(jià)的,關(guān)于兩者的零分布表都有。當(dāng)嚴(yán)格把你容量足夠大時(shí),在零假設(shè)的條件下1/3/202371版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組上面定義的為概率差1【例6.12】下面用例6.11中10個(gè)國家和地區(qū)1997年的國際化程度和國際競爭力的資料的關(guān)系來說明Kendallτ檢驗(yàn)。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202372【例6.12】下面用例6.11中10個(gè)國家和地區(qū)19版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組表6-1910個(gè)國家和地區(qū)1997年的國際化程度和國際競爭力的統(tǒng)計(jì)表國家或地區(qū)國際化程度排名國際競爭力排名Piqi美國1190新加坡2280香港3370盧森堡4951英國51232荷蘭6440愛爾蘭71130德國81420比利時(shí)92301法國1021001/3/202373版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組表6-1910個(gè)國家和地區(qū)1版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【解】通過計(jì)算可以得到:**Correlationissignificantatthe0.01level(2-tailed).VAR00001VAR00002Kendall’stau_bVAR00001CorrelationCofficient1.0000.822(**)Sig.(2-tailed)0.0000.001VARoooo2Correlationcoefficient0.822(*)1.000Sig.(2-tailed)0.0010.0001/3/202374版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【解】VAR00001VAR00
因而對于水平0.000拒絕零假設(shè)。顯然10個(gè)國家和地區(qū)1997年的國際化程度和國際競爭力具有顯著相關(guān)性。
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202375因而對于水平0.000拒絕零假設(shè)。顯然10本章小結(jié)1.t檢驗(yàn)并不穩(wěn)健,在不知總體分布時(shí),特別是小樣本時(shí),應(yīng)用t檢驗(yàn)就可能有風(fēng)險(xiǎn)。這時(shí)就要考慮使用與總體分布無關(guān)的非參數(shù)方法。對于本章所介紹的數(shù)據(jù)趨勢或隨機(jī)性檢驗(yàn),就不存在簡單的參數(shù)方法。非參數(shù)方法總是簡單實(shí)用的。符號檢驗(yàn)是最有代表性的非參數(shù)檢驗(yàn),一旦熟悉了符號檢驗(yàn)的基本思路,后面的內(nèi)容就很容易理解了。2.兩相關(guān)樣本的非參數(shù)檢驗(yàn)通常是用來比較成對數(shù)據(jù)的,它包括符號檢驗(yàn)與兩樣本配對Wilcoxon檢驗(yàn)。符號檢驗(yàn)只用到它們差異的符號,而對數(shù)字大小所包含的信息未能考慮。配對Wilcoxon檢驗(yàn)既考慮了差異的正、負(fù)號,又考慮了兩者差值的大小。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202376本章小結(jié)1.t檢驗(yàn)并不穩(wěn)健,在不知總體分布時(shí),特別是小樣本時(shí)3.兩獨(dú)立樣本的非參數(shù)檢驗(yàn)通常是用來比較兩個(gè)不同總體的位置參數(shù),傳統(tǒng)的t檢驗(yàn)在比較兩個(gè)不同總體的位置參數(shù)時(shí)并不穩(wěn)健,在不知總體分布時(shí),應(yīng)用t檢驗(yàn)是會有風(fēng)險(xiǎn)的。因此我們介紹了一些更為穩(wěn)健的非參數(shù)方法包括:Brown-Mood中位數(shù)檢驗(yàn)、Wlicoxon(Mann-Whitney)秩和檢驗(yàn)。比較兩個(gè)總體的中位數(shù)的檢驗(yàn)時(shí),Brown-Mood中位數(shù)檢驗(yàn)只利用了樣本大于或小于共同中位數(shù)的數(shù)目,如同前面的單獨(dú)符號秩檢驗(yàn)一樣,只有方向的信息,沒有差異大小的信息。作為單樣本的Wlicoxon秩和檢驗(yàn)的推廣,我們介紹了兩個(gè)樣本的Wlicoxon秩和檢驗(yàn)。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/2023773.兩獨(dú)立樣本的非參數(shù)檢驗(yàn)通常是用來比較兩個(gè)不同總體的位置參4.相關(guān)系數(shù)同樣只能度量X與Y的線性關(guān)系,并且存在其他缺陷。非參數(shù)相關(guān)性檢驗(yàn),Spearman相關(guān)系數(shù)與Kendallτ相關(guān)系數(shù)同樣作為衡量相關(guān)性的工具,克服了相關(guān)系數(shù)的以上缺陷。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/2023784.相關(guān)系數(shù)同樣只能度量X與Y的線性關(guān)系,并且存在其他缺
本章結(jié)束!版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202379本章結(jié)束!版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組12/1第六章
非參數(shù)統(tǒng)計(jì)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202380第六章非參數(shù)統(tǒng)計(jì)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組12/12/第一節(jié)引言第二節(jié)單樣本非參數(shù)檢驗(yàn)第四節(jié)兩樣本的非參數(shù)檢驗(yàn)第四節(jié)秩相關(guān)檢驗(yàn)
第六章非參數(shù)統(tǒng)計(jì)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202381第一節(jié)引言第六章非參數(shù)統(tǒng)計(jì)版權(quán)所有BY統(tǒng)計(jì)學(xué)本章重點(diǎn)與難點(diǎn)
重點(diǎn):了解和掌握單樣本非參數(shù)檢驗(yàn)、兩樣本的非參數(shù)檢驗(yàn)、秩相關(guān)檢驗(yàn)的基本方法。難點(diǎn):符號秩檢驗(yàn)的基本原理和秩相關(guān)檢驗(yàn)的基本原理及其計(jì)算方法。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202382本章重點(diǎn)與難點(diǎn)重點(diǎn):了解和掌握單樣本非參數(shù)檢驗(yàn)、兩樣第一節(jié)引言
一、關(guān)于非參數(shù)統(tǒng)計(jì)二、非參數(shù)統(tǒng)計(jì)中常用統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202383第一節(jié)引言一、關(guān)于非參數(shù)統(tǒng)計(jì)一、關(guān)于非參數(shù)統(tǒng)計(jì)
非參數(shù)統(tǒng)計(jì)方法的共同特征是與總體分布無關(guān),即總體分布未知的情況下的統(tǒng)計(jì)推斷方法。非參數(shù)檢驗(yàn)總是比傳統(tǒng)檢驗(yàn)安全。但是在總體分布形式已知時(shí),非參數(shù)檢驗(yàn)就不如傳統(tǒng)方法效率高。這是因?yàn)榉菂?shù)方法利用的信息要少些。往往在傳統(tǒng)方法可以拒絕零假設(shè)的情況,非參數(shù)檢驗(yàn)無法拒絕。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202384一、關(guān)于非參數(shù)統(tǒng)計(jì)非參數(shù)統(tǒng)計(jì)方法的共同特征是與總體分布無關(guān)
注意:非參數(shù)統(tǒng)計(jì)的“非參數(shù)(nonparametric)”意味著其方法不涉及描述總體分布的有關(guān)參數(shù);之所以稱和總體分布無關(guān)(distribution—free),是因?yàn)槠渫茢喾椒ú簧婕暗娇傮w分布,不應(yīng)理解為與所有分布(例如有關(guān)秩的分布)無關(guān)。版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202385注意:非參數(shù)統(tǒng)計(jì)的“非參數(shù)(nonparametri二、非參數(shù)統(tǒng)計(jì)中常用統(tǒng)計(jì)量
(一)順序統(tǒng)計(jì)量1.順序統(tǒng)計(jì)量2.基于順序統(tǒng)計(jì)量的統(tǒng)計(jì)量3.順序統(tǒng)計(jì)量的分布版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202386二、非參數(shù)統(tǒng)計(jì)中常用統(tǒng)計(jì)量
(一)順序統(tǒng)計(jì)量版權(quán)所有B1.順序統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、順序統(tǒng)計(jì)量:對于簡單隨機(jī)樣本X1,X2,…,Xn,如果按照升冪排列,得到X(1)≤X(2)≤…≤X(n)稱X(K)為k個(gè)順序統(tǒng)計(jì)量;稱X(1),X(2),…,X(n)為一個(gè)順序樣本;1/3/2023871.順序統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、順序統(tǒng)計(jì)量:對2.基于順序統(tǒng)計(jì)量的統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組中位數(shù)極差P分位數(shù)
1/3/2023882.基于順序統(tǒng)計(jì)量的統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組中位數(shù)3.順序統(tǒng)計(jì)量的分布
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組分布函數(shù)為1/3/2023893.順序統(tǒng)計(jì)量的分布
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組分布函數(shù)為版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組第r個(gè)順序統(tǒng)計(jì)量的密度函數(shù)為1/3/202390版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組第r個(gè)順序統(tǒng)計(jì)量的密度函數(shù)為12(二)秩統(tǒng)計(jì)量
1.秩統(tǒng)計(jì)量2.秩統(tǒng)計(jì)量的分布和數(shù)字特征3.線性符號秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202391(二)秩統(tǒng)計(jì)量
1.秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1.秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)X1,X2,…,Xn為來自總體X的簡單隨機(jī)樣本(其中無重復(fù)數(shù)據(jù)點(diǎn))。記Ri為樣本點(diǎn)Xi的秩,即Ri等于或等于Xi的Xj的個(gè)數(shù)1/3/2023921.秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)X版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.1】表6-1原始觀測值及相應(yīng)的秩統(tǒng)計(jì)表對于【例6.1】給定的樣本,分別給出了他們相應(yīng)的秩。原始觀測值xi9.30.23.273.161.5秩Ri71463521/3/202393版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.1】原始觀測值xi9.2.秩統(tǒng)計(jì)量的分布和數(shù)字特征版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組R1,R2,…,Rn的聯(lián)合分布為:Ri的概率分布為:Ri的數(shù)學(xué)期望:Ri的方差:1/3/2023942.秩統(tǒng)計(jì)量的分布和數(shù)字特征版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組R13.線性符號秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
設(shè)Ri+在∣X1∣,∣X2∣,…,∣Xn∣中的秩,定義an+(.)為在整數(shù)1,2,…,n上的非負(fù)函數(shù),且滿足an+(1),…,an+(n)不全為0,則稱為線性符號秩統(tǒng)計(jì)量。1/3/2023953.線性符號秩統(tǒng)計(jì)量版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)R版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
如果X1,X2,…,Xn為獨(dú)立同分布的連續(xù)隨機(jī)變量,并有關(guān)于0的對稱分布,則區(qū)別于秩統(tǒng)計(jì)量的分布,線性符號統(tǒng)計(jì)量的分布要求總體分布連續(xù)且對稱。1/3/202396版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組如果X1,X2,…,X第二節(jié)單樣本非參數(shù)檢驗(yàn)
一、單樣本擬合優(yōu)度檢驗(yàn)二、符號檢驗(yàn)三、Cox-Stuart趨勢檢驗(yàn)四、游程檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/202397第二節(jié)單樣本非參數(shù)檢驗(yàn)
一、單樣本擬合優(yōu)度檢驗(yàn)版權(quán)所有一、單樣本擬合優(yōu)度檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(1)提出統(tǒng)計(jì)假設(shè)H0:F(X)=F0(X)(2)選擇適當(dāng)統(tǒng)計(jì)量1/3/202398一、單樣本擬合優(yōu)度檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(1)提出版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(3)由給定的顯著性水平α,查卡方概率分布表確定臨界值Χα2(m-1-r)(這種檢驗(yàn)是右側(cè)檢驗(yàn))。(4)利用樣本值X1,…,Xn計(jì)算實(shí)際頻數(shù)fi,再計(jì)算經(jīng)驗(yàn)概率p,據(jù)以計(jì)算的值。(5)結(jié)論,若,則拒絕原假設(shè),即認(rèn)為總體的分布函數(shù)不為F0(X);反之,則接受原假設(shè),即認(rèn)為總體的分布函數(shù)為F0(X)。1/3/202399版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(3)由給定的顯著性水平α,查卡版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.2】某公路上,交通部門觀察每15秒鐘內(nèi)路過的汽車輛數(shù),共觀察了50分鐘,得如下樣本資料:表6-2交通部門觀察每15秒內(nèi)過路的汽車輛數(shù)統(tǒng)計(jì)表試問通過的汽車輛數(shù)可否認(rèn)為服從泊松分布,顯著性水平為α=0.05?輛數(shù)01234Σ實(shí)際頻數(shù)926811102001/3/2023100版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.2】某公路上,交通部門觀版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【解】由泊松分布的概率函數(shù)的估計(jì)量為:1/3/2023101版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【解】由泊松分布的概率函數(shù)12/版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組由題意,要檢驗(yàn)的假設(shè)為:H1:總體部服從泊松分布將數(shù)軸分為6個(gè)區(qū)間:(-∞,0],(0,1],(1,2],(2,3],(3,4],(4,∞),由泊松分布的概率函數(shù)分別計(jì)算落在這些區(qū)間的概率1/3/2023102版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組由題意,要檢驗(yàn)的假設(shè)為:12/11/3/202310312/12/202224版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組由計(jì)算表可知當(dāng)原假設(shè)為真時(shí),服從自由度為3(m-r-1=5-1-1=3)的χ2分布。由α=0.05,查χ2分布表得臨界值,因?yàn)?所以接受原假設(shè),認(rèn)為通過該地段的汽車輛數(shù)服從泊松分布。1/3/2023104版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組由計(jì)算表可知12/12/2022二、符號檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
假定用總體中位數(shù)M來表示中間位置,并且X1,…,Xn獨(dú)立同分布,這意味著X1,…,Xn取大于M的概率應(yīng)該與取小于M的概率均為1/2。對于我們所研究的問題,可以看作是只有兩種可能“成功”或“失敗”。成功為“+”,即大于中位數(shù);失敗為“-”,即小于中位數(shù)M。令:S+=得正負(fù)號的數(shù)目S-=得負(fù)負(fù)號的數(shù)目1/3/2023105二、符號檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組假定用總體中位版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組可以知道S+和S-均服從二項(xiàng)分布B(n,0.5),n=S++S-。則S+或S-可以用來做檢驗(yàn)的統(tǒng)計(jì)量,給定顯著性水平α。
1/3/2023106版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組可以知道S+和S-均服從二版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
對于左側(cè)檢驗(yàn)H0:M=M0;H1:M<M0,當(dāng)零假設(shè)為真時(shí),S+應(yīng)該不大不小。當(dāng)S+過小,即只有少數(shù)的觀測值大于M0,則M0可能太大,總體的中位數(shù)可能較M0小一些。如果P(S+<s+/H0)<α,則拒絕原假設(shè)。1/3/2023107版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組對于左側(cè)檢驗(yàn)H0:M=M版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
對于右側(cè)檢驗(yàn)H0:M=M0;H1:M>M0,當(dāng)零假設(shè)為真時(shí),S+應(yīng)該不大不小。當(dāng)S+過大,即有多數(shù)的觀測值大于M0,則M0可能太小,目前總體的中位數(shù)可能較M0大。如果P(S+<s+/H0)<α,則拒絕原假設(shè)。雙側(cè)檢驗(yàn)對備擇假設(shè)H1來說關(guān)心的是等于正的次數(shù)是否與等于負(fù)的次數(shù)有顯著差異。所以當(dāng)P(S+<s+/H0)+P(S->s-/H0)<α則拒絕原假設(shè)。1/3/2023108版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組對于右側(cè)檢驗(yàn)H0:M=M(二)Wilcoxon符號秩檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、Wilcoxon符號秩檢驗(yàn)的統(tǒng)計(jì)思想Wilcoxon符號秩檢驗(yàn)關(guān)于中位數(shù)對稱的總體的中位數(shù)是否否等于某個(gè)特定值,檢驗(yàn)假設(shè):
1/3/2023109(二)Wilcoxon符號秩檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
為了對假設(shè)做出判定,需要從總體中隨機(jī)抽取n個(gè)樣本。n個(gè)樣本記作X1,…,Xn,它們與M0的差值記為Di,Di=Xi-M0(i=1,2,…,n)。如果H0為真,那么樣本圍繞M0上下浮動(dòng),即Di關(guān)于0對稱。這時(shí),對于Di來說,正的差值和負(fù)的差值應(yīng)近似地相等。為了,借助秩統(tǒng)計(jì)量進(jìn)行假設(shè)檢驗(yàn),先忽略符號,而取絕對值∣Di∣,對n個(gè)∣Di∣按大小順序進(jìn)行排序,并找出他們分別對應(yīng)的n個(gè)秩。再按Di本身符號的正、負(fù)分別加總它們的秩,得到正秩的綜合T+與負(fù)秩T-。雖然秩本身都是正的,但這里是Di的符號計(jì)算秩和。1/3/2023110版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組為了對假設(shè)做出判定,需要從版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
H0為真時(shí),正秩的總和與負(fù)秩的總和應(yīng)該近似相等。如果正秩的總和遠(yuǎn)遠(yuǎn)大于負(fù)秩的總和,表明大部分的秩是正的差值,即Di為正的秩大。這時(shí),數(shù)據(jù)支持備擇假設(shè)H1:M>M0,即實(shí)際的中位數(shù)比M0大。類似的,如果負(fù)秩的總和遠(yuǎn)遠(yuǎn)大于正秩的總和,表明大部分大的秩是負(fù)的差值,即Di為負(fù)的秩大。這時(shí),數(shù)據(jù)支持備擇假設(shè)H1:M<M0,即實(shí)際的中位數(shù)比M0小,因?yàn)檎群拓?fù)秩的總和是個(gè)恒定的值,即1+2+…+n=n(n+1)/2,因此對于雙側(cè)備擇H1:M≠M(fèi)0來說,兩個(gè)總和中無論哪一個(gè)太大,都可以被支持。1/3/2023111版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組H0為真時(shí),正秩的總和與版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組檢驗(yàn)統(tǒng)計(jì)量Wilcoxon符號秩檢驗(yàn)所定義的檢驗(yàn)統(tǒng)計(jì)量為:正秩的總和T+負(fù)秩的總和T-1/3/2023112版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組檢驗(yàn)統(tǒng)計(jì)量12/12/20223版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(1)計(jì)算∣Xi-M0∣,它們代表這些樣本點(diǎn)到中位數(shù)的距離;(2)把上面的n個(gè)絕對值排序,并找出它們的n個(gè)秩;如果有相同的樣本點(diǎn),每個(gè)點(diǎn)取平均秩(如1,4,4,5的秩為1,2.5,2.5,4);(3)令T+等于Xi-M0>0的∣Xi-M0∣的秩和;T-等于Xi-M0<0的∣Xi-M0∣的秩和。注意:T++T-=n(n+1)/2;1/3/2023113版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(1)計(jì)算∣Xi-M0∣,它們代版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(4)對雙邊檢驗(yàn):H0:M=M0;H1:M≠M(fèi)0,在零假設(shè)下,T+與T-應(yīng)差不多,因而,當(dāng)其中之一非常小時(shí),應(yīng)懷疑零假設(shè);在此,取檢驗(yàn)統(tǒng)計(jì)量T=min(T+,T-)。類似地,對H0:M=MO;H1:M>M0,取T=T-;對H0:M=M0;H1:M<M0,取T=T+。(5)根據(jù)得到的T值,查wilcoxon符號秩檢驗(yàn)的分布表得到在零假設(shè)下P一值。如果n很大要用正態(tài)近似;得到一個(gè)與T有關(guān)的正態(tài)隨機(jī)變量Z的值,再查表得P-值?;蛑苯佑糜?jì)算機(jī)得到P-值。(6)如P-值較?。ū热缧∮诨虻扔诮o定的顯著性水平0.05)則可以拒絕零假設(shè)。1/3/2023114版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組(4)對雙邊檢驗(yàn):H0:M=M0三、Cox-Stuart趨勢檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.4】我國自1985年到1996年出口和進(jìn)口的差額(balance)(以億美元為單位)-149.0119.737.777.5-66.087.480.543.5122.254.0167.0122.2從這個(gè)數(shù)字,我們能否說這個(gè)差額總的趨勢是增長,還是減,還是都不明顯呢?下圖為該數(shù)據(jù)的趨勢圖。從圖可以看出,總趨勢似乎是增長,但1993年有個(gè)低谷;這個(gè)低谷能否說明總趨勢并不是增長的呢?我們希望利用統(tǒng)計(jì)方法對其是否具有趨勢性進(jìn)行檢驗(yàn)。1/3/2023115三、Cox-Stuart趨勢檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/2023116版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組12/12/202237版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、H0:無增長趨勢H1:有增長趨勢2、H0:無減少趨勢H1:有減少趨勢3、H0:無趨勢H1:有增長或減少趨勢形式上,該檢驗(yàn)問題可以重新敘述為:假定獨(dú)立觀察值X1,…,Xn分別來自分布為F(X,Θi)的總體,這里F(.)對稱于零點(diǎn)。上面第一個(gè)單邊檢驗(yàn)為H0:Θ1=…=Θn,H1:Θi不盡相同。1/3/2023117版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1、H0:無增長趨勢版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組當(dāng)n為偶數(shù)時(shí)共有C對,當(dāng)n為奇數(shù)時(shí)共有C-1對。在這個(gè)例子中n=12,因而C=6。這6個(gè)對子為(X1,X7),(X2,X8),(X3,X9),(X4,X10),(X5,X11),(X6,X12)。用每一對的兩元素Di=Xi-Xi+c的符號來衡量增減。令S+為Di=Xi-Xi+c大于零的數(shù)目,而令S-為Di=Xi-Xi+c小于零的數(shù)目。顯然當(dāng)正號太多時(shí),即S+很大時(shí)(或S-很小時(shí)),有下降趨勢,反之,則有增長趨勢。在沒有趨勢的零假設(shè)下它們應(yīng)服從二項(xiàng)分布b(n,0.5),這里n’為對子的數(shù)目(不包含差為0的對子),該檢驗(yàn)在某種意義上是符號檢驗(yàn)的一個(gè)特例。1/3/2023118版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組當(dāng)n為偶數(shù)時(shí)共有C對,當(dāng)n為奇數(shù)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
類似于符號檢驗(yàn),對于上面三種檢驗(yàn),分別取檢驗(yàn)統(tǒng)計(jì)量K=S+,K=S-和K=min(S+,S-)。在本例中,這6個(gè)數(shù)據(jù)對的符號為5負(fù)1正,這表明可能有增長的趨勢。因此需要檢驗(yàn):H0:無增長趨勢H1:有增長趨勢P(S+≤1)=0.1094檢驗(yàn)結(jié)果表明,我們不能拒絕原假設(shè),因此該數(shù)據(jù)無增長趨勢。1/3/2023119版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組類似于符號檢驗(yàn),對于上面四、游程檢驗(yàn)
1.游程的概念
一個(gè)可以屬性總體,如,按性別區(qū)分的人群、按產(chǎn)品是否有毛病區(qū)分的總體等等,隨機(jī)從中抽取一個(gè)樣本,樣本也可以分為兩類;類型Ⅰ和類型Ⅱ。若凡屬類型Ⅰ的記為符號A,類型Ⅱ的記為符號B,則當(dāng)樣本按某種順序排列(如按抽取時(shí)間先后排列)時(shí),一個(gè)或者一個(gè)以上相同符號連續(xù)出現(xiàn)的段,就被稱作游程,也就是說,游程是在一個(gè)兩種類型的符號的有序排列中,相同符號連續(xù)出現(xiàn)的段。
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/2023120四、游程檢驗(yàn)
1.游程的概念版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組12版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2、游程檢驗(yàn)的基本原理
假設(shè)隨機(jī)抽取的一個(gè)樣本,其觀察值按某種順序排列,如果研究所關(guān)心的問題是:有序排列的兩類符號是否隨機(jī),則可以建立雙側(cè)備擇假設(shè)為H0:序列是隨機(jī)的H1:序列不是隨機(jī)的1/3/2023121版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組2、游程檢驗(yàn)的基本原理12/12版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組如果關(guān)心的是序列是否具有某種傾向,則應(yīng)建立單側(cè)備擇假設(shè)為:H0:序列是隨機(jī)的H1:序列具有混合的傾向H0:序列是隨機(jī)的H1:序列具有成群的傾向1/3/2023122版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組如果關(guān)心的是序列是否具有某種傾向版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組R=游程的總數(shù)目游程R分布的證明是比較麻煩的?,F(xiàn)在m+n各抽屜里隨機(jī)選擇m個(gè),有Cm+nm種方法。如果游程數(shù)為奇數(shù)R=2K+1,這意味著:1、必定有k+1個(gè)由“1”構(gòu)成的游程和k個(gè)由“0”構(gòu)成的游程;2、或必定有k+1個(gè)由“0”構(gòu)成的游程和k個(gè)“1”構(gòu)成的游程。1/3/2023123版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組R=游程的總數(shù)目12/12/20版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組這就必須在m-1個(gè)位置中插入k個(gè)“隔離元”,使有“1”有K+1個(gè)游程,可以有種,同樣可以在n-1個(gè)“0”的n-1個(gè)空位上插入k-1個(gè)“隔離元”,有種。共有有利基本事件數(shù),所以1/3/2023124版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組這就必須在m-1個(gè)位置中插入k個(gè)【例6.5】從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn)瑕疵的產(chǎn)品是否是隨機(jī)出現(xiàn)的?,F(xiàn)隨機(jī)抽了30件產(chǎn)品,按生產(chǎn)線抽取的順序排列:000011111111111111000111111111問瑕疵的產(chǎn)品是隨機(jī)出現(xiàn)的嗎?版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/2023125【例6.5】從生產(chǎn)線上抽取產(chǎn)品檢驗(yàn)瑕疵的產(chǎn)品是否是隨機(jī)出第三節(jié)兩樣本的非參數(shù)檢驗(yàn)
一、配對符號檢驗(yàn)二、兩樣本配對Wilcoxon檢驗(yàn)三、Brown-Mood中位數(shù)檢驗(yàn)四、Wlicoxon(Mann-Whitney)秩和檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/2023126第三節(jié)兩樣本的非參數(shù)檢驗(yàn)
一、配對符號檢驗(yàn)版權(quán)所有BY一、配對符號檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)X和Y分別具有分布函數(shù)F(x)和F(y),從兩個(gè)總體得隨機(jī)配對樣本數(shù)據(jù)(x1,y1),(x2,y2),…,(xn,yn),研究X和Y是否具有相同的分布。即檢驗(yàn);H0:F(x)=F(y)。如果兩個(gè)總體具有相同的分布,則其中位數(shù)應(yīng)該相等,所以等價(jià)檢驗(yàn)的假設(shè)為:1/3/2023127一、配對符號檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組設(shè)X版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組配對資料符號檢驗(yàn)的計(jì)算步驟為:與單樣本的符號檢驗(yàn)一樣,也定義S+和S-為檢驗(yàn)的統(tǒng)計(jì)量。,表示xi>yi的數(shù)目,表示xi<yi的數(shù)目在原假設(shè)成立的條件下S+和S-的分布為二項(xiàng)分布,N=S++S-。如果S+大小適中,則支持原假設(shè),如果S+太大,S-太小,則支持H1:mx>my;反之,如果S+太小,S-太大,則支持H1:mx<my1/3/2023128版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組配對資料符號檢驗(yàn)的計(jì)算步驟為:1二、兩樣本配對Wilcoxon檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組Wilcoxon符號秩檢驗(yàn)的步驟:1.計(jì)算各觀察值對的差異Di=Xi-Yi;2.求差異的絕對值∣Di∣=∣Xi-Yi∣;3.按差異絕對值的大小排序;4.考慮各差異的符號,由絕對值差異秩得到符號值;5.分別計(jì)算正、負(fù)符號秩的和T+與T-;6.統(tǒng)計(jì)量T=min(T+,T-)7、結(jié)論1/3/2023129二、兩樣本配對Wilcoxon檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課三、Brown-Mood中位數(shù)檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組【例6.10】我國沿海地區(qū)和非沿海地區(qū)的人均國內(nèi)生產(chǎn)總值(GDP)的1997年抽樣數(shù)據(jù)如下(單位為元)。沿海地區(qū)為(y1,…,y12):1227053457730222758447945581366834951340815500而非沿海地區(qū)的為(X1,…X18):5163422042593881371540325122413037632093371527323313290137315167人們想要知道沿海和非沿海地區(qū)的人均GDP的中位數(shù)是否一樣,這就是檢驗(yàn)兩個(gè)總體的位置參數(shù)是否相等的問題。1/3/2023130三、Brown-Mood中位數(shù)檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組XY總和>MxyAba+b<Mxym-an-b(m+n)-(a+b)總和mnm+n表6-15兩個(gè)樣本和Mxy比較之后得到各個(gè)樣本中大于和小于它的數(shù)目2X2列聯(lián)表
在原假設(shè)成立的條件下,這個(gè)結(jié)果有一點(diǎn)象超幾何分布。1/3/2023131版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組XY總和>MxyAba+b<MxA為樣本X中大于Mxy的樣本點(diǎn)數(shù),在零假設(shè)下A為超幾何分布,即有取A為樣本X中大于Mxy的樣本點(diǎn)數(shù)作為檢驗(yàn)的統(tǒng)計(jì)量,則A應(yīng)該不大不小,如果A太大或太小,則應(yīng)該懷疑原假設(shè)。檢驗(yàn)規(guī)則如下表所示:1/3/2023132A為樣本X中大于Mxy的樣本點(diǎn)數(shù),在零假設(shè)下A為超幾何分布,版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組表6-16Brown-Wood中位數(shù)檢驗(yàn)假設(shè)檢驗(yàn)統(tǒng)計(jì)量P值H0:Mx=My;H1:Mx>MyAP(A≥a)H0:Mx=My;H1:Mx<MyAP(A≤a)H0:Mx=My;H1:Mx≠M(fèi)yA2min(P(A≥a),P(A≤a))1/3/2023133版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組表6-16版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組大樣本的時(shí)候,在零假設(shè)下,可以利用超幾何分布的正態(tài)近似進(jìn)行檢驗(yàn):小樣本時(shí),也可以使用連續(xù)修正為1/3/2023134版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組大樣本的時(shí)候,在零假設(shè)下,可以利版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組在上例中有如下結(jié)果:總體容量:30總體中成功的次數(shù):15樣本容量:12樣本中成功的次數(shù):111/3/2023135版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組在上例中有如下結(jié)果:12/12/四、Wlicoxon(Mann-Whitney)秩和檢驗(yàn)
版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
設(shè)(X1,…,Xn)和(Y1,…,Yn)分別為兩個(gè)連續(xù)總體F(x)和F(y)中隨機(jī)抽取的樣本,我們關(guān)心兩個(gè)總體是否有相同的分布形狀,或者他們的中位數(shù)是否相等。1/3/2023136四、Wlicoxon(Mann-Whitney)秩和檢驗(yàn)
版版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
為了對假設(shè)做出判定,如果H0為真,那么將m個(gè)X、n個(gè)Y的數(shù)據(jù),按數(shù)值的相對大小升序排列,X、Y的值應(yīng)該期望被很好地混合,這m+n=N個(gè)觀察值能夠被看作來自于共同總體的一個(gè)單一的隨機(jī)樣本。若大部分的Y大于X,或大部分的X大于Y,將不能證實(shí)這個(gè)有序的序列是一個(gè)隨機(jī)的混合,將拒絕X、Y來自一個(gè)相同總體的零假設(shè)。在X、Y混合排列的序列中,X占有的位置是相對于Y的相對位置,因此秩是表示位置的一個(gè)極為方便的方法。在X、Y的混合排列中,秩1是最小的觀測值,秩N是最大的。若X的秩大部分大于Y的秩,那么數(shù)據(jù)將支持H1:Mx>My,而X的秩大部分小于Y的秩,則數(shù)據(jù)將支持H1:Mx<My。1/3/2023137版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組為了對假設(shè)做出判定,如果H版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組檢驗(yàn)統(tǒng)計(jì)量。根據(jù)上面的基本原理,檢驗(yàn)統(tǒng)計(jì)量為Wx=X的秩和Wy=Y的秩和由于X、Y的混合序列的秩和為:1+2+…+N=N(N+1)/21/3/2023138版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組檢驗(yàn)統(tǒng)計(jì)量。根據(jù)上面的基本原理,版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組
所以與Wlicoxon提出統(tǒng)計(jì)量相等價(jià)的統(tǒng)計(jì)量為,該統(tǒng)計(jì)量由Mann-Whitney提出,其含義為:如有第一個(gè)總體的樣本:X1,…,Xm和第二個(gè)總體的樣本:Y1,…,Yn,N=m+n。令是把所有的Y樣本與X樣本做比較后,X大于Y的個(gè)數(shù),即表示(Xi,Xj)(i=1,…,m;j=1,…,n)共mn對中X大于Y的個(gè)數(shù),則有1/3/2023139版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組所以版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組則當(dāng)n足夠大時(shí),1/3/2023140版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組則當(dāng)n足夠大時(shí),12/12/20第四節(jié)秩相關(guān)檢驗(yàn)
一、Pearson相關(guān)系數(shù)二、Spearman秩相關(guān)檢驗(yàn)三、Kendallτ檢驗(yàn)版權(quán)所有BY統(tǒng)計(jì)學(xué)課程組1/3/2023141
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職(航空電子設(shè)備維修)飛機(jī)電子系統(tǒng)調(diào)試綜合測試題及答案
- 2025年大學(xué)大四(廣告學(xué))廣告效果評估試題及答案
- 2025年大學(xué)護(hù)理學(xué)(護(hù)理技能競賽)試題及答案
- 2025年中職市場營銷(市場營銷基礎(chǔ)知識)試題及答案
- 2025年高職攝影(攝影史)試題及答案
- 2025年高職新能源汽車檢測與維修(充電樁維護(hù))試題及答案
- 2025年大學(xué)三年級(勞動(dòng)與社會保障)醫(yī)療保險(xiǎn)管理基礎(chǔ)測試題及答案
- 2025年大學(xué)大一(心理學(xué)基礎(chǔ))社會心理學(xué)試題及答案
- 大學(xué)(生物學(xué))遺傳學(xué)基礎(chǔ)2026年試題及答案
- 2025年大學(xué)林業(yè)信息工程(林業(yè)信息技術(shù)研發(fā))試題及答案
- 2025-2030中國環(huán)保產(chǎn)業(yè)市場動(dòng)態(tài)及投資機(jī)遇深度分析報(bào)告
- 山東省煙臺市芝罘區(qū)2024-2025學(xué)年三年級上學(xué)期期末數(shù)學(xué)試題
- GB/T 6074-2025板式鏈、連接環(huán)和槽輪尺寸、測量力、抗拉載荷和動(dòng)載載荷
- 護(hù)理員職業(yè)道德與法律法規(guī)
- 2025年安徽省普通高中學(xué)業(yè)水平合格性考試化學(xué)試卷(含答案)
- 2025年寧波市公共交通集團(tuán)有限公司下屬分子公司招聘備考題庫及答案詳解參考
- 2026年關(guān)于汽車銷售工作計(jì)劃書
- 腫瘤放射治療的新技術(shù)進(jìn)展
- 視頻會議系統(tǒng)施工質(zhì)量控制方案
- 2025年高二數(shù)學(xué)建模試題及答案
- 2025年黨的二十屆四中全會精神宣講稿及公報(bào)解讀輔導(dǎo)報(bào)告
評論
0/150
提交評論