版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
非參數(shù)統(tǒng)計(jì)非參數(shù)統(tǒng)計(jì)Kruskal-Wallis單因素方差分析獨(dú)立樣本Mann-Whitney檢驗(yàn)配對樣本W(wǎng)ilcoxon符號秩檢驗(yàn)配對樣本符號檢檢驗(yàn)?zāi)夸汧riedman秩方差分析隨機(jī)游程檢驗(yàn)通用兩樣本轉(zhuǎn)移模模型秩相關(guān)及其檢檢驗(yàn)緒論Kruskal-Wallis單因素方差分析獨(dú)立樣本Mann-
參數(shù)統(tǒng)計(jì)方法
定義:樣本被視為從分布族的某個(gè)參數(shù)族抽取出來的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值,推斷問題就轉(zhuǎn)化為對分布族的若干個(gè)未知參數(shù)的估計(jì)問題,用樣本對這些參數(shù)做出估計(jì)或者進(jìn)行某種形式的假設(shè)檢驗(yàn),這類推斷方法稱為參數(shù)方法。一個(gè)典型的參數(shù)檢驗(yàn)過程:1.總體參數(shù)(如總體均值)2.假定數(shù)據(jù)的形態(tài)為數(shù)值型(定比數(shù)據(jù))3.有很強(qiáng)的假定(一般要求分布正態(tài))4.例子:ZTest,tTest,χ2Test
參數(shù)統(tǒng)計(jì)方法
定義:樣本被視為從分布族的某個(gè)參數(shù)族抽取出來15.1緒論2.過多無法證明的假設(shè)1.有些試驗(yàn)的觀測值無法量化參數(shù)估計(jì)的局限15.1緒論2.過多無法證明的假設(shè)1.有些試驗(yàn)的觀測值15.1緒論1老師上課的質(zhì)量水平3…………2對食物的喜愛程度1.無法量化的觀測值我們之前遇到的問題中觀測值都是可以量化的,比如考試的分?jǐn)?shù),兩組人的身高等等,但還有一些觀測值是無法量化的,我們可以去比較好壞,高低卻無法用數(shù)字來度量15.1緒論1老師上課的質(zhì)量水平3…………2對食物的喜15.1緒論在10.8中提到,用t檢驗(yàn)比較兩個(gè)基于獨(dú)立樣本的均值是否相等時(shí),有隱含的假設(shè)是兩個(gè)總體都服從正態(tài)分布并且有相同的方差。但我們無法證實(shí)在實(shí)際情況下這些假設(shè)是否成立。2.過多無法證明的假設(shè)15.1緒論在10.8中提到,用t檢驗(yàn)比較兩個(gè)基于獨(dú)立15.1緒論統(tǒng)計(jì)學(xué)家對于非參統(tǒng)計(jì)沒有統(tǒng)一的定義。但有一些是大家都認(rèn)同的。當(dāng)一個(gè)樣本所在的分布僅有有限個(gè)參數(shù)值未知,其他條件已知時(shí),解決相關(guān)問題的方法叫做參數(shù)方法。而非參數(shù)方法用于除此以外的所有情況,可以在一個(gè)很寬泛的假設(shè)下仍可以很好的推斷出關(guān)于概率分布及參數(shù)的相關(guān)信息。15.1緒論統(tǒng)計(jì)學(xué)家對于非參統(tǒng)計(jì)沒有統(tǒng)一的定義。但有一15.1緒論例:當(dāng)總體服從正態(tài)分布,且均值和方差未知時(shí),我們可以運(yùn)用t檢驗(yàn)。因?yàn)槌司岛头讲顑蓚€(gè)參數(shù)未知外,樣本所在分布的其他條件已知,所以說t檢驗(yàn)是個(gè)參數(shù)過程。假設(shè)相互獨(dú)立的樣本取自兩個(gè)總體,而我們要檢驗(yàn)兩個(gè)總體分布是否一致,但分布的形狀未知。在這種情況下,分布是不確定的,只能靠非參數(shù)方法來檢驗(yàn)。15.1緒論例:15.1緒論對于前面的章節(jié)所介紹了參數(shù)統(tǒng)計(jì)的方法,其有效性是建立在確定的分布假設(shè)成立或者至少近似滿足的前提下。即使所有的前提都滿足,研究表明,非參數(shù)統(tǒng)計(jì)幾乎和參數(shù)統(tǒng)計(jì)一樣能夠檢測出總體間的差異。而當(dāng)分布的假設(shè)前提不滿足時(shí),非參數(shù)統(tǒng)計(jì)或許往往是測量總體間差異最有效的方法。因此,有很多統(tǒng)計(jì)學(xué)家都更傾向于使用非參數(shù)統(tǒng)計(jì)。15.1緒論對于前面的章節(jié)所介紹了參數(shù)統(tǒng)計(jì)的方法,其有15.2通用兩樣本移動(dòng)模型通常,我們會(huì)從兩個(gè)總體中取得觀測值來檢驗(yàn)兩個(gè)總體是否有相同的分布。以正態(tài)總體為例。從兩個(gè)具有相同方差,均值分別為μx,μy的正態(tài)總體中,抽取獨(dú)立的隨機(jī)樣本X1,X2..Xn1和Y1,Y2...Yn2H0:μx-μy=0Ha:μx-μy<015.2通用兩樣本移動(dòng)模型通常,我們會(huì)從兩個(gè)總體中取得15.2通用兩樣本移動(dòng)模型如果H0為真,那么兩個(gè)總體均為正態(tài)分布且具有相同的均值和方差,也就是說二者的分布完全相同。如果Ha為真,即μx<μy并且X1與Y1的分布的形狀相同,只是Y1的均值位置μy比X1的均值μx更大。也就是說,Y1的分布相當(dāng)于是X1的分布向右平移得到的結(jié)果。μxμy平移距離fxfy15.2通用兩樣本移動(dòng)模型如果H0為真,那么兩個(gè)總體均15.2通用兩樣本移動(dòng)模型在之前的例子中,除了μx,μy和σ2的參數(shù)值,分布已經(jīng)完全確定,也就是說屬于參數(shù)統(tǒng)計(jì)。下面,我們將定義一個(gè)可以應(yīng)用于正態(tài)分布和其他分布等任何分布的平移模型。15.2通用兩樣本移動(dòng)模型在之前的例子中,除了μx,μ15.2通用兩樣本移動(dòng)模型令X1,X2,X3,…,Xn1為具有分布函數(shù)F(x)的總體中的一個(gè)隨機(jī)樣本,令Y1,Y2,…,Yn2為具有分布函數(shù)G(x)的總體中的一個(gè)隨機(jī)樣本。如果我們想要去檢驗(yàn)這兩個(gè)總體是否具有相同的分布,也就是在F(z),G(z)的分布形狀未知的情況下一個(gè)假設(shè)檢驗(yàn),這時(shí)我們就需要利用非參數(shù)的方法了。H0:F(z)=G(z)Ha:F(z)≠G(z)15.2通用兩樣本移動(dòng)模型令X1,X2,X3,…,Xn15.2通用兩樣本移動(dòng)模型Ha:F(z)≠G(z)可以轉(zhuǎn)化成下面的形式Y(jié)1與平移了(未知的)θ距離的X1具有相同的分布。這兩個(gè)分布只是在位置上不同。即對于某個(gè)未知的參數(shù)θ,有G(y)=P(Y1≤y)=P(X1≤y-θ)=F(y-θ)θfxfy15.2通用兩樣本移動(dòng)模型Ha:F(z)≠G(z)15.3配對試驗(yàn)的符號秩檢驗(yàn)SignTest(符號檢驗(yàn))忽略統(tǒng)計(jì)過程中的具體數(shù)量,僅利用正負(fù)號來區(qū)分兩類樣本數(shù)據(jù)并進(jìn)行推斷。若正負(fù)號的數(shù)目相差較大,則有理由拒絕原假設(shè),因此又稱為正負(fù)號檢驗(yàn)。Match-pairs(配對樣本)獨(dú)立樣本是指我們得到的樣本總體之間是相互獨(dú)立的,比如我們要研究一個(gè)地區(qū)百姓的生活水平,要同時(shí)考察家庭的子女?dāng)?shù)x,父母的教育水平y(tǒng),這就可以看到是獨(dú)立樣本。配對樣本則恰恰相反,是指我們得到的樣本總體之間是存在相關(guān)關(guān)系的,比如我們要研究藥效y與藥物用量x的關(guān)系,則(x,y)為配對樣本。15.3配對試驗(yàn)的符號秩檢驗(yàn)SignTest(符號檢驗(yàn))符號檢驗(yàn)的步驟(1)1)提出假設(shè)假設(shè)有n對隨機(jī)選取的獨(dú)立的配對樣本(xi,yi),我們想要檢驗(yàn)X和Y的分布是否相同。令Di=xi-yi,P+,P-代表Di為正號,負(fù)號出現(xiàn)的概率。由于在原假設(shè)成立的情況下Di為正(或?yàn)樨?fù))的概率等于1/2,則若p={X>Y},原假設(shè)H0:p=?備擇假設(shè)Ha:p>?(或者p<?或者p≠?)注意:樣本容量n是在去除相等的(xi,yi)(稱為一個(gè)結(jié)tie)之后得到的符號檢驗(yàn)的步驟(1)1)提出假設(shè)符號檢驗(yàn)的步驟(2)2)確定統(tǒng)計(jì)量設(shè)M是正號總個(gè)數(shù),如果X和Y分布相同,M的選取為n次伯努利實(shí)驗(yàn),服從p=1/2的二項(xiàng)分布:M~B(n,1/2)3)拒絕域RRHa:p>?時(shí),當(dāng)M很大時(shí)拒絕原假設(shè)Ha:p<?時(shí),當(dāng)M很小時(shí)拒絕原假設(shè)Ha:p≠?時(shí),當(dāng)M很大或者很小時(shí)拒絕原假設(shè)符號檢驗(yàn)的步驟(2)2)確定統(tǒng)計(jì)量符號檢驗(yàn)的步驟(3)
符號檢驗(yàn)的步驟(3)
符號檢驗(yàn)的大樣本情況N≥25時(shí)可以用正態(tài)分布來近似估計(jì)二項(xiàng)分布模型符號檢驗(yàn)的統(tǒng)計(jì)量改為:Z=(M-np)/√npq=(2M-n)/√n~N(0,1)拒絕域即為:RR:{|z|≧z
α/2}符號檢驗(yàn)的大樣本情況N≥25時(shí)配對試驗(yàn)的Wilcoxon符號秩檢驗(yàn)在H0之下,我們期望:1.n對樣本中,每對差值正負(fù)總和個(gè)數(shù)各為n/22.正負(fù)差值的絕對值相等等概率發(fā)生正負(fù)秩總和若存在一定差異,則意味著兩個(gè)分布之間存在平移總體非正態(tài)時(shí)可作為t檢驗(yàn)的替代配對試驗(yàn)的Wilcoxon符號秩檢驗(yàn)在H0之下,我們期望:H0:隨機(jī)變量X和Y分布相同Ha:1.雙邊檢驗(yàn)—兩總體只在位置上不同,形狀相同
2.單邊檢驗(yàn)—兩總體形狀相同,X分布在Y的右邊檢驗(yàn)統(tǒng)計(jì)量:1.T=min(T+,T-)2.T=T-拒絕域:1.雙邊檢驗(yàn)---如果T<T0,拒絕H02.單邊檢驗(yàn)---如果T-<T0,拒絕H0配對試驗(yàn)的Wilcoxon符號秩檢驗(yàn)H0:隨機(jī)變量X和Y分布相同配對試驗(yàn)的Wi例15.4一個(gè)配對試驗(yàn)被用來檢驗(yàn)A和B兩種混合物做成的蛋糕的差別,兩種蛋糕各6個(gè)被配對放在6個(gè)不同的烤箱中烘烤,檢驗(yàn)兩種蛋糕密度的總體分布是否有差異。數(shù)據(jù)見下表。解:原假設(shè):兩種蛋糕密度的總體分布相同備擇假設(shè):兩種蛋糕密度的總體分布不同取α=0.1,從附錄3表9中雙尾檢驗(yàn)T的臨界值為2
檢驗(yàn)統(tǒng)計(jì)量不在拒絕域中,所以沒有充分證據(jù)表明兩個(gè)總體不同因?yàn)樵讦?0.1時(shí)不拒絕原假設(shè),所以p-value>0.1例15.4一個(gè)配對試驗(yàn)被用來檢驗(yàn)A和B兩種混合物做成的蛋糕例15.4數(shù)據(jù)ABA-B差的絕對值差的絕對值的秩0.1350.1290.0060.00630.1020.120-0.0180.01850.1080.112-0.0040.0041.50.1410.152-0.0110.01140.1310.135-0.0040.0041.50.1440.163-0.0190.0196例15.4數(shù)據(jù)ABA-B差的絕對值差的絕對值的秩0.13515.5獨(dú)立隨機(jī)樣本的檢驗(yàn):
使用秩(ranks)1.如何取秩?
將從總體I和總體II取得的樣本排序,得到各個(gè)觀測值的秩.相同大小的觀測值具有相同的秩,我們稱之為結(jié)(ties)。
結(jié)(ties)的處理:將同秩觀測值的秩和平均分配給各個(gè)觀測值作為其秩。例:觀測值468810原秩12345處理后的秩123.53.5515.5獨(dú)立隨機(jī)樣本的檢驗(yàn):
使用秩(ranks)1.如何15.5獨(dú)立隨機(jī)樣本的檢驗(yàn):
使用秩(ranks)2.秩和檢驗(yàn)(rank-sumtest):
如果兩個(gè)總體相同,那么樣本的秩和(ranksum)應(yīng)當(dāng)與樣本量成比例。在樣本量相同的情況下,如果兩者的秩和相差很大,那么總體應(yīng)當(dāng)具有顯著區(qū)別。15.5獨(dú)立隨機(jī)樣本的檢驗(yàn):
使用秩(ranks)2.秩和15.6獨(dú)立隨機(jī)樣本的非參數(shù)檢驗(yàn):Mann-WhitneyU
檢驗(yàn)U統(tǒng)計(jì)量:
U是對于樣本II中每個(gè)觀測值,樣本I中比它小的觀測值的個(gè)數(shù)的總和。例:
25 26 27 28 29 31 32 35 x(1) x(2) x(3) y(1) y(2) x(4) y(3) y(4)
u1=3,u2=3,u3=4,u4=4
則U=u1+u2+u3+u4=3+3+4+4=1415.6獨(dú)立隨機(jī)樣本的非參數(shù)檢驗(yàn):Mann-WhitneU統(tǒng)計(jì)量的計(jì)算公式:其中:n1:樣本一中觀測值的個(gè)數(shù),n2:樣本二中觀測值的個(gè)數(shù)W:樣本一的秩和.n1≤n2U統(tǒng)計(jì)量的性質(zhì):
1.U的取值范圍:0,1,2,…,n1*n2 2.U的概率分布對(n1*n2)/2對稱
.因此U統(tǒng)計(jì)量的計(jì)算公式:其中:U統(tǒng)計(jì)量的性質(zhì):Mann-WhitneyU
檢驗(yàn) 總體I是較小樣本所對應(yīng)的總體(n1<n2)
H0:總體分布相同
Ha:(1)總體分布在位置上有區(qū)別(雙尾檢驗(yàn));(2)總體I的概率分布在總體II分布的右側(cè);(3).總體I分布在總體II分布左側(cè)
檢驗(yàn)統(tǒng)計(jì)量:
RR:
(1)對于雙尾檢驗(yàn),當(dāng)U≤U0或者U≥n1*n2-U0時(shí),拒絕H0,U0滿足:P(U≤U0)=α/2
(2)檢驗(yàn)總體I在總體II右側(cè),當(dāng)U≤U0時(shí),拒絕H0
(3)檢驗(yàn)總體I在總體II左側(cè),當(dāng)U≥n1*n2-U0時(shí),拒絕H0Mann-WhitneyU檢驗(yàn) 總體I是較小樣本所對應(yīng)的大樣本U檢驗(yàn)(n1>10n2>10)當(dāng)總體分布相同的時(shí)候,U具有以下性質(zhì):在大樣本(n1>10,n2>10)情況下
Z近似服從于標(biāo)準(zhǔn)正態(tài)分布
大樣本U檢驗(yàn)(n1>10n2>10)當(dāng)總體分布相同的時(shí)候,Kruskal-Wallis單因素方差分析Kruskal-Wallis單因素方差分析是用非參方法檢驗(yàn)多個(gè)總體是否相同。方差分析是用于檢驗(yàn)多獨(dú)立總體均值是否相等的參數(shù)方法,需要假設(shè)各總體服從正態(tài)分布且方差相等此方法不需要這個(gè)假設(shè)!!!!Kruskal-Wallis單因素方差分析Kruskal-WKruskal-Wallis單因素方差分析從每個(gè)總體中抽出一個(gè)樣本,共有k個(gè)獨(dú)立樣本,每個(gè)樣本的樣本量分別為n1,n2,.......,nk.將所有樣本的數(shù)據(jù)從小到大排列合并成一個(gè)單一的樣本,全部觀察值的總數(shù)位N=n1+n2+....+nk找出每個(gè)觀察值的秩,從1到N,對于N個(gè)觀測值來說Kruskal-Wallis單因素方差分析從每個(gè)總體中抽出一Kruskal-Wallis單因素方差分析Kruskal-Wallis單因素方差分析Kruskal-Wallis單因素方差分析H0:k個(gè)總體分布都同H1:至少有倆個(gè)總體分布不同ni=第i個(gè)總體的樣本量Ri=第i個(gè)樣本實(shí)際秩的總和拒絕域:Kruskal-Wallis單因素方差分析H0:k個(gè)總體分布Friedman秩方差分析
Friedman秩方差分析隨機(jī)化區(qū)組設(shè)計(jì)的Friedman秩方差分析
原假設(shè)與備擇假設(shè)12構(gòu)造統(tǒng)計(jì)量3拒絕域4檢驗(yàn)的假設(shè)隨機(jī)化區(qū)組設(shè)計(jì)的Friedman秩方差分析原假設(shè)與備擇假設(shè)原假設(shè)和備擇假設(shè)原假設(shè):H0:K種處理的概率分布是相同的備擇假設(shè):Ha:至少兩個(gè)分布的位置不同原假設(shè)和備擇假設(shè)原假設(shè):構(gòu)造統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量:Fr=b:區(qū)組的個(gè)數(shù)k:處理的個(gè)數(shù)Ri:第i個(gè)處理的秩的和,其中每個(gè)處理的秩的計(jì)算和它所在的區(qū)組中包含的處理的個(gè)數(shù)相關(guān)構(gòu)造統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量:拒絕域拒絕域:Fr>其中卡方分布自由度為(k-1)拒絕域拒絕域:檢驗(yàn)的假設(shè)假設(shè):在區(qū)組中,處理被隨機(jī)分配到實(shí)驗(yàn)單元區(qū)組數(shù)或處理數(shù)至少有一個(gè)大于5檢驗(yàn)的假設(shè)假設(shè):隨機(jī)游程檢驗(yàn)TheRunsTest:ATestforRandomness隨機(jī)游程檢驗(yàn)TheRunsTest:隨機(jī)游程檢驗(yàn)
SSSSSFFSSSFFFSSSSSSS游程(Run):一連串出現(xiàn)的相同符號的序列,其后則出現(xiàn)不同符號,或沒有符號游程用于檢驗(yàn)樣本的隨機(jī)性,通常游程過多或過少時(shí),都會(huì)懷疑樣本的隨機(jī)性上例中,包含5個(gè)游程隨機(jī)游程檢驗(yàn)SSSSSFFSSS隨機(jī)游程檢驗(yàn)—檢驗(yàn)原理與計(jì)算方法假設(shè)序列中含有n1個(gè)S元素,n2個(gè)F元素,n=n1+n2Y1個(gè)S的游程,Y2個(gè)F的游程,其中,Y1+Y2=R。H0:樣本序列隨機(jī)Ha:樣本序列不隨機(jī)檢驗(yàn)統(tǒng)計(jì)量:R(游程個(gè)數(shù))拒絕域:RR={R≤K1andR≥K2}P(R=2K)=2P(Y1=k,Y2=k)P(R=2K+1)=P(Y1=k,Y2=k+1)+P(Y1=k+1,Y2=k)隨機(jī)游程檢驗(yàn)—檢驗(yàn)原理與計(jì)算方法假設(shè)序列中含有n1個(gè)S元素,RunTest:大樣本的例子經(jīng)驗(yàn)表明:如果n1且n2>10,R
的抽樣分布近似為正態(tài)H0:樣本序列隨機(jī)Ha:樣本序列不隨機(jī)檢驗(yàn)統(tǒng)計(jì)量:Z拒絕域:RR={|Z|≥Zα/2}顯著水平:αRunTest:大樣本的例子經(jīng)驗(yàn)表明:H0:樣本序列隨機(jī)秩相關(guān)及其檢驗(yàn)兩個(gè)數(shù)值變量之間相關(guān)性我們用其相關(guān)系數(shù)度量,對于兩個(gè)順序變量之間相關(guān)程度的測量怎么辦呢?非參數(shù)統(tǒng)計(jì)中的秩相關(guān)系數(shù)為解決此問題的利器!在此方法的應(yīng)用中,我們對總體的分布不做任何假定,只需要對樣本觀測值進(jìn)行排秩最常見的秩相關(guān)系數(shù)有spearman’和kendall’秩相關(guān)及其檢驗(yàn)兩個(gè)數(shù)值變量之間相關(guān)性我們用其相關(guān)系數(shù)度量,對Spearman秩相關(guān)系數(shù)設(shè)樣本(X,Y)={(X1,Y1),……,(Xn,Yn)}來自總體:F(x,y)類似于相關(guān)系數(shù):R(xi)指的是xi在所有x觀測值中的秩,R(yi)指的是yi在所有y觀測值中的秩當(dāng)觀測值沒有打結(jié)出現(xiàn)時(shí),上式可化簡為:
Spearman秩相關(guān)系數(shù)設(shè)樣本(X,Y)={(X1,YSpearman秩相關(guān)檢驗(yàn)Spearman秩相關(guān)系數(shù)檢驗(yàn)檢驗(yàn)統(tǒng)計(jì)量:Spearman秩相關(guān)系數(shù)拒絕域:1或(雙尾檢驗(yàn))(上尾檢驗(yàn))(下尾檢驗(yàn))的相關(guān)值可以在書上的表11-3中查找原假設(shè):不存在相關(guān)性備擇假設(shè):1存在相關(guān)性(雙尾)2存在正(負(fù))相關(guān)(單尾)
Spearman秩相關(guān)檢驗(yàn)Spearman檢驗(yàn)統(tǒng)計(jì)量:拒絕域非參數(shù)統(tǒng)計(jì)的優(yōu)勢與弱點(diǎn)對總體假定較少,有廣泛的適用性,結(jié)果穩(wěn)定性較好。–1.假定較少–2.不需要對總體參數(shù)的假定–3.與參數(shù)結(jié)果接近針對幾乎所有類型的數(shù)據(jù)形態(tài)。容易計(jì)算–在計(jì)算機(jī)盛行之前就已經(jīng)發(fā)展起來非參數(shù)統(tǒng)計(jì)的缺點(diǎn)——可能會(huì)浪費(fèi)一些信息特別當(dāng)數(shù)據(jù)可以使用參數(shù)模型的時(shí)候非參數(shù)統(tǒng)計(jì)的優(yōu)勢與弱點(diǎn)對總體假定較少,有廣泛的適用性,謝謝觀賞謝謝觀賞非參數(shù)統(tǒng)計(jì)非參數(shù)統(tǒng)計(jì)Kruskal-Wallis單因素方差分析獨(dú)立樣本Mann-Whitney檢驗(yàn)配對樣本W(wǎng)ilcoxon符號秩檢驗(yàn)配對樣本符號檢檢驗(yàn)?zāi)夸汧riedman秩方差分析隨機(jī)游程檢驗(yàn)通用兩樣本轉(zhuǎn)移模模型秩相關(guān)及其檢檢驗(yàn)緒論Kruskal-Wallis單因素方差分析獨(dú)立樣本Mann-
參數(shù)統(tǒng)計(jì)方法
定義:樣本被視為從分布族的某個(gè)參數(shù)族抽取出來的總體的代表,而未知的僅僅是總體分布具體的參數(shù)值,推斷問題就轉(zhuǎn)化為對分布族的若干個(gè)未知參數(shù)的估計(jì)問題,用樣本對這些參數(shù)做出估計(jì)或者進(jìn)行某種形式的假設(shè)檢驗(yàn),這類推斷方法稱為參數(shù)方法。一個(gè)典型的參數(shù)檢驗(yàn)過程:1.總體參數(shù)(如總體均值)2.假定數(shù)據(jù)的形態(tài)為數(shù)值型(定比數(shù)據(jù))3.有很強(qiáng)的假定(一般要求分布正態(tài))4.例子:ZTest,tTest,χ2Test
參數(shù)統(tǒng)計(jì)方法
定義:樣本被視為從分布族的某個(gè)參數(shù)族抽取出來15.1緒論2.過多無法證明的假設(shè)1.有些試驗(yàn)的觀測值無法量化參數(shù)估計(jì)的局限15.1緒論2.過多無法證明的假設(shè)1.有些試驗(yàn)的觀測值15.1緒論1老師上課的質(zhì)量水平3…………2對食物的喜愛程度1.無法量化的觀測值我們之前遇到的問題中觀測值都是可以量化的,比如考試的分?jǐn)?shù),兩組人的身高等等,但還有一些觀測值是無法量化的,我們可以去比較好壞,高低卻無法用數(shù)字來度量15.1緒論1老師上課的質(zhì)量水平3…………2對食物的喜15.1緒論在10.8中提到,用t檢驗(yàn)比較兩個(gè)基于獨(dú)立樣本的均值是否相等時(shí),有隱含的假設(shè)是兩個(gè)總體都服從正態(tài)分布并且有相同的方差。但我們無法證實(shí)在實(shí)際情況下這些假設(shè)是否成立。2.過多無法證明的假設(shè)15.1緒論在10.8中提到,用t檢驗(yàn)比較兩個(gè)基于獨(dú)立15.1緒論統(tǒng)計(jì)學(xué)家對于非參統(tǒng)計(jì)沒有統(tǒng)一的定義。但有一些是大家都認(rèn)同的。當(dāng)一個(gè)樣本所在的分布僅有有限個(gè)參數(shù)值未知,其他條件已知時(shí),解決相關(guān)問題的方法叫做參數(shù)方法。而非參數(shù)方法用于除此以外的所有情況,可以在一個(gè)很寬泛的假設(shè)下仍可以很好的推斷出關(guān)于概率分布及參數(shù)的相關(guān)信息。15.1緒論統(tǒng)計(jì)學(xué)家對于非參統(tǒng)計(jì)沒有統(tǒng)一的定義。但有一15.1緒論例:當(dāng)總體服從正態(tài)分布,且均值和方差未知時(shí),我們可以運(yùn)用t檢驗(yàn)。因?yàn)槌司岛头讲顑蓚€(gè)參數(shù)未知外,樣本所在分布的其他條件已知,所以說t檢驗(yàn)是個(gè)參數(shù)過程。假設(shè)相互獨(dú)立的樣本取自兩個(gè)總體,而我們要檢驗(yàn)兩個(gè)總體分布是否一致,但分布的形狀未知。在這種情況下,分布是不確定的,只能靠非參數(shù)方法來檢驗(yàn)。15.1緒論例:15.1緒論對于前面的章節(jié)所介紹了參數(shù)統(tǒng)計(jì)的方法,其有效性是建立在確定的分布假設(shè)成立或者至少近似滿足的前提下。即使所有的前提都滿足,研究表明,非參數(shù)統(tǒng)計(jì)幾乎和參數(shù)統(tǒng)計(jì)一樣能夠檢測出總體間的差異。而當(dāng)分布的假設(shè)前提不滿足時(shí),非參數(shù)統(tǒng)計(jì)或許往往是測量總體間差異最有效的方法。因此,有很多統(tǒng)計(jì)學(xué)家都更傾向于使用非參數(shù)統(tǒng)計(jì)。15.1緒論對于前面的章節(jié)所介紹了參數(shù)統(tǒng)計(jì)的方法,其有15.2通用兩樣本移動(dòng)模型通常,我們會(huì)從兩個(gè)總體中取得觀測值來檢驗(yàn)兩個(gè)總體是否有相同的分布。以正態(tài)總體為例。從兩個(gè)具有相同方差,均值分別為μx,μy的正態(tài)總體中,抽取獨(dú)立的隨機(jī)樣本X1,X2..Xn1和Y1,Y2...Yn2H0:μx-μy=0Ha:μx-μy<015.2通用兩樣本移動(dòng)模型通常,我們會(huì)從兩個(gè)總體中取得15.2通用兩樣本移動(dòng)模型如果H0為真,那么兩個(gè)總體均為正態(tài)分布且具有相同的均值和方差,也就是說二者的分布完全相同。如果Ha為真,即μx<μy并且X1與Y1的分布的形狀相同,只是Y1的均值位置μy比X1的均值μx更大。也就是說,Y1的分布相當(dāng)于是X1的分布向右平移得到的結(jié)果。μxμy平移距離fxfy15.2通用兩樣本移動(dòng)模型如果H0為真,那么兩個(gè)總體均15.2通用兩樣本移動(dòng)模型在之前的例子中,除了μx,μy和σ2的參數(shù)值,分布已經(jīng)完全確定,也就是說屬于參數(shù)統(tǒng)計(jì)。下面,我們將定義一個(gè)可以應(yīng)用于正態(tài)分布和其他分布等任何分布的平移模型。15.2通用兩樣本移動(dòng)模型在之前的例子中,除了μx,μ15.2通用兩樣本移動(dòng)模型令X1,X2,X3,…,Xn1為具有分布函數(shù)F(x)的總體中的一個(gè)隨機(jī)樣本,令Y1,Y2,…,Yn2為具有分布函數(shù)G(x)的總體中的一個(gè)隨機(jī)樣本。如果我們想要去檢驗(yàn)這兩個(gè)總體是否具有相同的分布,也就是在F(z),G(z)的分布形狀未知的情況下一個(gè)假設(shè)檢驗(yàn),這時(shí)我們就需要利用非參數(shù)的方法了。H0:F(z)=G(z)Ha:F(z)≠G(z)15.2通用兩樣本移動(dòng)模型令X1,X2,X3,…,Xn15.2通用兩樣本移動(dòng)模型Ha:F(z)≠G(z)可以轉(zhuǎn)化成下面的形式Y(jié)1與平移了(未知的)θ距離的X1具有相同的分布。這兩個(gè)分布只是在位置上不同。即對于某個(gè)未知的參數(shù)θ,有G(y)=P(Y1≤y)=P(X1≤y-θ)=F(y-θ)θfxfy15.2通用兩樣本移動(dòng)模型Ha:F(z)≠G(z)15.3配對試驗(yàn)的符號秩檢驗(yàn)SignTest(符號檢驗(yàn))忽略統(tǒng)計(jì)過程中的具體數(shù)量,僅利用正負(fù)號來區(qū)分兩類樣本數(shù)據(jù)并進(jìn)行推斷。若正負(fù)號的數(shù)目相差較大,則有理由拒絕原假設(shè),因此又稱為正負(fù)號檢驗(yàn)。Match-pairs(配對樣本)獨(dú)立樣本是指我們得到的樣本總體之間是相互獨(dú)立的,比如我們要研究一個(gè)地區(qū)百姓的生活水平,要同時(shí)考察家庭的子女?dāng)?shù)x,父母的教育水平y(tǒng),這就可以看到是獨(dú)立樣本。配對樣本則恰恰相反,是指我們得到的樣本總體之間是存在相關(guān)關(guān)系的,比如我們要研究藥效y與藥物用量x的關(guān)系,則(x,y)為配對樣本。15.3配對試驗(yàn)的符號秩檢驗(yàn)SignTest(符號檢驗(yàn))符號檢驗(yàn)的步驟(1)1)提出假設(shè)假設(shè)有n對隨機(jī)選取的獨(dú)立的配對樣本(xi,yi),我們想要檢驗(yàn)X和Y的分布是否相同。令Di=xi-yi,P+,P-代表Di為正號,負(fù)號出現(xiàn)的概率。由于在原假設(shè)成立的情況下Di為正(或?yàn)樨?fù))的概率等于1/2,則若p={X>Y},原假設(shè)H0:p=?備擇假設(shè)Ha:p>?(或者p<?或者p≠?)注意:樣本容量n是在去除相等的(xi,yi)(稱為一個(gè)結(jié)tie)之后得到的符號檢驗(yàn)的步驟(1)1)提出假設(shè)符號檢驗(yàn)的步驟(2)2)確定統(tǒng)計(jì)量設(shè)M是正號總個(gè)數(shù),如果X和Y分布相同,M的選取為n次伯努利實(shí)驗(yàn),服從p=1/2的二項(xiàng)分布:M~B(n,1/2)3)拒絕域RRHa:p>?時(shí),當(dāng)M很大時(shí)拒絕原假設(shè)Ha:p<?時(shí),當(dāng)M很小時(shí)拒絕原假設(shè)Ha:p≠?時(shí),當(dāng)M很大或者很小時(shí)拒絕原假設(shè)符號檢驗(yàn)的步驟(2)2)確定統(tǒng)計(jì)量符號檢驗(yàn)的步驟(3)
符號檢驗(yàn)的步驟(3)
符號檢驗(yàn)的大樣本情況N≥25時(shí)可以用正態(tài)分布來近似估計(jì)二項(xiàng)分布模型符號檢驗(yàn)的統(tǒng)計(jì)量改為:Z=(M-np)/√npq=(2M-n)/√n~N(0,1)拒絕域即為:RR:{|z|≧z
α/2}符號檢驗(yàn)的大樣本情況N≥25時(shí)配對試驗(yàn)的Wilcoxon符號秩檢驗(yàn)在H0之下,我們期望:1.n對樣本中,每對差值正負(fù)總和個(gè)數(shù)各為n/22.正負(fù)差值的絕對值相等等概率發(fā)生正負(fù)秩總和若存在一定差異,則意味著兩個(gè)分布之間存在平移總體非正態(tài)時(shí)可作為t檢驗(yàn)的替代配對試驗(yàn)的Wilcoxon符號秩檢驗(yàn)在H0之下,我們期望:H0:隨機(jī)變量X和Y分布相同Ha:1.雙邊檢驗(yàn)—兩總體只在位置上不同,形狀相同
2.單邊檢驗(yàn)—兩總體形狀相同,X分布在Y的右邊檢驗(yàn)統(tǒng)計(jì)量:1.T=min(T+,T-)2.T=T-拒絕域:1.雙邊檢驗(yàn)---如果T<T0,拒絕H02.單邊檢驗(yàn)---如果T-<T0,拒絕H0配對試驗(yàn)的Wilcoxon符號秩檢驗(yàn)H0:隨機(jī)變量X和Y分布相同配對試驗(yàn)的Wi例15.4一個(gè)配對試驗(yàn)被用來檢驗(yàn)A和B兩種混合物做成的蛋糕的差別,兩種蛋糕各6個(gè)被配對放在6個(gè)不同的烤箱中烘烤,檢驗(yàn)兩種蛋糕密度的總體分布是否有差異。數(shù)據(jù)見下表。解:原假設(shè):兩種蛋糕密度的總體分布相同備擇假設(shè):兩種蛋糕密度的總體分布不同取α=0.1,從附錄3表9中雙尾檢驗(yàn)T的臨界值為2
檢驗(yàn)統(tǒng)計(jì)量不在拒絕域中,所以沒有充分證據(jù)表明兩個(gè)總體不同因?yàn)樵讦?0.1時(shí)不拒絕原假設(shè),所以p-value>0.1例15.4一個(gè)配對試驗(yàn)被用來檢驗(yàn)A和B兩種混合物做成的蛋糕例15.4數(shù)據(jù)ABA-B差的絕對值差的絕對值的秩0.1350.1290.0060.00630.1020.120-0.0180.01850.1080.112-0.0040.0041.50.1410.152-0.0110.01140.1310.135-0.0040.0041.50.1440.163-0.0190.0196例15.4數(shù)據(jù)ABA-B差的絕對值差的絕對值的秩0.13515.5獨(dú)立隨機(jī)樣本的檢驗(yàn):
使用秩(ranks)1.如何取秩?
將從總體I和總體II取得的樣本排序,得到各個(gè)觀測值的秩.相同大小的觀測值具有相同的秩,我們稱之為結(jié)(ties)。
結(jié)(ties)的處理:將同秩觀測值的秩和平均分配給各個(gè)觀測值作為其秩。例:觀測值468810原秩12345處理后的秩123.53.5515.5獨(dú)立隨機(jī)樣本的檢驗(yàn):
使用秩(ranks)1.如何15.5獨(dú)立隨機(jī)樣本的檢驗(yàn):
使用秩(ranks)2.秩和檢驗(yàn)(rank-sumtest):
如果兩個(gè)總體相同,那么樣本的秩和(ranksum)應(yīng)當(dāng)與樣本量成比例。在樣本量相同的情況下,如果兩者的秩和相差很大,那么總體應(yīng)當(dāng)具有顯著區(qū)別。15.5獨(dú)立隨機(jī)樣本的檢驗(yàn):
使用秩(ranks)2.秩和15.6獨(dú)立隨機(jī)樣本的非參數(shù)檢驗(yàn):Mann-WhitneyU
檢驗(yàn)U統(tǒng)計(jì)量:
U是對于樣本II中每個(gè)觀測值,樣本I中比它小的觀測值的個(gè)數(shù)的總和。例:
25 26 27 28 29 31 32 35 x(1) x(2) x(3) y(1) y(2) x(4) y(3) y(4)
u1=3,u2=3,u3=4,u4=4
則U=u1+u2+u3+u4=3+3+4+4=1415.6獨(dú)立隨機(jī)樣本的非參數(shù)檢驗(yàn):Mann-WhitneU統(tǒng)計(jì)量的計(jì)算公式:其中:n1:樣本一中觀測值的個(gè)數(shù),n2:樣本二中觀測值的個(gè)數(shù)W:樣本一的秩和.n1≤n2U統(tǒng)計(jì)量的性質(zhì):
1.U的取值范圍:0,1,2,…,n1*n2 2.U的概率分布對(n1*n2)/2對稱
.因此U統(tǒng)計(jì)量的計(jì)算公式:其中:U統(tǒng)計(jì)量的性質(zhì):Mann-WhitneyU
檢驗(yàn) 總體I是較小樣本所對應(yīng)的總體(n1<n2)
H0:總體分布相同
Ha:(1)總體分布在位置上有區(qū)別(雙尾檢驗(yàn));(2)總體I的概率分布在總體II分布的右側(cè);(3).總體I分布在總體II分布左側(cè)
檢驗(yàn)統(tǒng)計(jì)量:
RR:
(1)對于雙尾檢驗(yàn),當(dāng)U≤U0或者U≥n1*n2-U0時(shí),拒絕H0,U0滿足:P(U≤U0)=α/2
(2)檢驗(yàn)總體I在總體II右側(cè),當(dāng)U≤U0時(shí),拒絕H0
(3)檢驗(yàn)總體I在總體II左側(cè),當(dāng)U≥n1*n2-U0時(shí),拒絕H0Mann-WhitneyU檢驗(yàn) 總體I是較小樣本所對應(yīng)的大樣本U檢驗(yàn)(n1>10n2>10)當(dāng)總體分布相同的時(shí)候,U具有以下性質(zhì):在大樣本(n1>10,n2>10)情況下
Z近似服從于標(biāo)準(zhǔn)正態(tài)分布
大樣本U檢驗(yàn)(n1>10n2>10)當(dāng)總體分布相同的時(shí)候,Kruskal-Wallis單因素方差分析Kruskal-Wallis單因素方差分析是用非參方法檢驗(yàn)多個(gè)總體是否相同。方差分析是用于檢驗(yàn)多獨(dú)立總體均值是否相等的參數(shù)方法,需要假設(shè)各總體服從正態(tài)分布且方差相等此方法不需要這個(gè)假設(shè)!!!!Kruskal-Wallis單因素方差分析Kruskal-WKruskal-Wallis單因素方差分析從每個(gè)總體中抽出一個(gè)樣本,共有k個(gè)獨(dú)立樣本,每個(gè)樣本的樣本量分別為n1,n2,.......,nk.將所有樣本的數(shù)據(jù)從小到大排列合并成一個(gè)單一的樣本,全部觀察值的總數(shù)位N=n1+n2+....+nk找出每個(gè)觀察值的秩,從1到N,對于N個(gè)觀測值來說Kruskal-Wallis單因素方差分析從每個(gè)總體中抽出一Kruskal-Wallis單因素方差分析Kruskal-Wallis單因素方差分析Kruskal-Wallis單因素方差分析H0:k個(gè)總體分布都同H1:至少有倆個(gè)總體分布不同ni=第i個(gè)總體的樣本量Ri=第i個(gè)樣本實(shí)際秩的總和拒絕域:Kruskal-Wallis單因素方差分析H0:k個(gè)總體分布Friedman秩方差分析
Friedman秩方差分析隨機(jī)化區(qū)組設(shè)計(jì)的Friedman秩方差分析
原假設(shè)與備擇假設(shè)12構(gòu)造統(tǒng)計(jì)量3拒絕域4檢驗(yàn)的假設(shè)隨機(jī)化區(qū)組設(shè)計(jì)的Friedman秩方差分析原假設(shè)與備擇假設(shè)原假設(shè)和備擇假設(shè)原假設(shè):H0:K種處理的概率分布是相同的備擇假設(shè):Ha:至少兩個(gè)分布的位置不同原假設(shè)和備擇假設(shè)原假設(shè):構(gòu)造統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量:Fr=b:區(qū)組的個(gè)數(shù)k:處理的個(gè)數(shù)Ri:第i個(gè)處理的秩的和,其中每個(gè)處理的秩的計(jì)算和它所在的區(qū)組中包含的處理的個(gè)數(shù)相關(guān)構(gòu)造統(tǒng)計(jì)量檢驗(yàn)統(tǒng)計(jì)量:拒絕域拒絕域:Fr>其中卡方分布自由度為(k-1)拒
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人員薪酬體系制度
- 中國科學(xué)院采購制度
- 二維碼識別技術(shù)
- 精神病患者監(jiān)護(hù)培訓(xùn)課件
- 2025-2030中國節(jié)能環(huán)??照{(diào)行業(yè)銷售規(guī)模與營銷前景評估研究報(bào)告
- 2025-2030中國半鎮(zhèn)靜鋼市場供需形勢及營銷發(fā)展趨勢研究報(bào)告
- 2025-2030中國加濕器市場銷售戰(zhàn)略研究及產(chǎn)銷需求洞察研究報(bào)告
- 周口實(shí)驗(yàn)高級中學(xué)(鄲城一高周口校區(qū))2026年招聘公費(fèi)師范生備考題庫完整參考答案詳解
- 2026年武漢市第六醫(yī)院招聘護(hù)士若干(招滿即止)備考題庫及1套完整答案詳解
- 威遠(yuǎn)縣緊密型縣域醫(yī)共體管理委員會(huì)2025年下半年公開招聘成員單位編外人員的備考題庫及一套參考答案詳解
- 高凈值客戶資產(chǎn)配置方案
- 鐵凝《沒有紐扣的紅襯衫》閱讀答案
- 公路工地試驗(yàn)室安全培訓(xùn)課件
- 2025年南京市事業(yè)單位教師招聘考試體育學(xué)科專業(yè)知識試卷(夏季卷)
- 人教版八年級英語上冊期末復(fù)習(xí):完形填空15篇(含答案)
- 建筑消防設(shè)施介紹
- 圖書館志愿者培訓(xùn)課件
- 2025年特種設(shè)備作業(yè)人員考試壓力管道安全操作試題
- 足細(xì)胞損傷與糖尿病腎病病理機(jī)制研究
- 2026年高考政治一輪復(fù)習(xí):選擇性必修3《邏輯與思維》知識點(diǎn)復(fù)習(xí)提綱
- 結(jié)腸癌和直腸癌中西醫(yī)結(jié)合診療指南
評論
0/150
提交評論