版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
第十一章非參數(shù)檢驗(yàn)
在社會(huì)研究中我們經(jīng)常要采用定序尺度,但直到現(xiàn)在,我們都還沒(méi)有機(jī)會(huì)討論涉及到定序尺度的顯著性檢驗(yàn)。本章要講述某些用于定序尺度的雙樣本檢驗(yàn)。與以前所講的檢驗(yàn)不同,使用這類方法不需要對(duì)總體分布作任何事先的假定(例如正態(tài)總體)。同時(shí)從檢驗(yàn)的內(nèi)容來(lái)說(shuō),也不是檢驗(yàn)總體分布的某些參數(shù)(例如均值、成數(shù)、方差等),而是檢驗(yàn)總體某些有關(guān)的性質(zhì),所以稱為非參數(shù)檢驗(yàn)。非參數(shù)檢驗(yàn),泛指“對(duì)分布類型已知的總體進(jìn)行參數(shù)檢驗(yàn)”之外的所有檢驗(yàn)方法。
2/6/20231與均值差等檢驗(yàn)比較,非參數(shù)檢驗(yàn)有什么優(yōu)點(diǎn)呢?在對(duì)均值差進(jìn)行t檢驗(yàn)時(shí),不僅要有定距尺度的假定,還要有正態(tài)總體的假定。當(dāng)然,對(duì)于大樣本,正態(tài)總體的假定可以放松。但正是對(duì)于小樣本,這種假定最容易出問(wèn)題。因此,在滿足下面兩條件之一時(shí),我們期望用非參數(shù)檢驗(yàn)代替均值差檢驗(yàn):①?zèng)]有根據(jù)采用定距尺度,但可以安排數(shù)據(jù)的順序(即秩);②樣本小且不能假定具有正態(tài)分布。由于非參數(shù)檢驗(yàn)不能充分利用全部現(xiàn)有的資料信息。因此,如果有根據(jù)采用定距尺度,并且如果對(duì)于小樣本能夠假定其具有正態(tài)性,或?qū)Υ髽颖灸軌蚍潘蓪?duì)正態(tài)性假定的要求,一般寧愿使用均值差檢驗(yàn),而不用非參數(shù)檢驗(yàn)。
2/6/20232非參數(shù)檢驗(yàn),無(wú)需做出經(jīng)典統(tǒng)計(jì)所必要的關(guān)于分布的任何假設(shè)。唯一需要的假設(shè)是:全部數(shù)據(jù)或數(shù)據(jù)對(duì)都出自相同的基本總體,且取樣是隨機(jī)的、相互獨(dú)立的?;谶@種原因,非參數(shù)檢驗(yàn)又稱為分布自由(或無(wú)分布)檢驗(yàn)?!盁o(wú)分布”不是指總體真的無(wú)分布,而是指雖有時(shí)對(duì)總體分布一無(wú)所知,但仍可以進(jìn)行分析。不僅如此,這些很容易理解的方法還可以用于處理等級(jí)的資料和定性的信息。
2/6/20233很顯然,如果把從一個(gè)正態(tài)總體中抽取的數(shù)據(jù)用分布自由來(lái)處理,其效果肯定不如相應(yīng)的參數(shù)檢驗(yàn)有力。我們一般用下述指標(biāo)來(lái)確定非參數(shù)檢驗(yàn)的“效率”。式中的n
0和n分別是兩種檢驗(yàn)保證實(shí)現(xiàn)給定的檢驗(yàn)力所需的樣本容量。如果說(shuō)某種非參數(shù)檢驗(yàn)的檢驗(yàn)效率為95%,就意味著這種非參數(shù)檢驗(yàn)在使用100個(gè)數(shù)據(jù)時(shí)的效力等于t檢驗(yàn)(在正確模型條件下)使用95個(gè)數(shù)據(jù)的效力。
檢驗(yàn)力又稱檢驗(yàn)勢(shì),它是用1―β或[1―(犯第二類錯(cuò)誤的概率)]來(lái)定義的。也就是說(shuō),對(duì)于固定的樣本容量,檢驗(yàn)?zāi)軌蚍穸ㄥe(cuò)誤假設(shè)的能力越大,其相對(duì)檢驗(yàn)力越大。2/6/20234“符號(hào)檢驗(yàn)”是針對(duì)觀察結(jié)果之差的符號(hào)來(lái)作估價(jià)的。在單一實(shí)驗(yàn)組的實(shí)驗(yàn)中,對(duì)于樣本中每個(gè)個(gè)體的前測(cè)與后測(cè),如果我們并不關(guān)心(X1―X0)的具體數(shù)值,而只關(guān)心是增大了還是減小了。具體來(lái)說(shuō),就是只研究差值d的符號(hào),即若X1>X0,記作“+”;若X1<X0,記作“―”;若X1=X0,刪去。那么我們面對(duì)的就將是配對(duì)樣本的“符號(hào)檢驗(yàn)”問(wèn)題了。“符號(hào)檢驗(yàn)”并不要求配對(duì)樣本出自同一個(gè)總體,重要的是各個(gè)對(duì)的結(jié)果要相互獨(dú)立。
第一節(jié)符號(hào)檢驗(yàn)
2/6/20235符號(hào)檢驗(yàn)的零假設(shè)就是配對(duì)觀察結(jié)果的差平均起來(lái)等于零:人們期望這些差中有一半小于零(負(fù)號(hào)),而另一半大于零(正號(hào)),因此符號(hào)檢驗(yàn)就是對(duì)差分布之中位數(shù)為零的零假設(shè)檢驗(yàn)。現(xiàn)將符號(hào)檢驗(yàn)的零假設(shè)和備擇假設(shè)表達(dá)如下H0:p(+)=p(―)=0.5H1:?jiǎn)蝹?cè)檢驗(yàn)p(+)>p(―)或p(+)<p(―)雙側(cè)檢驗(yàn)p(+)≠p(―)很顯然,符號(hào)檢驗(yàn)就是先假設(shè)p=0.5,按二項(xiàng)分布計(jì)算正號(hào)“+”出現(xiàn)次數(shù)之抽樣分布,然后以樣本中正號(hào)“+”出現(xiàn)的次數(shù)x作為檢驗(yàn)統(tǒng)計(jì)量。如果它是B(x;n,0.5)下的小概率事件,便否定對(duì)差分布之中位數(shù)為零的零假設(shè),即認(rèn)為兩總體存在平均水平上的差別。由此可見(jiàn),符號(hào)檢驗(yàn)是二項(xiàng)檢驗(yàn)的一種實(shí)際應(yīng)用。
2/6/20236[例]假設(shè)我們觀測(cè)15個(gè)相配的對(duì),獲得兩個(gè)差為零和13個(gè)差不為零,其中有11個(gè)正號(hào),2個(gè)負(fù)號(hào),試在2.5%的顯著性水平上進(jìn)行單側(cè)檢驗(yàn)。[解]H0:p=0.5
H1:p(+)>p(―)由α=0.025確定否定域,查二項(xiàng)分布表(附表2)
P(13;13,0.5)=0.000P(12;13,0.5)=0.002P(11;13,0.5)=0.010P(10;13,0.5)=0.035
P(13)+P(12)+P(11)=0.000+0.002+0.010=0.012<0.025
P(13)+P(12)+P(11)+P(10)=0.012+0.035=0.047>0.025所以否定域由x等于11,12,13組成。現(xiàn)檢驗(yàn)統(tǒng)計(jì)量x=11,所以零假設(shè)p=0.5在2.5%顯著性水平上被拒絕。
2/6/20237[例]隨機(jī)地選擇13個(gè)單位,放映一部描述吸煙有害于身體健康的影片,下表中的數(shù)字是各單位認(rèn)為吸煙有害身體健康的職工的百分比,現(xiàn)試在0.05顯著性水平上,用符號(hào)檢驗(yàn)檢驗(yàn)實(shí)驗(yàn)無(wú)效的零假設(shè)。2/6/20238[解]H0:p=0.5
H1:p(+)>p(―)由上例知,B(x;13,0.5)在α=0.025顯著性水平上,單側(cè)檢驗(yàn)(p>0.5)否定域由x由11,12,13組成。觀察前表知,在13個(gè)相配的對(duì)中,10個(gè)差為正號(hào),3個(gè)差為負(fù)號(hào),即檢驗(yàn)統(tǒng)計(jì)量x=10。所以零假設(shè)p=0.5在2.5%顯著性水平上不能被拒絕。2/6/20239
對(duì)比[例10.3.1]和[例11.1.2]可見(jiàn),由于符號(hào)檢驗(yàn)只計(jì)及差值d的符號(hào),而沒(méi)有計(jì)及差值d的大小,所以有時(shí)用t檢驗(yàn)可以作出拒絕零假設(shè)的判定,如改用符號(hào)檢驗(yàn)卻往往不能作出這樣的判定。因此說(shuō),符號(hào)檢驗(yàn)效力較低。根據(jù)計(jì)算,就滿足正態(tài)分布而言,符號(hào)檢驗(yàn)法的效率是配對(duì)樣本t檢驗(yàn)的63%。即如果符號(hào)檢驗(yàn)法需要樣本容量為100的話,那么t檢驗(yàn)法只需n=63就可作出相同的檢驗(yàn)。但符號(hào)檢驗(yàn)運(yùn)用于定類尺度,對(duì)總體分布又無(wú)需加以限制,所以就配對(duì)樣本的顯著性檢驗(yàn)而言,其適應(yīng)面是相當(dāng)廣的。像符號(hào)檢驗(yàn)這樣的非參數(shù)值驗(yàn),在分布自由檢驗(yàn)中稱為簡(jiǎn)便檢驗(yàn)(或快速檢驗(yàn))。
2/6/202310對(duì)于配對(duì)樣本,至此我們已經(jīng)接觸了兩種檢驗(yàn),即符號(hào)檢驗(yàn)和t檢驗(yàn)。在符號(hào)檢驗(yàn)中,只考慮差值d的符號(hào)而不管其大小,并且應(yīng)用二項(xiàng)分布檢驗(yàn)零假設(shè)。另一方面,最有力的檢驗(yàn)——t檢驗(yàn),則不僅需要定距尺度,而且還要求假定差值d服從正態(tài)分布。配對(duì)符號(hào)秩檢驗(yàn)兼?zhèn)淞松鲜鰞煞N檢驗(yàn)的某些特征,其效力也介乎兩者之間。第二節(jié)配對(duì)符號(hào)秩檢驗(yàn)
2/6/202311配對(duì)符號(hào)秩檢驗(yàn)對(duì)于非正態(tài)分布的d值,是最佳檢驗(yàn),其檢驗(yàn)效力大大高于符號(hào)檢驗(yàn)。如果t檢驗(yàn)的假定成立,配對(duì)符號(hào)秩檢驗(yàn)的檢驗(yàn)效力對(duì)于大、小樣本都近乎為95%。因此,在定距尺度測(cè)量的水平上,若由于樣本容量太小而不能假定正態(tài)分布的時(shí)候,配對(duì)符號(hào)秩檢驗(yàn)特別有用。2/6/202312
配對(duì)符號(hào)秩檢驗(yàn)的零假設(shè)基本上和符號(hào)檢驗(yàn)以及用于配對(duì)樣本的t檢驗(yàn)的零假設(shè)相同。配對(duì)符號(hào)秩檢驗(yàn)的步驟如下:(1)首先求出每對(duì)數(shù)據(jù)的差值d。(2)不計(jì)正負(fù),按絕對(duì)值大小把差值d按順序排列起來(lái)。(3)絕對(duì)值最小者賦秩為l,第二小者賦秩為2,……,絕對(duì)值最大者賦秩為n(其中絕對(duì)值相等者,將它們應(yīng)得的秩均分之),再在差值前補(bǔ)填上符號(hào)。(4)求得正差值的秩和T+及負(fù)差值的秩和T-。我們期望兩個(gè)秩和應(yīng)該近似相等。如果T+和T-相差太大,就應(yīng)該否定零假設(shè)。2/6/202313
(5)取兩個(gè)秩和中較小的一個(gè),即T=min(T+,|T-|),作為檢驗(yàn)統(tǒng)計(jì)量。(6)給定顯著性水平α。如果n小,從配對(duì)符號(hào)秩檢驗(yàn)表(附表9)中直接查出臨界值Tα(n)。如果n大(n>25),就要應(yīng)用正態(tài)近似法,查出Zα(單側(cè)檢驗(yàn))或Zα/2(雙側(cè)檢驗(yàn)),同時(shí)檢驗(yàn)統(tǒng)計(jì)量Z按下式計(jì)算(7)若T≤Tα(n),就拒絕零假設(shè),同時(shí)認(rèn)為總體間有顯著性差異。2/6/202314[例]隨機(jī)地選擇13個(gè)單位,放映一部描述吸煙有害于身體健康的影片,下表中的數(shù)字是各單位認(rèn)為吸煙有害身體健康的職工的百分比,現(xiàn)試在0.05顯著性水平上,用配對(duì)符號(hào)秩檢驗(yàn)檢驗(yàn)檢驗(yàn)實(shí)驗(yàn)無(wú)效的零假設(shè)。2/6/202315[解]H0:T+=|T-|,即在總體中,正秩和等于負(fù)秩和。H1:T+>|T-|。前表給出了有關(guān)資料,由此又列出了配對(duì)符號(hào)秩檢驗(yàn)所需要的數(shù)據(jù)。根據(jù)表中數(shù)據(jù),可以看出負(fù)秩和小于正秩和。因此檢驗(yàn)統(tǒng)計(jì)量T取負(fù)秩和。
T=|T-|=1.5+4+8=13.5由α=0.025,n=13,查表得單側(cè)檢驗(yàn)的T0.025(13)=l7>13.5,所以否定T+=|T-|的零假設(shè),即說(shuō)明該實(shí)驗(yàn)刺激有效。2/6/202316將[例11.2.1]與[例l0.3.1]和[例11.1.2]對(duì)比,可見(jiàn)配對(duì)符號(hào)秩檢驗(yàn)的效力比符號(hào)檢驗(yàn)的效力高得多,而很接近于t檢驗(yàn)的效力。理論研究表明,對(duì)于配對(duì)樣本非正態(tài)分布的差值d,配對(duì)符號(hào)秩檢驗(yàn)是最佳檢驗(yàn)。雖然本例中n很小,但是為了說(shuō)明用法,我們?nèi)匀皇褂谜龖B(tài)近似法計(jì)算一下檢驗(yàn)統(tǒng)計(jì)量在單側(cè)檢驗(yàn)中,Zα=Z0.025=1.96<2.24,我們可以否定零假設(shè)。但必須指出,正態(tài)近似計(jì)算法沒(méi)有把同數(shù)值(或同分對(duì))的情況考慮在內(nèi)而作出修正。因此,它在同數(shù)值的數(shù)目很大時(shí)不能使用。2/6/202317前面我們剛剛討論過(guò)的符號(hào)檢驗(yàn)和配對(duì)符號(hào)秩檢驗(yàn),都只適用于配對(duì)樣本。當(dāng)樣本為獨(dú)立樣本時(shí),可采用本節(jié)所討論的秩和檢驗(yàn)法。其具體步驟為:
(1)設(shè)從兩個(gè)未知的總體1和總體2中分別獨(dú)立、隨機(jī)地各抽取一個(gè)樣本,樣本1的容量為n1,樣本2的容量為n2,兩樣本的數(shù)據(jù)分別列示如下:樣本1:X1,X2,…,Xn1樣本2:Y1,Y2,…,Y
n2(2)把樣本1和樣本2混合起來(lái),并按數(shù)值從小到大順序編號(hào),每個(gè)數(shù)據(jù)的編號(hào)即為它的秩。如果混合樣本中有相同數(shù)值的數(shù)據(jù),則將它們應(yīng)得的秩均分。
第三節(jié)秩和檢驗(yàn)2/6/202318(3)分別計(jì)算兩樣本的秩和:樣本l中所有X1,X2,…,Xn1的秩和記作R1;樣本2中所有Y1,Y2,…,Y
n2的秩和記作R2。(4)秩和檢驗(yàn)是針對(duì)兩個(gè)總體具有完全相同的形式的零假設(shè)而進(jìn)行檢驗(yàn)的。在均值差檢驗(yàn)中,研究的重點(diǎn)放在中心趨勢(shì)的差異上,而不是離差的差異或形式的差異。秩和檢驗(yàn)的零假設(shè)則可以用任何差異形式表示出來(lái)。(5)計(jì)算檢驗(yàn)統(tǒng)計(jì)量U。檢驗(yàn)統(tǒng)計(jì)量U是對(duì)混合樣本中n1+n2個(gè)元素根據(jù)它們的秩和和它們所屬的總體標(biāo)出的雙重指標(biāo)
2/6/202319檢驗(yàn)統(tǒng)計(jì)量U是U1和U2中較小的一個(gè),即U=min(U1,U2),然后用下式核對(duì)計(jì)算
U1+U2=n1
n2
(6)給出顯著性水平α,從秩和檢驗(yàn)表(附表10)中查出臨界值Uα,如果計(jì)算出的U值小于或等于從附表10中查出的臨界值Uα(n1
,n2),則零假設(shè)被拒絕。
2/6/202320[例]設(shè)評(píng)審專家對(duì)19所大專院校按校園環(huán)境質(zhì)量排名次,環(huán)境質(zhì)量最好的學(xué)校記分?jǐn)?shù)為1,環(huán)境質(zhì)量最差的學(xué)技記分?jǐn)?shù)為19。其中10所學(xué)校是本科院校,其他9所學(xué)校是??圃盒?。假定這19所學(xué)校是分別從全部大專院校中隨機(jī)地抽取的,試問(wèn):??祁愒盒:捅究祁愒盒5沫h(huán)境質(zhì)量是否有顯著性差異(α=0.05)?本科院校環(huán)境質(zhì)量的名次(秩)為:1,2,4,5,6,7,9,11,14,17(n1=10)??圃盒-h(huán)境質(zhì)量的名次(秩)為:3,8,10,12,13.15.16,18,19(n2=9)
2/6/202321[解]H0:??祁愒盒:捅究祁愒盒5沫h(huán)境質(zhì)量無(wú)差異
H1:專科類院校和本科類院校的環(huán)境質(zhì)量有差異根據(jù)題意R1=l+2+4+5+6+7+9+11+14+17=76R2=3+8+10+12+13+15+16+18+19=114代入下兩式得
所以檢驗(yàn)統(tǒng)計(jì)量U=min(U1,U2)=U2=2l由α=0.05查附表10得
Uα(n1,n2)=U0.05(10,9)=20<2l所以不否定零假設(shè),說(shuō)明在0.05的水平上,不能認(rèn)為??祁愒盒:捅究祁愒盒5沫h(huán)境質(zhì)量有顯著性差異。
2/6/202322
秩和檢驗(yàn)本來(lái)可直接用R1和R2,不必求U。但由于對(duì)于n小的U,其值可以準(zhǔn)確地從數(shù)表中查出,所以在秩和檢驗(yàn)中一般使用統(tǒng)計(jì)量U比較方便。秩和檢驗(yàn)因而也有了U檢驗(yàn)之稱。如果n較大,U的抽樣分布接近正態(tài)分布N(μ,σ2),可以利用正態(tài)分布作近似檢驗(yàn),其均值、標(biāo)準(zhǔn)差和標(biāo)準(zhǔn)正態(tài)變量分別是
2/6/202323游程檢驗(yàn)是適用于獨(dú)立樣本的另一種檢驗(yàn)法。游程檢驗(yàn)的基本原理和計(jì)算方法很簡(jiǎn)單:先把兩個(gè)樣本混合起來(lái),按大小排列,并賦予其秩。那么,當(dāng)樣本所屬的總體是同分布的話,是不大可能出現(xiàn)來(lái)自總體1的樣本全是高秩、而來(lái)自總體2的樣本全是低秩的情況;反之亦然??赡苄宰疃嗟那闆r是,來(lái)自總體1和總體2的樣本,其秩是隨機(jī)交錯(cuò)的。因此,根據(jù)混合樣本中兩樣本交錯(cuò)的次數(shù)來(lái)檢定秩交錯(cuò)次數(shù)是隨機(jī)的零假設(shè),這就是游程檢驗(yàn)。其具體步驟如下:
第四節(jié)游程檢驗(yàn)2/6/202324
(1)設(shè)從兩個(gè)未知的總體1和總體2中分別獨(dú)立、隨機(jī)地各抽取1個(gè)樣本,樣本1的容量為n1,樣本2的容量為n2。(2)把樣本1和樣本2混合起來(lái),并按數(shù)值從小到大順序編號(hào),每個(gè)數(shù)據(jù)的編號(hào)就是它的秩。(3)點(diǎn)算游程數(shù)目。一個(gè)游程指混合樣本中接連屬于一個(gè)樣本的一串秩,其前后是另一個(gè)樣本的秩。例如,A和B分別代表混合樣本中來(lái)自第一個(gè)樣本的秩和來(lái)自第二個(gè)樣本的秩,這樣一來(lái),混合樣本被賦予秩的數(shù)據(jù)序列便呈以下形式
ABBABAAABABBABBAAABAAB在此例中,第一個(gè)游程由一個(gè)A組成,第二個(gè)游程由兩個(gè)B組成,然后又是一個(gè)A組成的游程……,游程的總數(shù)為14。
2/6/202325(4)根據(jù)顯著性水平α確定否定域(n1,n2)。游程數(shù)目r的抽樣分布(見(jiàn)附表11)可用于建立否定零假設(shè)的否定域。(5)檢定零假設(shè)。以混合樣本中的游程數(shù)目為檢驗(yàn)統(tǒng)計(jì)量:如果游程的數(shù)目很大,就表明兩個(gè)樣本混合得很好,不能否定零假設(shè);相反,如果游程的數(shù)目較小,零假設(shè)就很可能是錯(cuò)的,應(yīng)該否定。
2/6/202326[例]設(shè)評(píng)審專家對(duì)19所大專院校按校園環(huán)境質(zhì)量排名次,環(huán)境質(zhì)量最好的學(xué)校記分?jǐn)?shù)為1,環(huán)境質(zhì)量最差的學(xué)技記分?jǐn)?shù)為19。其中10所學(xué)校是本科院校,其他9所學(xué)校是??圃盒!<俣ㄟ@19所學(xué)校是分別從全部大專院校中隨機(jī)地抽取的,試問(wèn):??祁愒盒:捅究祁愒盒5沫h(huán)境質(zhì)量是否有顯著性差異(α=0.05)?(請(qǐng)作游程檢驗(yàn))本科院校環(huán)境質(zhì)量的名次(秩)為:1,2,4,5,6,7,9,11,14,17(n1=10)。??圃盒-h(huán)境質(zhì)量的名次(秩)為:3,8,10,12,13.15.16,18,19(n2=9)。
2/6/202327[解]將大專院校按校園環(huán)境質(zhì)量的優(yōu)劣順序混合排列,然后在第一個(gè)樣本的游程下畫(huà)上橫線,屬于第二個(gè)樣本的游程下則不畫(huà)橫線:
12345678910111213141516171819得檢驗(yàn)統(tǒng)計(jì)量r=12由α=0.05,查表得臨界值
rα(n1,n2)=(10,9)=6<l2所以不否定零假設(shè),說(shuō)明在0.05的水平上,不能說(shuō)專科類院校和本科類院校的校園環(huán)境質(zhì)量有顯著性差異。
對(duì)于同一道例題,對(duì)照此解和上解,我們看到秩和檢驗(yàn)和游程檢驗(yàn)做出了相同的判斷。但應(yīng)用前者,更接近于否定零假設(shè)。所以,如果零假設(shè)實(shí)際上是錯(cuò)誤的,應(yīng)用秩和檢驗(yàn)比應(yīng)用游程檢驗(yàn)犯第二類錯(cuò)誤的可能性小。2/6/202328當(dāng)n1和n2都小于20時(shí),游程數(shù)目r的準(zhǔn)確抽樣分布可以從附表11中查找。當(dāng)n1和n2都大于20時(shí),r的抽樣分布近似于正態(tài)分布N(μ,σ2),其均值、標(biāo)準(zhǔn)差及標(biāo)準(zhǔn)正態(tài)變量分別是
2/6/202329第五節(jié)累計(jì)頻數(shù)檢驗(yàn)
累計(jì)頻數(shù)檢驗(yàn)是另一種雙樣本的非參數(shù)檢驗(yàn),它所需要的假定同秩和檢驗(yàn)和游程檢驗(yàn)一樣。以上各種非參數(shù)檢驗(yàn),對(duì)于定序變量,都要求等級(jí)分得較多較細(xì),實(shí)際上用的是未分組資料。但在社會(huì)研究中,對(duì)定序變量往往也用分組資料。例如一位研究者可以將一個(gè)城市社區(qū)的居民按文化程度分成六組,從中獨(dú)立、隨機(jī)地抽取兩個(gè)樣本。樣本l是喜愛(ài)圍棋者,容量為n1;樣本2是不喜愛(ài)圍棋者,容量為n2。將n1和n2分配到以文化程度為秩尺度的六個(gè)組中,這樣我們就得到了兩個(gè)樣本的分組資料〔參見(jiàn)后表〕。在樣本容量較大而等級(jí)劃分又很有限的情況下,累計(jì)頻數(shù)檢驗(yàn)就顯得十分有用了。2/6/2023302/6/202331
累計(jì)頻數(shù)檢驗(yàn)的原理很簡(jiǎn)單:如果獨(dú)立隨機(jī)樣本取自兩個(gè)形式完全相同的總體的零假設(shè)正確,即可期望兩個(gè)樣本累計(jì)相對(duì)頻數(shù)分布基本上相似。累計(jì)頻數(shù)檢驗(yàn)使用的檢驗(yàn)統(tǒng)計(jì)量是由兩個(gè)累計(jì)頻數(shù)分布構(gòu)成的一系列差值之最大值D,即
如果D大于零假設(shè)前提下偶然性作用的期望值,就表明兩個(gè)分布相差太大,以致應(yīng)否定零假設(shè)。累計(jì)頻數(shù)檢驗(yàn)的步驟如下:
2/6/202332
(1)設(shè)從兩個(gè)未知的總體1和總體2中,分別獨(dú)立、隨機(jī)地抽取兩個(gè)樣本,樣本容量分別為n1和n2。(2)將兩個(gè)樣本分別按同一秩尺度分組,得到如前表所示的兩個(gè)頻數(shù)分配數(shù)列。(3)根據(jù)兩個(gè)樣本的頻數(shù)分布,做出兩個(gè)樣本的累計(jì)頻率分布。(4)根據(jù)兩個(gè)樣本的累計(jì)頻率分布,算出差值的一系列數(shù)值,找出最大差,即為檢驗(yàn)統(tǒng)計(jì)量D。(5)抽樣分布是零假設(shè)下隨機(jī)變量D的各個(gè)取值的概率分布。當(dāng)n1=n2,且n值較小(≤40)時(shí),可以給出D抽樣分布的準(zhǔn)確形式。但我們不討論這種情況。因?yàn)樵趎很小時(shí),可以不用累計(jì)頻數(shù)檢驗(yàn),而用秩和檢驗(yàn);而且在大多數(shù)社會(huì)研究中,兩個(gè)樣本容量正好相等的情況極少。如果兩樣本的容量都大于40,則分兩種情況加以討論:
2/6/202333
如果沒(méi)有預(yù)測(cè)方向,臨界值D可以由下式近似求得
其中:kα是由下表給出的依賴于顯著性水平α的常數(shù)。
如果已經(jīng)預(yù)測(cè)方向,檢驗(yàn)統(tǒng)計(jì)量應(yīng)改用卡方近似法求得,即注意:在累計(jì)頻數(shù)檢驗(yàn)中,卡方的自由度總為2。
(6)判定。如果檢驗(yàn)統(tǒng)計(jì)量落在否定域內(nèi),就否定零假設(shè);如果檢驗(yàn)統(tǒng)計(jì)量落在否定域外,則不否定零假設(shè)。
2/6/202334
[例]對(duì)表11.3所示資料作累計(jì)頻數(shù)檢驗(yàn),顯著性水平選為0.0l,分別作雙側(cè)檢驗(yàn)和單側(cè)檢驗(yàn)。[解]①雙側(cè)檢驗(yàn)
H0:對(duì)圍棋的喜好與文化程度的高低無(wú)關(guān)
H1:對(duì)圍棋的喜好與文化程度的高低有關(guān)檢驗(yàn)統(tǒng)計(jì)量的計(jì)算過(guò)程參見(jiàn)后表。
2/6/2023352/6/202336由于α=0.01,查表11.4,代人下式得臨界值
<0.257
所以拒絕零假設(shè),
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 護(hù)士培訓(xùn)考試題庫(kù)含答案
- 計(jì)劃調(diào)度員職位專業(yè)書(shū)籍及學(xué)習(xí)答案
- 會(huì)計(jì)面試題及財(cái)務(wù)實(shí)操能力考察
- 2025年便捷物流配送服務(wù)項(xiàng)目可行性研究報(bào)告
- 2025年現(xiàn)代化養(yǎng)殖技術(shù)研發(fā)項(xiàng)目可行性研究報(bào)告
- 2025年線上線下零售融合發(fā)展項(xiàng)目可行性研究報(bào)告
- 2025年車聯(lián)網(wǎng)及智能交通系統(tǒng)集成項(xiàng)目可行性研究報(bào)告
- 2026年閩西職業(yè)技術(shù)學(xué)院?jiǎn)握新殬I(yè)傾向性考試題庫(kù)及參考答案詳解一套
- 2026年湖北省宜昌市單招職業(yè)適應(yīng)性測(cè)試題庫(kù)及答案詳解1套
- 2026年安徽醫(yī)學(xué)高等??茖W(xué)校單招職業(yè)傾向性考試題庫(kù)及答案詳解1套
- 基建工程索賠管理人員索賠證據(jù)收集與審核指南
- AI智能生產(chǎn)平臺(tái)-AI+質(zhì)量管理
- 農(nóng)村山塘維修合同
- 量子點(diǎn)材料的發(fā)光性能研究與應(yīng)用
- 2025廣東廣州市衛(wèi)生健康委員會(huì)直屬事業(yè)單位廣州市紅十字會(huì)醫(yī)院招聘47人(第一次)筆試考試參考題庫(kù)及答案解析
- 中國(guó)外運(yùn)招聘筆試題庫(kù)2025
- 建筑物拆除施工溝通協(xié)調(diào)方案
- 2025食品行業(yè)專利布局分析及技術(shù)壁壘構(gòu)建與創(chuàng)新保護(hù)策略報(bào)告
- 2025四川省教育考試院招聘編外聘用人員15人考試筆試模擬試題及答案解析
- 特許經(jīng)營(yíng)教學(xué)設(shè)計(jì)教案
- 2025年智能消防安全系統(tǒng)開(kāi)發(fā)可行性研究報(bào)告
評(píng)論
0/150
提交評(píng)論