浙江工商大學(xué)統(tǒng)計(jì)學(xué)課件-11非參數(shù)統(tǒng)計(jì)方法.ppt_第1頁(yè)
浙江工商大學(xué)統(tǒng)計(jì)學(xué)課件-11非參數(shù)統(tǒng)計(jì)方法.ppt_第2頁(yè)
浙江工商大學(xué)統(tǒng)計(jì)學(xué)課件-11非參數(shù)統(tǒng)計(jì)方法.ppt_第3頁(yè)
浙江工商大學(xué)統(tǒng)計(jì)學(xué)課件-11非參數(shù)統(tǒng)計(jì)方法.ppt_第4頁(yè)
浙江工商大學(xué)統(tǒng)計(jì)學(xué)課件-11非參數(shù)統(tǒng)計(jì)方法.ppt_第5頁(yè)
免費(fèi)預(yù)覽已結(jié)束,剩余71頁(yè)可下載查看

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第十一章 非參數(shù)統(tǒng)計(jì)方法,第一節(jié) 非參數(shù)統(tǒng)計(jì)的一般問(wèn)題 第二節(jié) 單樣本非參數(shù)統(tǒng)計(jì)檢驗(yàn)方法 第三節(jié) 兩個(gè)相關(guān)樣本的非參數(shù)統(tǒng)計(jì)方法 第四節(jié) 兩個(gè)獨(dú)立樣本的非參數(shù)統(tǒng)計(jì)方法 第五節(jié) 多個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)方法* 第六節(jié) 多個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)方法*,學(xué)習(xí)要求,了解非參數(shù)統(tǒng)計(jì)的含義與內(nèi)容 掌握單樣本、雙樣本情形之下的非參數(shù)檢驗(yàn)理論 了解多個(gè)樣本情形之下的非參數(shù)統(tǒng)計(jì)檢驗(yàn)思路 重點(diǎn)掌握每一種非參數(shù)統(tǒng)計(jì)檢驗(yàn)方法對(duì)數(shù)據(jù)類型的要求及操作原理,第一節(jié) 非參數(shù)統(tǒng)計(jì)的一般問(wèn)題,在統(tǒng)計(jì)學(xué)中,如果總體的精確率分布形式已知,而只是其中的某些參數(shù)未知時(shí),通常是從總體中隨機(jī)取樣本,根據(jù)樣本信息對(duì)總體參數(shù)進(jìn)行估計(jì)或假設(shè)檢驗(yàn),這

2、就是一般所說(shuō)的參數(shù)統(tǒng)計(jì)方法。 但在許多實(shí)際問(wèn)題中,我們對(duì)總體分布的具體形式是未知或知之甚少的,只知道總體為連續(xù)分布還是離散分布,也不能對(duì)總體的分布形式作進(jìn)一步的假定(如假定總體為近似正態(tài)分布等),這時(shí)要對(duì)總體的某些性質(zhì)進(jìn)行統(tǒng)計(jì)估計(jì)或假設(shè)檢驗(yàn),就要采用非參數(shù)統(tǒng)計(jì)方法。,非參數(shù)統(tǒng)計(jì)的歷史,非參數(shù)統(tǒng)計(jì)的形成主要?dú)w功于20世紀(jì)40年代50年代化學(xué)家F.Wilcoxon等人的工作。Wilcoxon于1945年提出兩樣本秩和檢驗(yàn),1947年Mann和Whitney二人將結(jié)果推廣到兩組樣本量不等的一般情況; Pitman于1948年回答了非參數(shù)統(tǒng)計(jì)方法相對(duì)于參數(shù)方法來(lái)說(shuō)的相對(duì)效率方面的問(wèn)題;,60年代中后期

3、,Cox和Ferguson最早將非參數(shù)方法應(yīng)用于生存分析。 70年代到80年代,非參數(shù)統(tǒng)計(jì)借助計(jì)算機(jī)技術(shù)和大量計(jì)算獲得更穩(wěn)健的估計(jì)和預(yù)測(cè),以P.J.Huber以及 F.Hampel為代表的統(tǒng)計(jì)學(xué)家從計(jì)算技術(shù)的實(shí)現(xiàn)角度,為衡量估計(jì)量的穩(wěn)定性提出了新準(zhǔn)則。 90年代有關(guān)非參數(shù)統(tǒng)計(jì)的研究和應(yīng)用主要集中在非參數(shù)回歸和非參數(shù)密度估計(jì)領(lǐng)域,其中較有代表性的人物是Silverman和J. Fan。,非參數(shù)統(tǒng)計(jì)方法的特點(diǎn),首先,在利用樣本資料對(duì)總體進(jìn)行估計(jì)或檢驗(yàn)時(shí),不必依賴于總體的分布形式。因此,也稱之為“自由分布統(tǒng)計(jì)”。 其次,它與總體分布所具有的參數(shù)無(wú)關(guān),所以通常不必對(duì)總體所特有的參數(shù)(如均值、標(biāo)準(zhǔn)差)進(jìn)

4、行估計(jì)或檢驗(yàn)。 再次,它對(duì)變量的量化要求很低,不論是品質(zhì)標(biāo)志還是數(shù)量標(biāo)志,均可以采用非參數(shù)統(tǒng)計(jì)方法進(jìn)行估計(jì)或檢驗(yàn)。,非參數(shù)統(tǒng)計(jì)的種類,第二節(jié) 單樣本非參數(shù)統(tǒng)計(jì)檢驗(yàn)方法,適應(yīng)性檢驗(yàn) 柯?tīng)柲缏宸驒z驗(yàn) 單樣本游程檢驗(yàn),一、 適應(yīng)性檢驗(yàn),分布在參數(shù)統(tǒng)計(jì)中可用于方差估計(jì)檢驗(yàn),但在非參數(shù)統(tǒng)計(jì)領(lǐng)域,它有更加廣泛的應(yīng)用。在單樣本情況之下,它主要用于檢驗(yàn)客觀現(xiàn)象是否服從于某種理論分布(稱為吻合性或擬合優(yōu)度檢驗(yàn)),或者檢驗(yàn)?zāi)撤N理論分布是否正確(稱一致性檢驗(yàn)或同質(zhì)性檢驗(yàn))。我們將兩者合稱為“適應(yīng)性檢驗(yàn)”。原假設(shè)及備擇假設(shè)為: H0:觀察值的頻數(shù)Oi與期望(理論)頻數(shù)Ei相吻合 Hi:觀察值的頻數(shù)Oi與期望(理論)

5、頻數(shù)Ei不相吻合,擬合優(yōu)度檢驗(yàn)原理以及計(jì)算,觀測(cè)頻數(shù) 和理論頻數(shù) 的差別作為檢驗(yàn)總體分布和理論分布是否一致的標(biāo)準(zhǔn),定義Pearson 統(tǒng)計(jì)量:,例12.1 某企業(yè)開(kāi)發(fā)了一種新型的食品,初步設(shè)想出五種不同的包裝方式(每種包裝方式的含量相同),現(xiàn)欲了解消費(fèi)者對(duì)這些不同包裝方式的偏好是否有差異,經(jīng)過(guò)市場(chǎng)實(shí)驗(yàn),得到如表12-2所示的銷售數(shù)據(jù)。 表12-2 各種包裝方式的飲料銷售量 單位:瓶,H0:對(duì)不同包裝方式的偏好無(wú)差異 H1:對(duì)不同包裝方式的偏好有差異 在H0成立之下,應(yīng)有: E1=E2=E3=E4=E5=1700/5=340 故統(tǒng)計(jì)量值為:,故不拒絕 ,即不能認(rèn)為五種不同包裝方式之間銷售有顯著差

6、異。,二、Kolmogorov-Smirnov正態(tài)性檢驗(yàn),Kolmogorov-Smirnov正態(tài)性檢驗(yàn)根據(jù)樣本經(jīng)驗(yàn)分布和理論分布的比較,檢驗(yàn)樣本是否來(lái)自于該理論分布。假設(shè)檢驗(yàn)問(wèn)題:,假設(shè)樣本的經(jīng)驗(yàn)分布函數(shù)為 ,定義 當(dāng) 時(shí),拒絕零假設(shè)。,例12.3 某茶葉公司的產(chǎn)品灌裝生產(chǎn)線在灌裝過(guò)程中,會(huì)出現(xiàn)重量(份量)的偏差。根據(jù)質(zhì)量要求,一定范圍之內(nèi)的誤差是允許的。質(zhì)量標(biāo)準(zhǔn)是:平均盒重(凈)500g,允許極限誤差(99.73%的可靠性)為12g?,F(xiàn)隨機(jī)抽取1000盒產(chǎn)品進(jìn)行檢驗(yàn),結(jié)果重量資料如表12-3所示(已分組)?,F(xiàn)欲想證明該灌裝生產(chǎn)線所包裝的產(chǎn)品重量是否服從于均值500g,方差為16g的正態(tài)分布

7、。,表12-3 灌裝產(chǎn)品重量的樣本資料,此列原假設(shè)H0為:產(chǎn)品包裝凈重服從均值為500g,標(biāo)準(zhǔn)差為4g的正態(tài)分布。有關(guān)中間過(guò)程列在表12-3中。 因本例理論分布的總體參數(shù)與均已知,故可計(jì)算出每一組上限為止的“理論頻率”。 D統(tǒng)計(jì)量值為: D=max|Sn(x)-Fn(x)|=0.0165 查D分布表。因本例n大大超過(guò)40,我們采用近似的公式計(jì)算臨界值,即: 由于D=0.0165D0.05(1000)=0.04301故不能拒絕H0,即可認(rèn)為該生產(chǎn)線產(chǎn)品的包裝凈重服從正態(tài)分布。,H0:對(duì)不同包裝方式的偏好無(wú)差異 H1:對(duì)不同包裝方式的偏好有差異 在H0成立之下,應(yīng)有: E1=E2=E3=E4=E5

8、=1700/5=340 故統(tǒng)計(jì)量值為:,故不拒絕 ,即不能認(rèn)為五種不同包裝方式之間銷售有顯著差異。,三、單樣本隨機(jī)游程檢驗(yàn),隨機(jī)性是抽樣調(diào)查方案設(shè)計(jì)中的一條重要原則。但在現(xiàn)實(shí)生活中,我們經(jīng)常會(huì)遇到一些非隨機(jī)的序列。游程檢驗(yàn)(也稱連貫檢驗(yàn))就是為了檢驗(yàn)樣本觀察值出現(xiàn)次序的隨機(jī)性而發(fā)展起來(lái)的一種非參數(shù)統(tǒng)計(jì)方法,有著十分廣泛的應(yīng)用。例如檢驗(yàn)股票價(jià)格波動(dòng)的隨機(jī)性,檢驗(yàn)樣本的隨機(jī)性,檢驗(yàn)生產(chǎn)過(guò)程是否處于隨機(jī)控制狀態(tài)等等。 如果一個(gè)變量的取值只有兩種情況(如記為M與F),即是非標(biāo)志(若不是“是非標(biāo)志”,我們可以將之轉(zhuǎn)化成“是非標(biāo)志”)。變量值按一定次序出現(xiàn)(即有順序的),則就可能有如下形式的序列: MMM

9、 FFF M FF MM FF M FFF MMM FFFF,所謂游程,就是由同類事物(符號(hào),如M)連續(xù)構(gòu)成的一個(gè)子序列,它的前面和后面有另外的事物(符號(hào),如F),或前后根本沒(méi)有別的事物。顯然,上面列出的變量值序列就有十個(gè)游程。第一個(gè)游程是由3個(gè)M構(gòu)成,第二個(gè)游程是由3個(gè)F構(gòu)成,第三個(gè)游程則由一個(gè)M構(gòu)成,第四個(gè)游程由兩個(gè)F松成 游程檢驗(yàn)中最常用的方法是游程個(gè)數(shù)檢驗(yàn)。其原假設(shè)及備擇假設(shè)為: H0:現(xiàn)象(序列)是隨機(jī)的 H1:序列是非隨機(jī)的,例12.4 在證券價(jià)格理論中,有一種叫“隨機(jī)漫步”理論,認(rèn)為股市價(jià)格變化是隨機(jī)的。人們經(jīng)常采用游程檢驗(yàn)來(lái)驗(yàn)證這一理論。設(shè)某種股票在過(guò)去的38個(gè)交易日中價(jià)格變動(dòng)

10、情況如下(+表示價(jià)格上升,-表示價(jià)格下降): +-+-+-+-+-+-+-+-+- 計(jì)算得 n1=20, n2=18, R=18。查游程總數(shù)臨界值表,在0.05顯著性水平下, , ,顯然 ,即實(shí)際序列中游程個(gè)數(shù)“不多也不少”,故不能拒絕 H0 ,即認(rèn)為該股票價(jià)格變化是隨機(jī)的。,第三節(jié) 兩個(gè)相關(guān)樣本的非參數(shù)統(tǒng)計(jì)方法,麥克勒瑪檢驗(yàn) 符號(hào)檢驗(yàn) 威爾克遜配對(duì)符秩檢驗(yàn),一、麥克勒瑪檢驗(yàn)基本原理,麥克勒瑪(McNemar)檢驗(yàn)是適用于研究現(xiàn)象“前后”情況有無(wú)顯著變化的一種非參數(shù)統(tǒng)計(jì)方法。 設(shè)n個(gè)樣本單位在某一條件下(即變化前)的觀察值為第一個(gè)樣本(觀察值為“是非標(biāo)志”),在另一個(gè)條件下(即變化后)的觀察值

11、為第二個(gè)樣本,則可以得到如表12-4所示的頻數(shù)統(tǒng)計(jì)表。,表12-4 麥克勒瑪檢驗(yàn)頻數(shù)表 這里,A是前后均為“非”的次數(shù)。D為前后均為“是”的次數(shù),B是從“非”變?yōu)椤笆恰钡拇螖?shù),C是從“是”變?yōu)椤胺恰钡拇螖?shù)。顯然,前后情況有無(wú)變化,就是指C、B 兩格子內(nèi)次數(shù)的變動(dòng)情況。麥克勒瑪檢驗(yàn)關(guān)心的也正是這一點(diǎn),故統(tǒng)計(jì)假設(shè)為: H0 :事件在兩個(gè)方向上的變化可能性相同 H1:事件在兩個(gè)方向上的變化可能性不同,例12.6 某高校欲研究某系學(xué)生專業(yè)態(tài)度的變化情況,以驗(yàn)證新生入學(xué)專業(yè)教育的效果。從整個(gè)專業(yè)的100名新生中隨機(jī)抽取80名學(xué)生進(jìn)行態(tài)度調(diào)查:在剛?cè)胄r(shí),記載學(xué)生們對(duì)所學(xué)專業(yè)的態(tài)度(喜歡或不喜歡),經(jīng)過(guò)一

12、段時(shí)間的專業(yè)教育,在新生入學(xué)后第三個(gè)月對(duì)這80名學(xué)生的專業(yè)態(tài)度再次作訪問(wèn)調(diào)查,兩次專業(yè)態(tài)度整理成下表12-5。 表12-5 大學(xué)生專業(yè)態(tài)度變化頻數(shù)統(tǒng)計(jì)表,計(jì)算卡方統(tǒng)計(jì)量值為: 在顯著性水平 0.05時(shí) 。因?yàn)?故拒絕H0 ,認(rèn)為學(xué)生專業(yè)態(tài)度有明顯變化(即更多的學(xué)生培養(yǎng)起了專業(yè)興趣)。,二、符號(hào)檢驗(yàn),配對(duì)樣本(x1,y1), (x2,y2) , (xn,yn) 將 記為“+”, 記為“-” , 記為“0”,記P+ 為“+”比例, P- 為“-”比 例,那么假設(shè)檢驗(yàn)問(wèn)題: 可以用符號(hào)秩檢驗(yàn)。,H0:P+=P- H1:P+=P-,例12.7 某企業(yè)生產(chǎn)一種月餅,有A、B兩種口味,為確定哪種口味更加適

13、合消費(fèi)者青睞,此前特作一次市場(chǎng)研究。經(jīng)市場(chǎng)實(shí)驗(yàn),被調(diào)查者對(duì)兩種月餅的的偏好如表12-6所示。 表12-6 月餅口味偏愛(ài)情況調(diào)查表,顯然,若評(píng)價(jià)者對(duì)兩種口味無(wú)顯著偏好,則+號(hào)與-號(hào)個(gè)數(shù)應(yīng)該是相近的。本例中 n+ =7,n- =2, n =9,l=min(n+ ,n-)=2,結(jié)點(diǎn)舍去,則由二項(xiàng)分布,可計(jì)算出“-”號(hào)小于等于2的概率P,即 若取顯著性水平為0.1,則拒絕H0 ,認(rèn)為消費(fèi)者更喜歡A種月餅的口味。,三、Wilcoxon符號(hào)秩檢驗(yàn),對(duì)稱分布的中心一定是中位數(shù),在對(duì)稱分布情況下,中位數(shù)不唯一,研究對(duì)稱中心比中位數(shù)更有意義,例:下面的數(shù)據(jù)中,O是對(duì)稱中心嗎?,Wilcoxon符號(hào)秩檢驗(yàn)原理以及

14、性質(zhì),用 表示 在絕對(duì)值樣本中的秩,反秩 由 定義。 表示 的符號(hào), 稱為符號(hào)秩統(tǒng)計(jì)量。Wilcoxon符號(hào)秩統(tǒng)計(jì)量定義為:,首先,設(shè)樣本絕對(duì)值 的順序統(tǒng)計(jì) 量 ,如果數(shù)據(jù)關(guān)于0點(diǎn)對(duì)稱,那么對(duì)稱中心兩側(cè)的數(shù)據(jù)疏密程度應(yīng)該一樣,整數(shù)在取絕對(duì)值以后的樣本中的秩應(yīng)該和負(fù)數(shù)在絕對(duì)值樣本中的秩和相近。,表12-7 方案設(shè)計(jì)效果調(diào)查表達(dá)式,例12.8 某房地產(chǎn)公司為了驗(yàn)證其新的設(shè)計(jì)方案是否有效,在新設(shè)計(jì)方案之前與新設(shè)計(jì)方案之后作了一次對(duì)比調(diào)查,從消費(fèi)者中隨機(jī)抽取20名進(jìn)行了解,記錄了他們?cè)谠O(shè)計(jì)方案前后對(duì)該公司房產(chǎn)產(chǎn)品的評(píng)分,如表12-7所示。要求檢驗(yàn): H0 :新設(shè)計(jì)方案有效; H1 :新設(shè)計(jì)方案無(wú)效。

15、有關(guān)中間過(guò)程的表12-7所示。 Wilcoxon-T統(tǒng)計(jì)量值為T(mén)=44.5。查表(雙側(cè)): 拒絕H0 ,即認(rèn)為設(shè)計(jì)方案是顯著有效的。,第四節(jié) 兩個(gè)獨(dú)立樣本的非參數(shù)統(tǒng)計(jì)方法,曼惠特尼U檢驗(yàn) 中位數(shù)檢驗(yàn) 斯米爾諾夫檢驗(yàn) 雙樣本游程檢驗(yàn) 獨(dú)立雙樣本卡方檢驗(yàn),一、曼惠特尼U 檢驗(yàn),這是檢驗(yàn)兩個(gè)獨(dú)立樣本是否來(lái)自具有相同均值的總體的非參數(shù)檢驗(yàn)方法,又稱秩和檢驗(yàn)法。它與配對(duì)Wilcoxon檢驗(yàn)相類似,要考慮到每一個(gè)樣本中各觀察值所處的次序(秩),故為一種功效較強(qiáng)的檢驗(yàn)方法。 設(shè)第一樣本n1個(gè)觀察值為xi,i=1,2,n2 ;第二樣本n2個(gè)觀察值為xj, j=1,2,n2 。則其基本步驟為 (1)將兩個(gè)樣本合

16、并成一個(gè)樣本再評(píng)秩。可以按升序評(píng)秩,也可按降序評(píng)秩。若多個(gè)觀察點(diǎn)數(shù)值相同,則取其平均秩次。,(2)計(jì)算每個(gè)樣本觀察點(diǎn)所得的秩和。記為T(mén)R1與TR2。 (3)計(jì)算U統(tǒng)計(jì)量。如果兩個(gè)樣本的確抽自同一個(gè)總體(H0),則可以設(shè)想樣本1所得到的平均秩次與樣本2所得到的平均秩次大致相同。故定義統(tǒng)計(jì)量U為: 其中 (4)查U統(tǒng)計(jì)量分布表。若 ,則拒絕H0 ,認(rèn)為兩個(gè)樣本的均值有顯著差異,即抽自不同的總體。,例12.10 對(duì)兩所大學(xué)入學(xué)新生的智能進(jìn)行測(cè)驗(yàn),結(jié)果如表12-8所示?,F(xiàn)要檢驗(yàn)這兩所大學(xué)新生的智能水平是否有顯著差異。 表12-8 兩所大學(xué)新生智能抽樣測(cè)驗(yàn)分?jǐn)?shù),取顯著性水平0.05。則統(tǒng)計(jì)假設(shè)為: H0

17、:兩校新生智能水平無(wú)顯著差異 H1:兩校新生智能水平有顯著差異 n1=12,n2 =11。將這兩個(gè)樣本混合之后評(píng)秩,結(jié)果如表12-9所示。 表12-9 兩所大學(xué)新生智能分?jǐn)?shù)抽樣評(píng)秩,二、中位數(shù)檢驗(yàn),(一)基本原理 這是檢驗(yàn)兩個(gè)彼此獨(dú)立樣本是否來(lái)自有相同中位數(shù)的總體。由于在社會(huì)經(jīng)濟(jì)統(tǒng)計(jì)中,我們遇到的變量可能是“定序變量”,若檢驗(yàn)兩個(gè)樣本在該變量值上的“一般水平”(統(tǒng)計(jì)平均數(shù))是否相同,采用參數(shù)統(tǒng)計(jì)中“兩個(gè)均值差異性”的 檢驗(yàn)可能行不通,這時(shí)可采用中位數(shù)檢驗(yàn)法,因?yàn)橹形粩?shù)也是一種平均數(shù)。 中位數(shù)檢驗(yàn)的原假設(shè)及備擇假設(shè)為: H 0 :兩個(gè)獨(dú)立樣本來(lái)自有相同中位數(shù)的總體 H 1 :兩個(gè)獨(dú)立樣本來(lái)自的有

18、不同中位數(shù)的總體,例12.14 設(shè)有兩批不同廠家的燈泡,經(jīng)質(zhì)量檢驗(yàn),它們的壽命如下(小時(shí)): 甲廠家:1208,1406,1250,1622,1326,1414,1500,1480,1251,1262,1365,1462,1518,1610,1285,1382 乙廠家:1428,1579,1325,1328,1685,1476,1490,1588,1442,1578,1369,1479,1465,1672,1587,1592,1581 要求檢驗(yàn)兩廠該燈泡壽命的中位數(shù)是否相同。,此例若假定該燈泡的壽命服從正態(tài)分布,則就可用參數(shù)統(tǒng)計(jì)中的t檢驗(yàn)法進(jìn)行檢驗(yàn)。我們現(xiàn)在采用中位數(shù)法進(jìn)行檢驗(yàn)。 由所給資料可

19、計(jì)算知,n1=16, n2=17,混合中位數(shù)的中數(shù)為Me=1465小時(shí)。則x(甲廠燈泡壽命超過(guò)混合中位數(shù)的個(gè)數(shù))為5,y(乙廠燈泡壽命超過(guò)混合中位數(shù)的個(gè)數(shù))為11。于是可計(jì)算出累積的一伴隨概率為: 顯然,P=0.01 。故我們認(rèn)為兩個(gè)廠的燈泡壽命中位數(shù)顯著不同。,三、斯米爾諾夫檢驗(yàn),(一)基本原理 這是在柯?tīng)柲宸驒z驗(yàn)(單樣本,見(jiàn)第二節(jié))的基礎(chǔ)之上推廣到兩個(gè)獨(dú)立樣本之間的比較,判斷兩個(gè)總體分布是否相等的方法。有時(shí)也稱 K-S 雙樣本檢驗(yàn)。第一個(gè)樣本有 n 1 個(gè)觀察值,隨機(jī)抽自某一分布函數(shù)為 F ( x )(但未知具體形式)的總體,第二個(gè)樣本有 n 2 個(gè)觀察值,隨機(jī)抽自另一分布函數(shù)為 G (

20、 y )(也未知其具體形式)的總體?,F(xiàn)要通過(guò)兩個(gè)樣本的比較,對(duì)以下假設(shè)進(jìn)行檢驗(yàn) H 0 : F ( x ) =G ( y ), 即兩總體分布相同 ( -x , y ) H 1 : F ( x ) G ( y ),即兩總體分布不同 ( -x , y ),例12.16 設(shè)男、女兩類消費(fèi)者對(duì)某餐廳風(fēng)味的評(píng)分(10分制)資料如下表12-11所示?,F(xiàn)欲知兩類消費(fèi)者的評(píng)分分布是否相同。 表12-11 男、女兩類消費(fèi)者的評(píng)分,先將上述樣本資料混合編制單項(xiàng)式分布數(shù)列,如表12-12所示。 表12-12 斯米爾諾夫檢驗(yàn)計(jì)算過(guò)程 故不拒絕 H 0 ,即認(rèn)為男女兩類消費(fèi)者對(duì)該餐廳風(fēng)味的評(píng)分分布沒(méi)有顯著差異。,四、雙

21、樣本游程檢驗(yàn) (一)基本原理和和步驟 這是單樣本游程檢驗(yàn)的推廣,用來(lái)檢驗(yàn)兩個(gè)獨(dú)立樣本是否有相同的總體分布,也稱“瓦爾德-沃夫維茨”的檢驗(yàn)(Wals-Wolflwitz檢驗(yàn),簡(jiǎn)記W-W游程檢驗(yàn))。其基本步驟如下: (1)將兩個(gè)樣本的觀察值混合,并按大小順序從小到大排列。并以符號(hào) 表示第一樣本的元素,以符號(hào)y表示第二樣本的元素。 (2)計(jì)算 ,y序列中的游程總數(shù),方法與單樣本游程檢驗(yàn)完全相同。,(3)查游程總數(shù)檢驗(yàn)臨界值表。在單樣本情況下,游程個(gè)數(shù)太多太少都表示 不成立。但在雙樣本情況之下,游程個(gè)數(shù)越多,表示兩個(gè)樣本值的混合越理想, 越不能拒絕。故此時(shí)要查游程總數(shù)檢驗(yàn)的下限臨界值 。若 ,則拒絕

22、,認(rèn)為游程個(gè)數(shù)太少,從而兩個(gè)樣本來(lái)自不同的總體。值得指出的是,當(dāng) 或 超過(guò)20時(shí),可用正態(tài)分布來(lái)檢驗(yàn)。 例12.17 假設(shè)要比較兩個(gè)醫(yī)院滿月新生兒重量是否有顯著差異,從兩個(gè)醫(yī)院抽得的滿月新生兒重量分別為(單位:KG): 醫(yī)院1:4.97 5.21 4.30 4.78 5.09 4.83 4.52 5.34 4.90 4.94 醫(yī)院2:4.88 4.55 5.36 4.43 4.93 4.70 5.28 4.53 5.46 4.95 4.98,要求檢驗(yàn)這些新生兒的重量分布是否來(lái)自同一總體(或來(lái)自有相同分布函數(shù)的兩個(gè)總體)。 先將上述兩組數(shù)據(jù)混合排序,并在第二樣本的數(shù)據(jù)之下劃一橫線: 4.30 4

23、.43 4.52 4.53 4.55 4.70 4.78 4.83 4.88 4.90 4.93 4.94 4.95 4.97 4.98 5.09 5.21 5.28 5.34 5.36 5.46 可見(jiàn),游程總個(gè)數(shù)R=14。由所給 得游程總數(shù)臨界值(下限)為 ,因?yàn)?,故不否定 ,認(rèn)為兩個(gè)總體有相同的分布。,五、獨(dú)立雙樣本卡方檢驗(yàn) 該法是單樣本卡方檢驗(yàn)的推廣,也是列聯(lián)表分析的應(yīng)用。主要用于檢驗(yàn)兩個(gè)彼此獨(dú)立的樣本的頻率分布是否有差異,或是行變量與列變量之間是否具有相關(guān)性。檢驗(yàn)步驟如下: (1)獨(dú)立隨機(jī)抽取兩個(gè)樣本,將全部可能觀察值進(jìn)行分組,得到如表12-13所示的頻數(shù)資料 (分布數(shù)列)。 表12

24、-13 樣本頻數(shù)分布,(2)計(jì)算期望頻數(shù)。若兩個(gè)樣本對(duì)應(yīng)于具體觀察值的出現(xiàn)概率是相同的(即 為真,兩個(gè)總體無(wú)差異),則在實(shí)際的調(diào)查中,全部n個(gè)樣本單位中屬于第i 樣品的估計(jì)概率為 ,全部n個(gè)樣本單位中,出現(xiàn)第j個(gè)觀察結(jié)果的估計(jì)概率應(yīng)為 。按聯(lián)合概率,即可推知在全部的n個(gè)單位中,出現(xiàn)上述表格每一格子中的期望次數(shù) 為: (3)計(jì)算卡方統(tǒng)計(jì)量: (4)作檢驗(yàn)。若 ,則拒絕 ,認(rèn)為兩個(gè)總體有顯著差異。,例12.18 某市場(chǎng)研究公司對(duì)某國(guó)際體育產(chǎn)品公司生產(chǎn)的A、B兩種品牌產(chǎn)品的消費(fèi)群進(jìn)行了一次體育節(jié)目收視情況調(diào)查,以了解他們喜歡收看哪些體育節(jié)目,從而為該企業(yè)提供選擇廣告時(shí)段的參考資料。調(diào)查結(jié)果如表12-

25、14所示。 表12-14 樣本中A、B兩品牌消費(fèi)者觀看不同電視節(jié)目的人數(shù),表中括號(hào)內(nèi)為期望頻數(shù)(即人數(shù))??捎?jì)算得卡方位計(jì)量值為: 。由于 , , 故拒絕 ,認(rèn)為這兩種品牌消費(fèi)者在電視節(jié)目收視方面是有差異的。,第五節(jié) 多個(gè)相關(guān)樣本的非參數(shù)檢驗(yàn)方法,柯克倫 Q 檢驗(yàn) 費(fèi)里德曼雙向評(píng)秩方差分析,一、柯克倫Q檢驗(yàn) (一)基本原理,將麥克勒瑪檢驗(yàn)推廣到兩個(gè)以上樣本,就得到K個(gè)相關(guān)樣本的柯克倫(Cochran)Q檢驗(yàn),它是用來(lái)檢驗(yàn)配對(duì)的三組或三組以上的頻率彼此之間有無(wú)顯著差異的一種方法。例如,我們研究k種不同優(yōu)惠策略的效果時(shí),請(qǐng)N個(gè)消費(fèi)者對(duì)K種策略作出態(tài)度回答(贊同、不贊同),然后就可研究消費(fèi)者對(duì)K種優(yōu)

26、惠策略的反應(yīng)是否有差異。 柯克倫Q檢驗(yàn)的原假設(shè)及備擇假設(shè)一般為: H0: k個(gè)樣本的頻率沒(méi)有差異 H1: k個(gè)樣本的頻率有顯著差異,(二)檢驗(yàn)步驟 (1)取得如表12-15所示的原始資料: 表12-15 柯克倫Q檢驗(yàn)調(diào)查表,注:表中取值為“0”或“1”,每個(gè)觀察點(diǎn)可以是一個(gè)單位,也可以是包含k個(gè)小組的匹配值。例如,在研究n種不同教學(xué)方法的效果時(shí),同一個(gè)受試者(學(xué)生)顯然不能同時(shí)接受k種方法進(jìn)行教學(xué)。這時(shí),某個(gè)觀察點(diǎn)內(nèi)就應(yīng)該有k個(gè)各方面條件完全相同(如智力水平、年齡、性別等)的學(xué)生組成一個(gè)“匹配組”,對(duì)這k個(gè)“基礎(chǔ)”相同的學(xué)生實(shí)施不同教學(xué)方法,如該組1號(hào)學(xué)生實(shí)施第一種教學(xué)方法,2號(hào)學(xué)生實(shí)施第二種

27、教學(xué)方法,第k種學(xué)生實(shí)施第k種教學(xué)方法。每個(gè)觀察點(diǎn)都是由k個(gè)學(xué)生組成的“匹配組”。 完成教學(xué)任務(wù)之后,進(jìn)行測(cè)試,如通過(guò)考核者為1,未通過(guò)考核者為0,填入表中。例如,樣本1登記的就是各觀察點(diǎn)陣為所有1號(hào)學(xué)生的考核結(jié)果,樣本2登記的就是各觀察點(diǎn)所有2號(hào)學(xué)生的考核結(jié)果,其余類推。,(2)計(jì)算Q統(tǒng)計(jì)量: 其中 , 及 的含義見(jiàn)表12-15。 可以證明,Q (k-1)。 (3)查 分布表,作出檢驗(yàn)。若 ,則拒絕 H0。認(rèn)為k個(gè)樣本的反應(yīng)有顯著差異。,例12.9 某公司為了提高生產(chǎn)工人的技能,嘗試了四種不同的培訓(xùn)方法。經(jīng)過(guò)一段時(shí)間的培訓(xùn),參加行業(yè)技能考試的通過(guò)情況如表12-16所示(配對(duì)點(diǎn)有20個(gè)。每個(gè)點(diǎn)

28、內(nèi)由4名技工組成)。 顯然,k=4,n=20, 統(tǒng)計(jì)量值為: 由于 , 故不能拒絕H0 ,即不能認(rèn)為這四種培訓(xùn)方法的行業(yè)技能考試通過(guò)率之間有顯著差異。,表12-16 不同培訓(xùn)方法之下行業(yè)技能考試通過(guò)情況,二、費(fèi)里德曼雙向評(píng)秩方差分析 (一)基本原理 這也是檢驗(yàn)K個(gè)相關(guān)樣本之間差異性的一種非參數(shù)統(tǒng)計(jì)方法。但它與Q檢驗(yàn)不同,它要求變量值至少是有順序的。如上面行業(yè)技能考試通過(guò)率的例子,Q檢驗(yàn)只在乎“有沒(méi)有通過(guò)”而不在乎分?jǐn)?shù)的高低。費(fèi)里德曼(Friedman)雙向評(píng)秩方差分析則不同,它更關(guān)心分?jǐn)?shù)的高低。其待檢假設(shè)為: H0: k個(gè)樣本的頻率沒(méi)有差異 H1: k個(gè)樣本的頻率有顯著差異,(二)檢驗(yàn)步驟 (

29、1)與Q檢驗(yàn)相類似,取得如表12-17形式的調(diào)查表。但此時(shí)表中的數(shù)值不是01變量值,而是秩次或具體數(shù)值。若是具體數(shù)值,則將之評(píng)秩。 表12-17 費(fèi)里德曼檢驗(yàn)調(diào)查表,注:表中數(shù)值為“秩次”,由于這一表格是按橫向(樣本之間)評(píng)秩,又按縱向求秩次總和的,故稱為“雙向評(píng)秩”。 (2)計(jì)算統(tǒng)計(jì)量 : 其中:S1 ,可以證明 上式中,Rj為第j樣本得到的秩次和,顯然,若不同樣本之間沒(méi)有差異,則它們所得到的秩次和Rj之間應(yīng)該很接近,若Rj之間差異越大,說(shuō)明各樣本得到的秩次差別越遠(yuǎn),從而 值越大,H0也越難成立。 (3)作出檢驗(yàn)結(jié)論。在給定的顯著性水平之下,查 分布表。若 則拒絕H0。,例12.20 根據(jù)例

30、12.19行業(yè)考試通過(guò)率的例子,若研究者關(guān)心的并不是“通過(guò)”與否,而是成績(jī)的高低,則就等于檢驗(yàn)下面的假設(shè): H0:四種不同培訓(xùn)方法之下職工考分無(wú)差異 H1:四種不同培訓(xùn)方法之下職工考分有差異 我們將原始資料列于表12-18中。 取=0.05時(shí), 故拒絕H0,認(rèn)為四種不同培訓(xùn)方法的效果是有顯著差異的。這個(gè)結(jié)論與前面的Q檢驗(yàn)結(jié)論之間之所以不同,是因?yàn)樗鼈兯P(guān)心的問(wèn)題不完全相同。在實(shí)踐中,可以通加增加樣本容量來(lái)作進(jìn)一步的驗(yàn)證與研究。,表12-18 四種不同技能培訓(xùn)方法的考分及名次,第六節(jié) 多個(gè)獨(dú)立樣本的非參數(shù)檢驗(yàn)方法,多個(gè)獨(dú)立樣本的卡方檢驗(yàn) 克魯斯卡爾瓦利斯 H 檢驗(yàn),一、多個(gè)獨(dú)立樣本的卡方檢驗(yàn) (

31、一)基本原理和步驟 將獨(dú)立雙樣本 檢驗(yàn)進(jìn)一步推廣,可得到多個(gè)總體的 檢驗(yàn),或稱“k個(gè)總體齊一性檢驗(yàn)”。它與獨(dú)立雙樣本 檢驗(yàn)之下的做法基本相同,也是 列聯(lián)表分析技術(shù)的應(yīng)用。它可用來(lái)檢驗(yàn)k個(gè)總體的分布是否相等的原假設(shè)。 檢驗(yàn)步驟如下: (1)將調(diào)查數(shù)據(jù)按樣本及觀察點(diǎn)取值情況進(jìn)行分組,得如表12-19所示的二維列聯(lián)表,表內(nèi)為實(shí)際觀察頻數(shù)Oij。,表12-19 樣本實(shí)際觀察頻數(shù)表 (2)計(jì)算期望頻數(shù)Eij: (3)計(jì)算卡方統(tǒng)計(jì)量。由皮爾遜定理,卡方統(tǒng)計(jì)量為 它服從自由度為(R-1)(K-1)=RK-R-K+1的卡方分布。,(4)作出檢驗(yàn)結(jié)論。若 ,則拒絕H0,認(rèn)為這K個(gè)總體的分布不盡相同。 例12.2

32、1 某女士美容公司為了了解客戶對(duì)旗下三個(gè)子公司服務(wù)質(zhì)量的評(píng)價(jià),從各家公司的全部固定客戶中隨機(jī)抽取部分(共950戶),經(jīng)調(diào)查,評(píng)價(jià)意見(jiàn)如表12-20所示。 本例采用 檢驗(yàn),即 H0:客戶對(duì)三家子公司服務(wù)質(zhì)量評(píng)價(jià)無(wú)差異 H1:客戶對(duì)三家子公司服務(wù)質(zhì)量評(píng)價(jià)有差異 我們將期望次數(shù)及(Oij-Eij)2/Eij列入下表12-21中。,表12-20 客戶對(duì)三家子公司服務(wù)質(zhì)量的評(píng)價(jià) 表12-21 期望次數(shù)及(Oij-Eij)2/Eij,由于 所以H0被拒絕,即三家子公司的服務(wù)質(zhì)量顯著不同。 二、克魯斯卡爾瓦利斯H 檢驗(yàn) (一)基本原理 這是一種非常有用的非參數(shù)統(tǒng)計(jì)方法。在參數(shù)統(tǒng)計(jì)中,對(duì)方差分析是采用F檢驗(yàn)進(jìn)行的,以檢驗(yàn)推斷多個(gè)正態(tài)總體均值是否相等。但當(dāng)總體并不服從正態(tài)分布時(shí),F(xiàn)檢驗(yàn)就受到了限制。這時(shí)通常可用克魯斯卡爾瓦利斯的H檢驗(yàn)法。它可以看作是Wilcoxon-W檢驗(yàn)或曼惠特尼U檢驗(yàn)的推廣。待檢驗(yàn)假設(shè)為:,H0:k 個(gè)樣本來(lái)自不同一總體 H1:k 個(gè)樣本不全來(lái)自同一總體 (二)檢驗(yàn)步驟 (1)把k

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論