秩轉(zhuǎn)換的非參數(shù)檢驗(yàn).ppt_第1頁
秩轉(zhuǎn)換的非參數(shù)檢驗(yàn).ppt_第2頁
秩轉(zhuǎn)換的非參數(shù)檢驗(yàn).ppt_第3頁
秩轉(zhuǎn)換的非參數(shù)檢驗(yàn).ppt_第4頁
秩轉(zhuǎn)換的非參數(shù)檢驗(yàn).ppt_第5頁
已閱讀5頁,還剩77頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第八章秩轉(zhuǎn)換的非參數(shù)檢驗(yàn) (Nonparametric Test),主要內(nèi)容,第一節(jié) 配對樣本資料的Wilcoxon符號秩檢驗(yàn) 第二節(jié) 兩個獨(dú)立樣本比較的Wilcoxon秩和檢驗(yàn) 第三節(jié) 完全隨機(jī)設(shè)計(jì)多個樣本比較的Kruskal- Wallis H檢驗(yàn) 第四節(jié) 隨機(jī)區(qū)組設(shè)計(jì)多個樣本的Friedman M檢驗(yàn),參數(shù)檢驗(yàn),參數(shù)檢驗(yàn)方法:t 檢驗(yàn),方差分析; 總體分布假定:各組樣本所來自的總體為正態(tài)分布(已知的分布形式),各組樣本所來自的總體方差齊性。,非參數(shù)檢驗(yàn),定義:不依賴于總體的分布類型,對樣本所來自總體的分布不作嚴(yán)格假定的統(tǒng)計(jì)推斷方法,稱為非參數(shù)檢驗(yàn)(nonparametric test)。

2、直接對總體分布做假設(shè)檢驗(yàn)。 又稱為任意分布檢驗(yàn)(distribution-free test)。,注意:如果已知其計(jì)量資料滿足(或近似滿足) 檢驗(yàn)或 檢驗(yàn)條件,當(dāng)然選 檢驗(yàn)或 檢驗(yàn),因?yàn)檫@時若選秩轉(zhuǎn)換的非參數(shù)檢驗(yàn),會降低檢驗(yàn)效能。,非參數(shù)檢驗(yàn)是一類統(tǒng)計(jì)學(xué)方法的總稱,基于秩轉(zhuǎn)換(rank transformation)的非參數(shù)檢驗(yàn)只是其中的一種。,秩轉(zhuǎn)換的非參數(shù)檢驗(yàn),秩次(rank):某種測量值按照從小到大的順序排序后,每一測量值所對應(yīng)的序號。 秩轉(zhuǎn)換:將某一變量值從小到大排序后,獲得每一變量值的秩次,并用此秩次代替原有變量值的過程。,秩轉(zhuǎn)換的非參數(shù)檢驗(yàn),秩和檢驗(yàn)的方法-秩轉(zhuǎn)換,秩和檢驗(yàn)的基本計(jì)

3、算步驟: 1.將數(shù)據(jù)(x)按大小轉(zhuǎn)化為秩次(i),用秩次的大小反映變量值的大小。 2.對各組”秩次”求和,稱為秩和(T =i)。 3.對各組秩和(T)做檢驗(yàn)的方法稱為秩和檢驗(yàn)。,例: 秩轉(zhuǎn)換的基本方法,將兩組比較原始數(shù)據(jù)(X)混合按大小編秩,如x相同取平均秩, 分別對各組的秩求和(T). 甲組(x) 3 5 10 20 22 秩和 秩號 (i) 1 3 5 7 8 T1=24 乙組(x) 4 9 15 25 35 秩號(i) 2 4 6 9 10 T2=31,總秩和,T=10(10+1)/2=55,例: 兩組比較的等級數(shù)據(jù)編秩,A組 : 、 +、 +、 +、 + 秩(i) : 1 2 4.5

4、4.5 4.5 8.5 秩和 : TA25 (組間相同,求平均秩) B組 : +、+、+、+、+、+ 秩(i) :4.5 8.5 8.5 8.5 11 12 秩和 : TB53 (組內(nèi)相同,不影響求秩和),總秩和 : TA+TB=12(12+1)/2=78,秩次:在一定程度上反映了原始數(shù)據(jù)大小(等級)的信息。 秩和:反映了一組數(shù)據(jù)在分布上的范圍位置。 平均秩次:反映一組數(shù)據(jù)平均水平 A組平均秩次=23.5/6=3.92 B組平均秩次=54.5/6=9.08,A組(x) 3, 5, 7, 9 11 14 (i) 1 2 3 4 5 8.5 T=23.5 B組(x) 12 13 14 16 20

5、22 (i) 6 7 8.5 10 11 12 T=54.5,非參數(shù)檢驗(yàn)的應(yīng)用場合,計(jì)量資料: 不滿足參數(shù)檢驗(yàn)的條件,且無適當(dāng)?shù)淖兞孔儞Q方法解決此問題時; 分布類型無法獲知的小樣本計(jì)量資料; 一端或兩端存在不確定數(shù)值(如1000IU)的計(jì)量資料; 等級資料:比較各組間等級強(qiáng)度的差別。,非參數(shù)檢驗(yàn)的優(yōu)缺點(diǎn):,優(yōu)點(diǎn): 適用范圍廣 對數(shù)據(jù)要求不嚴(yán) 方法簡便、易于理解和掌握 缺點(diǎn): 損失信息、檢驗(yàn)效能低,第一節(jié) 配對樣本比較的Wilcoxon符號秩檢驗(yàn),Wilcoxon符號秩檢驗(yàn)簡介,符號秩檢驗(yàn)由Wilcoxon于1945年提出; 應(yīng)用: 配對樣本差值的中位數(shù)與0比較; 單個樣本中位數(shù)與總體中位數(shù)(給

6、定值)的比較。,符號秩檢驗(yàn)的基本思想,在H0成立(兩配對樣本差值的總體中位數(shù)為0)的條件下,兩配對樣本的差值的正負(fù)及其絕對值的相對大小是隨機(jī)的; 在此情況下,正秩和與負(fù)秩和之間應(yīng)當(dāng)相近,差別不會太大; 如果正秩和與負(fù)秩和之間相差足夠大,則可認(rèn)為H0成立的可能性很小,從而加以拒絕。,配對樣本差值的中位數(shù)與0比較 配對設(shè)計(jì)兩組處理效應(yīng)的比較一般采用配對t 檢驗(yàn),如果差數(shù)嚴(yán)重偏離正態(tài)分布,可采用Wilcoxon符號秩檢驗(yàn)。,例8-1:兩種方法測量12份血清ALT測量結(jié)果,例8-1:兩種方法測量12份血清ALT測量結(jié)果,例8-1分析結(jié)果,取負(fù)秩和為T,則T=11.5; 查T界值表得0.05P0.1;

7、結(jié)論:不拒絕H0,不能認(rèn)為兩種方法檢測ALT的結(jié)果有差別。,正態(tài)近似法:,n25時,T分布近似正態(tài)分布可用正態(tài)近似法作u檢驗(yàn):,相同秩次較多時的校正值:,注意:仍為非參數(shù)檢驗(yàn),2.配對設(shè)計(jì)等級資料的符號秩檢驗(yàn),1. 把等級從弱到強(qiáng)轉(zhuǎn)換成秩,如某指標(biāo)的檢測結(jié)果為-,+,+,+,可轉(zhuǎn)化為相應(yīng)的秩次1,2,3,4; 2. 求各對秩次的差值,省略所有差值為0的對子數(shù),令余下的有效對子數(shù)為n; 3. 按n個差值編正秩與負(fù)秩,求正秩和與負(fù)秩和 注意:由于等級資料相同秩多,此時小樣本的檢驗(yàn)結(jié)果會存在偏性,最好用大樣本。,3. 單個樣本中位數(shù)和指定的總體中位數(shù)比較,例8-2:12名工人尿氟含量與45.3比較,

8、假設(shè)檢驗(yàn)過程,與配對資料符號秩檢驗(yàn)基本相同。 此處先計(jì)算每一測量值與給定的值的差數(shù); 然后對此差數(shù)進(jìn)行秩轉(zhuǎn)換,進(jìn)行與配對資料符號秩檢驗(yàn)完全相同的操作過程。 此例得T=1.5,查表得P0.005; 拒絕H0,認(rèn)為該廠工人的尿氟含量高于當(dāng)?shù)卣H说乃健?第二節(jié) 兩個獨(dú)立樣本比較的 Wilcoxon秩和檢驗(yàn),Wilcoxon秩和檢驗(yàn),Wilcoxon秩和檢驗(yàn)(rank sum test)用于推斷計(jì)量資料或等級資料的兩個獨(dú)立樣本所來自總體的分布位置是否有差別。 對分布的形狀不加考慮,因此應(yīng)注意分布位置和分布(包括位置和形狀)的區(qū)別。 分布形狀相同或類似的兩個總體分布位置比較,可以簡化地理解為兩總體中

9、位數(shù)的比較。,1. 計(jì)量資料兩樣本比較,例8-3 兩類肺病患者RD值比較,(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),H0:兩組患者RD值總體分布位置相同 H1:肺癌病人RD值高于矽肺0期工人RD值 =0.05,(2)混合編秩,求統(tǒng)計(jì)量T,將兩樣本數(shù)據(jù)混合,從小到大排序; 對混合數(shù)據(jù)進(jìn)行秩轉(zhuǎn)換,獲得每一觀察值對應(yīng)的秩次; 觀察值相等者取平均秩次; 分別計(jì)算兩樣本的秩和; 取樣本量較小者為n1,其秩和作為統(tǒng)計(jì)量T; 兩樣本量相等者任取其中一個作為統(tǒng)計(jì)量T(通常取秩和較小者)。,(3)確定P值,作出結(jié)論,若n110且n2-n110,可通過查閱T界值表(附表10)確定P值; 若兩樣本量不滿足上述條件,則可采用

10、正態(tài)近似法作u檢驗(yàn),按公式(8-2)計(jì)算u值。,正態(tài)近似法,例8-3分析結(jié)果,本例n1=10, n2-n1=2,T=T1=141.5,滿足查T界值表的條件; 查表得單側(cè)0.025P0.05; 拒絕H0 ,認(rèn)為肺癌病人的RD值高于矽肺0期病人的RD值。,2. 等級資料兩樣本比較,例8-4 吸煙和不吸煙工人HbCO含量比較,(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),H0:兩組工人HbCO含量總體分布位置相同 H1:吸煙工人HbCO含量高于不吸煙工人 =0.05,(2)混合編秩,求統(tǒng)計(jì)量T,確定各等級的合計(jì)人數(shù); 根據(jù)各等級的合計(jì)人數(shù)確定其秩次范圍和平均秩; 分別計(jì)算兩樣本的秩和; 取樣本量較小者為n1,其

11、秩和(T1)作為統(tǒng)計(jì)量T; 根據(jù)公式(8-2)計(jì)算u值,執(zhí)行u檢驗(yàn)過程。,例8-4分析結(jié)果,本例n1=39, n2=40,T=T1=1917; 計(jì)算得u=3.7023,查表得單側(cè)P0.0005; 拒絕H0,認(rèn)為吸煙工人HbCO含量高于不吸煙工人HbCO含量。,(3)確定P值,作出結(jié)論,第三節(jié):完全隨機(jī)設(shè)計(jì)多個樣本比較的Kruskal-Wallis H檢驗(yàn),Kruskal-Wallis H應(yīng)用,Kruskal-Wallis H檢驗(yàn)用于推斷計(jì)量資料或等級資料的多個獨(dú)立樣本所來自總體的分布位置是否有差別。,1. 計(jì)量資料多個樣本比較,例8-5 三種藥物殺滅釘螺的死亡率(%)比較,(1)建立檢驗(yàn)假設(shè),

12、確定檢驗(yàn)水準(zhǔn),H0:三種藥物殺滅釘螺的死亡率總體分布位置相同 H1:三種藥物殺滅釘螺的死亡率總體分布位置不全相同 =0.05,(2)混合編秩,分組求秩和,將多組樣本數(shù)據(jù)混合,從小到大排序; 對混合數(shù)據(jù)進(jìn)行秩轉(zhuǎn)換,獲得每一觀察值對應(yīng)的秩次; 觀察值相等者取平均秩次; 分別計(jì)算各組樣本的秩和Ri及樣本量ni;,(3)求統(tǒng)計(jì)量H,(3)確定P值,作出結(jié)論,若組數(shù)g=3且每個樣本例數(shù)ni5時,可通過查閱H界值表(附表11)確定P值; 若組數(shù)g=3且最大樣本例數(shù)5或g3時,則H或Hc近似服從=g-1的卡方分布,可通過查閱卡方界值表確定P值。,例8-5分析結(jié)果,本例n1=n2=n3=5,N=15,滿足查H

13、界值表的條件; 計(jì)算得H=9.74,查表得雙側(cè)P0.01; 拒絕H0 ,認(rèn)為三種藥物殺滅釘螺的效果不同。,2. 等級資料多個樣本比較,例8-7 四種疾病患者痰液內(nèi)噬酸粒細(xì)胞比較,(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),H0:四種疾病患者痰液內(nèi)噬酸粒細(xì)胞總體分布位置相同 H1:四種疾病患者痰液內(nèi)噬酸粒細(xì)胞總體分布位置不全相同 =0.05,(2)混合編秩,求統(tǒng)計(jì)量H,確定各等級的合計(jì)人數(shù) 根據(jù)各等級的合計(jì)人數(shù)確定其秩次范圍和平均秩 分別計(jì)算各組樣本的秩和,即各組中各等級的頻數(shù)乘以相應(yīng)的平均秩,然后求和 按照公式(8-4)和公式(8-5)求統(tǒng)計(jì)量Hc,(3)確定P值,作出結(jié)論,確定P值的方法和計(jì)量資料多組

14、樣本比較的情形相同; 此處g3,通過查卡方界值表(附表8)確定P值;,例8-7分析結(jié)果,本例計(jì)算得H=14.28,Hc =15.52,查卡方界值表得雙側(cè)P0.005; 拒絕H0 ,認(rèn)為四種疾病患者痰液內(nèi)噬酸粒細(xì)胞有差別。,秩和檢驗(yàn)的兩兩比較,方法有: 1、Nemenyi法檢驗(yàn) 2、擴(kuò)展的t檢驗(yàn) 3、q檢驗(yàn),幾種方法理論上仍存在爭議,故SAS、SPSS等軟件沒有提供這方面的分析,3. 多個獨(dú)立樣本兩兩比較的Nemenyi檢驗(yàn),Nemenyi檢驗(yàn)方法簡介,類似于多組樣本比較方差分析的情形,當(dāng)經(jīng)過多個獨(dú)立樣本比較的Kruskal-Wallis H檢驗(yàn)拒絕H0之后,可進(jìn)一步進(jìn)行組間兩兩比較; Neme

15、nyi檢驗(yàn)即為執(zhí)行此類統(tǒng)計(jì)學(xué)比較的方法之一。,例8-8 小白鼠接種三種傷寒菌的存活日數(shù),三組樣本所來自的總體分布位置比較,三組樣本所來自的總體分布位置比較的操作過程與例8-5完全相同; 本例得Hc=9.97,P0.01,拒絕H0; 認(rèn)為接種三種傷寒桿菌的存活日數(shù)有差別; 為進(jìn)一步觀察不同傷寒桿菌之間的差別,可進(jìn)一步進(jìn)行三組間的兩兩比較。,任意兩組間分布位置的比較,計(jì)算各組的平均秩和,根據(jù)公式(8-6)計(jì)算任意兩組之間比較的卡方值; 自由度取組數(shù)減一,即=g-1; 查表確定相應(yīng)的P值,進(jìn)行統(tǒng)計(jì)推斷。,例8-8分析結(jié)果,,0.025P0.05 ,0.01P0.025 ,0.99P0.995 推論:

16、9D組與11C組和DSC1組間差別均有統(tǒng)計(jì)學(xué)意義;11C組與DSC1組間差別無統(tǒng)計(jì)學(xué)意義。,第四節(jié):隨機(jī)區(qū)組設(shè)計(jì)多個樣本比較的Friedman M檢驗(yàn),Friedman M檢驗(yàn)簡介,Friedman M檢驗(yàn)用于推斷隨機(jī)區(qū)組設(shè)計(jì)的多個相關(guān)樣本所來自總體的分布位置是否有差別。 對分布的形狀不加考慮。,1. 多個相關(guān)樣本比較的Friedman M檢驗(yàn),例8-9 8名受試者對4種頻率聲音的反應(yīng)率,(1)建立檢驗(yàn)假設(shè),確定檢驗(yàn)水準(zhǔn),H0:四種頻率聲音刺激的反應(yīng)率總體分布位置相同 H1:四種頻率聲音刺激的反應(yīng)率總體分布位置不全相同 =0.05,(2)區(qū)組內(nèi)編秩,求統(tǒng)計(jì)量M,將每個區(qū)組內(nèi)的數(shù)據(jù)從小到大排列;

17、 在每個區(qū)組內(nèi)進(jìn)行秩轉(zhuǎn)換,獲得每個數(shù)據(jù)的秩次 數(shù)據(jù)相等時取平均秩次; 計(jì)算各組樣本的秩和Ri,平均秩和 按照公式(8-7)求統(tǒng)計(jì)量M。,(3)確定P值,作出結(jié)論,當(dāng)區(qū)組個數(shù)n15且處理組數(shù)g15時,可通過查閱M界值表(附表12)獲得P值; M值大于相應(yīng)界值時,P值小于對應(yīng)的界值。 當(dāng)區(qū)組個數(shù)n15或處理組數(shù)g15時,則通過公式(8-8)進(jìn)行近似卡方檢驗(yàn),確定P值。 實(shí)際上當(dāng)g4,或者g=4且n5,或者g=3且n9 ,即可采用近似卡方檢驗(yàn)方法。,例8-9分析結(jié)果,本例計(jì)算得M=199.5,查M界值表得雙側(cè)P0.05; 拒絕H0 ,認(rèn)為四種頻率聲音刺激的反應(yīng)率有差別。,2. 多個相關(guān)樣本兩兩比較的q檢驗(yàn),q檢驗(yàn)方法簡介,當(dāng)經(jīng)過多個相關(guān)樣本比較的Friedman M

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論