第十章 卡方檢驗_第1頁
第十章 卡方檢驗_第2頁
第十章 卡方檢驗_第3頁
第十章 卡方檢驗_第4頁
第十章 卡方檢驗_第5頁
已閱讀5頁,還剩39頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

第十章卡方檢驗第1頁,共44頁,2023年,2月20日,星期三

本章教學目的:推斷:兩個總體率或構成比之間有無差別多個總體率或構成比之間有無差別兩個分類變量之間有無關聯(lián)性頻數分布擬合優(yōu)度的檢驗

第2頁,共44頁,2023年,2月20日,星期三

檢驗的基本思想第3頁,共44頁,2023年,2月20日,星期三四格表資料的基本形式

第4頁,共44頁,2023年,2月20日,星期三基本思想:可通過檢驗的基本公式來理解。式中,A為實際頻數(actualfrequency),

T為理論頻數(theoreticalfrequency)。第5頁,共44頁,2023年,2月20日,星期三

檢驗統(tǒng)計量值反映了實際頻數與理論頻數的吻合程度。若檢驗假設H0:π1=π2成立,四個格子的實際頻數A與理論頻數T相差不應該很大,即統(tǒng)計量不應該很大。如果值很大,即相對應的P值很小,若,則反過來推斷A與T相差太大,超出了抽樣誤差允許的范圍,從而懷疑H0的正確性,繼而拒絕H0,接受其對立假設H1,即π1≠π2。第6頁,共44頁,2023年,2月20日,星期三

由公式還可以看出:值的大小還取決于個數的多少(嚴格地說是自由度ν的大小)。由于各皆是正值,故自由度ν愈大,值也會愈大;所以只有考慮了自由度ν的影響,值才能正確地反映實際頻數A和理論頻數T的吻合程度。檢驗的自由度取決于可以自由取值的格子數目,而不是樣本含量n。四格表資料只有兩行兩列,=1,即在周邊合計數固定的情況下,4個基本數據當中只有一個可以自由取值。第7頁,共44頁,2023年,2月20日,星期三樣本率與總體率比較

例:全國高血壓病調查結果:城市人口高血壓病患病率19.6%;某調查獲得有高血壓病家族史者358人,其中高血壓病者127人(P=35.47%)問:有高血壓病家族史者患病率是否高于一般人群?第8頁,共44頁,2023年,2月20日,星期三+-合計實際(A)127231358理論(T)70.168287.832358Chi-Square=57.252第9頁,共44頁,2023年,2月20日,星期三第一節(jié)2×2表檢驗

第10頁,共44頁,2023年,2月20日,星期三目的:推斷兩個總體率(構成比)是否有差別(和u檢驗等價)資料:兩樣本的兩分類個體數排列成四格表資料第11頁,共44頁,2023年,2月20日,星期三四格表資料檢驗的專用公式第12頁,共44頁,2023年,2月20日,星期三

分布是一連續(xù)型分布,而四格表資料屬離散型分布,由此計算得的統(tǒng)計量的抽樣分布亦呈離散性質。為改善統(tǒng)計量分布的連續(xù)性,則進行連續(xù)性校正。第13頁,共44頁,2023年,2月20日,星期三四格表資料檢驗公式選擇條件:

,不校正的理論或專用公式;,校正公式,直接計算概率。

連續(xù)性校正僅用于的四格表資料,當時,一般不作校正。

第14頁,共44頁,2023年,2月20日,星期三四格表資料檢驗的校正公式

第15頁,共44頁,2023年,2月20日,星期三

P151:例10-1

第16頁,共44頁,2023年,2月20日,星期三第17頁,共44頁,2023年,2月20日,星期三第18頁,共44頁,2023年,2月20日,星期三P153:例10-2第19頁,共44頁,2023年,2月20日,星期三第20頁,共44頁,2023年,2月20日,星期三第21頁,共44頁,2023年,2月20日,星期三兩相關樣本率檢驗(McNemar檢驗)

配對四格表資料的檢驗第22頁,共44頁,2023年,2月20日,星期三

P155:例10-4:第23頁,共44頁,2023年,2月20日,星期三檢驗統(tǒng)計量為第24頁,共44頁,2023年,2月20日,星期三注意:

本法一般用于樣本含量不太大的資料。因為它僅考慮了兩法結果不一致的兩種情況(b,c),而未考慮樣本含量n和兩法結果一致的兩種情況(a,d)。所以,當n很大且a與d的數值很大(即兩法的一致率較高),b與c的數值相對較小時,即便是檢驗結果有統(tǒng)計學意義,其實際意義往往也不大。第25頁,共44頁,2023年,2月20日,星期三第二節(jié)R×C表檢驗

第26頁,共44頁,2023年,2月20日,星期三行×列表資料①

多個樣本率比較時,有R行2列,稱為R×2表;②

兩個樣本的構成比比較時,有2行C列,稱2×C表;③

多個樣本的構成比比較,以及雙向無序分類資料關聯(lián)性檢驗時,有行列,稱為R×C表。第27頁,共44頁,2023年,2月20日,星期三檢驗統(tǒng)計量第28頁,共44頁,2023年,2月20日,星期三多個樣本率的比較

P156:例10-6第29頁,共44頁,2023年,2月20日,星期三第30頁,共44頁,2023年,2月20日,星期三兩組構成比的比較P157:例10-7第31頁,共44頁,2023年,2月20日,星期三多個樣本率間的多重比較Bonferroni法基本思想:為保證犯第I類錯誤的概率總和不超過ALPHA,調整每一兩兩比較的檢驗水準P159:例10-9第32頁,共44頁,2023年,2月20日,星期三R×C表檢驗的條件第33頁,共44頁,2023年,2月20日,星期三1.行列表中的各格T≥1,并且1≤T<5的格子數不宜超過1/5格子總數,否則可能產生偏性。處理方法有三種:

增大樣本含量以達到增大理論頻數的目的,屬首選方法,只是有些研究無法增大樣本含量第34頁,共44頁,2023年,2月20日,星期三根據專業(yè)知識,刪去理論頻數太小的行或列,或將理論頻數太小的行或列與性質相近的鄰行或鄰列合并。這樣做會損失信息及損害樣本的隨機性。注意:不同年齡組可以合并,但不同血型就不能合并。改用雙向無序R×C表的Fisher確切概率法(可用SAS軟件實現)。第35頁,共44頁,2023年,2月20日,星期三關聯(lián)性分析2

×2表的關聯(lián)P154:例10-3第36頁,共44頁,2023年,2月20日,星期三第37頁,共44頁,2023年,2月20日,星期三關聯(lián)性分析配對四格表的關聯(lián)P156:例10-5第38頁,共44頁,2023年,2月20日,星期三第39頁,共44頁,2023年,2月20日,星期三關聯(lián)性分析行×列表的關聯(lián)P157:例10-8第40頁,共44頁,2023年,2月20日,星期三第41頁,共44頁,2023年,2月20日,星期三R×C表資料Chi-Square檢驗

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論