計量經(jīng)濟學專題01卡方檢驗韓紀江XXXX0810_第1頁
計量經(jīng)濟學專題01卡方檢驗韓紀江XXXX0810_第2頁
計量經(jīng)濟學專題01卡方檢驗韓紀江XXXX0810_第3頁
計量經(jīng)濟學專題01卡方檢驗韓紀江XXXX0810_第4頁
計量經(jīng)濟學專題01卡方檢驗韓紀江XXXX0810_第5頁
已閱讀5頁,還剩60頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

卡方檢驗

chi-squaretest,chi-squared,χ2test卡方檢驗屬于非參數(shù)假設檢驗,適用于布爾型或二項分布數(shù)據(jù),主要用于分類變量.基于兩個概率間的比較,早期用于生產(chǎn)企業(yè)的產(chǎn)品合格率等2022/11/21回顧:Chi-square

ProbabilityDistributionΧ2分布χ2分布[Chisquaredistribution],與正態(tài)分布很相似。是由正態(tài)分布派生出來的一種分布.隨機變量X服從均值為μ,方差為σ2的正態(tài)分布隨機變量Z=(X-μ)/σ是標準正態(tài)變量,即Z~N(0,1)。X~N(μ,σ2)標準正態(tài)變量的平方服從自由度為1的χ2分布用符號表示為,Z2=χ2(1)是平方和中獨立觀察值的個數(shù)。自由度僅為1,這是因為僅考慮一個標準正態(tài)變量令Z1,Z2,?,ZK為K個獨立的標準正態(tài)變量(即每一個變量均是均值為0,方差為1的正態(tài)變量),對所有的變量ZS平方,則它們的平方和服從自由度為K的χ2分布,可證明定義自由度推廣2022/11/22進一步理解設X1,X2,X3,...,Xn,相互獨立,且服從標準正態(tài)分布N(0,1)則稱χ2=X12+X22+X32+...+Xn2,服從自由度為

n

的Χ2

分布記為χ2~χ2(n)χ2分布的概率密度2022/11/23χ2分布的概率密度曲線設X1,X2,X3,...,Xn,相互獨立,且服從正態(tài)分布N(μ,σ2)2022/11/24PropertiesoftheChi-squareDistributionΧ2分布的性質takesonlypositivevalues(afterall,itisthedistributionofasquaredquantity)andrangesfrom0toinfinity.只取正值(是平方和的分布)從0到無限大。1isaskeweddistribution,thedegreeoftheskewnessdependingonthed.f.Forcomparativelyfewd.f.thedistributionishighlyskewedtotheright,butasthed.f.increase,thedistributionbecomesincreasinglysymmetricalandapproachesthenormaldistribution.是斜分布,其偏度取決于自由度大小,自由度越小,越向右偏。隨著自由度增大,逐漸呈對稱,接近正態(tài)分布。2Theexpected,ormean,valueofachi-squarer.v.iskanditsvarianceis2k,wherekisthed.f.Thisisanoteworthypropertyofthechi-squaredistributioninthatitsvarianceistwiceitsmeanvalue.期望為k,方差為2k。即方差是其均值的兩倍。3IfZ1andZ2aretwoindependentchi-squarevariableswithk1andk2d.f.,thentheirsum(Z1+Z2)isalsoachi-squarevariablewithd.f.=(k1+k2).獨立自由變量的自由度可以相加。42022/11/25χ2分布的分位點對于給定的α,α∈(0,1)滿足條件P{χ2>χα2(n)}=∫χα2(n)∞f(y)dy=α的點χα2(n)為χ2(n)分布的上α分位點對于不同的α,n,可以通過查表求得上α分位點的值2022/11/262022/11/272022/11/282022/11/292022/11/2102022/11/211一、卡方檢驗的基本思想1.卡方檢驗:以卡方分布為基礎的一種常用假設檢驗方法,用于比較兩個及以上樣本率(構成比),或兩個分類變量的關聯(lián)性分析。用于2個變量都屬于分類變量(例如性別、婚姻狀態(tài)等,屬于定性數(shù)據(jù))時的數(shù)據(jù)分析比較理論頻數(shù)和實際頻數(shù)的吻合程度或擬合優(yōu)度例如要分析性別與色盲之間(色盲一般分為“有”和“無”2個分類,屬于定性變量)的關系兩個率或兩個構成比的比較,多個率或多個構成比的比較在分類資料統(tǒng)計推斷中的應用包括分類資料的相關分析。2022/11/2122.卡方檢驗的步驟(1)建立零假說(NullHypothesis),即認為觀測值與理論值的差異是由于隨機誤差所致,觀察頻數(shù)與期望頻數(shù)沒有差別。無效假設H0

:假設H0成立,基于此前提,計算理論值(即期望值)。確定數(shù)據(jù)間的實際差異即求出卡方χ2值表示觀察值與理論值之間的偏離程度2022/11/213(2)卡方值的計算殘差=A-EA代表某個類別的觀察頻數(shù)E代表基于H0計算出的期望頻數(shù)表示某一個類別觀察值和理論值的偏離程度一方面因為殘差有正有負,如果將殘差簡單相加,會彼此抵消,總和仍然為0。為此,可以將殘差平方后求和。另一方面殘差大小是一個相對的概念,相對于10,20非常大,但相對于1000就很小??紤]到這一點,將殘差平方除以期望頻數(shù)再求和,以估計觀察頻數(shù)與期望頻數(shù)的差別。將殘差加總2022/11/214χ2統(tǒng)計量公式(i=1,2,3,…,k),k為單元格數(shù)。Χ2公式Ai為i水平的觀察頻數(shù),Ei為i水平的期望頻數(shù)。

n為總頻數(shù),pi為i水平的期望頻率

字母公式當n比較大時,χ2統(tǒng)計量近似服從k-1個自由度的卡方分布。最初是由英國統(tǒng)計學家KarlPearson在1900年首次提出,因此也稱之為Pearsonχ2

。2022/11/215(3)判斷原則χ2值為0

χ2值越小由卡方公式當觀察頻數(shù)與期望頻數(shù)完全一致時觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小χ2值越大反之,觀察頻數(shù)與期望頻數(shù)差別越大,兩者間差異越大小的χ2值表明觀察頻數(shù)接近期望頻數(shù),接近假設大的χ2值表明觀察頻數(shù)遠離期望頻數(shù),即表明遠離假設換言之就傾向于接受H0

就傾向于拒絕H0

χ2是觀察頻數(shù)與期望頻數(shù)之間距離的一種度量指標,也是假設成立與否的度量指標。如果χ2值足夠小如果χ2值足夠大2022/11/216(4)判斷標準選定至于χ2在每個具體研究中究竟要大到什么程度才能拒絕H0

,則要借助于卡方分布求出所對應的P值來確定如卡方值大于某特定概率標準(即顯著性差異)下的理論值則拒絕零假說,即實測值與理論值的差異在該顯著性水平下是顯著的。根據(jù)χ2分布及自由度,確定在H0假設成立的情況下獲得當前統(tǒng)計量及更極端情況的概率P。如果P值很小,說明觀察值與理論值偏離程度太大,應當拒絕無效假設,表示比較資料之間有顯著差異;否則,就不能拒絕無效假設,尚不能認為樣本所代表的實際情況和理論假設有差別。2022/11/217(5)應用條件只有當樣本量比較充足時才可以忽略兩者之間的差異,卡方分布本身是連續(xù)型分布,但是在分類資料的統(tǒng)計分析中,顯然頻數(shù)只能以整數(shù)形式出現(xiàn),因此計算出的統(tǒng)計量是非連續(xù)的。否則將可能導致較大的偏差對于卡方檢驗中的每一個單元格,要求其最小期望頻數(shù)均大于1

且至少有4/5的單元格期望頻數(shù)大于5,

一般認為此時使用卡方分布計算出的概率值才是準確的2022/11/218行列表卡方檢驗的適用條件如果數(shù)據(jù)不符合要求,可以采用不太理想的辦法與鄰近行或列中的實際頻數(shù)合并刪去理論頻數(shù)太小的格子所對應的行或列最理想的辦法增加樣本含量以增大理論頻數(shù)(但是可能嗎)確切概率法2022/11/2193.卡方檢驗的用途檢驗某個連續(xù)變量的分布是否與某種理論分布相一致如是否符合正態(tài)分布、均勻分布、Poisson分布等檢驗某個分類變量各類的出現(xiàn)概率是否等于指定概率如在36選7的彩票抽獎中,每個數(shù)字出現(xiàn)的概率是否各為1/36;擲硬幣時,正反兩面出現(xiàn)的概率是否均為0.5。檢驗某兩個分類變量是否相互獨立如吸煙(二分類變量:是、否)與呼吸道疾?。ǘ诸愖兞浚菏?、否)有關?產(chǎn)品原料種類(多分類變量)是否與合格(二分類變量:是、否)有關?①②③考察某無序分類變量各水平在兩組或多組間分布實際上是否一致2022/11/220控制某種或某幾種分類因素以后,另兩個分類變量是否相互獨立如控制性別、年齡因素影響以后,吸煙是否和呼吸道疾病有關;控制產(chǎn)品加工工藝的影響后,產(chǎn)品原料類別是否與產(chǎn)品合格有關。④檢驗某兩種方法的結果是否一致如采用兩種診斷方法對同一批人進行診斷,其診斷結果是否一致;采用兩種方法對客戶進行價值類別預測,預測結果是否一致。⑤2022/11/2214.舉例四格表(fourfoldtable)步驟(1)計算理論頻數(shù)?;贖0成立,兩樣本所在總體無差別的前提下計算出各單元格的理論頻數(shù)來。計算總的理論齲齒率和理論未齲齒率總的理論齲齒率=患齲齒人數(shù)合計/總調查人數(shù)合計總的理論未齲齒率=未患齲齒人數(shù)合計/總調查人數(shù)合計①實際調查結果牙膏類型患齲齒人數(shù)未患齲人數(shù)調查人數(shù)齲患率(%)含氟牙膏701302000.3500一般牙膏45551000.4500合計1151853000.38332022/11/222理論頻數(shù)與實際頻數(shù)的比較H0成立后,在理論上牙膏類型患齲齒人數(shù)未患齲人數(shù)調查人數(shù)

含氟牙膏76.67123.332000.3833一般牙膏38.3361.671000.3833合計1151853000.3833使用含氟牙膏人群總的理論齲齒率×含氟牙膏調查人數(shù)=使用含氟牙膏齲齒率總的理論未齲齒率×含氟牙膏調查人數(shù)=使用含氟牙膏未齲齒率使用一般牙膏人群總的理論齲齒率×一般牙膏調查人數(shù)=使用一般牙膏齲齒率總的理論未齲齒率×一般牙膏調查人數(shù)=使用一般牙膏未齲齒率2022/11/223步驟(2)計算殘差殘差=A-E設A=某個類別的觀察頻數(shù),E=基于H0計算出的期望頻數(shù)表示某一個類別觀察值和理論值的偏離程度調整殘差殘差有正有負,相加后會彼此抵消,總和仍然為0。為此,將殘差平方后求和,以表示樣本總的偏離無效假設的程度。進一步調整殘差大小是一個相對的概念,相對于期望頻數(shù)為10時,20的殘差非常大;可相對于期望頻數(shù)為1000時20就很小。因此又將殘差平方除以期望頻數(shù)再求和,以標準化觀察頻數(shù)與期望頻數(shù)的差別。最終得卡方統(tǒng)計量公式為:2022/11/224步驟(3)理解從卡方的計算公式可見當觀察頻數(shù)與期望頻數(shù)完全一致時,卡方值為0實際觀察頻數(shù)與期望頻數(shù)越接近,兩者之間的差異越小,卡方值越小;反之實際觀察頻數(shù)與期望頻數(shù)差別越大,兩者之間的差異越大,卡方值越大。當然,卡方值的大小也和單元格數(shù)(自由度)有關。2022/11/225步驟(4)具體操作建立檢驗假設和確定檢驗水準H0:使用含氟牙膏和一般牙膏兒童齲患率相等H1:使用含氟牙膏和一般牙膏兒童齲患率不等=0.05

①②計算檢驗統(tǒng)計量х2值③查附表χ2界值表,得p>0.05?;蛘逤HIINV(0.05,1)】=3.841按=0.05水準,不拒絕H0,尚不能認為使用含氟牙膏比使用一般牙膏兒童的齲患率低。

④2022/11/226卡方檢驗假設的等價性兩組齲齒率相同兩組發(fā)生率的比較實際數(shù)據(jù)的頻數(shù)分布和理論假設相同理論分布與實際分布的檢驗使用不同的牙膏并不會影響齲齒的發(fā)生(兩個分類變量間無關聯(lián))兩變量的相關分析①②③2022/11/227二、各類檢驗點數(shù)ab118202192032320420205162062420檢驗二者的接近程度利用樣本數(shù)據(jù)檢驗總體分布是否為某一特定分布。1.適合度檢驗實際執(zhí)行多項式試驗而得到觀察次數(shù),與假設的期望次數(shù)相比較以擲骰子為例(1)擲一骰子120次各點數(shù)的出現(xiàn)次數(shù)為a各點數(shù)出現(xiàn)的期望值b=120×1/6=202022/11/228零假設H0:觀察分布等于期望分布。點數(shù)ab卡方計算118200.2219200.05323200.45420200516200.8624200.8卡方統(tǒng)計量=2.3卡方臨界值=11.070498計算卡方檢驗統(tǒng)計量【Excel

D2】【=(B2-C2)^2/C2】

【Excel

D8】【=SUM(D2:D7)】卡方統(tǒng)計量=2.3

確定自由度(6-1)×(2-1)=5選擇顯著水平α=0.05

利用Excel提供的CHIINV函數(shù)求臨界值【ExcelD9】【=CHIINV(0.05,5)】,得臨界值11.07比較統(tǒng)計量和臨界值統(tǒng)計量2.3

<臨界值11.07,故差異不顯著,接受H0。2022/11/229例子周日死亡數(shù)期望E差方卡方臨界值一1115.711.41二1915.710.69三1715.710.11四1515.710.03五1315.710.47六1615.710.01日

1915.710.69卡方

3.4012.59CHIINV(0.05,6)=12.59卡方統(tǒng)計量=3.403.40<12.59接受原假設,危險性相同某地一周內各日死亡數(shù)的分布如下表,請檢驗一周內各日的死亡危險性是否相同?2022/11/2302.獨立性檢驗性別有關無關不好說合計男1206050230女10011060270合計220170110500用途用來檢驗兩個屬性間是否獨立一個變量作為行,另一個變量作為列數(shù)據(jù)某機構欲了解現(xiàn)在性別與收入是否有關隨機抽樣500人,詢問對此的看法結果分為“有關、無關、不好說”三種答案確定自由度(3-1)×(2-1)=2選擇顯著水平α=0.05

2022/11/231零假設H0:性別與收入無關。抽樣數(shù)據(jù)性別有關無關不知道合計男1206050230女10011060270合計220170110500期望值性別有關無關不知道合計男101.278.250.6230女118.891.859.4270合計220170110500求男女對收入與性別相關性看法的期望次數(shù)采用所在行列合計值相乘,除以總計值來計算每一個期望值【Excel

B9=B5*E3/E5】【Excel

B10=B5*E4/E5】

【Excel

C9=C5*E3/E5】【ExcelC10=C5*E4/E5】【Excel

D9=D5*E3/E5】【Excel

D10=D5*E4/E5】

2022/11/232抽樣數(shù)據(jù)性別有關無關不知道合計男1206050230女10011060270合計220170110500期望值性別有關無關不知道合計男101.278.250.6230女118.891.859.4270合計220170110500卡方統(tǒng)計量性別有關無關不知道合計男3.494.240.017.74女2.983.610.016.59

14.32

卡方臨界值5.9915利用卡方統(tǒng)計量公式計算統(tǒng)計量【ExcelB15=(B3-B9)^2/B9】其余單元格依次類推。加總χ2=14.32利用Excel提供的CHIINV函數(shù)求臨界值【Excel

E19=CHIINV(0.05,2)】,得臨界值5.9915比較統(tǒng)計量和臨界值統(tǒng)計量14.32>臨界值5.9915,故拒絕零假設。2022/11/233藥物療效試驗原始數(shù)據(jù)處理措施有效無效合計新藥組41344傳統(tǒng)藥物組18624合計59968計算期望值處理措施有效無效合計新藥組38.185.8244傳統(tǒng)藥物組20.823.1824合計59968計算卡方處理措施有效無效合計新藥組0.211.37

傳統(tǒng)藥物組0.382.51

卡方臨界值卡方0.593.884.473.8415比較某新藥與傳統(tǒng)藥物治療腦動脈硬化的療效,臨床試驗結果見表,問兩種藥物的療效有無差異?2022/11/2343.統(tǒng)一性檢驗抽查統(tǒng)計結果滿意程度南京北京合計非常滿意100110210滿意程度150160310不滿意180170350非常不滿意170160330合計6006001200檢驗兩個或兩個以上總體的某一特性分布,也就是各“類別”的比例是否統(tǒng)一或相近數(shù)據(jù)從南京抽出600居民,北京抽取600居民每個居民對滿意程度(非常滿意、滿意、不滿意、非常不滿意)任選一種,且只能選一種想了解南京和北京市民對最低生活保障的滿意程度是否相同2022/11/235南京和北京居民對最低生活保障滿意程度的比例相同零假設H0=(4-1)×(2-1)=3確定自由度α=0.05選擇顯著水平【=CHIINV(0.05,3)】=7.81求解卡方檢驗的臨界值2022/11/236計算北京和南京不同滿意程度的期望值抽查統(tǒng)計結果滿意程度南京北京合計非常滿意1001102107.815滿意程度150160310不滿意180170350非常不滿意170160330合計6006001200期望值滿意程度南京北京合計非常滿意105105滿意程度155155不滿意175175非常不滿意165165合計【ExcelB11=$B$7*D3/$D$7】【ExcelC11=$C$7*D3/$D$7】【Excel選中B11:C11】【按住C11右下角,填充至C14】2022/11/237抽查統(tǒng)計結果滿意程度南京北京合計非常滿意1001102107.815滿意程度150160310不滿意180170350非常不滿意170160330合計6006001200期望值滿意程度南京北京合計非常滿意105105滿意程度155155不滿意175175非常不滿意165165合計統(tǒng)計量滿意程度南京北京合計非常滿意0.2380.2380.476滿意程度0.1610.1610.323不滿意0.1430.1430.286非常不滿意0.1520.1520.303合計0.6940.6941.388計算卡方統(tǒng)計量【ExcelB19=(B3-B11)^2/B11】其余單元格依次類推。比較統(tǒng)計量和臨界值統(tǒng)計量1.388<臨界值7.815,故接受零假設。2022/11/238行列表——新藥療效實驗數(shù)據(jù)關節(jié)炎類型

有效

無效

合計類風濕性關節(jié)炎9718115風濕性關節(jié)炎372057骨性關節(jié)炎141731合計14855203理論頻數(shù)關節(jié)炎類型

有效

無效

合計類風濕性關節(jié)炎83.8431.16115風濕性關節(jié)炎41.5615.4457骨性關節(jié)炎22.608.4031合計14855203計算卡方關節(jié)炎類型

有效

無效合計類風濕性關節(jié)炎2.065.56

風濕性關節(jié)炎0.501.34

骨性關節(jié)炎3.278.81

卡方臨界值合計5.8415.7121.555.9915用某新藥治療不同類型關節(jié)炎的療效如表,問該藥治療不同類型關節(jié)炎的療效是否有差別?建立假設H0:三種不同類型關節(jié)炎的療效相同H1:三種不同類型關節(jié)炎的療效不全相同求出統(tǒng)計量下結論2022/11/2394.雙變量無序:Pearson卡方雙變量無序:Pearson卡方行列表資料統(tǒng)計分析【Stata】tabi556344\456923\575436tabi556344\456923\575436|colrow|123|Total-----------+---------------------------------+----------1|556344|1622|456923|1373|575436|147-----------+---------------------------------+----------Total|157186103|446Pearsonchi2(4)=8.1064Pr=0.0882022/11/240三、列聯(lián)表的卡方檢驗專用公式R行C列表資料卡方檢驗的卡方值

=n[(A11/n1n1+A12/n1n2+…+Arc/nrnc)-1]

1.行×列表資料的卡方檢驗:用于多個率或多個構成比的比較。同一組對象觀察每一個個體對兩種分類方法的表現(xiàn)結果構成雙向交叉排列的統(tǒng)計表就是列聯(lián)表2022/11/241行×列表卡方檢驗的條件否則當有E<1或1<E<5的格子較多時可采用并行并列、刪行刪列、增大樣本含量的辦法使其符合行×列表資料卡方檢驗的應用條件而多個率的兩兩比較可采用行×列表分割的辦法卡方檢驗的理論頻數(shù)不能太小R×C表中理論數(shù)小于5的格子不能超過1/5

不能有小于1的理論數(shù)2022/11/2422.四格表y1y2總計x1aba+bx2cdc+d總計a+cb+da+b+c+d有兩個分類變量X和Y它們的值域分別為{x1,x2}和{y1,y2},

其樣本頻數(shù)列聯(lián)表為:四個格子的頻數(shù)分別為a,b,c,d

利用獨立性檢驗,來較精確地考察兩個變量是否有關系H0:X不因Y而存在差異。

H1:X與Y有關系算出卡方值卡方值=(a+b+c+d)(ad-bc)^2/[(a+b)(c+d)(a+c)(b+d)]

其中a+b+c+d為樣本容量自由度v=(行數(shù)-1)(列數(shù)-1)此處k=2,也就是k-1,卡方值越大,說明“X與Y有關系”的可能性越大。也就是說,X因Y而出現(xiàn)差異。假設2022/11/243應用條件P(χ2≥k)0.500.400.250.150.100.050.0250.0100.0050.001k0.4550.7081.3232.0722.7063.8415.0246.6357.87910.828若所有的理論數(shù)E≥5、且總樣本量n≥40,用Pearson卡方檢驗如果有理論數(shù)1≤E<5,且n≥40,用連續(xù)性校正卡方檢驗如果有理論數(shù)E<1或n<40,則用Fisher’s檢驗,只能用確切概率法計算概率。

當表中數(shù)據(jù)a,b,c,d都不小于5時,可以查閱下表來確定結論“X與Y有關系”的可信程度例如當“X與Y有關系”的χ2變量的值為6.109,根據(jù)表格,因為5.024≤6.109<6.635,所以“X與Y有關系”成立的概率為1-0.025=0.975,即97.5%。2022/11/244四格表資料——大白鼠致癌劑統(tǒng)計數(shù)據(jù)處理發(fā)癌數(shù)未發(fā)癌數(shù)合計發(fā)癌率%未發(fā)癌率%甲組5219710.7320.268乙組393420.9290.071合計91221130.8050.195期望值處理發(fā)癌數(shù)未發(fā)癌數(shù)合計甲組57.213.871.0乙組33.88.242.0合計91.022.0113.0統(tǒng)計量處理發(fā)癌數(shù)未發(fā)癌數(shù)合計

甲組0.471.942.41

乙組0.793.284.07卡方臨界值合計

6.483.841兩組大白鼠在不同致癌劑作用下的發(fā)癌率如下,問兩組有無差別?每格中的理論頻數(shù)E是在假定兩組發(fā)癌率相等(均等于兩組合計發(fā)癌率)情況下計算出來的如第一行第一列的理論頻數(shù)為71*(91/113)=57.18計算卡方值【Excel

B15=(B3-B9)^2/B9】匯總所有卡方值=6.48計算卡方臨界值【=CHIINV(0.05,1)】=3.8416.48>3.841,說明有差別公式:卡方值=(52+19+39+3)*(52*3-19*39)^2/((52+19)*(39+3)*(52+39)*(19+3))=6.482022/11/2453.四格表的兩種用途卡方值=(ad-bc)2×(a+b+c+d)/(a+b)(c+d)(a+c)(b+d),

卡方值計算公式不同,可以達到不同目的此時用于進行配對四格表的相關分析,如考察兩種檢驗方法的結果有無關系卡方值=(b?c)2/(b+c)時用來進行四格表的差異檢驗,如考察兩種檢驗方法的檢出率有無差別(1)用一般四格表的卡方檢驗計算(2)2×2表格的配對樣本2022/11/246(1)一般四格表的卡方檢驗牙膏類型患齲齒人數(shù)未患齲齒人數(shù)調查人數(shù)齲患率(%)含氟牙膏70(76.67)130(123.33)20035.00一般牙膏45(38.33)55(61.67)10045.00合計11518530038.33使用含氟牙膏與一般牙膏兒童的齲患率建立檢驗假設和確定檢驗水準H0:使用含氟牙膏和一般牙膏兒童齲患率相等H1:使用含氟牙膏和一般牙膏兒童齲患率不等=0.05

計算統(tǒng)計量χ2值查附表χ2界值表,得p>0.05?;蛘逤HIINV(0.05,1)】=3.841按=0.05水準,不拒絕H0,尚不能認為使用含氟牙膏比使用一般牙膏兒童的齲患率低。

2022/11/247操作步驟卡方值=(a+b+c+d)(ad-bc)^2/[(a+b)(c+d)(a+c)(b+d)]

對于四格表,卡方的計算公式又可進行簡化,以方便手工計算對計算機而言這種簡化,并無實際價值Stata程序:tabiab\cd,chi2,非常簡單了比如Stata中輸入:tabi70130\4555,chi2.tabi70130\4555,chi2|colrow|12|Total-----------+----------------------+----------1|70130|2002|4555|100-----------+----------------------+----------Total|115185|300Pearsonchi2(1)=2.8202Pr=0.0932022/11/248四格表——兩種藥物治療腦動脈硬化的療效為比較某新藥與傳統(tǒng)藥物治療腦動脈硬化的療效,臨床試驗結果見表,問兩種藥物的療效有無差異?tabi413\186,chi2|colrow|12|Total-----------+----------------------+----------1|413|442|186|24-----------+----------------------+----------Total|599|68Pearsonchi2(1)=4.4705Pr=0.034原始數(shù)據(jù)

處理措施有效無效合計新藥組41344傳統(tǒng)藥物組18624合計59968

計算期望值

處理措施有效無效合計新藥組38.185.8244傳統(tǒng)藥物組20.823.1824合計59968

計算卡方

處理措施有效無效合計新藥組0.211.37

傳統(tǒng)藥物組0.382.51

卡方計算值0.593.884.47卡方臨界值

3.8415【Stata】tabiab\cd,chi22022/11/249(2)McNemar'stest,用于2×2表格的配對樣本原始數(shù)據(jù)A法B法+-合計+56(a)35(b)91-21(c)28(d)49合計7763140用A、B兩種方法檢查已確診的乳腺癌患者140名A法檢出91名(65%),B法檢出77名(55%),A、B兩法一致檢出56名(40%),問哪種方法陽性檢出率更高?配對設計兩樣本率比較的χ2檢驗2022/11/250自身配對設計:對同一個個體有兩次不同的測量。應當求出各對的差值,首先考察差值的分布是否按照H0假設的情況對稱分布然后整理出配對四格表最終原始數(shù)據(jù)A法B法+-合計+56(a)35(b)91-21(c)28(d)49合計7763140主對角線上兩種檢驗方法的結論a,d

相同,對問題解答不會有任何貢獻另兩個單元格b,c才代表了檢驗方法間的差異2022/11/251假設檢驗步驟假設H0:兩法總體陽性檢出率無差別,即b=cH1:兩法總體陽性檢出率有差別,即bcEb=Ec=(b+c)/2根據(jù)H0得b、c兩格理論數(shù)均為對應的配對檢驗統(tǒng)計量為【Stata】Mcci56352128

.mcci56352128|Controls|Cases|ExposedUnexposed|Total-----------------+------------------------+------------Exposed|5635|91Unexposed|2128|49-----------------+------------------------+------------Total|7763|140McNemar'schi2(1)=3.50Prob>chi2=0.0614ExactMcNemarsignificanceprobability=0.0814按=0.05水準,不拒絕H02022/11/252McNemar檢驗的條件一般在b+c<40時需用確切概率法進行檢驗,或者進行校正。問題因此,對于一致性較好的大樣本數(shù)據(jù),McNemar檢驗會失去實用價值McNemar檢驗只關心兩者不一致的評價情況,用于比較兩個評價者間存在怎樣的傾向例如對1萬個案例進行一致性評價,9995個都是完全一致的,在主對角線上,另有5個分布在左下的三角區(qū),顯然,此時一致性相當?shù)暮?。但如果使用McNemar檢驗,此時反而會得出兩種評價有差異的結論來。2022/11/253四、四格表χ2值的校正英國統(tǒng)計學家Yates認為,χ2分布是一種連續(xù)型分布,而四格表資料是分類資料,屬離散型分布,由此計算的χ2值的抽樣分布也應當是不連續(xù)的,當樣本量較小時,兩者間的差異不可忽略,應進行連續(xù)性校正(在每個單元格的殘差中都減去0.5)校正要求若n>40,此時有1<T5時,需計算Yates連續(xù)性校正χ2值Yates連續(xù)性校正T<1,或n<40時,應改用Fisher確切概率法直接計算概率Fisher確切概率法皮爾森卡方檢定皮爾森卡方檢定是最有名的卡方檢驗,當提到卡方檢定而沒有特別注明是哪一種時,便是指皮爾森卡方檢定。有兩種用途,分別是“適配度檢定”(GoodnessofFittest)以及“獨立性檢定”。2022/11/2541.葉氏連續(xù)性修正(Ya

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論