版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、分類變量的重復(fù)測量分類變量的重復(fù)測量資料分析資料分析流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室流行病與衛(wèi)生統(tǒng)計(jì)學(xué)教研室沈毅沈毅2005.3.15 分類變量分類變量(categorical variable)又稱為定性變量(qualitative variable),在工作中應(yīng)用甚廣。根據(jù)其不同的取值性質(zhì),又可分為3種類型: 第一種是名義刻度名義刻度(nominal scale)的分類變量,它是按事物屬性分類的變量,如性別、職業(yè)等。在統(tǒng)計(jì)學(xué)上為了計(jì)算方便,將這些不同的屬性進(jìn)行數(shù)量化處理,如男性賦值為1,女性賦值為2。這種數(shù)值只是作為屬性的代碼,其間并無大小之分。 第二種為有序刻度有序刻度(ordinal scal
2、e)的分類變量,它是根據(jù)事物呈現(xiàn)出的程度或水平不同進(jìn)行賦值。如臨床化驗(yàn)結(jié)果用符號“-、+、+、+”,文化程度用“文盲、小學(xué)、中學(xué)、大學(xué)、研究生”來劃分等級,在進(jìn)行數(shù)量化處理時(shí)賦值1、2、3、。這里需要注意的是,1與2之差不一定等于2與3之差。 第三種是區(qū)間刻度區(qū)間刻度(interval scale),如人口學(xué)統(tǒng)計(jì)中的年齡分組,“0-,10-,20-,”就是典型的例子。根據(jù)資料的性質(zhì),區(qū)間跨度有等距的,也有不等距的。 把分類變量作為反應(yīng)變量進(jìn)行重復(fù)觀察的情形在工作中應(yīng)用較廣。在本書第九章第五節(jié)中介紹了二分類反應(yīng)變量的重復(fù)測量資料分析方法。 本章將介紹分類反應(yīng)變量重復(fù)測量資料的一般分析方法。主要介
3、紹加權(quán)最小二乘法分析方法。第一節(jié)一個(gè)總體的二分類反應(yīng)重復(fù)測量資料的分析。第一節(jié)第一節(jié) 二分類反應(yīng)重復(fù)測量二分類反應(yīng)重復(fù)測量資料的分析資料的分析一、資料結(jié)構(gòu) 設(shè)有n例受試者,反應(yīng)變量y,分為 r水平(當(dāng)r=2時(shí)稱y為二分類反應(yīng)變量),有p個(gè)觀測時(shí)間點(diǎn),每一受試者可能出現(xiàn)的結(jié)果共有rp種。當(dāng)r=2、p=3時(shí)的所有可能結(jié)果共有8種。當(dāng)對y用(0,1)賦值方法時(shí),n例受試者在這8種組合情況下出現(xiàn)的邊際合計(jì)數(shù)為n000至n111。詳細(xì)分配情況見下面示意圖圖11 .1。 邊際合計(jì)數(shù)n000至n111是每種可能取值結(jié)果組合情況下的觀察例數(shù)??偫龜?shù)n為邊際合計(jì)數(shù)之和。如果將上述示意圖資料按獨(dú)立觀察資料整理各時(shí)
4、間點(diǎn)的頻數(shù)分布時(shí)(表11.1),每一時(shí)間點(diǎn)的合計(jì)數(shù)都為n=n1+=n2+=n3+,總例數(shù)變成了3n而不是n。但實(shí)際是觀察例數(shù)為n,觀察次數(shù)為3n。一般統(tǒng)計(jì)學(xué)方法是以表11 .1的資料類型為出發(fā)點(diǎn)進(jìn)行分析的。而本章介紹的方法是以圖11 .1的邊際合計(jì)數(shù)為出發(fā)點(diǎn)進(jìn)行分析的。二、模型結(jié)構(gòu) 受試者i在時(shí)間點(diǎn)j的反應(yīng)變量為yij ,其取值概率為pj,(j=1,p)。單總體重復(fù)測量資料的任務(wù)為是要分析這p個(gè)概率p1,pp,是否相等。令反應(yīng)頻數(shù)的某種函數(shù)即反應(yīng)函數(shù)(response function)Ff(m),建立的線性模型為: 式中X為dq維的設(shè)計(jì)矩陣,d=(r-1)p,為反應(yīng)函數(shù)。B為q維未知參數(shù)。
5、由于每一個(gè)體在不同時(shí)間點(diǎn)的反應(yīng)變量的取值是相關(guān)的,因此,在配合模型時(shí)應(yīng)將這種相關(guān)性納入模型中。對式(11.1)求參數(shù)估計(jì)值的加權(quán)最小二乘解法就是在考慮到這種相關(guān)性的基礎(chǔ)上建立起來的。模型(11.1)的加權(quán)最小二乘解法求參數(shù)的估計(jì)值 的計(jì)算公式為 例11.1一項(xiàng)藥物對風(fēng)濕性關(guān)節(jié)炎的治療效果觀察。用一種藥物對46名患風(fēng)濕性關(guān)節(jié)炎的病人進(jìn)行治療,共三個(gè)療程。每個(gè)療程結(jié)束后評價(jià)其治療效果。有效者記為yij=1,否則yij=0 i=1,,46; j=1,2,3。資料列于表11.2中。表中的T1,T2,T3分別代表三個(gè)療程。本項(xiàng)研究的目的是探討不同療程的療差別。三、配合線性模型的步驟 表11.2為資料的原
6、始記錄形式,需要將其整理成邊際頻數(shù)表的格式后再配合模型。計(jì)算步驟介紹如下。 1.首先用下列SAS程序計(jì)算邊際合計(jì)數(shù) 程序中的subj為受試者號,time1、time2、time3代表3個(gè)療程。計(jì)算出的邊際頻數(shù)列于表11.3中。從而得到邊際頻數(shù)向量n及其函數(shù)邊際頻率向量m為: n= (6 16 2 4 2 4 6 6) M=(6/46 0.3478 0.0435 0.0870 0.0435 0.0870 0.1304 0.1304) 用nj及mj表示向量n及m中的元素。 2.給出轉(zhuǎn)換矩陣A 本例的轉(zhuǎn)換矩陣A的結(jié)構(gòu)為 A的作用是將反應(yīng)頻率M轉(zhuǎn)換成反應(yīng)函數(shù)F。 3. 求出反應(yīng)函數(shù)F 它是每一時(shí)間點(diǎn)反
7、應(yīng)變量各個(gè)水平的邊際概率。但它不包含該反應(yīng)變量最后一個(gè)水平的反應(yīng)概率。本例有3個(gè)時(shí)間點(diǎn)(time1 time2 time3),每個(gè)時(shí)間點(diǎn)的反應(yīng)變量為r=2水平,故每一時(shí)間點(diǎn)只有一個(gè)反應(yīng)函數(shù)。共有3個(gè)反應(yīng)函數(shù)為: 如f1=0.6086957=0.1304348+0.3478261+0.0434783+0.0869565 以上分析可用SAS的CATMOD過程。程序如下: PROC CATMOD DATA=exmp11_1 order=DATA; RESPONSE MARGINALS; MODEL time1*time2*time3=_RESPONSE_/ONEWAY COV; REPEATED t
8、ime3/_RESPONSE_=time; RUN; 程序中的RESPONSE MARGINALS語句是指定反應(yīng)函數(shù)為在MODEL中規(guī)定的反應(yīng)變量的邊際概率。輸出結(jié)果見表11.5、 表11.6、 表11.7。 從輸出的表11.5反應(yīng)函數(shù)和協(xié)方差矩陣中看出,第一和第二療程的有效率都為0.6087(60.87%),第三療程的有效率為0.3478(34.78%)。從表11.6方差分析看,標(biāo)記time的有效率分析,第三療程的效果顯著低于前兩個(gè)療程。對各療程療效一致性的假設(shè)檢驗(yàn)可用下列公式計(jì)算。令對比矩陣C為: 從表11.7加權(quán)最小二乘估計(jì)值分析可見,有關(guān)TIME的兩個(gè)參數(shù)估計(jì)值都為正值,反映藥物在療程
9、1、2期的效果優(yōu)于第3期的效果。在程序中的REPEATED語句的下面加入CONTRAST語句:CONTRAST time1 VS time3_RESPONSE_2 1; 或CONTRAST time1 VS time3 ALL _PARMS 0 2 1;為了檢驗(yàn)第一療程與第三療程療效的相等性,所用的檢驗(yàn)假設(shè)為: Ho:22 3或Ho : 2 2 3 0 ;H1:2 2 3 0 這是因?yàn)樵趨?shù)化時(shí)用了關(guān)系式4 2 3( 4代表第三療程療效),故有2 4等價(jià)于2 2 3 上述SAS程序是用每個(gè)病例的記錄建立數(shù)據(jù)集配合模型用的,也可以用頻數(shù)表資料(表11.3)配合模型。所用SAS程序?yàn)椋旱玫捷敵鼋Y(jié)果
10、見表11.8。從表11.8對比分析看出,第一期的療效與第三期療效間有顯著差異(P0.0161)。DATA exmpl 1_1; INPUT time1 time2 time3 count;CARDS; 1 1 1 6 1 1 0 16 1 0 1 2 1 0 0 4 0 1 1 2 0 1 0 4 0 0 1 6 0 0 0 6 ;PROC CATMOD DATA=exmpl 1_1 ORDER=DATA; RESPONSE MARGINALS; WEIGHT count;MODEL time1*time2*time3=_RESPONSE_/ONEWAY COV; REPEATED time3
11、/_RESPONSE_=time;RUN;第二節(jié) 多組資料的分析方法 當(dāng)有多組資料時(shí),統(tǒng)計(jì)分析所要回答的問題有三點(diǎn): 資料是否存在組間差異。 反應(yīng)是否隨時(shí)間變化。 是否存在處理組與時(shí)間之間的交互效應(yīng)。分析所用公式以及計(jì)算步驟與單總體的情形基本一致。 下面用一個(gè)具有二分類反應(yīng)變量的2組重復(fù)測量資料為例加以介紹。 例11.2 對65歲及以上老年人參與某項(xiàng)社會活動(dòng)的6年追蹤調(diào)查。樣本量為男性662人,女性1311人,分別在當(dāng)年、第3年和第6年調(diào)查他們參與社會活動(dòng)的情況。反應(yīng)變量y的賦值規(guī)則為: y= 1 經(jīng)常參加該項(xiàng)社會活動(dòng) 0 不經(jīng)常參加該項(xiàng)社會活動(dòng) 資料列于表11.9中。 本例的分組變量為性別,
12、分組數(shù)a2。反應(yīng)變量y的分類數(shù):r2。重復(fù)測量時(shí)間點(diǎn)數(shù)p3。計(jì)算步驟如下。 1列出邊際頻數(shù)矩陣N及相應(yīng)的邊際頻率矩陣M 每一組的邊際頻數(shù)占一列,即N(n1,n2 )。與之對應(yīng),每一組的邊際頻率也占頻率矩陣中的一列,即M(ml,m2) 。 同時(shí)可以建立一個(gè)161維的邊際頻率向量L為: L(0.69 0.07 0.02 0.04 0.03 0.02 0.02 0.12 0.59 0.05 0.02 0.04 0.02 0.03 0.03 0.22) 2. 建立轉(zhuǎn)換矩陣A 由于每一組都是3個(gè)反應(yīng)變量,每一反應(yīng)變量具有2個(gè)水平,所以所建立的轉(zhuǎn)換矩陣A與例11 1的A完全相同。即3計(jì)算反應(yīng)函數(shù)F 4分組
13、計(jì)算邊際頻率mg(g1,2)的協(xié)方差矩陣V(ml)和V(m2) 5兩組反應(yīng)頻率的協(xié)方差矩陣V(M)本例的V(M)為1616維矩陣,對角元素為V(mg),非主對角元素為0。 6求F的協(xié)方差矩陣V(F) 本例的V(F)為66維矩陣:7定設(shè)計(jì)矩陣X 例11.2資料的設(shè)計(jì)矩陣(含交互效應(yīng))見表11.11故本例含有交互作用項(xiàng)的設(shè)計(jì)矩陣為: 8用式(11 .2)計(jì)算參數(shù)估計(jì)值(表11.12)9用對比矩陣C作兩組比較的假設(shè)檢驗(yàn) C的結(jié)構(gòu)為:利用式(11.6)得到231.38,自由度3,查附表3: 2界值表,有20.05(3)7.81,反映兩組間的差異有統(tǒng)計(jì)學(xué)意義。以上計(jì)算過程所用SAS程序如下:DATA e
14、xmpl 1_2; input gender $ year0 year3 year6 count ;CARDS; f 1 1 1 904 f 1 1 0 88 f 1 0 1 25 f 1 0 0 51 f 0 1 1 33 f 0 1 0 22 f 0 0 1 30 f 0 0 0 158 m 1 1 1 391 m 1 1 0 36 m 1 0 1 12 m 1 0 0 143 m 0 1 1 15 m 0 1 0 21 m 0 0 1 18 m 0 0 0 143 ;PROC CATMOD ORDER=DATA; WEIGHT count; RESPONSE marginals; MOD
15、EL year0*year3*year6=gender| _RESPONSE_/PRED=FREQ COV; REPEATED year; RUN;輸出結(jié)果見表11.13表11.17。 從輸出表11 .17方差分析結(jié)果看,性別(gender)和年份(year)都有顯著的統(tǒng)計(jì)學(xué)意義(P0.0001);但性別*年份(gender*year)間交互作用無顯著的統(tǒng)計(jì)學(xué)意義(P0.6476)。 因此,在模型中剔除交互作用項(xiàng)后從新配合下列模型: MODEL year0*year3*year6genderRESPONSE/FREDFREQ COV; 得到輸出結(jié)果見表11 .18,表11.19。 輸出結(jié)果表11.19表明,性別間的差異和年份間的差異都具有統(tǒng)計(jì)學(xué)意義。由于無性別關(guān)年份交互作用,所以不同性別受試者對參與某項(xiàng)社會活動(dòng)的時(shí)間趨勢是類似的。 為進(jìn)一步驗(yàn)證這一結(jié)論,可對不同時(shí)間的效應(yīng)進(jìn)行兩兩比較。提出的檢驗(yàn)假設(shè)為: H0: year3-year0=year6-year3, H1:year3-year0year6-year3,由于在參數(shù)化中year0 , year3的效應(yīng)是用3和4表示的,year6的效應(yīng)則為34。故上述假設(shè)用參數(shù)表示為: 在表11.19加權(quán)最小二乘估計(jì)值分析中已給出了檢
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 北京中國文物交流中心面向社會招聘高層次專業(yè)技術(shù)人員筆試歷年參考題庫附帶答案詳解
- 北京2025年北京市房山區(qū)燕山教育委員會所屬事業(yè)單位第一批招聘教師筆試歷年參考題庫附帶答案詳解
- 北京2025年中國中醫(yī)科學(xué)院中藥資源中心招聘應(yīng)屆生(第二批)筆試歷年參考題庫附帶答案詳解
- 2025吉林大學(xué)白求恩第一醫(yī)院呼吸與危重癥醫(yī)學(xué)科技術(shù)員招聘2人備考題庫完整參考答案詳解
- 麗水2025年浙江省麗水市蓮都區(qū)人才引進(jìn)(浙江大學(xué))招聘筆試歷年參考題庫附帶答案詳解
- 中央2025年中華全國供銷合作總社直屬事業(yè)單位招聘49人筆試歷年參考題庫附帶答案詳解
- 上海上海立信會計(jì)金融學(xué)院2025年招聘新校區(qū)建設(shè)辦公室工作人員筆試歷年參考題庫附帶答案詳解
- 上海上海市農(nóng)業(yè)生物基因中心工作人員招聘2人(2025年第二批)筆試歷年參考題庫附帶答案詳解
- 上海2025年上??茖W(xué)院事業(yè)單位工作人員招聘筆試歷年參考題庫附帶答案詳解
- 2026四川天府新區(qū)潤朗幼兒園招聘備考題庫參考答案詳解
- 2026福建能源石化集團(tuán)校招面筆試題及答案
- 華東理工大學(xué)2026年公開招聘工作人員46名備考題庫及參考答案詳解
- 云南師大附中2026屆高三高考適應(yīng)性月考卷(六)歷史試卷(含答案及解析)
- 2025桐梓縣國土空間規(guī)劃城市年度體檢報(bào)告成果稿
- ISO-26262功能安全培訓(xùn)
- 2025浙江杭州錢塘新區(qū)建設(shè)投資集團(tuán)有限公司招聘5人備考筆試試題及答案解析
- 智能家居銷售培訓(xùn)課件
- 2025-2026學(xué)年小學(xué)蘇少版(2024)新教材一年級上冊美術(shù)期末測試卷及答案
- 2025-2026學(xué)年北師大版六年級數(shù)學(xué)上冊期末測試卷及答案
- 不同類型休克的床旁超聲鑒別診斷策略
- 企業(yè)ESG審計(jì)體系構(gòu)建-洞察及研究
評論
0/150
提交評論