多層統(tǒng)計(jì)分析模型課件_第1頁
多層統(tǒng)計(jì)分析模型課件_第2頁
多層統(tǒng)計(jì)分析模型課件_第3頁
多層統(tǒng)計(jì)分析模型課件_第4頁
多層統(tǒng)計(jì)分析模型課件_第5頁
已閱讀5頁,還剩135頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

多層統(tǒng)計(jì)分析模型陶莊中國CDC衛(wèi)生統(tǒng)計(jì)研究室多層統(tǒng)計(jì)分析模型陶莊1緒論緒論2青蛙與池塘(“Frog-pondtheory”)青蛙—學(xué)生個(gè)體;池塘—學(xué)校環(huán)境;學(xué)生的成績(jī)好壞不僅受到個(gè)體本身的影響,也受到學(xué)校環(huán)境的影響!青蛙與池塘(“Frog-pondtheory”)青蛙—學(xué)生3多層數(shù)據(jù)低一層(低水平)單位(個(gè)體)的數(shù)據(jù)嵌套(nested)于高一層(高水平)的單位(組群)之中。結(jié)局變量,個(gè)體解釋變量,場(chǎng)景變量(contextualvariables)多層數(shù)據(jù)低一層(低水平)單位(個(gè)體)的數(shù)據(jù)嵌套(nested4組內(nèi)觀察相關(guān)

(within-groupobservationdependence)同一組內(nèi)的個(gè)體,較不同組的個(gè)體而言,在觀念、行為等很多方面更為接近或相似;即便不是刻意分組,也是如此。組內(nèi)同質(zhì)(within-grouphomogeneity),組間異質(zhì)(between-groupheterogeneity)很小的相關(guān)將導(dǎo)致很大的I類錯(cuò)誤。組內(nèi)觀察相關(guān)

(within-groupobservati5多層數(shù)據(jù)的常見來源復(fù)雜抽樣;多中心臨床試驗(yàn);縱向研究(longitudinalstudies)與重復(fù)測(cè)量(repeatedmeasures);“高低搭配”;Meta分析;……多層數(shù)據(jù)的常見來源復(fù)雜抽樣;6多層統(tǒng)計(jì)模型的研究?jī)?nèi)容哪些個(gè)體解釋變量會(huì)影響結(jié)局變量;哪些場(chǎng)景變量會(huì)影響結(jié)局變量;個(gè)體解釋變量對(duì)結(jié)局變量的影響是否會(huì)受到場(chǎng)景變量的影響。多層統(tǒng)計(jì)模型的研究?jī)?nèi)容哪些個(gè)體解釋變量會(huì)影響結(jié)局變量;7多層統(tǒng)計(jì)模型出現(xiàn)前對(duì)多層數(shù)據(jù)進(jìn)行分析的探索多層統(tǒng)計(jì)模型出現(xiàn)前對(duì)多層數(shù)據(jù)進(jìn)行分析的探索8探索(1)—分別估計(jì)在個(gè)體水平和組群水平分別進(jìn)行分析;試圖用單一的個(gè)體水平模型的分析結(jié)果來推論另一水平的統(tǒng)計(jì)結(jié)果。探索(1)—分別估計(jì)在個(gè)體水平和組群水平分別進(jìn)行分析;9探索(2)—傳統(tǒng)回歸用傳統(tǒng)的固定效應(yīng)回歸模型中一般的交互項(xiàng)理解多層數(shù)據(jù)中的跨層(cross-level)交互作用。探索(2)—傳統(tǒng)回歸用傳統(tǒng)的固定效應(yīng)回歸模型中一般的交互項(xiàng)理10探索(3)—兩步模型

(two-stagemodel)第一步模型,對(duì)各組分別進(jìn)行同一回歸模型估計(jì),獲得一系列的系數(shù);對(duì)這些系數(shù)的恒定性進(jìn)行檢驗(yàn);如果不恒定,則進(jìn)行第二步模型,以組變量為因變量,系數(shù)為自變量進(jìn)行回歸。探索(3)—兩步模型

(two-stagemodel)第一11探索(3)—兩步模型的問題無論哪一步均使用OLS,并不適用;當(dāng)組群過多,則十分麻煩;某些組內(nèi)樣本量很少時(shí),進(jìn)行回歸不穩(wěn)定;將每個(gè)組群認(rèn)為是不相關(guān)的,忽略了其為從一大樣本中抽取的事實(shí)。探索(3)—兩步模型的問題無論哪一步均使用OLS,并不適用;12多層統(tǒng)計(jì)模型的出現(xiàn)研究的學(xué)者很多;系統(tǒng)的主要為兩;研究的理論沒有根本上的分歧;雙方研究成果的發(fā)布時(shí)間基本相同(上世紀(jì)80年代末90年代初);分別有各自分析的成熟的軟件;目前,大家基本上接受兩組人分別獨(dú)立開發(fā)出同一模型的結(jié)果。多層統(tǒng)計(jì)模型的出現(xiàn)研究的學(xué)者很多;13S.Raudenbush與A.Bryk模型稱為:hierarchicallinearmodel;軟件為:HLMS.Raudenbush與A.Bryk模型稱為:hier14H.Goldstein模型稱為:multilevelmodels;軟件為:MLwiN(早期版本稱ML3,MLn)H.Goldstein模型稱為:multilevelmo15多層統(tǒng)計(jì)模型的名稱multilevelmodelshierarchicallinearmodelrandom-effectmodelrandomcoefficientmodelvariouscomponentmodelmixed-effectmodelempiricalBayesmodel多層統(tǒng)計(jì)模型的名稱multilevelmodels16多層統(tǒng)計(jì)模型的優(yōu)點(diǎn)同時(shí)分析組效應(yīng)和個(gè)體效應(yīng);不需有獨(dú)立性假設(shè);對(duì)稀疏(sparse)數(shù)據(jù),即每組樣本很少的數(shù)據(jù),特別有效;特別適合對(duì)發(fā)展模型(GM)的分析。多層統(tǒng)計(jì)模型的優(yōu)點(diǎn)同時(shí)分析組效應(yīng)和個(gè)體效應(yīng);17多層統(tǒng)計(jì)模型的局限性(1)模型復(fù)雜,不夠簡(jiǎn)約;需較大樣本以保證穩(wěn)定性;組群數(shù)量較少,會(huì)出現(xiàn)偏倚;高水平單位并非嚴(yán)格抽樣獲得;某些場(chǎng)景變量通常是各組個(gè)體的聚集性測(cè)量,而不是總體內(nèi)個(gè)體的聚集性測(cè)量;多層統(tǒng)計(jì)模型的局限性(1)模型復(fù)雜,不夠簡(jiǎn)約;18多層統(tǒng)計(jì)模型的局限性(2)研究對(duì)象一般具有流動(dòng)性,即受到群組影響的程度不同,雖可用出入時(shí)間進(jìn)行控制,但此信息一般不可知;依然存在自變量帶有測(cè)量誤差的問題,必需借助于結(jié)構(gòu)方程模型(SEM);完全嵌套假設(shè),即每一個(gè)低水平單位嵌套、且僅嵌套于一個(gè)高水平單位。多層統(tǒng)計(jì)模型的局限性(2)研究對(duì)象一般具有流動(dòng)性,即受到群組19用于多層統(tǒng)計(jì)模型的軟件專門軟件:HLM;MLwiN;SuperMIX;aML;EGRET;LISREL;Mplus等。通用統(tǒng)計(jì)學(xué)軟件:SAS;SPSS;stata;S-plus/R等。用于多層統(tǒng)計(jì)模型的軟件專門軟件:HLM;MLwiN;Supe20線性多層統(tǒng)計(jì)模型基礎(chǔ)知識(shí)線性多層統(tǒng)計(jì)模型基礎(chǔ)知識(shí)21組內(nèi)相關(guān)系數(shù)

(Intra-ClassCorrelationCoefficient,ICC)組間方差占總方差的比例??墒褂脤?duì)“空模型”的擬合獲得;值域在0到1之間,越接近1,說明相關(guān)越明顯;對(duì)ICC的檢驗(yàn)是是否選擇多層模型的依據(jù)。組內(nèi)相關(guān)系數(shù)

(Intra-ClassCorrelatio22兩水平模型的公式表達(dá)兩水平模型的公式表達(dá)23空模型(又稱截距模型)空模型(又稱截距模型)24兩個(gè)水平1自變量、一個(gè)水平2自變量?jī)蓚€(gè)水平1自變量、一個(gè)水平2自變量25一般模型一般模型26SAS中的公式表達(dá)SAS中的公式表達(dá)27模型假設(shè)模型假設(shè)28模型假設(shè)—SAS的表達(dá)模型假設(shè)—SAS的表達(dá)29固定和隨機(jī)回歸系數(shù)固定和隨機(jī)回歸系數(shù)30模型估計(jì)方法模型估計(jì)方法31最大似然法(ML)包括普通最大似然法(ML)和限制性最大似然法(REML);兩者用于估計(jì)的殘差基礎(chǔ)不同,后者的殘差包括所有的隨機(jī)變異;REML是SAS的MIXED過程和HLM的默認(rèn)算法;REML通常用于組數(shù)量較少的模型;ML可以用于模型比較,而REML不行;REML估計(jì)較優(yōu),而ML較快。最大似然法(ML)包括普通最大似然法(ML)和限制性最大似然32最小二乘法(LS)包括迭代廣義最小二乘法(IGLS)和限制性迭代廣義最小二乘法(RIGLS)都以普通最小二乘估計(jì)(OLS)為初始值進(jìn)行迭代;地位及相對(duì)關(guān)系大致等同于ML和REML;是MLwiN使用的算法。最小二乘法(LS)包括迭代廣義最小二乘法(IGLS)和限制性33經(jīng)驗(yàn)Bayes方法(EB)“收縮估計(jì)(shrinkageestimator)”以可靠性權(quán)重確定最后的估計(jì)值;對(duì)于某些樣本量很小的組,則更多的使用總樣本的信息,進(jìn)行“借力(borrowstrength)”經(jīng)驗(yàn)Bayes方法(EB)“收縮估計(jì)(shrinkagee34空模型的可靠性權(quán)重空模型的可靠性權(quán)重35對(duì)模型擬合的評(píng)價(jià)SAS給出:-2LL,AIC,AICC,BIC等統(tǒng)計(jì)量,其值越小越好;但只在比較模型時(shí)有用;模型收斂的速度可以說明擬合的好壞。對(duì)模型擬合的評(píng)價(jià)SAS給出:-2LL,AIC,AICC,BI36假設(shè)檢驗(yàn)全局檢驗(yàn):F檢驗(yàn);局部檢驗(yàn):對(duì)方差-協(xié)方差估計(jì)使用WaldZ檢驗(yàn);對(duì)系數(shù)使用t檢驗(yàn);單測(cè)檢驗(yàn),P值需除2;其它可使用LR等。假設(shè)檢驗(yàn)全局檢驗(yàn):F檢驗(yàn);37模型比較對(duì)于嵌套模型,使用LR檢驗(yàn);對(duì)于非嵌套模型,使用AIC,AICC和BIC檢驗(yàn);無論何種,均需使用ML進(jìn)行估計(jì)。模型比較對(duì)于嵌套模型,使用LR檢驗(yàn);38對(duì)變異的解釋程度(RB)對(duì)變異的解釋程度(RB)39對(duì)變異的解釋程度(SB)對(duì)變異的解釋程度(SB)40示例與SAS實(shí)現(xiàn)示例與SAS實(shí)現(xiàn)41例1:對(duì)醫(yī)生滿意度調(diào)查Patid:病人編號(hào);Phys:醫(yī)生編號(hào);Age:病人年齡;Sat:滿意度分?jǐn)?shù);Practice:執(zhí)業(yè)時(shí)間;例1:對(duì)醫(yī)生滿意度調(diào)查Patid:病人編號(hào);42空模型空模型43空模型2步迭代完成;所有隨機(jī)系數(shù)的檢驗(yàn)均高于檢驗(yàn)水準(zhǔn);ICC=0.00292/(0.00292+1.291)=0.23%不用進(jìn)一步擬合多水平模型空模型2步迭代完成;44例2:SNA角度測(cè)量值id:觀察對(duì)象編號(hào);occa:每次觀察編號(hào);Age:病人年齡;SNA:角度;agg:場(chǎng)景變量;例2:SNA角度測(cè)量值id:觀察對(duì)象編號(hào);45空模型3步迭代完成;所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn);ICC=0.4296/(0.4296+0.5629)=43.28%應(yīng)進(jìn)一步擬合多水平模型空模型3步迭代完成;46空模型加入場(chǎng)景變量空模型加入場(chǎng)景變量47空模型加入場(chǎng)景變量3步迭代完成,隨機(jī)截距有意義;所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn);該模型-2LL=345.8,空模型-2LL=352.2,則LRχ2=6.4,p=0.0114;RB=1-0.3330/0.4296=0.2248;空模型加入場(chǎng)景變量3步迭代完成,隨機(jī)截距有意義;48加入水平1變量(固定效應(yīng))加入水平1變量(固定效應(yīng))49加入水平1變量(固定效應(yīng))3步迭代完成,隨機(jī)截距有意義;所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn);該模型-2LL=199.1,前模型-2LL=345.8,則LRχ2=146.7,p=0.000;加入水平1變量(固定效應(yīng))3步迭代完成,隨機(jī)截距有意義;50檢驗(yàn)水平1的隨機(jī)性檢驗(yàn)水平1的隨機(jī)性51檢驗(yàn)水平1的隨機(jī)性4步迭代完成,2個(gè)隨機(jī)系數(shù)均有意義;所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn);該模型-2LL=185.6,前模型-2LL=199.1,則LRχ2=3.5,p=0.1738;檢驗(yàn)水平1的隨機(jī)性4步迭代完成,2個(gè)隨機(jī)系數(shù)均有意義;52跨層交互作用評(píng)估跨層交互作用評(píng)估53跨層交互作用評(píng)估5步迭代完成,隨機(jī)截距有意義,但交互項(xiàng)沒意義;-2LL等都對(duì)前模型有所增加;跨層交互作用不顯著??鐚咏换プ饔迷u(píng)估5步迭代完成,隨機(jī)截距有意義,但交互項(xiàng)沒意義54建模一般步驟運(yùn)行空模型以獲得ICC,判斷是否進(jìn)行多層模型擬合;加入水平2解釋變量;加入水平1解釋變量;檢驗(yàn)水平1隨機(jī)斜率;檢驗(yàn)跨水平交互作用(全模型)。建模一般步驟運(yùn)行空模型以獲得ICC,判斷是否進(jìn)行多層模型擬合55發(fā)展模型發(fā)展模型56傳統(tǒng)縱向數(shù)據(jù)分析方法的局限性重復(fù)測(cè)量的方差分析;假設(shè)殘差方差在各時(shí)間點(diǎn)上相等;或,假設(shè)任何時(shí)點(diǎn)之間的殘差方差的差異相等(即所謂“球面(sphericity)”假設(shè)或稱“環(huán)形(circularity)”假設(shè));要求完整均衡數(shù)據(jù),即等時(shí)距,無缺失。傳統(tǒng)縱向數(shù)據(jù)分析方法的局限性重復(fù)測(cè)量的方差分析;57發(fā)展模型的優(yōu)點(diǎn)可處理缺失和不完整數(shù)據(jù);可處理不等時(shí)距問題;不要求對(duì)象內(nèi)獨(dú)立即其它的限制性假設(shè);可以容易的加入時(shí)間依賴自變量。發(fā)展模型的優(yōu)點(diǎn)可處理缺失和不完整數(shù)據(jù);58發(fā)展模型與一般多層模型的區(qū)別發(fā)展模型與一般多層模型的區(qū)別59SAS程序procmixedcovtestic;classidtimec;modely=trt|time/sddfm=KRnotest;randominttime/subject=idGtype=UN;repeatedtimec/subject=idRtype=AR(1);run;SAS程序procmixedcovtestic;60離散型結(jié)局變量的多層統(tǒng)計(jì)模型離散型結(jié)局變量的多層統(tǒng)計(jì)模型61廣義線性模型隨機(jī)成分(randomcomponents):指的是分布,一般為指數(shù)族分布;系統(tǒng)成分(systematiccomponent):即傳統(tǒng)回歸模型形態(tài);鏈接函數(shù)(linkfunction)廣義線性模型隨機(jī)成分(randomcomponents):62廣義線性混合效應(yīng)模型對(duì)廣義線性模型和多層統(tǒng)計(jì)模型的結(jié)合和擴(kuò)展。廣義線性混合效應(yīng)模型對(duì)廣義線性模型和多層統(tǒng)計(jì)模型的結(jié)合和擴(kuò)展63廣義線性混合效應(yīng)模型的估計(jì)方法線性化法(linearizationmethods)數(shù)值法積分近似法(integralapproximationwithnumericalmethods)廣義線性混合效應(yīng)模型的估計(jì)方法線性化法(linearizat64線性化法使用泰勒展開式等技術(shù)來近似估計(jì)該積分似然函數(shù);不使用原始數(shù)據(jù),而是按原始數(shù)據(jù)產(chǎn)生偽數(shù)據(jù)(pseudo-data)進(jìn)行估計(jì);SAS中的GLMMIX過程。線性化法使用泰勒展開式等技術(shù)來近似估計(jì)該積分似然函數(shù);65線性化法的優(yōu)點(diǎn)和局限性模型的聯(lián)合分布難于確定,也可以勝任;可擬合較多隨機(jī)效應(yīng);允許不同結(jié)構(gòu)的R矩陣;可以使用REML等;由于使用偽數(shù)據(jù)進(jìn)行擬合,不能使用LR進(jìn)行模型比較;SAS提供的隨機(jī)效應(yīng)的標(biāo)準(zhǔn)誤有偏,不能用于假設(shè)檢驗(yàn)。線性化法的優(yōu)點(diǎn)和局限性模型的聯(lián)合分布難于確定,也可以勝任;66數(shù)值法積分近似法使用原始數(shù)據(jù)估算邊際積分似然函數(shù)的近似值;默認(rèn)的是適應(yīng)性高斯求積法;并可使用多種優(yōu)化技術(shù),默認(rèn)的是二元準(zhǔn)牛頓算法;SAS中的NLMIXED過程。數(shù)值法積分近似法使用原始數(shù)據(jù)估算邊際積分似然函數(shù)的近似值;67數(shù)值法積分近似法的優(yōu)點(diǎn)和局限性使用原始數(shù)據(jù)進(jìn)行擬合,可以使用LR進(jìn)行模型比較;SAS提供顯著性檢驗(yàn);非常耗時(shí),且不易收斂;不能隨意設(shè)定R的結(jié)構(gòu);只能使用ML。數(shù)值法積分近似法的優(yōu)點(diǎn)和局限性使用原始數(shù)據(jù)進(jìn)行擬合,可以使用68各種離散型結(jié)局變量模型多層logistic回歸模型多層累積logistic回歸模型;多層多項(xiàng)logistic回歸模型;多層poisson回歸模型;……各種離散型結(jié)局變量模型多層logistic回歸模型69謝謝大家!謝謝大家!70多層統(tǒng)計(jì)分析模型陶莊中國CDC衛(wèi)生統(tǒng)計(jì)研究室多層統(tǒng)計(jì)分析模型陶莊71緒論緒論72青蛙與池塘(“Frog-pondtheory”)青蛙—學(xué)生個(gè)體;池塘—學(xué)校環(huán)境;學(xué)生的成績(jī)好壞不僅受到個(gè)體本身的影響,也受到學(xué)校環(huán)境的影響!青蛙與池塘(“Frog-pondtheory”)青蛙—學(xué)生73多層數(shù)據(jù)低一層(低水平)單位(個(gè)體)的數(shù)據(jù)嵌套(nested)于高一層(高水平)的單位(組群)之中。結(jié)局變量,個(gè)體解釋變量,場(chǎng)景變量(contextualvariables)多層數(shù)據(jù)低一層(低水平)單位(個(gè)體)的數(shù)據(jù)嵌套(nested74組內(nèi)觀察相關(guān)

(within-groupobservationdependence)同一組內(nèi)的個(gè)體,較不同組的個(gè)體而言,在觀念、行為等很多方面更為接近或相似;即便不是刻意分組,也是如此。組內(nèi)同質(zhì)(within-grouphomogeneity),組間異質(zhì)(between-groupheterogeneity)很小的相關(guān)將導(dǎo)致很大的I類錯(cuò)誤。組內(nèi)觀察相關(guān)

(within-groupobservati75多層數(shù)據(jù)的常見來源復(fù)雜抽樣;多中心臨床試驗(yàn);縱向研究(longitudinalstudies)與重復(fù)測(cè)量(repeatedmeasures);“高低搭配”;Meta分析;……多層數(shù)據(jù)的常見來源復(fù)雜抽樣;76多層統(tǒng)計(jì)模型的研究?jī)?nèi)容哪些個(gè)體解釋變量會(huì)影響結(jié)局變量;哪些場(chǎng)景變量會(huì)影響結(jié)局變量;個(gè)體解釋變量對(duì)結(jié)局變量的影響是否會(huì)受到場(chǎng)景變量的影響。多層統(tǒng)計(jì)模型的研究?jī)?nèi)容哪些個(gè)體解釋變量會(huì)影響結(jié)局變量;77多層統(tǒng)計(jì)模型出現(xiàn)前對(duì)多層數(shù)據(jù)進(jìn)行分析的探索多層統(tǒng)計(jì)模型出現(xiàn)前對(duì)多層數(shù)據(jù)進(jìn)行分析的探索78探索(1)—分別估計(jì)在個(gè)體水平和組群水平分別進(jìn)行分析;試圖用單一的個(gè)體水平模型的分析結(jié)果來推論另一水平的統(tǒng)計(jì)結(jié)果。探索(1)—分別估計(jì)在個(gè)體水平和組群水平分別進(jìn)行分析;79探索(2)—傳統(tǒng)回歸用傳統(tǒng)的固定效應(yīng)回歸模型中一般的交互項(xiàng)理解多層數(shù)據(jù)中的跨層(cross-level)交互作用。探索(2)—傳統(tǒng)回歸用傳統(tǒng)的固定效應(yīng)回歸模型中一般的交互項(xiàng)理80探索(3)—兩步模型

(two-stagemodel)第一步模型,對(duì)各組分別進(jìn)行同一回歸模型估計(jì),獲得一系列的系數(shù);對(duì)這些系數(shù)的恒定性進(jìn)行檢驗(yàn);如果不恒定,則進(jìn)行第二步模型,以組變量為因變量,系數(shù)為自變量進(jìn)行回歸。探索(3)—兩步模型

(two-stagemodel)第一81探索(3)—兩步模型的問題無論哪一步均使用OLS,并不適用;當(dāng)組群過多,則十分麻煩;某些組內(nèi)樣本量很少時(shí),進(jìn)行回歸不穩(wěn)定;將每個(gè)組群認(rèn)為是不相關(guān)的,忽略了其為從一大樣本中抽取的事實(shí)。探索(3)—兩步模型的問題無論哪一步均使用OLS,并不適用;82多層統(tǒng)計(jì)模型的出現(xiàn)研究的學(xué)者很多;系統(tǒng)的主要為兩;研究的理論沒有根本上的分歧;雙方研究成果的發(fā)布時(shí)間基本相同(上世紀(jì)80年代末90年代初);分別有各自分析的成熟的軟件;目前,大家基本上接受兩組人分別獨(dú)立開發(fā)出同一模型的結(jié)果。多層統(tǒng)計(jì)模型的出現(xiàn)研究的學(xué)者很多;83S.Raudenbush與A.Bryk模型稱為:hierarchicallinearmodel;軟件為:HLMS.Raudenbush與A.Bryk模型稱為:hier84H.Goldstein模型稱為:multilevelmodels;軟件為:MLwiN(早期版本稱ML3,MLn)H.Goldstein模型稱為:multilevelmo85多層統(tǒng)計(jì)模型的名稱multilevelmodelshierarchicallinearmodelrandom-effectmodelrandomcoefficientmodelvariouscomponentmodelmixed-effectmodelempiricalBayesmodel多層統(tǒng)計(jì)模型的名稱multilevelmodels86多層統(tǒng)計(jì)模型的優(yōu)點(diǎn)同時(shí)分析組效應(yīng)和個(gè)體效應(yīng);不需有獨(dú)立性假設(shè);對(duì)稀疏(sparse)數(shù)據(jù),即每組樣本很少的數(shù)據(jù),特別有效;特別適合對(duì)發(fā)展模型(GM)的分析。多層統(tǒng)計(jì)模型的優(yōu)點(diǎn)同時(shí)分析組效應(yīng)和個(gè)體效應(yīng);87多層統(tǒng)計(jì)模型的局限性(1)模型復(fù)雜,不夠簡(jiǎn)約;需較大樣本以保證穩(wěn)定性;組群數(shù)量較少,會(huì)出現(xiàn)偏倚;高水平單位并非嚴(yán)格抽樣獲得;某些場(chǎng)景變量通常是各組個(gè)體的聚集性測(cè)量,而不是總體內(nèi)個(gè)體的聚集性測(cè)量;多層統(tǒng)計(jì)模型的局限性(1)模型復(fù)雜,不夠簡(jiǎn)約;88多層統(tǒng)計(jì)模型的局限性(2)研究對(duì)象一般具有流動(dòng)性,即受到群組影響的程度不同,雖可用出入時(shí)間進(jìn)行控制,但此信息一般不可知;依然存在自變量帶有測(cè)量誤差的問題,必需借助于結(jié)構(gòu)方程模型(SEM);完全嵌套假設(shè),即每一個(gè)低水平單位嵌套、且僅嵌套于一個(gè)高水平單位。多層統(tǒng)計(jì)模型的局限性(2)研究對(duì)象一般具有流動(dòng)性,即受到群組89用于多層統(tǒng)計(jì)模型的軟件專門軟件:HLM;MLwiN;SuperMIX;aML;EGRET;LISREL;Mplus等。通用統(tǒng)計(jì)學(xué)軟件:SAS;SPSS;stata;S-plus/R等。用于多層統(tǒng)計(jì)模型的軟件專門軟件:HLM;MLwiN;Supe90線性多層統(tǒng)計(jì)模型基礎(chǔ)知識(shí)線性多層統(tǒng)計(jì)模型基礎(chǔ)知識(shí)91組內(nèi)相關(guān)系數(shù)

(Intra-ClassCorrelationCoefficient,ICC)組間方差占總方差的比例??墒褂脤?duì)“空模型”的擬合獲得;值域在0到1之間,越接近1,說明相關(guān)越明顯;對(duì)ICC的檢驗(yàn)是是否選擇多層模型的依據(jù)。組內(nèi)相關(guān)系數(shù)

(Intra-ClassCorrelatio92兩水平模型的公式表達(dá)兩水平模型的公式表達(dá)93空模型(又稱截距模型)空模型(又稱截距模型)94兩個(gè)水平1自變量、一個(gè)水平2自變量?jī)蓚€(gè)水平1自變量、一個(gè)水平2自變量95一般模型一般模型96SAS中的公式表達(dá)SAS中的公式表達(dá)97模型假設(shè)模型假設(shè)98模型假設(shè)—SAS的表達(dá)模型假設(shè)—SAS的表達(dá)99固定和隨機(jī)回歸系數(shù)固定和隨機(jī)回歸系數(shù)100模型估計(jì)方法模型估計(jì)方法101最大似然法(ML)包括普通最大似然法(ML)和限制性最大似然法(REML);兩者用于估計(jì)的殘差基礎(chǔ)不同,后者的殘差包括所有的隨機(jī)變異;REML是SAS的MIXED過程和HLM的默認(rèn)算法;REML通常用于組數(shù)量較少的模型;ML可以用于模型比較,而REML不行;REML估計(jì)較優(yōu),而ML較快。最大似然法(ML)包括普通最大似然法(ML)和限制性最大似然102最小二乘法(LS)包括迭代廣義最小二乘法(IGLS)和限制性迭代廣義最小二乘法(RIGLS)都以普通最小二乘估計(jì)(OLS)為初始值進(jìn)行迭代;地位及相對(duì)關(guān)系大致等同于ML和REML;是MLwiN使用的算法。最小二乘法(LS)包括迭代廣義最小二乘法(IGLS)和限制性103經(jīng)驗(yàn)Bayes方法(EB)“收縮估計(jì)(shrinkageestimator)”以可靠性權(quán)重確定最后的估計(jì)值;對(duì)于某些樣本量很小的組,則更多的使用總樣本的信息,進(jìn)行“借力(borrowstrength)”經(jīng)驗(yàn)Bayes方法(EB)“收縮估計(jì)(shrinkagee104空模型的可靠性權(quán)重空模型的可靠性權(quán)重105對(duì)模型擬合的評(píng)價(jià)SAS給出:-2LL,AIC,AICC,BIC等統(tǒng)計(jì)量,其值越小越好;但只在比較模型時(shí)有用;模型收斂的速度可以說明擬合的好壞。對(duì)模型擬合的評(píng)價(jià)SAS給出:-2LL,AIC,AICC,BI106假設(shè)檢驗(yàn)全局檢驗(yàn):F檢驗(yàn);局部檢驗(yàn):對(duì)方差-協(xié)方差估計(jì)使用WaldZ檢驗(yàn);對(duì)系數(shù)使用t檢驗(yàn);單測(cè)檢驗(yàn),P值需除2;其它可使用LR等。假設(shè)檢驗(yàn)全局檢驗(yàn):F檢驗(yàn);107模型比較對(duì)于嵌套模型,使用LR檢驗(yàn);對(duì)于非嵌套模型,使用AIC,AICC和BIC檢驗(yàn);無論何種,均需使用ML進(jìn)行估計(jì)。模型比較對(duì)于嵌套模型,使用LR檢驗(yàn);108對(duì)變異的解釋程度(RB)對(duì)變異的解釋程度(RB)109對(duì)變異的解釋程度(SB)對(duì)變異的解釋程度(SB)110示例與SAS實(shí)現(xiàn)示例與SAS實(shí)現(xiàn)111例1:對(duì)醫(yī)生滿意度調(diào)查Patid:病人編號(hào);Phys:醫(yī)生編號(hào);Age:病人年齡;Sat:滿意度分?jǐn)?shù);Practice:執(zhí)業(yè)時(shí)間;例1:對(duì)醫(yī)生滿意度調(diào)查Patid:病人編號(hào);112空模型空模型113空模型2步迭代完成;所有隨機(jī)系數(shù)的檢驗(yàn)均高于檢驗(yàn)水準(zhǔn);ICC=0.00292/(0.00292+1.291)=0.23%不用進(jìn)一步擬合多水平模型空模型2步迭代完成;114例2:SNA角度測(cè)量值id:觀察對(duì)象編號(hào);occa:每次觀察編號(hào);Age:病人年齡;SNA:角度;agg:場(chǎng)景變量;例2:SNA角度測(cè)量值id:觀察對(duì)象編號(hào);115空模型3步迭代完成;所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn);ICC=0.4296/(0.4296+0.5629)=43.28%應(yīng)進(jìn)一步擬合多水平模型空模型3步迭代完成;116空模型加入場(chǎng)景變量空模型加入場(chǎng)景變量117空模型加入場(chǎng)景變量3步迭代完成,隨機(jī)截距有意義;所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn);該模型-2LL=345.8,空模型-2LL=352.2,則LRχ2=6.4,p=0.0114;RB=1-0.3330/0.4296=0.2248;空模型加入場(chǎng)景變量3步迭代完成,隨機(jī)截距有意義;118加入水平1變量(固定效應(yīng))加入水平1變量(固定效應(yīng))119加入水平1變量(固定效應(yīng))3步迭代完成,隨機(jī)截距有意義;所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn);該模型-2LL=199.1,前模型-2LL=345.8,則LRχ2=146.7,p=0.000;加入水平1變量(固定效應(yīng))3步迭代完成,隨機(jī)截距有意義;120檢驗(yàn)水平1的隨機(jī)性檢驗(yàn)水平1的隨機(jī)性121檢驗(yàn)水平1的隨機(jī)性4步迭代完成,2個(gè)隨機(jī)系數(shù)均有意義;所有隨機(jī)系數(shù)的檢驗(yàn)部分低于檢驗(yàn)水準(zhǔn);該模型-2LL=185.6,前模型-2LL=199.1,則LRχ2=3.5,p=0.1738;檢驗(yàn)水平1的隨機(jī)性4步迭代完成,2個(gè)隨機(jī)系數(shù)均有意義;122跨層交互作用評(píng)估跨層交互作用評(píng)估123跨層交互作用評(píng)估5步迭代完成,隨機(jī)截距有意義,但交互項(xiàng)沒意義;-2LL等都對(duì)前模型有所增加;跨層交互作用不顯著??鐚咏换プ饔迷u(píng)估5步迭代完成,隨機(jī)截距有意義,但交互項(xiàng)沒意義124建模一般步驟運(yùn)行空模型以獲得ICC,判斷是否進(jìn)行多層模型擬合;加入水平2解釋變量;加入水平1解釋變量;檢驗(yàn)水平1隨機(jī)斜率;檢驗(yàn)跨水平交互作用(全模型)。建模一般步驟運(yùn)行空模型以獲得ICC,判斷是否進(jìn)行多層模型擬合125發(fā)展模型發(fā)展模型126傳統(tǒng)縱向數(shù)據(jù)分析方法的局限性重復(fù)測(cè)量的方差分析;假設(shè)殘差方差在各時(shí)間點(diǎn)上相等;或,假設(shè)任何時(shí)點(diǎn)之間的殘差方差的差異相等(即所謂“球面(sphericity)”假設(shè)或稱“環(huán)形(circularity)”假設(shè));要求完整均衡數(shù)據(jù),即等時(shí)距,無缺失。傳統(tǒng)縱向數(shù)據(jù)分析方法的局限性重復(fù)測(cè)量的方差分析;127發(fā)展模型的優(yōu)點(diǎn)可處理缺失和不完整數(shù)據(jù);可處理不等時(shí)距問題;不要求對(duì)象內(nèi)獨(dú)立即其它的限制性假設(shè);可以容易的加入時(shí)間依賴自變量。發(fā)展模型的優(yōu)點(diǎn)可處理缺失和不完整數(shù)據(jù);128發(fā)展模型與一般多層模型的區(qū)別發(fā)展模型與一

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論