版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
SPSS詳細操作:1:n傾向性評分匹配(PSM)在上一篇文章中,我們向大家介紹了如何給SPSS安裝插件,拓展出1:n傾向性評分匹配的功能。詳見:滿滿干貨!給SPSS插上1:n傾向性評分匹配(PSM)的翅膀在今天的內(nèi)容中,我們就繼續(xù)給大家介紹一下,如何使用SPSS進行簡單的幾步操作,就能輕松搞定高大上的1:n傾向性評分匹配。一、問題與數(shù)據(jù)假設(shè)某位心內(nèi)科醫(yī)生在門診連續(xù)收集了170名就診患者,其中冠心病(CHD)患者24名,146名對照,并記錄了他們的性別、年齡、BMI、LDL-C等信息,擬探討LDL-C水平與冠心病的關(guān)系(此處不對該研究的設(shè)計方法進行評價)。數(shù)據(jù)格式如下:注意:這里有2點大坑需要大家值得關(guān)注:(1)所有的變量名須是英文名稱,不要使用中文,否則會導(dǎo)致后面回歸模型建模失?。?2)所有變量不能有缺失值,包括擬進行匹配和不進行匹配的全部變量,都不允許出現(xiàn)缺失值。首先該醫(yī)生對數(shù)據(jù)進行了初步分析,將病例組和對照組之間的各個因素進行比較,結(jié)果發(fā)現(xiàn)兩組各因素間差異均有統(tǒng)計學(xué)顯著性。但為了保證兩組人群之間各混雜因素能夠均衡可比,該醫(yī)生擬采用1:n傾向性評分匹配的方法來對兩組人群進行匹配。表1.傾向性評分匹配前兩組間各個因素的比較結(jié)果二、SPSSPSMatching拓展功能操作1.選擇analyze→PSMatching2.在PropensityScoreMatching對話框中(1)將分組變量CHD選入BinaryTreatmentIndicator中,其中1代表病例組,0代表對照組,且變量類型必須定義為尺度變量。(2)將用于計算傾向性評分的協(xié)變量age、BMI、gender選入Covariates,將與處理因素?zé)o關(guān)的協(xié)變量選入AdditionalCovariates。注意:一般根據(jù)結(jié)局變量與混雜變量構(gòu)建二分類logistic回歸模型,進行逐步回歸,將進入模型的變量選入Covariates,剔除的變量選入AdditionalCovariates。(3)設(shè)定Caliper值,為0~1之間,該值設(shè)置越大,越接近于1,就越容易找到匹配的對象,但結(jié)果就越容易出現(xiàn)不平衡;該值設(shè)置越小越接近于0,匹配就越嚴格,但是符合匹配要求的患者就少了,最終導(dǎo)致研究的統(tǒng)計效能降低,很有可能找不到匹配的對象。本例中暫且設(shè)置為0.1,也就是說如果一個病例組研究對象患有冠心病的概率為0.8,那么與之匹配的對照組研究對象患有冠心病的概率須在0.7-0.9之間。3.點擊PlotandOutput選項在Plots下勾選Histogramofstandardizeddifferences、Dotplotofstandardizedmeandifferences、Lineplotofindividualdifferences,分別繪制SD分布直方圖、單變量SD散點圖、標準化差異變化線圖。在OutputDatasets下勾選Paireddatasetby“matched_id”,在Include下選擇Matchedcases,并在BalanceStatistics下選擇Detailed–byExactMatchingvariables。4.點擊NearestNeighbor選項在MatchRatio下選擇Match1:many,并設(shè)定匹配數(shù)量n,一般n不超過4,否則容易出現(xiàn)過度匹配的現(xiàn)象。本例中以設(shè)定1:2為例進行匹配。Matchingorder下拉框選擇Random。5.點擊OK完成操作。三、結(jié)果解讀1.樣本匹配結(jié)果結(jié)果顯示,SPSS生成了一個新的已完成匹配的數(shù)據(jù)文件,其中包含病例組21人,對照組39人,我們發(fā)現(xiàn)兩組人群約為1:2,但并非是絕對的1:2匹配,這是因為有些病例未能同時找到有效匹配的對照人群。2.匹配后的均衡性度量在輸出結(jié)果“RelativemultivariateimbalanceL1”中,L1measure統(tǒng)計量理論上介于0~1之間,匹配前和匹配后相比,L1measure統(tǒng)計量越小,提示匹配效果越好。在本例研究中,匹配后的L1measure統(tǒng)計量為0.643,遠小于匹配前的0.808,提示匹配良好。3.顯示匹配后不均衡的變量在輸出結(jié)果“Summaryofunbalancedcovariates”中,若|d|>0.25,則提示變量存在不均衡性。在本例研究中,結(jié)果顯示沒有變量|d|>0.25,提示匹配后所有匹配的變量都達到了平衡。4.匹配后均衡性比較對于匹配后的協(xié)變量均衡性比較應(yīng)該遵守兩個原則:①評價方法應(yīng)該是針對樣本而不是總體
仔細想想,傾向性評分匹配實際上是從一個隨機獲得的有代表性樣本中再“挑”出一部分進行分析,這時候再去通過“挑出來樣本”去推斷最開始的總體,顯然已經(jīng)不合適啦。②評價指標應(yīng)該與樣本量大小無關(guān)
為啥呢?想想看看,我們前面提到的匹配比例可以從1:1設(shè)定到1:4(事實上可以任意無限大設(shè)置,但是考慮匹配效率,推薦不要超過1:4),如果某個評價指標和樣本量有關(guān),那極有可能會遇到不同樣本量下完全不一樣的比較結(jié)果。綜上,你腦海里第一反應(yīng)的t檢驗或者卡方檢驗在這里已經(jīng)不合適了。當(dāng)然,還有其他常見的可用于協(xié)變量均衡性比較的指標,比如說C統(tǒng)計量等,也是存在很多缺點的(想要進一步了解這方面的內(nèi)容,推薦大家一篇綜述[1])。有小伙伴要問啦,這個方法也不行,那個也不行,到底用啥方法評價均衡性?別急,方法還是有的。在傾向性評分匹配后的均衡性比較中,推薦大家使用標準差異(Standardizeddifference)。一般而言,標準差異絕對值小于10%時,可認為組間均衡性較好。具體計算公式如下:再回到本例中,SPSS在結(jié)果中輸出了DetailedBalance表格,展示了各個變量匹配前后的均值、標準差和標準差異等信息,結(jié)果顯示CHD組和對照組的年齡、BMI的標準差異絕對值分別為12.2%和3.7%。由于性別為分類變量,匹配后根據(jù)上述公式計算其標準差異絕對值為0.83%。按照上面提到的10%的標準,性別和BMI匹配后在兩組中均衡性較好,但是年齡就差點兒,這也說明傾向性評分匹配也不是萬能的,如果兩組沒有足夠“重疊的部分”(比如說一個不太恰當(dāng)?shù)睦?,某慢病人群和體檢中心健康人群進行匹配,前者年齡一般會比后者大不少,想要保證兩組匹配后年齡均衡可比,自然是難度大大的),匹配的結(jié)果也不會非常理想。以上僅是舉例,重在方法操作。再回過頭來,瞅瞅組間LDL-C水平(表2)。結(jié)果顯示,匹配后的CHD組LDL-C水平高于對照組,組間差異明顯縮小了不少,但是獲得了一個比較“干凈”的效應(yīng),提示LDL-C可能是CHD發(fā)生的一個危險因素。為了進一步確定LDL-C水平對CHD發(fā)生風(fēng)險的效應(yīng)大小,可以根據(jù)我們前期推送的教程《SPSS實例教程|1:m匹配病例對照Logistic回歸》,來進行更加深入的分析和探討。表2.傾向性評分匹配前后兩組LDL-C比較結(jié)果5.圖形輸出結(jié)果5.1SD分布直方圖若匹配后的標準差異集中在0附近,可以提示匹配達到了較好的效果。5.2標準化差異變化線圖和單變量SD散點圖這兩個圖的點值與上述DetailedBalance表格中的值是相對應(yīng)的,均展示了匹配前后,各個協(xié)變量標準差異的變化。標準化差異變化線圖顯示,匹配后各個協(xié)變量標準差異均明顯降低,單變量SD散點圖顯示匹配后標準差異基本集中在0附近,提示變量達到了均衡,匹配效果良好,可以結(jié)合DetailedBalance表格進行輔助判斷。我們通過兩期的內(nèi)容向大家詳細介紹了在SPSS中實現(xiàn)1:n傾向性評分匹配的功能,在學(xué)習(xí)統(tǒng)計學(xué)的道路上又get了一項高大上的新技能,如果大家在實操的過程中還遇到什么問題,歡迎在下方留言討論哈!參考文獻1.JClinEpidemiol.2015;68:112-21.更多閱讀1
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 武術(shù)機構(gòu)運營管理制度
- 酒店運營部安全責(zé)任制度
- 外賣運營公司制度
- 重點工程運營監(jiān)管制度
- 運營審計制度
- 社區(qū)運營專員制度
- 養(yǎng)老院運營規(guī)章制度
- 小程序門店運營管理制度
- 運營與銷售協(xié)同管理制度
- 特殊快遞運營管理制度范本
- 2026年及未來5年市場數(shù)據(jù)中國鮮雞肉行業(yè)市場深度研究及投資規(guī)劃建議報告
- 診所相關(guān)衛(wèi)生管理制度
- 2024-2025學(xué)年廣東深圳實驗學(xué)校初中部八年級(上)期中英語試題及答案
- 牛津版八年級英語知識點總結(jié)
- 2026中國電信四川公用信息產(chǎn)業(yè)有限責(zé)任公司社會成熟人才招聘備考題庫及完整答案詳解
- 2026中國電信四川公用信息產(chǎn)業(yè)有限責(zé)任公司社會成熟人才招聘備考題庫含答案詳解
- 國際話語體系構(gòu)建與策略分析課題申報書
- 戶外領(lǐng)隊培訓(xùn)課件
- 中考字音字形練習(xí)題(含答案)-字音字形專項訓(xùn)練
- CTD申報資料撰寫模板:模塊三之3.2.S.4原料藥的質(zhì)量控制
- 2024屆新高考物理沖刺復(fù)習(xí):“正則動量”解決帶電粒子在磁場中的運動問題
評論
0/150
提交評論