2026年醫(yī)學統(tǒng)計學專業(yè)考試試題及答案_第1頁
2026年醫(yī)學統(tǒng)計學專業(yè)考試試題及答案_第2頁
2026年醫(yī)學統(tǒng)計學專業(yè)考試試題及答案_第3頁
2026年醫(yī)學統(tǒng)計學專業(yè)考試試題及答案_第4頁
2026年醫(yī)學統(tǒng)計學專業(yè)考試試題及答案_第5頁
已閱讀5頁,還剩22頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

2026年醫(yī)學統(tǒng)計學專業(yè)考試試題及答案1.單項選擇題(每題1分,共30分)1.1在生存分析中,若某研究對象的失訪時間早于其死亡時間,則該數據應記為A.完全數據B.右刪失C.左刪失D.區(qū)間刪失答案:B解析:失訪時尚未發(fā)生終點事件,僅知“存活到失訪時點”,屬于右刪失。1.2對二分類資料進行單因素篩選時,若期望隊列發(fā)病率<5%,首選的檢驗方法是A.Pearsonχ2B.Fisher精確概率法C.Mantel-Haenszelχ2D.二項精確檢驗答案:B解析:當期望頻數<5時,Pearsonχ2近似性差,Fisher法基于超幾何分布,結果精確。1.3某RCT采用分層隨機化,層因素為“中心”與“性別”,分析時應首選A.簡單t檢驗B.協(xié)方差分析C.分層隨機效應模型D.廣義估計方程答案:C解析:分層隨機化需保持層內均衡,采用含層隨機效應的混合模型可正確還原隨機結構。1.4對重復測量資料,若關心處理×時間交互,且數據存在缺失,應優(yōu)先A.重復測量ANOVAB.末次觀察結轉C.混合效應線性模型D.廣義估計方程答案:C解析:混合效應模型利用所有可觀測數據,在MAR缺失機制下提供無偏估計。1.5在Meta分析中,若I2=62%,其含義為A.62%的研究存在發(fā)表偏倚B.62%的異質性由隨機誤差引起C.62%的總變異源于研究間異質D.合并效應量不可信答案:C解析:I2表示研究間方差占總體方差的比例,>50%提示中度異質。1.6對數秩檢驗的零假設是A.各組生存曲線相同B.各組風險比為0C.各組中位生存期相等D.基線風險函數為常數答案:A解析:對數秩檢驗比較整條生存曲線,零假設為各組生存函數一致。1.7某預測模型AUC=0.88,最佳截斷值約登指數為0.58,此時A.靈敏度+特異度=1.58B.靈敏度=特異度=0.88C.假陽性率=0.12D.陽性預測值必>0.9答案:A解析:約登指數=靈敏度+特異度?1,故和為1.58。1.8在Poisson回歸中,若暴露人年作為偏移,其系數應A.固定為0B.固定為1C.取對數后作為偏移D.與解釋變量交互答案:C解析:Poisson回歸用log(offset)強制系數為1,實現率比估計。1.9對高維組學數據變量篩選,最可能過擬合的方法是A.LASSOB.彈性網C.單變量t檢驗排序D.隨機森林平均下降精度答案:C解析:單變量篩選忽略變量間相關,極易在后續(xù)模型中過擬合。1.10某研究OR=1.30,95%CI0.97–1.74,可認為A.有統(tǒng)計學意義B.拒絕零假設C.可能為機會發(fā)現D.需增加樣本量答案:C解析:置信帶包含1,P>0.05,差異可能由隨機誤差導致。1.11在交叉設計中,若存在遺留效應,應首選A.忽略,因隨機化可抵消B.增加洗脫期C.采用序列×時期交互模型D.改用平行設計答案:C解析:通過模型檢驗序列×時期交互,可量化遺留效應大小。1.12對病例-父母對照設計,估計相對風險應采用A.ORB.RRC.傳遞不平衡比D.條件logistic回歸答案:C解析:該設計利用等位基因傳遞概率,計算TDT。1.13某研究樣本量估算顯示需n=90,預計失訪20%,最終應納入A.90B.108C.112D.120答案:C解析:90/(1?0.2)=112.5,向上取整。1.14在多重插補后,合并估計量需使用A.簡單平均B.Rubin法則C.bootstrapD.最大似然答案:B解析:Rubin法則綜合組內與組間方差,給出正確標準誤。1.15對有序分類結局,比例優(yōu)勢假設檢驗P=0.02,應A.仍使用比例優(yōu)勢模型B.改用偏比例優(yōu)勢模型C.合并相鄰類別D.視為無序答案:B解析:P<0.05提示假設不成立,需放寬約束。1.16若兩變量Pearsonr=0,可推斷A.獨立B.無直線相關C.無線性關系D.無曲線關系答案:B解析:r僅度量直線線性關系,非線性依賴可存在。1.17在貝葉斯統(tǒng)計中,若先驗為β~N(0,102),似然方差小,則后驗A.由先驗主導B.由似然主導C.不變D.無法計算答案:B解析:似然信息量大時,數據壓倒先驗。1.18對零膨脹數據,首選A.負二項回歸B.零膨脹PoissonC.廣義PoissonD.普通Poisson答案:B解析:ZIP同時建模“零過多”與“計數”兩部分。1.19在交叉驗證中,k值越大A.偏差增大B.方差增大C.計算量減小D.過擬合風險降低答案:D解析:k大訓練集比例高,模型更接近全樣本,方差小偏差小。1.20若Cox模型線性假設檢驗P<0.01,應A.加入二次項B.分層變量C.改用參數模型D.時間依賴系數答案:D解析:時間×變量交互可放松比例風險假設。1.21對生態(tài)學研究,主要偏倚為A.回憶偏倚B.混雜偏倚C.生態(tài)學謬誤D.選擇偏倚答案:C解析:群體水平關聯(lián)不能推至個體。1.22在劑量-反應Meta分析中,應采用A.隨機效應B.固定效應C.劑量-反應回歸D.Peto法答案:C解析:利用廣義最小二乘擬合劑量-反應曲線。1.23若兩獨立樣本均來自正態(tài)總體,方差齊性檢驗P=0.04,應A.仍用合并方差t檢驗B.改用Welcht檢驗C.非參數檢驗D.對數轉換答案:B解析:方差不齊時Welch法調整自由度。1.24在適應性設計中,若期中分析顯示P=0.012,按O’Brien-Fleming邊界0.014,應A.繼續(xù)試驗B.拒絕無效假設C.增加樣本量D.降低α答案:B解析:O-F邊界更嚴,P<邊界可提前終止。1.25對高維數據降維,主成分分析要求A.變量獨立B.變量標準化C.正態(tài)分布D.線性可分答案:B解析:量綱差異大時需標準化,避免大尺度變量主導。1.26若診斷試驗靈敏度與特異度負相關,可采用A.固定靈敏度B.ROC曲線下面積C.約登指數D.似然比答案:B解析:AUC綜合各截斷,不受閾值選擇影響。1.27在病例-隊列設計中,估計HR需A.普通CoxB.加權CoxC.條件logisticD.精確法答案:B解析:病例-隊列需逆概率加權,校正過抽樣。1.28若隨機效應Meta分析τ2=0,則A.異質性高B.與固定效應結果一致C.發(fā)表偏倚大D.需剪補法答案:B解析:τ2=0表示無異質,隨機退化為固定。1.29對計數資料過度離散,應A.改用負二項B.加入隨機效應C.準似然調整D.以上均可答案:D解析:負二項、隨機效應、準似然均能處理過度離散。1.30在機器學習可解釋性中,SHAP值滿足A.局部準確性B.全局一致性C.缺失性D.以上全部答案:D解析:SHAP基于博弈論,滿足三條公理。2.多項選擇題(每題2分,共20分)2.1關于多重比較校正,正確的是A.Bonferroni法控制族錯誤率B.FDR控制期望假發(fā)現比例C.固定序列法不消耗αD.模擬顯示Holm法比Bonferroni有更高檢驗效能E.貝葉斯方法無需校正答案:A,B,D解析:C錯誤,固定序列仍需分配α;E錯誤,貝葉斯仍需決策規(guī)則。2.2下列哪些屬于非概率抽樣A.方便抽樣B.雪球抽樣C.配額抽樣D.系統(tǒng)抽樣E.整群抽樣答案:A,B,C解析:系統(tǒng)、整群可嵌入概率框架。2.3在生存數據回歸診斷中,可評估比例風險的圖包括A.Schoenfeld殘差圖B.log-log圖C.累積鞅殘差D.deviance殘差E.dfbeta答案:A,B,C解析:dfbeta評估影響點,非比例風險。2.4關于貝葉斯因子,正確的是A.BF??>10表示強證據支持H?B.與似然比相同C.受先驗影響D.可用于模型選擇E.可比較非嵌套模型答案:A,C,D,E解析:B錯誤,BF積分掉參數,非簡單似然比。2.5下列哪些方法可處理時間依賴混雜A.邊際結構模型B.g-estimationC.結構嵌套模型D.傳統(tǒng)CoxE.逆概率加權答案:A,B,C,E解析:傳統(tǒng)Cox無法處理時依混雜。2.6在診斷準確性系統(tǒng)評價中,可檢測發(fā)表偏倚的有A.Deeks漏斗圖B.Egger回歸C.剪補法D.輪廓增強漏斗圖E.伽利略圖答案:A,B,D解析:剪補用于干預Meta,伽利略圖不常用。2.7關于交叉驗證,正確的是A.留一法方差低B.分層交叉驗證保持結局比例C.重復交叉驗證可降低方差D.嵌套交叉驗證用于調參E.驗證集越大,偏差越小答案:B,C,D解析:留一法方差高;驗證集大訓練集小,偏差大。2.8下列哪些屬于縱向數據缺失機制A.MCARB.MARC.MNARD.截斷E.右刪失答案:A,B,C解析:截斷與刪失屬生存數據概念。2.9在劑量-反應分析中,可用模型包括A.線性B.二次C.限制性立方樣條D.分段回歸E.Hill模型答案:A,B,C,D,E解析:均為常見參數化形式。2.10關于隨機化,正確的是A.可期望平衡已知混雜B.可期望平衡未知混雜C.區(qū)組隨機化可保持組間均衡D.動態(tài)隨機化可最小化協(xié)變量不平衡E.開放標簽下隨機化無效答案:A,B,C,D解析:E錯誤,隨機化仍有效,盲法減少測量偏倚。3.判斷題(每題1分,共10分)3.1對數變換可使任意右偏資料正態(tài)化。答案:×解析:對數僅對右偏且>0數據有效,極端偏態(tài)需Box-Cox。3.2在Cox模型中,基線風險函數估計需指定分布。答案:×解析:Cox為半參數,基線任意。3.3若兩變量VIF>10,則一定存在嚴重共線性。答案:√解析:經驗閾值10,>10說明方差膨脹嚴重。3.4貝葉斯可信區(qū)間頻率覆蓋概率一定等于名義水平。答案:×解析:覆蓋概率依賴先驗,頻率性質不一定。3.5對匹配病例對照研究,需用條件logistic回歸。答案:√解析:匹配設計需分層條件似然。3.6在Meta回歸中,研究數<10亦可進行多變量回歸。答案:×解析:事件過少易過擬合,一般要求研究數≥10×變量數。3.7對零膨脹模型,若Vuong檢驗P<0.05,則ZIP優(yōu)于普通Poisson。答案:√解析:Vuong用于非嵌套比較,P<0.05提示ZIP更好。3.8交叉設計必然比平行設計節(jié)省樣本。答案:×解析:若存在遺留效應或高退出,反而更費。3.9在機器學習測試中,驗證集用于調超參數。答案:×解析:驗證集調參,測試集僅最終評估。3.10對生態(tài)學相關分析,控制個體水平混雜即可消除生態(tài)學謬誤。答案:×解析:群體水平關聯(lián)仍不能推個體,需多水平數據。4.簡答題(每題10分,共40分)4.1給出隨機效應Meta分析中DerSimonian-Laird估計τ2的公式,并說明其局限。答案:公式:τ2=max{0,[Q?(k?1)]/[Σw??Σw?2/Σw?]}其中Q=Σw?(θ??θ?)2,w?=1/(σ?2+τ2)。局限:1.基于矩估計,效率低;2.當研究數k小,τ2可能為0,低估異質;3.不考慮不確定性,置信區(qū)間偏窄;4.對極端研究敏感;5.無法處理稀疏數據。4.2解釋邊際結構模型(MSM)如何控制時依混雜,并寫出權重公式。答案:時依混雜既是后續(xù)暴露的預測因子,又受既往暴露影響,傳統(tǒng)回歸調整會引入碰撞偏倚。MSM通過逆概率加權構建“偽人群”,使暴露獨立于時依混雜。權重公式(非穩(wěn)定):SW?(t)=∏_{k=0}^{t}1/[P(A(k)=a(k)|ā(k?1),L?(k))]穩(wěn)定權重再乘以P(A(k)=a(k)|ā(k?1))。加權后,可直接用簡單模型估計暴露因果效應。4.3說明LASSO回歸的幾何解釋,并比較其與嶺回歸在變量選擇上的差異。答案:LASSO約束Σ|β?|≤t,可行域為菱形,角點易使系數恰好為0,實現稀疏。嶺回歸約束Σβ?2≤t,可行域為球體,無角點,系數連續(xù)收縮但不為零。因此LASSO兼具選擇與收縮,嶺僅收縮。當預測變量高度相關,LASSO傾向于任選一個,而嶺將系數均分。4.4給出計算NetReclassificationImprovement(NRI)的步驟,并指出其爭議。答案:步驟:1.基于舊模型與新模型,分別計算每個個體的風險分類(如<5%,5–20%,>20%)。2.對病例組,計算新模型向上分類比例p_up,down;對非病例組計算q_up,down。3.NRI=(p_up?p_down)?(q_up?q_down)。爭議:1.分類閾值主觀;2.忽略連續(xù)風險變化;3.對基礎風險敏感;4.統(tǒng)計顯著≠臨床意義;5.置信區(qū)間計算需事件與非事件分別bootstrap,易誤用。5.計算與分析題(共50分)5.1某新藥II期試驗采用單臂Simon二階段設計,預期有效率p?=0.20,p?=0.35,α=0.05,β=0.20。第一階段若≤3/19有效則終止。(1)給出第二階段樣本量及總拒絕閾值;(2)若第一階段觀察到4例有效,是否進入第二階段?(3)若最終有效13/54,結論?答案:(1)查Simon最優(yōu)設計表:n?=19,r?=3;n=54,r=13。(2)4>3,進入第二階段。(3)13≥13,拒絕p≤0.20,認為有效。5.2下表為配對病例對照研究,調查X基因型與疾病關聯(lián):||病例+|病例?||----------|-------|-------||對照+|35|8||對照?|21|46|(1)計算McNemarχ2及P值;(2)給出OR及95%CI;(3)解釋結果。答案:(1)不一致對子:b=8,c=21;χ2=(b?c)2/(b+c)=6.76,P=0.009。(2)OR=c/b=2.625;95%CI=exp[ln(OR)±1.96√(1/b+1/c)]=1.29–5.34。(3)基因型與疾病顯著相關,攜帶者患病風險增加約1.6倍。5.3生存數據:組An=60,觀察人年=480,死亡18;組Bn=60,人年=510,死亡10。(1)計算率比RR及95%CI;(2)若用Poisson回歸,寫出Stata命令;(3)解釋RR。答案:(1)λ_A=18/480=0.0375,λ_B=10/510=0.0196;RR=1.91;95%CI=exp[ln(1.91)±1.96√(1/18+1/10)]=0.89–4.11。(2)stsettime,failure(dead)poissondeadi.group,exposure(time)irr(3)A組死亡率為B組1.9倍,但置信帶包含1,尚不能認為顯著升高。5.4預測模型開發(fā):總樣本n=800,事件200,候選變量40。(1)用LASSOlogistic篩選后保留12變量,計算事件per變量;(2)指出潛在問題;(3)給出改進策略。答案:(1)200/12≈16.7事件/變量。(2)仍低于經驗20事件/變量,可能過擬合,外推差。(3)①外部驗證;②Bootstrapoptimism校正;③懲罰回歸調優(yōu);④簡化模型;⑤合并大樣本。5.5多水平數據:患者嵌套于醫(yī)院,共30醫(yī)院,每院≈100患者,結局為術后感染。(1)給出空模型公式;(2)若空模型方差成分:醫(yī)院水平σ2_u=0.36,患者水平σ2_e=3.20,計算ICC;(3)解釋ICC含義。答案:(1)logit(π??)=β?+u?,u?~N(0,σ2_u)。(2)ICC=σ2_u/(σ2_u+σ2_e)=0.36/(0.36+3.20)=0.101。(3)10.1%的總變異源于醫(yī)院水平,提示醫(yī)院差異對感染影響中等,需關注院內管理。6.綜合應用題(共40分)6.1某研究團隊擬評估空氣污染(PM2.5)對急性心梗(AMI)入院的影響,擁有2018–2025年某市每日AMI入院計數、PM2.5濃度、氣象變量(溫

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論