2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-非參數(shù)統(tǒng)計(jì)方法在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用_第1頁
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-非參數(shù)統(tǒng)計(jì)方法在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用_第2頁
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-非參數(shù)統(tǒng)計(jì)方法在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用_第3頁
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-非參數(shù)統(tǒng)計(jì)方法在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用_第4頁
2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案-非參數(shù)統(tǒng)計(jì)方法在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

2026年大學(xué)統(tǒng)計(jì)學(xué)期末考試題庫及答案—非參數(shù)統(tǒng)計(jì)方法在生物醫(yī)學(xué)領(lǐng)域的應(yīng)用1.單選題(每題4分,共40分)1.1在比較兩組小鼠腫瘤體積隨時(shí)間變化曲線是否重合時(shí),首選的非參數(shù)方法是A.Mann-WhitneyU檢驗(yàn)B.Kolmogorov-Smirnov雙樣本檢驗(yàn)C.帶FDR校正的Wilcoxon符號(hào)秩檢驗(yàn)D.基于秩的縱向Jonckheere-Terpstra檢驗(yàn)答案:B解析:K-S檢驗(yàn)比較兩條經(jīng)驗(yàn)分布函數(shù)的整體差異,對(duì)“曲線是否重合”最敏感;其余方法或僅比較位置,或僅用于橫斷面數(shù)據(jù)。1.2某臨床試驗(yàn)用Kaplan-Meier估計(jì)生存函數(shù),若在最后觀察時(shí)點(diǎn)仍有25%受試者存活,則該時(shí)點(diǎn)生存率的標(biāo)準(zhǔn)誤可用Greenwood公式計(jì)算。若此時(shí)風(fēng)險(xiǎn)集人數(shù)為n=16,則標(biāo)準(zhǔn)誤約為A.0.125B.0.108C.0.095D.0.087答案:B解析:Greenwood公式SE=√[S2(t)∑(d_i/(n_i(n_i-d_i)))],末端僅1項(xiàng),d=0,故SE=S(t)/√n=0.25/4=0.108。1.3對(duì)單細(xì)胞RNA-seq的數(shù)千個(gè)基因做差異表達(dá),若采用非參數(shù)秩檢驗(yàn)并控制FDR,下列哪一步驟能最大限度減少“離散型p值”帶來的FDR低估A.將p值進(jìn)行Storey的q值轉(zhuǎn)換B.使用帶隨機(jī)擾動(dòng)的Wilcoxon檢驗(yàn)C.采用permutation-basedFDRD.增加樣本量至n>100答案:C解析:permutation保留離散結(jié)構(gòu),F(xiàn)DR估計(jì)無偏;Storey需連續(xù)p值;擾動(dòng)破壞原假設(shè);樣本量增大不解決離散問題。1.4在影像組學(xué)中,對(duì)同一患者的MRI與CT紋理特征做一致性評(píng)價(jià),若數(shù)據(jù)明顯非正態(tài)且存在大量結(jié)值,應(yīng)選A.ICC(2,1)B.ConcordancecorrelationcoefficientC.Kendall’sWD.Bland-Altmanwithlog-transformation答案:C解析:Kendall’sW對(duì)結(jié)值穩(wěn)健且完全非參數(shù),適用于多序列排序一致性;ICC與CCC均假設(shè)近似正態(tài)。1.5對(duì)5個(gè)中心各招募20名患者進(jìn)行疼痛評(píng)分(0-10),欲檢驗(yàn)“中心效應(yīng)是否存在”,數(shù)據(jù)極度偏態(tài),最佳非參數(shù)方案為A.Kruskal-WallisfollowedbyDwass-Steel-Critchlow-Flignerpost-hocB.帶中心隨機(jī)效應(yīng)的bootstrapANOVAC.Friedman檢驗(yàn)D.混合效應(yīng)模型秩變換(rank-basedmixedmodel)答案:D解析:中心為隨機(jī)效應(yīng),需考慮重復(fù)測量結(jié)構(gòu);rank-basedmixedmodel保留非參數(shù)特性且可處理隨機(jī)效應(yīng)。1.6若對(duì)生存數(shù)據(jù)擬合Cox比例風(fēng)險(xiǎn)模型后發(fā)現(xiàn)Schoenfeld殘差呈明顯非線性,可考慮A.引入時(shí)間依賴協(xié)變量系數(shù)B.改用加速失效模型C.采用log-rank檢驗(yàn)D.對(duì)協(xié)變量做Box-Cox變換答案:A解析:非線性Schoenfeld提示比例風(fēng)險(xiǎn)不成立,可令β(t)為時(shí)間的函數(shù);log-rank無法處理協(xié)變量;變換協(xié)變量不解決比例問題。1.7對(duì)高維代謝組學(xué)數(shù)據(jù)(p?n)做非參數(shù)判別,若希望輸出變量重要性且對(duì)異常值穩(wěn)健,首選A.隨機(jī)森林平均下降精度B.基于秩的SVM權(quán)重C.帶L1正則的Logistic回歸D.非參數(shù)Bayesian稀疏模型答案:B解析:基于秩的SVM將原始數(shù)據(jù)映射到秩空間,權(quán)重直接反映變量貢獻(xiàn),對(duì)異常值不敏感;RF需OOB估計(jì),且在高維易過擬合。1.8若用非參數(shù)bootstrap估計(jì)中位數(shù)的95%置信區(qū)間,bootstrap分布出現(xiàn)明顯“跳躍”導(dǎo)致分位數(shù)區(qū)間端點(diǎn)恰好落在同一觀測值上,可A.改用平滑bootstrapB.增加bootstrap次數(shù)至10000C.采用學(xué)生化區(qū)間D.改用百分位-t區(qū)間答案:A解析:平滑bootstrap對(duì)經(jīng)驗(yàn)分布加小擾動(dòng),消除離散導(dǎo)致的跳躍;單純?cè)黾覤不解決離散問題。1.9對(duì)兩組成年人步態(tài)加速度信號(hào)(長度不等)檢驗(yàn)“整體波形差異”,若要求對(duì)齊時(shí)間軸且對(duì)振幅單調(diào)變換穩(wěn)健,應(yīng)選A.動(dòng)態(tài)時(shí)間規(guī)整(DTW)后做permutationMANOVAB.傅里葉變換后HotellingT2C.函數(shù)型主成分t檢驗(yàn)D.帶彈性距離的秩和檢驗(yàn)答案:A解析:DTW對(duì)齊非線性時(shí)間變形,permutationMANOVA無需正態(tài);傅里葉對(duì)單調(diào)變換不穩(wěn)健;函數(shù)型PCA需正態(tài)假設(shè)。1.10在基因集富集分析(GSEA)中,若表型為二分類且樣本量極小(n1=n2=6),下列哪種做法最能保持非參數(shù)特性并控制FWERA.使用基因水平t檢驗(yàn)生成排序列表B.直接對(duì)表達(dá)矩陣做permutationofclasslabelsC.采用Wilcoxonrank-sum生成排序列表D.使用parametricGSEAwithasymptoticp-value答案:B解析:對(duì)標(biāo)簽做permutation保留聯(lián)合分布,F(xiàn)WER由permutation控制;t檢驗(yàn)/Wilcoxon均假設(shè)基因獨(dú)立,且asymptotic近似在小樣本失效。2.多選題(每題5分,共30分,少選得2分,錯(cuò)選0分)2.1下列哪些非參數(shù)方法可用于評(píng)估診斷試驗(yàn)的ROC曲線下面積(AUC)置信區(qū)間A.DeLong非參數(shù)法B.bootstrap百分位法C.Mann-WhitneyU的漸近方差D.基于秩的jackknifeE.二項(xiàng)分布精確法答案:A,B,C,D解析:E僅適用于單點(diǎn)靈敏度,不適用于AUC。2.2對(duì)重復(fù)測量的收縮壓(非正態(tài))比較三種降壓藥,若每例患者觀測5個(gè)時(shí)點(diǎn),可用A.邊際模型GEEwithrobustsandwich估計(jì)B.混合效應(yīng)秩變換模型C.Friedman檢驗(yàn)D.縱向rank-basedANOVA-typestatisticE.協(xié)變量調(diào)整的Kruskal-Wallis答案:A,B,D解析:Friedman僅處理單變量重復(fù);E忽略重復(fù)結(jié)構(gòu);A、B、D均保留非參數(shù)特性且考慮相關(guān)。2.3關(guān)于多重比較校正,下列說法正確的是A.Bonferroni法對(duì)任意依賴結(jié)構(gòu)均保守B.Holm法比Bonferroni有更高檢驗(yàn)效能C.Benjamini-Hochberg法控制FDR≤αD.若檢驗(yàn)統(tǒng)計(jì)量正相關(guān),Westfall-Youngpermutation法可提高效能E.固定順序檢驗(yàn)可控制FWER但需預(yù)設(shè)層次答案:A,B,C,D,E解析:全部正確,E指序貫gatekeeping。2.4對(duì)單細(xì)胞UMAP嵌入做聚類后,欲非參數(shù)檢驗(yàn)?zāi)炒厥欠窀弑磉_(dá)某基因,應(yīng)避免A.對(duì)該簇與其他簇做Wilcoxon秩和B.用logistic回歸LRTC.對(duì)簇成員做permutation檢驗(yàn)D.用t檢驗(yàn)假設(shè)正態(tài)E.采用帶結(jié)校正的exactranktest答案:B,D解析:B假設(shè)線性及大樣本;D假設(shè)正態(tài);A、C、E均為非參數(shù)。2.5下列哪些技術(shù)可用于高維生存數(shù)據(jù)的非參數(shù)變量篩選A.基于permutation的隨機(jī)生存森林最小深度B.帶L1正則的Cox模型C.非參數(shù)加性CoxwithcomponentselectionD.基于秩的sureindependencescreeningE.梯度提升Coxwithsubsampling答案:A,C,D解析:B、E為半?yún)?shù);A、C、D完全非參數(shù)。2.6對(duì)功能近紅外光譜(fNIRS)的通道×?xí)r間矩陣做被試間差異檢驗(yàn),若數(shù)據(jù)非正態(tài)且通道間相關(guān),可用A.基于球化秩的F型檢驗(yàn)B.帶cluster-mass的permutation檢驗(yàn)C.函數(shù)型Wilcoxon檢驗(yàn)D.多元Kruskal-WallisE.基于tensorrank的MANOVA答案:A,B,C,E解析:D忽略時(shí)間維度相關(guān);A、B、C、E均非參數(shù)且考慮相關(guān)。3.填空題(每空3分,共30分)3.1對(duì)n=12的配對(duì)阿爾茨海默量表得分,用Wilcoxon符號(hào)秩檢驗(yàn),正秩和T+=56,負(fù)秩和T-=22,則雙側(cè)精確p值=________。(保留三位小數(shù))答案:0.263解析:查Wilcoxon精確分布表,n=12,T=min(T+,T-)=22,P(T≤22)=0.1315,雙側(cè)p=2×0.1315=0.263。3.2若對(duì)兩獨(dú)立樣本n1=n2=15做permutationt檢驗(yàn),所有permutation中|t|≥觀測值的排列有________個(gè)。答案:大于1小于binom(30,15)解析:精確數(shù)目需枚舉,但最大可能為C(30,15)=155117520,實(shí)際取決于數(shù)據(jù)。3.3對(duì)生存數(shù)據(jù)用log-rank檢驗(yàn),若O-E=4.8,Var(O-E)=9,則Z值=________。答案:1.60解析:Z=(O-E)/√Var=4.8/3=1.60。3.4若對(duì)基因表達(dá)做rank-transform,設(shè)原始值x=(7,3,5,5,9),則rank后平均秩為________。答案:(5,1,3,3,5)解析:結(jié)值取平均,(3+4)/2=3.5,修正:(5,1,3.5,3.5,5)。3.5對(duì)n=100的樣本,bootstrap估計(jì)中位數(shù),B=2000,若bootstrap分布第2.5百分位為12.3,第97.5百分位為18.7,則95%置信區(qū)間=________。答案:(12.3,18.7)解析:直接取百分位區(qū)間。3.6對(duì)k=6組做Kruskal-Wallis,H=14.52,df=5,則近似χ2的p值=________。(保留三位小數(shù))答案:0.013解析:查χ2分布,P(χ2?≥14.52)=0.013。3.7若對(duì)ROC曲線做DelLong方差估計(jì),AUC=0.891,SE=0.043,則95%Wald區(qū)間=________。答案:(0.807,0.975)解析:0.891±1.96×0.043→(0.807,0.975)。3.8對(duì)n=50的樣本,用核密度估計(jì)pdf,若采用Silverman規(guī)則帶寬,σ?=2.3,則h=________。答案:0.786解析:h=1.06σ?n^(-1/5)=1.06×2.3×50^(-0.2)=0.786。3.9對(duì)兩樣本做Mann-Whitney檢驗(yàn),U=345,n1=25,n2=30,則標(biāo)準(zhǔn)化Z=________。(無結(jié))答案:2.18解析:μ_U=n1n2/2=375,σ_U=√[n1n2(n1+n2+1)/12]=√[25×30×56/12]=61.24,Z=(345-375)/61.24=-0.49,取絕對(duì)值0.49,雙側(cè)無意義,但題目僅求Z值。3.10對(duì)n=200的生存數(shù)據(jù),用Nelson-Aalen估計(jì)累積風(fēng)險(xiǎn),若在某時(shí)刻風(fēng)險(xiǎn)集100人,死亡10人,則ΔH=________。答案:0.10解析:ΔH=d/n=10/100=0.10。4.綜合應(yīng)用題(共100分)4.1某研究比較新型抗纖維化藥物與對(duì)照對(duì)肺功能下降速率的影響。招募n=48例,隨機(jī)雙盲,每3個(gè)月測FVC%,共8次。數(shù)據(jù)嚴(yán)重右偏,含15%缺失且為MAR。要求:(1)給出非參數(shù)檢驗(yàn)整體藥物效應(yīng)的完整方案(含缺失處理、縱向比較、多重比較校正);(20分)(2)用R語言寫出核心代碼;(10分)(3)若藥物組m=24,對(duì)照組m=24,縱向秩-transform后得F=7.34,df1=1,df2=42,求p值并解釋。(5分)答案與解析:(1)步驟:①缺失:用非參數(shù)多重插補(bǔ)(predictivemeanmatching,m=20)生成完整數(shù)據(jù);②對(duì)每次訪視分別計(jì)算FVC%的秩,采用Brunner-Munzel非參數(shù)邊際模型,檢驗(yàn)組×?xí)r間交互;③若交互顯著,用rank-basedANOVA-typestatistic做post-hoc,比較各時(shí)點(diǎn)差異;④用Westfall-Youngpermutation法控制FWER,permutation單元為受試者,保持縱向相關(guān);⑤敏感性分析:對(duì)最差值插補(bǔ)做相同流程,比較結(jié)論穩(wěn)健性。(2)R核心代碼:```rlibrary(nparLD)library(mice)set.seed(42)imp<mice(df,m=20,method="pmm",printFlag=FALSE)fitList<with(imp,nparLD(fvc~group*time,subject="id",data=df.long))pool<pool(fitList)summary(pool)```(3)p=0.0095,拒絕原假設(shè),提示藥物顯著改變FVC%下降軌跡。4.2某醫(yī)院收集n=120例肝癌患者術(shù)前MRI紋理特征共p=350維,欲建立非參數(shù)預(yù)后模型預(yù)測2年復(fù)發(fā)。事件數(shù)d=40,數(shù)據(jù)高維、高度共線、非正態(tài)。(1)給出變量篩選+模型構(gòu)建+內(nèi)部驗(yàn)證的完整非參數(shù)流程;(25分)(2)說明如何計(jì)算C-index及其95%CI;(10分)(3)若隨機(jī)生存森林給出最小深度排序,前20變量中含8個(gè)已被臨床證實(shí),求富集OR并解釋。(5分)答案與解析:(1)流程:①隨機(jī)生存森林(RSF)withmtry=√p,ntree=2000,用permutationimportance+最小深度篩選top30;②對(duì)top30做稀疏偏秩相關(guān)(SPRC)進(jìn)一步去冗余,保留≤15變量;③用非參數(shù)加性Coxwithcomponentselection(coxboost)再精煉,調(diào)λvia5-foldCV;④最終模型用RSFwithselectedvars,計(jì)算OOBC-index;⑤內(nèi)部驗(yàn)證:bootstrap500次,每次bootstrap樣本建模,原始樣本測試,得optimism-correctedC-index。(2)對(duì)每次bootstrap,計(jì)算C_idxb,用bootstrap百分位法取2.5%與97.5%分位,得95%CI。(3)富集OR=(8/20)/(8/350)=17.5,提示RSF最小深度顯著富集已知變量,篩選可信。4.3單細(xì)胞ATAC-seq在兩種T細(xì)胞亞群(各n=200細(xì)胞)中檢測peaks,共p=80000維,欲非參數(shù)檢驗(yàn)差異開放。(1)為何不能直接用Wilcoxon秩和逐peak檢驗(yàn)?(5分)(2)給出結(jié)合非參數(shù)檢驗(yàn)與FDR控制的完整方案;(15分)(3)若采用帶結(jié)校正的exactranktest,計(jì)算量過大,給出加速算法;(10分)答案與解析:(1)單細(xì)胞數(shù)據(jù)稀疏(>90%零),秩和分布極度離散,p值直方圖呈“鋸齒”,F(xiàn)DR估計(jì)失真;且逐檢驗(yàn)忽略細(xì)胞間相關(guān)。(2)方案:①對(duì)每peak,用two-partWilcoxon(零部分用二項(xiàng),非零部分用秩和),合并p值;②用permutationofclasslabels(B=10000)生成零分布,保留聯(lián)合結(jié)構(gòu);③用Storey’sq-value估計(jì)π0,控制FDR≤0.05;④對(duì)toppeaks用非參數(shù)bootstrap估計(jì)log2FC置信區(qū)間;⑤用

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論