2025年生物統(tǒng)計(jì)學(xué)應(yīng)用與分析考試卷及答案_第1頁
2025年生物統(tǒng)計(jì)學(xué)應(yīng)用與分析考試卷及答案_第2頁
2025年生物統(tǒng)計(jì)學(xué)應(yīng)用與分析考試卷及答案_第3頁
2025年生物統(tǒng)計(jì)學(xué)應(yīng)用與分析考試卷及答案_第4頁
2025年生物統(tǒng)計(jì)學(xué)應(yīng)用與分析考試卷及答案_第5頁
已閱讀5頁,還剩10頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年生物統(tǒng)計(jì)學(xué)應(yīng)用與分析考試卷及答案一、單項(xiàng)選擇題(每題2分,共20分。每題只有一個(gè)正確答案,請(qǐng)將正確選項(xiàng)字母填入括號(hào)內(nèi))1.某研究欲比較三種不同肥料對(duì)玉米株高的影響,隨機(jī)抽取30塊試驗(yàn)田,每塊田隨機(jī)施用其中一種肥料。若數(shù)據(jù)滿足正態(tài)性與方差齊性,應(yīng)首選的假設(shè)檢驗(yàn)方法為()A.單樣本t檢驗(yàn)B.配對(duì)t檢驗(yàn)C.單因素方差分析D.KruskalWallis檢驗(yàn)答案:C2.在Logistic回歸中,若某自變量X的回歸系數(shù)β=0.8,則其優(yōu)勢(shì)比OR為()A.0.45B.1.00C.2.23D.8.00答案:C(OR=e^0.8≈2.23)3.對(duì)同一批小鼠先后兩次測(cè)量血糖值,欲評(píng)估測(cè)量方法的一致性,應(yīng)選用()A.Pearson相關(guān)系數(shù)B.組內(nèi)相關(guān)系數(shù)ICCC.決定系數(shù)R2D.Cronbachα系數(shù)答案:B4.在生存分析中,若KaplanMeier曲線出現(xiàn)交叉,說明()A.兩組生存率無差異B.比例風(fēng)險(xiǎn)假設(shè)可能不成立C.樣本量不足D.中位生存期相等答案:B5.某實(shí)驗(yàn)記錄細(xì)胞存活率(%)與藥物濃度(μg/mL)的關(guān)系,經(jīng)BoxCox變換后仍呈明顯“S”型趨勢(shì),應(yīng)優(yōu)先考慮的回歸模型為()A.線性回歸B.多項(xiàng)式回歸C.四參數(shù)Logistic回歸D.指數(shù)回歸答案:C6.在多重比較校正方法中,若實(shí)驗(yàn)共進(jìn)行10次兩兩比較,原始P值分別為0.01、0.02…0.10,則Bonferroni校正后仍顯著的P值閾值為()A.0.01B.0.005C.0.05D.0.50答案:B(0.05/10=0.005)7.對(duì)基因表達(dá)數(shù)據(jù)進(jìn)行主成分分析(PCA),第一主成分方差貢獻(xiàn)率為82%,第二主成分貢獻(xiàn)率為10%,則前兩個(gè)主成分累計(jì)貢獻(xiàn)率為()A.82%B.90%C.92%D.172%答案:C8.在隨機(jī)區(qū)組設(shè)計(jì)中,若區(qū)組因素與處理因素存在交互效應(yīng),則正確的統(tǒng)計(jì)模型應(yīng)包含()A.僅主效應(yīng)B.主效應(yīng)+交互項(xiàng)C.僅區(qū)組效應(yīng)D.僅處理效應(yīng)答案:B9.若某變量服從泊松分布,其均數(shù)λ=4,則其方差為()A.2B.4C.16D.無法確定答案:B10.在Meta分析中,若I2=75%,則說明()A.無異質(zhì)性B.輕度異質(zhì)性C.中度異質(zhì)性D.高度異質(zhì)性答案:D二、多項(xiàng)選擇題(每題3分,共15分。每題有兩個(gè)或兩個(gè)以上正確答案,多選、少選、錯(cuò)選均不得分)11.下列哪些情況可能導(dǎo)致線性回歸出現(xiàn)“共線性”問題()A.樣本量遠(yuǎn)小于自變量個(gè)數(shù)B.某自變量是另一自變量的線性組合C.自變量間Pearson|r|>0.9D.因變量呈明顯偏態(tài)E.殘差呈自相關(guān)答案:A、B、C12.關(guān)于非參數(shù)檢驗(yàn),下列說法正確的是()A.不要求總體分布已知B.檢驗(yàn)效能總是高于參數(shù)檢驗(yàn)C.適用于等級(jí)資料D.MannWhitneyU檢驗(yàn)適用于兩組獨(dú)立樣本E.Wilcoxon符號(hào)秩檢驗(yàn)適用于配對(duì)設(shè)計(jì)答案:A、C、D、E13.在RNAseq差異表達(dá)分析中,下列哪些方法可用于控制FDR()A.BenjaminiHochberg法B.Bonferroni法C.Storeyq值法D.DESeq2內(nèi)置的BH法E.TukeyHSD法答案:A、C、D14.下列哪些屬于“重復(fù)測(cè)量設(shè)計(jì)”的特點(diǎn)()A.同一受試對(duì)象多次觀測(cè)B.觀測(cè)值間獨(dú)立C.需考慮協(xié)方差結(jié)構(gòu)D.可采用混合效應(yīng)模型E.時(shí)間可作為固定效應(yīng)或隨機(jī)效應(yīng)答案:A、C、D、E15.關(guān)于AIC與BIC,下列說法正確的是()A.AIC懲罰項(xiàng)小于BICB.均用于模型選擇C.越小表示模型越好D.BIC隨樣本量增大懲罰更重E.僅適用于線性模型答案:A、B、C、D三、判斷題(每題1分,共10分。正確打“√”,錯(cuò)誤打“×”)16.當(dāng)樣本量趨于無窮大時(shí),t分布趨近于標(biāo)準(zhǔn)正態(tài)分布。(√)17.在Logistic回歸中,若因變量為二分類,則連接函數(shù)必須是logit函數(shù),不可使用probit。(×)18.對(duì)同一數(shù)據(jù),若ShapiroWilk檢驗(yàn)P=0.03,則可直接認(rèn)為數(shù)據(jù)不服從正態(tài)分布。(√)19.生存分析中,若存在失訪數(shù)據(jù),KaplanMeier法仍可使用,但需將失訪數(shù)據(jù)作為刪失處理。(√)20.在多重線性回歸中,若VIF>10,則一定存在嚴(yán)重多重共線性。(√)21.非參數(shù)檢驗(yàn)的零假設(shè)總是“總體分布相同”。(×)22.對(duì)計(jì)數(shù)資料進(jìn)行χ2檢驗(yàn)時(shí),若期望頻數(shù)<5的格子數(shù)超過20%,應(yīng)使用Fisher精確概率法。(√)23.在隨機(jī)森林中,增加樹的數(shù)量一定能降低測(cè)試誤差。(×)24.若兩變量Pearsonr=0,則一定獨(dú)立。(×)25.Meta分析中,固定效應(yīng)模型假設(shè)所有研究的真實(shí)效應(yīng)量相同。(√)四、填空題(每空2分,共20分)26.在單因素方差分析中,總離差平方和SST=SSA+________。答案:SSE27.若某藥物劑量X(mg)與心率Y(次/分)呈負(fù)相關(guān),線性回歸方程為Y=120?2.5X,則劑量每增加1mg,心率平均下降________次/分。答案:2.528.在泊松回歸中,常用的連接函數(shù)為________函數(shù)。答案:對(duì)數(shù)29.若隨機(jī)變量X~N(μ,σ2),則Z=(X?μ)/σ服從________分布。答案:標(biāo)準(zhǔn)正態(tài)30.當(dāng)資料存在過度離散時(shí),負(fù)二項(xiàng)回歸的離散參數(shù)θ越大,方差越________。答案:小31.在生存分析中,若風(fēng)險(xiǎn)函數(shù)h(t)為常數(shù),則生存函數(shù)S(t)呈________分布。答案:指數(shù)32.若某2×2列聯(lián)表χ2=6.25,則其列聯(lián)系數(shù)C=________(保留三位小數(shù))。答案:0.62033.對(duì)p維數(shù)據(jù)做PCA,最多可提取________個(gè)非零特征值的主成分。答案:p34.在混合線性模型中,隨機(jī)效應(yīng)的假定其服從均數(shù)為0、方差為________的正態(tài)分布。答案:G(或隨機(jī)效應(yīng)協(xié)方差矩陣)35.若某實(shí)驗(yàn)的檢驗(yàn)效能1?β=0.90,則第二類錯(cuò)誤概率β=________。答案:0.10五、簡(jiǎn)答題(每題8分,共24分)36.簡(jiǎn)述RNAseq數(shù)據(jù)在差異表達(dá)分析前為何需要進(jìn)行“標(biāo)準(zhǔn)化”以及常用的兩種標(biāo)準(zhǔn)化方法原理。答案要點(diǎn):1.原因:測(cè)序深度、基因長(zhǎng)度、樣本間文庫大小差異導(dǎo)致原始計(jì)數(shù)不可比;標(biāo)準(zhǔn)化消除系統(tǒng)偏差,使表達(dá)量具有可比性。2.TPM(TranscriptsPerMillion):先將readsperkilobase(RPK)計(jì)算,再除以樣本總RPK的百萬倍,保證同一樣本內(nèi)基因相對(duì)比例不變,且樣本間可比。3.DESeq2的sizefactors:通過medianofratios方法,假設(shè)大部分基因非差異表達(dá),計(jì)算每個(gè)樣本的sizefactor,使樣本間基因計(jì)數(shù)的中位數(shù)比值趨于1,再進(jìn)行縮放。37.說明KaplanMeier法估計(jì)生存函數(shù)的基本步驟,并指出其兩個(gè)前提假設(shè)。答案要點(diǎn):步驟:1.將事件時(shí)間排序;2.計(jì)算每個(gè)時(shí)間點(diǎn)的死亡數(shù)與風(fēng)險(xiǎn)集;3.用乘積限法計(jì)算S(t)=∏(1?d_i/n_i);4.繪制階梯曲線。假設(shè):1.刪失時(shí)間與事件時(shí)間獨(dú)立;2.研究對(duì)象的風(fēng)險(xiǎn)集代表目標(biāo)人群,即失訪者與未失訪者具有相同的事件風(fēng)險(xiǎn)。38.解釋“交互效應(yīng)”與“混雜因素”在回歸模型中的區(qū)別,并各舉一例說明如何識(shí)別與處理。答案要點(diǎn):交互效應(yīng):某自變量對(duì)因變量的影響隨另一自變量水平變化而變化,需在模型中加入乘積項(xiàng);識(shí)別可用似然比檢驗(yàn)比較主效應(yīng)模型與含交互項(xiàng)模型;處理:保留顯著交互項(xiàng)并分層解釋?;祀s因素:與自變量及因變量均相關(guān),且不在因果路徑上,導(dǎo)致虛假關(guān)聯(lián);識(shí)別:比較加入與未加入該因素時(shí)系數(shù)變化>10%;處理:納入模型調(diào)整或使用匹配/分層分析。六、計(jì)算與分析題(共31分)39.(10分)為研究光照強(qiáng)度(Lux,X)對(duì)擬南芥光合速率(μmolm?2s?1,Y)的影響,測(cè)得數(shù)據(jù):n=8,∑X=800,∑Y=56,∑X2=90000,∑Y2=420,∑XY=6000。(1)建立線性回歸方程Y=a+bX;(2)檢驗(yàn)回歸系數(shù)顯著性(α=0.05,t?.???,?=2.447);(3)當(dāng)X=120Lux時(shí),預(yù)測(cè)Y并給出95%置信區(qū)間(已知S_YX=0.8,X?=100)。解:(1)b=(n∑XY?∑X∑Y)/(n∑X2?(∑X)2)=(8×6000?800×56)/(8×90000?8002)=0.04a=Y??bX?=(56/8)?0.04×100=7?4=3方程:Y=3+0.04X(2)SSX=∑X2?(∑X)2/n=90000?8002/8=10000sb=SYX/√SSX=0.8/√10000=0.008t=b/sb=0.04/0.008=5|t|=5>2.447,拒絕H?,回歸顯著。(3)Y?=3+0.04×120=7.8SE_pred=SYX√[1/n+(X?X?)2/SSX]=0.8√[1/8+(120?100)2/10000]=0.8√0.125+0.0004≈0.28395%CI:7.8±2.447×0.283→(7.11,8.49)40.(10分)某新藥試驗(yàn),記錄兩組小鼠(n?=n?=15)的生存天數(shù):實(shí)驗(yàn)組:9,12,13,15,15,17,18,20,22,23,25,27,30,32,35?(?為刪失)對(duì)照組:5,6,8,9,10,11,12,13,14,15,16,17,18,19,20(1)繪制KaplanMeier曲線草圖(文字描述即可);(2)用Logrank檢驗(yàn)判斷兩組生存差異(給出檢驗(yàn)統(tǒng)計(jì)量及結(jié)論,α=0.05,χ2?.??,?=3.84)。解:(1)曲線描述:實(shí)驗(yàn)組曲線整體位于對(duì)照組右上方,呈緩慢下降,35天仍存活1只;對(duì)照組曲線自5天起快速下降至20天歸零。(2)Logrank計(jì)算:合并排序事件時(shí)間,列出四格表,計(jì)算O?=7,E?=11.2,O?=13,E?=8.8χ2=(O??E?)2/E?+(O??E?)2/E?=(7?11.2)2/11.2+(13?8.8)2/8.8≈1.58+2.01=3.593.59<3.84,不拒絕H?,尚不能認(rèn)為兩組生存差異有統(tǒng)計(jì)學(xué)意義(P≈0.058)。41.(11分)為研究基因表達(dá)量(X,log?CPM)與表型值(Y)的關(guān)系,建立線性模型Y=β?+β?X+ε,發(fā)現(xiàn)殘差方差不齊?,F(xiàn)采用加權(quán)最小二乘(WLS),權(quán)重w=1/σ2,其中σ2與X正相關(guān)。(1)寫出WLS目標(biāo)函數(shù);(2)推導(dǎo)β?的WLS估計(jì)公式;(3)若n=5,數(shù)據(jù)如下:X:0,1,2,3,4Y:2.1,3.9,5.8,8.2,10.1w:2,1.5,1,0.8,0.5計(jì)算β?_WLS。解:(1)目標(biāo)函數(shù):min∑w_i(Y_i?β??β?X_i)2(2)β?_WLS=∑w_i(X_i?X?_w)(Y_i?Y?_w)/∑w_i(X_i?X?_w)2,其中X?_w=∑w_iX_i/∑w_i(3)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論