2025年大學(xué)《生物統(tǒng)計學(xué)》專業(yè)題庫- 系統(tǒng)發(fā)育和生物統(tǒng)計學(xué)的交叉研究_第1頁
2025年大學(xué)《生物統(tǒng)計學(xué)》專業(yè)題庫- 系統(tǒng)發(fā)育和生物統(tǒng)計學(xué)的交叉研究_第2頁
2025年大學(xué)《生物統(tǒng)計學(xué)》專業(yè)題庫- 系統(tǒng)發(fā)育和生物統(tǒng)計學(xué)的交叉研究_第3頁
2025年大學(xué)《生物統(tǒng)計學(xué)》專業(yè)題庫- 系統(tǒng)發(fā)育和生物統(tǒng)計學(xué)的交叉研究_第4頁
2025年大學(xué)《生物統(tǒng)計學(xué)》專業(yè)題庫- 系統(tǒng)發(fā)育和生物統(tǒng)計學(xué)的交叉研究_第5頁
已閱讀5頁,還剩4頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

2025年大學(xué)《生物統(tǒng)計學(xué)》專業(yè)題庫——系統(tǒng)發(fā)育和生物統(tǒng)計學(xué)的交叉研究考試時間:______分鐘總分:______分姓名:______一、選擇題(每題2分,共20分)1.在系統(tǒng)發(fā)育分析中,使用最大似然法構(gòu)建樹時,選擇最優(yōu)進(jìn)化模型的主要依據(jù)是?A.樹的拓?fù)浣Y(jié)構(gòu)最簡單B.能夠獲得最高的樹長C.模型對數(shù)據(jù)的擬合度最高(似然值最大)D.模型參數(shù)最少2.當(dāng)比較兩個基于不同進(jìn)化模型構(gòu)建的系統(tǒng)發(fā)育樹的拓?fù)湟恢滦詴r,常用的統(tǒng)計指標(biāo)是?A.樹長B.置信度(Bootstrap支持率或自引導(dǎo)值)C.置信區(qū)間D.p值3.在分析核苷酸序列數(shù)據(jù)時,選擇合適的堿基頻率模型(如JTT,GTR,HKY)對于系統(tǒng)發(fā)育推斷的重要性在于?A.影響樹的拓?fù)浣Y(jié)構(gòu)B.影響樹的分支長估計的準(zhǔn)確性C.決定使用哪種統(tǒng)計檢驗方法D.主要影響樹的構(gòu)建時間4.對于一個給定的系統(tǒng)發(fā)育樹,計算節(jié)點(diǎn)的后驗概率(PosteriorProbability)所依賴的核心統(tǒng)計模型是?A.簡約法模型B.距離矩陣模型C.貝葉斯模型D.線性回歸模型5.在系統(tǒng)發(fā)育數(shù)據(jù)分析中,假設(shè)檢驗通常用于?A.判斷系統(tǒng)發(fā)育樹的拓?fù)涫欠耧@著B.估計物種分化時間C.計算系統(tǒng)發(fā)育樹的分支長D.選擇最優(yōu)的進(jìn)化模型6.以下哪種統(tǒng)計方法通常不直接用于檢驗系統(tǒng)發(fā)育樹拓?fù)浣Y(jié)構(gòu)之間的差異顯著性?A.Shimodaira-Hasegawa(SH)testB.LikelihoodRatioTest(LRT)C.WilcoxonSigned-RanktestD.Fisher'sExactTest7.當(dāng)使用貝葉斯方法進(jìn)行系統(tǒng)發(fā)育推斷時,MCMC(MarkovChainMonteCarlo)模擬的核心目的是?A.計算樹的拓?fù)涓怕蔅.估計模型參數(shù)的邊際后驗分布C.直接生成系統(tǒng)發(fā)育樹D.計算分支長度8.在系統(tǒng)發(fā)育統(tǒng)計推斷中,參數(shù)估計的不確定性通常通過什么方式量化?A.樹長B.標(biāo)準(zhǔn)誤(StandardError)或置信區(qū)間C.支持率D.自引導(dǎo)值9.如果研究者希望檢驗一個特定基因alogous序列對是否表現(xiàn)出與其他序列對不同的進(jìn)化速率,最適合采用的統(tǒng)計方法是?A.比較樹拓?fù)涞腟HtestB.檢驗不同樹的拓?fù)洳町惖腖RTC.獨(dú)立contrastsanalysisD.計算節(jié)點(diǎn)的后驗概率10.將系統(tǒng)發(fā)育樹視為一個包含進(jìn)化信息的統(tǒng)計模型時,對其進(jìn)行統(tǒng)計分析的關(guān)鍵在于?A.確保樹形拓?fù)渫耆_B.獲得該樹所對應(yīng)的參數(shù)(如分支長、根節(jié)點(diǎn)時間)的估計值及其不確定性C.使用盡可能復(fù)雜的進(jìn)化模型D.選擇支持率最高的樹二、填空題(每空1分,共10分)1.系統(tǒng)發(fā)育樹的拓?fù)浣Y(jié)構(gòu)表示了物種之間的________關(guān)系,而分支長度通常與________成正比。2.在系統(tǒng)發(fā)育數(shù)據(jù)分析中,選擇進(jìn)化模型時,AIC和BIC是常用的________準(zhǔn)則,它們傾向于選擇擬合數(shù)據(jù)t?t且復(fù)雜度適中的模型。3.統(tǒng)計學(xué)中的假設(shè)檢驗通常涉及原假設(shè)(H0)和備擇假設(shè)(H1),系統(tǒng)發(fā)育分析中的SHtest或LRT等可以看作是檢驗________與________之間差異是否顯著。4.對于連續(xù)型系統(tǒng)發(fā)育數(shù)據(jù)(如形態(tài)測量值),在進(jìn)行系統(tǒng)發(fā)育分析前,常需要進(jìn)行________以消除系統(tǒng)發(fā)育方差的影響,從而更清晰地檢測選擇信號。5.貝葉斯系統(tǒng)發(fā)育分析中,先驗分布反映了研究者對參數(shù)(如樹拓?fù)洌┑腳_______知識或假設(shè),而MCMC模擬則是通過________來近似后驗分布。三、簡答題(每題5分,共15分)1.簡述距離法構(gòu)建系統(tǒng)發(fā)育樹的基本原理及其主要優(yōu)缺點(diǎn)。2.解釋什么是系統(tǒng)發(fā)育數(shù)據(jù)中的“系統(tǒng)發(fā)育噪聲”(PhylogeneticNoise)及其可能來源。3.比較并說明最大似然法(ML)和貝葉斯法(BayesianInference)在系統(tǒng)發(fā)育推斷中的主要異同點(diǎn)。四、計算題與分析題(共15分)1.假設(shè)通過對五個物種的DNA序列進(jìn)行比對,獲得一個簡約樹(星形樹),樹的分支長度(代表進(jìn)化距離)如下:物種A到B的距離為0.1,A到C的距離為0.2,A到D的距離為0.2,A到E的距離為0.3,B到C的距離為0.3,B到D的距離為0.4,B到E的距離為0.5,C到D的距離為0.4,C到E的距離為0.6,D到E的距離為0.7。請根據(jù)此信息回答:(1)請描述該簡約樹的拓?fù)浣Y(jié)構(gòu)。(2)如果假設(shè)進(jìn)化模型為JTT(賈森斯-泰勒模型),請計算物種A和物種E之間的總進(jìn)化距離。(3)簡要說明,如果使用不同的進(jìn)化模型(如GTR),計算得到的分支長度和總進(jìn)化距離可能會有何不同,并解釋原因。(3分)2.研究者收集了六個物種(物種1至6)的某一基因片段的核苷酸序列數(shù)據(jù),并使用最大似然法構(gòu)建了兩棵拓?fù)浣Y(jié)構(gòu)略有差異的系統(tǒng)發(fā)育樹(TreeA和TreeB)。TreeA的似然值(Likelihood)為-2000,TreeB的似然值為-2020。假設(shè)數(shù)據(jù)集包含1000個位點(diǎn)。(4分)(1)基于似然值,哪棵樹在統(tǒng)計上更優(yōu)?請說明理由。(2)請計算這兩棵樹之間差異的似然比檢驗(LikelihoodRatioTest,LRT)的統(tǒng)計量(2*ln(L0/L1)),并判斷在α=0.05水平下,是否可以拒絕TreeA優(yōu)于TreeB的原假設(shè)(H0:TreeA=TreeB)?(3)簡述LRT在系統(tǒng)發(fā)育分析中判斷樹拓?fù)洳町愶@著性的基本原理。3.在一項關(guān)于鳥類喙部形狀進(jìn)化的研究中,研究者測量了五個物種喙長(變量X)和喙寬(變量Y)的數(shù)據(jù),并假設(shè)這些數(shù)據(jù)符合混合線性模型。研究者使用統(tǒng)計軟件得到部分輸出結(jié)果如下(僅為示例,非真實數(shù)據(jù)):“Group1:Coefficients(X)|EstimateSEtvaluePr(>|t|)______|________________|__________(Intercept)|10.01.56.670.0001X|0.80.24.000.005Group2:Coefficients(Y)|EstimateSEtvaluePr(>|t|)______|________________|__________(Intercept)|8.01.26.670.0001X|0.50.15.000.008”其中,Group1代表使用喙長預(yù)測喙寬的模型,Group2代表使用喙長預(yù)測喙長的模型。(4分)(1)請解釋該輸出結(jié)果中“Intercept”和“X”分別代表什么生物學(xué)含義?(2)根據(jù)輸出結(jié)果,判斷使用喙長預(yù)測喙寬(Group1)和使用喙長預(yù)測喙長(Group2)的線性關(guān)系是否顯著?(3)簡述這種基于線性回歸的統(tǒng)計方法如何可能被應(yīng)用于分析系統(tǒng)發(fā)育數(shù)據(jù)中的形態(tài)性狀進(jìn)化關(guān)系,并舉例說明。五、論述題(10分)結(jié)合具體的生物學(xué)實例(如研究物種分化速率、適應(yīng)性進(jìn)化、選擇壓力等),詳細(xì)闡述統(tǒng)計模型(如恰當(dāng)?shù)倪M(jìn)化模型選擇、混合模型、選擇模型等)在系統(tǒng)發(fā)育分析中的重要性,并說明如何通過統(tǒng)計方法評估模型的擬合優(yōu)度和結(jié)果的有效性。試卷答案一、選擇題1.C2.B3.B4.C5.A6.D7.B8.B9.C10.B二、填空題1.進(jìn)化/分化2.模型選擇/Modelselection3.單一樹/一棵樹/Asingletree/Aspecifictree,系統(tǒng)發(fā)育樹/系統(tǒng)發(fā)育假設(shè)/Aphylogenetictree/Aphylogenetichypothesis4.系統(tǒng)發(fā)育控制/Phylogeneticcontrol/系統(tǒng)發(fā)育過濾/Phylogeneticfiltering5.先驗/Prior,馬爾可夫鏈蒙特卡洛模擬/MCMCsampling三、簡答題1.原理:距離法首先根據(jù)物種間性狀的相似性或差異性計算距離矩陣,然后將距離矩陣轉(zhuǎn)化為樹形圖(如UPGMA、鄰接法),使得相鄰物種之間的距離在樹圖上最短或符合某種距離轉(zhuǎn)換規(guī)則。樹的構(gòu)建過程基于“距離最短連接”或“最小進(jìn)化距離”原則。優(yōu)點(diǎn):概念直觀,計算相對簡單快捷,適用于大量物種和/或多性狀數(shù)據(jù)。缺點(diǎn):對系統(tǒng)發(fā)育噪聲敏感,容易受到性狀多態(tài)性、性狀轉(zhuǎn)換速率變化的影響,可能產(chǎn)生與真實進(jìn)化歷史不符的拓?fù)浣Y(jié)構(gòu),對異常數(shù)據(jù)點(diǎn)敏感。2.定義:系統(tǒng)發(fā)育噪聲是指由于測量誤差、系統(tǒng)發(fā)育關(guān)系的不確定性、數(shù)據(jù)中的偽信號等因素,導(dǎo)致系統(tǒng)發(fā)育數(shù)據(jù)(如序列、形態(tài)測量值)不能準(zhǔn)確反映物種真實進(jìn)化歷史的信息偏差或干擾。來源:測量誤差(如測序錯誤、測量誤差);系統(tǒng)發(fā)育樹的構(gòu)建不完善或假設(shè)不正確;數(shù)據(jù)本身的多態(tài)性、轉(zhuǎn)換/丟失速率;環(huán)境因素對性狀的直接影響(非遺傳因素);數(shù)據(jù)缺失或壓縮;統(tǒng)計分析方法的局限性等。3.相同點(diǎn):都是基于概率模型進(jìn)行系統(tǒng)發(fā)育推斷;都試圖找到最可能(或后驗概率最高)的系統(tǒng)發(fā)育樹來表示數(shù)據(jù)中的進(jìn)化關(guān)系;都涉及模型選擇(進(jìn)化模型、先驗分布等)。不同點(diǎn):ML主要尋找給定模型下能使觀測數(shù)據(jù)似然值最大的樹,關(guān)注模型擬合度;貝葉斯法在給定先驗分布和模型下,通過MCMC等計算后驗概率分布,提供參數(shù)(包括樹拓?fù)洌┑母怕式忉?;ML通常給出單一最優(yōu)樹或基于似然比檢驗比較不同樹的相對支持度,貝葉斯法提供樹的概率分布和參數(shù)的不確定性估計;貝葉斯法可以自然地整合先驗知識,而ML通常視為先驗為無信息先驗的貝葉斯分析。四、計算題與分析題1.(1)該樹為星形樹,物種A為共同祖先,物種B、C、D、E從A獨(dú)立分化出來。(2)總進(jìn)化距離=A到B的距離+A到E的距離=0.1+0.3=0.4。(3)不同模型會基于不同的堿基頻率假設(shè)和進(jìn)化速率參數(shù)估計分支長度,因此結(jié)果不同。例如,GTR模型考慮了堿基頻率的異質(zhì)性,能更好地擬合真實序列數(shù)據(jù)中的飽和效應(yīng)等,通常能提供更準(zhǔn)確、更精細(xì)的分支長度估計,反映更真實的進(jìn)化速率差異。如果實際進(jìn)化速率在不同分支上差異很大,GTR等更復(fù)雜的模型能更好地捕捉這種差異,而JTT模型假設(shè)堿基頻率恒定,可能無法準(zhǔn)確反映所有分支的速率,導(dǎo)致分支長度估計相對粗略。2.(1)TreeA更優(yōu)。因為給定相同的模型和數(shù)據(jù),TreeA具有更高的似然值(-2000>-2020),表示它擬合數(shù)據(jù)更好。(2)LRT統(tǒng)計量=2*(LL_B-LL_A)=2*(-2020+2000)=2*(-20)=-40。由于計算結(jié)果為負(fù)數(shù),且似然比檢驗要求L0<L1(即原假設(shè)樹的似然值小于備擇假設(shè)),這里應(yīng)修正為LRT統(tǒng)計量=2*(LL_A-LL_B)=2*(2000+2020)=2*(40)=80。p值=P(LRT>=80|H0為真)。由于計算出的LRT統(tǒng)計量(80)遠(yuǎn)大于在H0為真時(即兩樹拓?fù)湎嗤┰摻y(tǒng)計量服從的卡方分布的臨界值(自由度為3,α=0.05時臨界值約7.815),因此p<0.05。拒絕H0,即在α=0.05水平下,認(rèn)為TreeA顯著優(yōu)于TreeB。(3)LRT的基本原理是比較兩個嵌套模型(通常一個是另一個的特例)的似然值差異。在系統(tǒng)發(fā)育中,通常比較一棵樹的似然值(L0)與其通過添加一個或多個節(jié)點(diǎn)/分支變?yōu)榱硪豢脴洌↙1)的似然值。計算統(tǒng)計量2*ln(L0/L1),該統(tǒng)計量在原假設(shè)(兩棵樹拓?fù)湎嗤┫陆品淖杂啥鹊扔谔砑拥墓?jié)點(diǎn)/分支數(shù)(或差異)的卡方分布。如果計算得到的統(tǒng)計量顯著大于臨界值,則拒絕原假設(shè),認(rèn)為新添加的拓?fù)浣Y(jié)構(gòu)是顯著的。3.(1)“Intercept”(截距):在Group1中,當(dāng)喙長(X)為0時,預(yù)測的喙寬(Y)的值(理論上是10.0);在Group2中,當(dāng)喙長(X)為0時,預(yù)測的喙長(Y)的值(理論上是8.0)。雖然喙長或喙寬為0在生物學(xué)上可能無意義,但在統(tǒng)計模型中代表了一個基準(zhǔn)值?!癤”(斜率):在Group1中,喙長(X)每增加一個單位,預(yù)測的喙寬(Y)平均增加0.8個單位;在Group2中,喙長(X)每增加一個單位,預(yù)測的喙長(Y)平均增加0.5個單位。(2)Group1:p值=0.005<0.05,拒絕原假設(shè),線性關(guān)系顯著。Group2:p值=0.008<0.05,拒絕原假設(shè),線性關(guān)系顯著。(3)這種方法可以用于分析系統(tǒng)發(fā)育數(shù)據(jù)中的形態(tài)性狀進(jìn)化關(guān)系,例如,可以通過線性回歸分析在系統(tǒng)樹上連接的性狀(如親代和子代)之間是否存在預(yù)期的比例關(guān)系或線性關(guān)系。例如,分析鳥類翅長和翼展在系統(tǒng)發(fā)育樹上的關(guān)系是否遵循一定的比例;或者分析某種性狀(如體型)與其親緣物種數(shù)量之間的關(guān)系。通過統(tǒng)計檢驗(如p值)可以判斷這種關(guān)系是否在統(tǒng)計學(xué)上顯著,從而推斷進(jìn)化趨勢或模式。例如,如果發(fā)現(xiàn)體型

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論