版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
2025年生物信息學(xué)研究生入學(xué)考試試卷及答案一、單項選擇題(每題2分,共30分)1.下列關(guān)于二代測序(NGS)技術(shù)的描述,錯誤的是:A.基于邊合成邊測序原理B.單讀長通常為50-300bpC.主要用于全基因組重測序、轉(zhuǎn)錄組測序等D.典型代表技術(shù)為PacBioSMRT測序2.在NCBI數(shù)據(jù)庫中,GenBank存儲的主要數(shù)據(jù)類型是:A.蛋白質(zhì)三維結(jié)構(gòu)B.核酸序列C.基因表達譜D.代謝通路3.關(guān)于序列比對算法,下列說法正確的是:A.BLAST適用于局部比對,采用動態(tài)規(guī)劃算法B.Smith-Waterman算法用于全局比對,時間復(fù)雜度較高C.全局比對適用于同源性較高的短序列D.局部比對無法檢測序列中的保守結(jié)構(gòu)域4.基因預(yù)測工具Glimmer主要應(yīng)用于:A.真核生物蛋白質(zhì)編碼基因預(yù)測B.原核生物蛋白質(zhì)編碼基因預(yù)測C.非編碼RNA基因預(yù)測D.轉(zhuǎn)座子元件識別5.在RNA-seq差異表達分析中,DESeq2軟件的核心模型是:A.正態(tài)分布模型B.泊松分布模型C.負二項分布模型D.二項分布模型6.下列不屬于蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫的是:A.PDB(ProteinDataBank)B.AlphaFoldDBC.UniProtD.CATH(ClassArchitectureTopologyHomology)7.基因組組裝中,“contig”指的是:A.通過重疊群連接形成的更長序列B.不含gaps的連續(xù)序列片段C.包含測序讀段(reads)的原始數(shù)據(jù)D.經(jīng)糾錯后的高質(zhì)量測序讀段8.在系統(tǒng)發(fā)育樹構(gòu)建中,鄰接法(Neighbor-Joining)的主要特點是:A.基于最大似然法,計算復(fù)雜度高B.構(gòu)建的樹為有根樹,需外類群C.通過逐步合并最鄰近的分類單元構(gòu)建樹D.僅適用于核酸序列,不適用于蛋白質(zhì)序列9.關(guān)于單細胞測序技術(shù),下列描述錯誤的是:A.10xGenomics平臺通過微流控技術(shù)分離單細胞B.單細胞RNA-seq(scRNA-seq)可檢測細胞異質(zhì)性C.單細胞ATAC-seq用于分析染色質(zhì)可及性D.單細胞測序無需擴增,直接測序原始RNA/DNA10.在GWAS(全基因組關(guān)聯(lián)研究)中,常用的顯著性閾值(Bonferroni校正后)約為:A.1×10??B.5×10??C.1×10??D.0.0511.下列工具中,用于宏基因組物種分類的是:A.HISAT2B.MetaPhlAnC.BWAD.StringTie12.關(guān)于表觀遺傳學(xué)數(shù)據(jù)(如ChIP-seq)分析,關(guān)鍵步驟不包括:A.比對到參考基因組B.峰(peak)識別C.差異表達基因篩選D.motif富集分析13.蛋白質(zhì)互作網(wǎng)絡(luò)(PPI)中,“節(jié)點”和“邊”分別代表:A.蛋白質(zhì)、互作關(guān)系B.基因、表達量C.代謝物、反應(yīng)D.轉(zhuǎn)錄因子、結(jié)合位點14.三代測序(TGS)的主要優(yōu)勢是:A.測序成本低B.讀長超長(10kb-2Mb)C.錯誤率低(<0.1%)D.適合小片段插入缺失檢測15.在生信分析中,“Q30”指的是:A.測序質(zhì)量值≥30的堿基占比B.比對率≥30%的讀段比例C.基因覆蓋度≥30%的區(qū)域D.差異表達基因中上調(diào)基因占比二、填空題(每空1分,共20分)1.三代測序技術(shù)的典型代表是________(如PacBio)和________(如OxfordNanopore)。2.BAM文件是________格式的二進制壓縮版本,常用于存儲測序讀段的比對結(jié)果。3.系統(tǒng)發(fā)育樹構(gòu)建方法主要包括________(基于距離)、最大簡約法(基于特征)和________(基于概率模型)。4.蛋白質(zhì)結(jié)構(gòu)預(yù)測的三個層次是:一級結(jié)構(gòu)(序列)、二級結(jié)構(gòu)(如α-螺旋、β-折疊)和________(三維空間構(gòu)象)。5.RNA-seq數(shù)據(jù)預(yù)處理步驟通常包括質(zhì)量控制(如FastQC)、________(如Trimmomatic)和________(如STAR、HISAT2)。6.在基因組注釋中,重復(fù)序列識別常用工具是________(基于同源比對)和________(基于從頭預(yù)測)。7.單細胞測序數(shù)據(jù)降維常用方法有________(線性降維)和________(非線性降維,適合可視化)。8.GWAS研究中,為控制群體分層偏倚,常用________(如主成分分析)或混合線性模型(MLM)進行校正。9.代謝組學(xué)數(shù)據(jù)分析中,常用________(如XCMS)進行峰對齊和特征提取,________(如KEGG)進行代謝通路富集。10.生信分析中,“假陽性率(FDR)”常用________方法校正,例如Benjamini-Hochberg(BH)校正。三、簡答題(每題8分,共40分)1.簡述一代測序(Sanger)、二代測序(NGS)和三代測序(TGS)的核心原理及優(yōu)缺點比較。2.解釋基因組組裝中“contig”與“scaffold”的區(qū)別,并說明如何通過測序數(shù)據(jù)(如Illumina短讀長+PacBio長讀長)提升組裝質(zhì)量。3.簡述RNA-seq數(shù)據(jù)分析的主要流程(從原始數(shù)據(jù)到差異表達基因篩選),并列舉每一步的常用工具。4.蛋白質(zhì)互作網(wǎng)絡(luò)(PPI)分析中,常用的拓撲學(xué)指標有哪些?請舉例說明其生物學(xué)意義。5.單細胞測序技術(shù)(如scRNA-seq)在腫瘤研究中的應(yīng)用有哪些?請至少列舉3個方向并簡要說明。四、計算題(每題10分,共20分)1.某物種基因組大小約為3Gb,使用Illumina測序平臺(雙端150bp讀段)進行測序,測得總數(shù)據(jù)量為90Gb(原始數(shù)據(jù))。假設(shè)測序錯誤率為1%,且80%的讀段能成功比對到參考基因組。(1)計算測序深度(coveragedepth)和覆蓋度(coveragebreadth)(假設(shè)無重復(fù)測序)。(2)若該物種為二倍體,組裝基因組時通常需要至少30×的測序深度,判斷當前數(shù)據(jù)是否滿足要求。2.某研究通過全外顯子測序(WES)在病例組(100例)和對照組(100例)中檢測到一個SNP(rs12345),基因型分布如下:病例組:AA=10,Aa=50,aa=40;對照組:AA=20,Aa=60,aa=20。(1)計算病例組和對照組中A等位基因的頻率。(2)使用卡方檢驗(χ2)分析該SNP與疾病的關(guān)聯(lián)性(列出公式并計算)。五、綜合分析題(每題20分,共40分)1.某實驗室獲得了10例肝癌腫瘤組織和10例癌旁正常組織的全外顯子測序(WES)數(shù)據(jù)(Illumina平臺,150bp雙端,平均測序深度100×)。請設(shè)計一套完整的分析流程,包括關(guān)鍵步驟、目的及常用工具,并說明如何篩選肝癌相關(guān)的候選驅(qū)動基因。2.基于單細胞RNA-seq數(shù)據(jù)(10xGenomics平臺,5000個細胞),請設(shè)計實驗方案:(1)鑒定腫瘤微環(huán)境中的主要細胞亞群(如腫瘤細胞、T細胞、巨噬細胞);(2)分析某關(guān)鍵基因(如PD-L1)在不同亞群中的表達差異;(3)對差異亞群進行功能富集分析(GO/KEGG)。要求說明每一步的方法、工具及生物學(xué)意義。參考答案一、單項選擇題1.D(PacBio屬于三代測序)2.B(GenBank存儲核酸序列)3.C(全局比對適合同源性高的短序列)4.B(Glimmer用于原核基因預(yù)測)5.C(DESeq2基于負二項分布)6.C(UniProt是蛋白質(zhì)序列數(shù)據(jù)庫)7.B(contig是無gap的連續(xù)序列)8.C(鄰接法逐步合并鄰近分類單元)9.D(單細胞測序需擴增)10.B(Bonferroni校正后約5×10??)11.B(MetaPhlAn用于宏基因組分類)12.C(ChIP-seq不直接篩選差異表達基因)13.A(節(jié)點是蛋白質(zhì),邊是互作)14.B(三代測序讀長超長)15.A(Q30是質(zhì)量值≥30的堿基占比)二、填空題1.單分子實時測序(SMRT);納米孔測序2.SAM(序列比對格式)3.鄰接法(NJ);最大似然法(ML)4.三級結(jié)構(gòu)5.接頭修剪(或質(zhì)量修剪);比對到參考基因組6.RepeatMasker;RepeatModeler7.PCA(主成分分析);UMAP(或t-SNE)8.群體結(jié)構(gòu)校正9.代謝組學(xué)處理軟件;代謝通路數(shù)據(jù)庫10.多重假設(shè)檢驗三、簡答題1.核心原理及優(yōu)缺點:-一代測序(Sanger):基于雙脫氧核苷酸鏈終止法,通過電泳分離不同長度的片段并讀取序列。優(yōu)點:讀長最長(~1000bp)、準確性高(>99.99%);缺點:通量低、成本高、耗時長。-二代測序(NGS):基于邊合成邊測序(如Illumina)或焦磷酸測序(如454),通過大規(guī)模并行測序產(chǎn)生短讀長(50-300bp)。優(yōu)點:通量高、成本低;缺點:讀長短、難以解決重復(fù)區(qū)域和復(fù)雜結(jié)構(gòu)變異。-三代測序(TGS):單分子實時測序(PacBio)或納米孔測序(OxfordNanopore),無需PCR擴增,直接讀取長讀長(10kb-2Mb)。優(yōu)點:讀長超長、可檢測表觀修飾;缺點:單堿基錯誤率較高(PacBio~1%,納米孔~5-15%),成本仍較高。2.contig與scaffold的區(qū)別及組裝優(yōu)化:-contig(重疊群):通過短讀長之間的重疊關(guān)系拼接形成的無gap連續(xù)序列,反映基因組的連續(xù)部分。-scaffold(支架):通過配對末端(paired-end)或長讀長(如PacBio)的跨度信息,將多個contig連接成更長的序列,中間可能包含gap(用N填充)。-優(yōu)化方法:Illumina短讀長用于校正錯誤(低錯誤率),PacBio長讀長用于跨越重復(fù)區(qū)域(解決contig間的連接問題),結(jié)合兩者可提升scaffold的連續(xù)性和準確性(如使用Canu或Flye進行長讀長組裝,再用短讀長拋光)。3.RNA-seq分析流程及工具:-原始數(shù)據(jù)質(zhì)控:FastQC檢查質(zhì)量,Trimmomatic修剪接頭和低質(zhì)量堿基。-比對到參考基因組:STAR或HISAT2將cleanreads比對到參考基因組(或轉(zhuǎn)錄組)。-定量分析:HTSeq或Salmon計算基因/轉(zhuǎn)錄本的表達量(FPKM/TPM)。-差異表達分析:DESeq2或edgeR識別差異基因(基于負二項分布模型,校正FDR)。-功能富集:clusterProfiler進行GO/KEGG富集分析,STRING或Cytoscape構(gòu)建共表達網(wǎng)絡(luò)。4.PPI拓撲學(xué)指標及意義:-度(Degree):節(jié)點連接的邊數(shù),反映蛋白質(zhì)的“中心性”(如hubs蛋白可能是關(guān)鍵調(diào)控因子)。-介度(Betweenness):節(jié)點作為橋梁的次數(shù),高介度節(jié)點可能參與信號傳遞。-聚類系數(shù)(ClusteringCoefficient):節(jié)點鄰居間的連接緊密程度,反映功能模塊的聚集性(如代謝通路中的酶常形成高聚類模塊)。-舉例:p53蛋白在PPI網(wǎng)絡(luò)中通常具有高度,提示其參與多種互作,是癌癥相關(guān)的核心蛋白。5.單細胞測序在腫瘤研究中的應(yīng)用:-腫瘤異質(zhì)性分析:通過scRNA-seq鑒定不同腫瘤亞克?。ㄈ缒退巵喨海沂巨D(zhuǎn)移和復(fù)發(fā)機制。-腫瘤微環(huán)境(TME)解析:識別T細胞(如耗竭性CD8+T細胞)、巨噬細胞(如M2型促癌巨噬細胞)等免疫細胞亞群,指導(dǎo)免疫治療靶點開發(fā)(如PD-1/PD-L1)。-發(fā)育軌跡推斷:使用Monocle等工具構(gòu)建腫瘤細胞的分化軌跡,研究癌癥干細胞的起源和演進。四、計算題1.(1)測序深度與覆蓋度:-測序深度=總數(shù)據(jù)量/基因組大小=90Gb/3Gb=30×。-覆蓋度(假設(shè)無重復(fù))=(有效比對數(shù)據(jù)量)/基因組大小=(90Gb×80%)/3Gb=24×(但覆蓋度通常指區(qū)域比例,若假設(shè)所有區(qū)域均被覆蓋,則覆蓋度為100%;實際中需考慮重復(fù)序列,此處簡化為100%)。-(2)判斷:組裝需要至少30×深度,當前數(shù)據(jù)深度為30×(原始數(shù)據(jù)),但有效比對后為24×,可能略不足(需結(jié)合數(shù)據(jù)質(zhì)量和重復(fù)率調(diào)整,通常認為30×原始數(shù)據(jù)可滿足組裝需求)。2.(1)等位基因頻率:-病例組A頻率=(2×AA+Aa)/(2×總樣本數(shù))=(2×10+50)/(2×100)=70/200=0.35。-對照組A頻率=(2×20+60)/(2×100)=100/200=0.5。-(2)卡方檢驗:構(gòu)建2×2列聯(lián)表(等位基因Avsa):病例組:A=70(10×2+50),a=130(40×2+50);對照組:A=100(20×2+60),a=100(20×2+60)??倶颖緮?shù)=200(病例)+200(對照)=400。期望頻數(shù)E=(行合計×列合計)/總樣本數(shù):E(病例A)=(200×170)/400=85;E(病例a)=(200×230)/400=115;E(對照A)=(200×170)/400=85;E(對照a)=(200×230)/400=115。χ2=Σ[(O-E)2/E]=(70-85)2/85+(130-115)2/115+(100-85)2/85+(100-115)2/115≈(225/85)+(225/115)+(225/85)+(225/115)≈2.647+1.957+2.647+1.957≈9.208。自由度df=1,查χ2表,P<0.01(臨界值3.84),提示該SNP與疾病顯著關(guān)聯(lián)。五、綜合分析題1.肝癌WES數(shù)據(jù)分析流程:-步驟1:原始數(shù)據(jù)質(zhì)控:用FastQC檢查測序質(zhì)量(如堿基質(zhì)量、接頭污染),Trimmomatic修剪低質(zhì)量堿基和接頭,得到cleanreads。-步驟2:比對與變異檢測:BWA-MEM將cleanreads比對到人類參考基因組(GRCh38),GATK進行本地重比對(IndelRealignment)和堿基質(zhì)量校正(BQSR),最后用Mutect2或VarScan2檢測SNV和Indel。-步驟3:變異注釋:ANNOVAR或VEP注釋變異的功能(如錯義突變、剪接位點變異)、頻率(gnomAD數(shù)據(jù)庫中正常人群頻率<1%)、致病性(ClinVar、PolyPhen-2、SIFT)。-步驟4:驅(qū)動基因篩選:-統(tǒng)計腫瘤樣本中高頻突變基因(如突變頻率>10%);-結(jié)合功能影響(如終止密碼子突變、關(guān)鍵結(jié)構(gòu)域變異);-富集分析(如KEGG通路,篩選PI3K-AKT、TP53等癌癥相關(guān)通路中的突變基因);-結(jié)合TCGA肝癌數(shù)據(jù)庫驗證(如cBioPortal),排除種系突變(通過癌旁正常組織
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年金沙縣中等職業(yè)學(xué)校招聘考試真題
- 選礦工安全操作知識考核試卷含答案
- 我國上市公司實際控制人狀況對公司信息透明度的影響:基于多元視角的深度剖析
- 意匠工沖突解決競賽考核試卷含答案
- 修腳師崗前理論知識考核試卷含答案
- 液化氣體生產(chǎn)工安全理論能力考核試卷含答案
- 氣體深冷分離工崗前技術(shù)評優(yōu)考核試卷含答案
- 老年皮膚萎縮對外用制劑刺激性的影響
- 老年用藥依從性行為策略
- 老年焦慮抑郁共病的藥物研發(fā)趨勢
- 工廠網(wǎng)絡(luò)設(shè)計方案
- 福建省泉州市2023-2024學(xué)年高一上學(xué)期期末教學(xué)質(zhì)量監(jiān)測政治試題
- 日文常用漢字表
- JCT947-2014 先張法預(yù)應(yīng)力混凝土管樁用端板
- QC003-三片罐206D鋁蓋檢驗作業(yè)指導(dǎo)書
- 高血壓達標中心標準要點解讀及中心工作進展-課件
- 某經(jīng)濟技術(shù)開發(fā)區(qū)突發(fā)事件風(fēng)險評估和應(yīng)急資源調(diào)查報告
- 混凝土質(zhì)量缺陷成因及預(yù)防措施1
- GB/T 28288-2012足部防護足趾保護包頭和防刺穿墊
- GB/T 15087-1994汽車牽引車與全掛車機械連接裝置強度試驗
- GB/T 10922-200655°非密封管螺紋量規(guī)
評論
0/150
提交評論