2025年基因組學(xué)與生物信息學(xué)考試試卷及答案_第1頁(yè)
2025年基因組學(xué)與生物信息學(xué)考試試卷及答案_第2頁(yè)
2025年基因組學(xué)與生物信息學(xué)考試試卷及答案_第3頁(yè)
2025年基因組學(xué)與生物信息學(xué)考試試卷及答案_第4頁(yè)
2025年基因組學(xué)與生物信息學(xué)考試試卷及答案_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

2025年基因組學(xué)與生物信息學(xué)考試試卷及答案一、單項(xiàng)選擇題(每題2分,共30分)1.以下關(guān)于三代測(cè)序技術(shù)(如PacBioHiFi、OxfordNanopore)的描述,錯(cuò)誤的是:A.單分子實(shí)時(shí)測(cè)序(SMRT)通過檢測(cè)DNA聚合酶合成時(shí)的信號(hào)變化獲取序列B.納米孔測(cè)序的原始信號(hào)為電流波動(dòng),需通過堿基調(diào)用(Basecalling)轉(zhuǎn)換為序列C.三代測(cè)序的讀長(zhǎng)可達(dá)數(shù)十萬(wàn)堿基,但單堿基錯(cuò)誤率通常高于一代測(cè)序D.HiFi測(cè)序通過環(huán)狀一致性測(cè)序(CCS)將單分子讀長(zhǎng)錯(cuò)誤率降至0.1%以下2.單細(xì)胞RNA測(cè)序(scRNA-seq)中,“UMI(唯一分子標(biāo)識(shí)符)”的主要作用是:A.區(qū)分不同細(xì)胞的來源B.校正擴(kuò)增過程中的PCR偏好性C.提高測(cè)序讀長(zhǎng)的準(zhǔn)確性D.增強(qiáng)稀有轉(zhuǎn)錄本的檢測(cè)靈敏度3.在人類全基因組關(guān)聯(lián)研究(GWAS)中,“曼哈頓圖”的橫軸和縱軸分別代表:A.染色體位置與效應(yīng)值(β)B.染色體位置與-Log10(P值)C.基因表達(dá)量與P值D.SNP密度與連鎖不平衡(LD)程度4.以下哪種算法常用于長(zhǎng)讀長(zhǎng)基因組組裝的糾錯(cuò)步驟?A.Canu(基于重疊群校正)B.BWA(短讀長(zhǎng)比對(duì))C.GATK(變異檢測(cè))D.DESeq2(差異表達(dá)分析)5.關(guān)于結(jié)構(gòu)變異(SV)檢測(cè),以下說法正確的是:A.短讀長(zhǎng)測(cè)序(如Illumina)可高效檢測(cè)>10kb的大缺失(Deletion)B.納米孔測(cè)序的高錯(cuò)誤率使其無(wú)法準(zhǔn)確識(shí)別插入(Insertion)變異C.基于配對(duì)末端(Paired-end)測(cè)序的“跨度異?!保―iscordantPair)可輔助檢測(cè)倒位(Inversion)D.單核苷酸多態(tài)性(SNP)屬于結(jié)構(gòu)變異的一種6.單細(xì)胞ATAC-seq(染色質(zhì)可及性測(cè)序)的主要研究目標(biāo)是:A.分析不同細(xì)胞類型的基因表達(dá)異質(zhì)性B.定位轉(zhuǎn)錄因子結(jié)合位點(diǎn)和開放染色質(zhì)區(qū)域C.檢測(cè)單細(xì)胞水平的拷貝數(shù)變異(CNV)D.重建細(xì)胞發(fā)育的時(shí)間軌跡(Pseudotime)7.在宏基因組學(xué)(Metagenomics)分析中,“分箱”(Binning)的核心目的是:A.去除測(cè)序數(shù)據(jù)中的宿主污染B.區(qū)分不同物種的基因組片段C.提高低豐度物種的測(cè)序深度D.預(yù)測(cè)微生物群落的功能富集8.以下哪個(gè)數(shù)據(jù)庫(kù)主要存儲(chǔ)人類基因組變異及其臨床意義?A.Ensembl(基因注釋)B.dbSNP(單核苷酸多態(tài)性)C.gnomAD(人群變異頻率)D.ClinVar(臨床相關(guān)變異)9.長(zhǎng)讀長(zhǎng)測(cè)序數(shù)據(jù)(如PacBio)組裝時(shí),“重疊群”(Contig)與“支架”(Scaffold)的關(guān)鍵區(qū)別在于:A.Contig無(wú)缺口(Gap),Scaffold包含缺口但通過連接信息(如Hi-C)確定順序B.Contig由短讀長(zhǎng)組裝,Scaffold由長(zhǎng)讀長(zhǎng)組裝C.Contig僅含編碼區(qū),Scaffold包含非編碼區(qū)D.Contig用于原核生物,Scaffold用于真核生物10.在RNA-seq數(shù)據(jù)分析中,“剪接異構(gòu)體定量”(IsoformQuantification)的挑戰(zhàn)主要源于:A.測(cè)序讀長(zhǎng)過短導(dǎo)致不同異構(gòu)體的讀段重疊B.樣本RNA降解影響數(shù)據(jù)質(zhì)量C.基因表達(dá)量的技術(shù)噪聲(TechnicalNoise)D.轉(zhuǎn)錄本的3’偏倚(3’Bias)11.以下關(guān)于“泛基因組”(Pangenome)的描述,錯(cuò)誤的是:A.泛基因組包含物種內(nèi)所有個(gè)體的核心基因(CoreGene)和可變基因(AccessoryGene)B.人類泛基因組計(jì)劃(HGP)的目標(biāo)是替代參考基因組(GRCh38)C.泛基因組可通過圖基因組(GraphGenome)形式存儲(chǔ),解決參考基因組的偏向性問題D.植物泛基因組研究有助于解析物種適應(yīng)性進(jìn)化的遺傳基礎(chǔ)12.單細(xì)胞多組學(xué)(如同時(shí)測(cè)RNA、ATAC和蛋白)的主要技術(shù)瓶頸是:A.單細(xì)胞分離的通量不足B.不同組學(xué)數(shù)據(jù)的歸一化(Normalization)和整合分析C.測(cè)序成本過高D.樣本保存導(dǎo)致的降解問題13.在癌癥基因組學(xué)中,“腫瘤突變負(fù)荷”(TMB)的計(jì)算通?;冢篈.全外顯子組測(cè)序(WES)中非同義突變的數(shù)量B.全基因組測(cè)序(WGS)中所有體細(xì)胞突變的數(shù)量C.轉(zhuǎn)錄組測(cè)序(RNA-seq)中融合基因的數(shù)量D.甲基化測(cè)序(WGBS)中差異甲基化位點(diǎn)的數(shù)量14.以下哪種生物信息學(xué)工具常用于長(zhǎng)讀長(zhǎng)數(shù)據(jù)的從頭組裝?A.FlyeB.BWA-MEMC.STARD.Salmon15.關(guān)于“基因編輯脫靶效應(yīng)檢測(cè)”,以下方法中靈敏度最高的是:A.基于PCR的T7E1酶切法B.全基因組測(cè)序(WGS)結(jié)合整合分析C.靶向擴(kuò)增子測(cè)序(Amplicon-seq)D.體外切割實(shí)驗(yàn)(如GUIDE-seq)二、填空題(每空1分,共20分)1.三代測(cè)序技術(shù)中,PacBio的________模式通過環(huán)狀模板的多次測(cè)序生成高準(zhǔn)確性的一致性序列(CCS),而納米孔測(cè)序的原始信號(hào)為________波動(dòng),需通過________算法轉(zhuǎn)換為堿基序列。2.單細(xì)胞測(cè)序中,常用的細(xì)胞分離技術(shù)包括________(如10xGenomics)和________(如流式分選結(jié)合微流控)。3.基因組組裝質(zhì)量的評(píng)估指標(biāo)主要包括________(N50)、________(L50)和________(BUSCO),其中________用于評(píng)估基因區(qū)域的完整性。4.結(jié)構(gòu)變異(SV)的類型包括缺失(Deletion)、________(Duplication)、________(Inversion)和________(Translocation),其檢測(cè)方法可分為基于________(如短讀長(zhǎng)的跨度異常)、基于________(長(zhǎng)讀長(zhǎng)的直接比對(duì))和基于________(如光學(xué)圖譜)的技術(shù)。5.生物信息學(xué)中,常用的序列比對(duì)算法分為________(如BLAST)和________(如Smith-Waterman)兩大類,前者適用于________,后者適用于________。三、簡(jiǎn)答題(每題8分,共40分)1.比較短讀長(zhǎng)測(cè)序(如Illumina)與長(zhǎng)讀長(zhǎng)測(cè)序(如PacBioHiFi)在基因組組裝中的優(yōu)缺點(diǎn),并說明二者如何互補(bǔ)。2.簡(jiǎn)述單細(xì)胞RNA測(cè)序(scRNA-seq)數(shù)據(jù)預(yù)處理的主要步驟(包括原始數(shù)據(jù)到表達(dá)矩陣的流程),并指出每一步的關(guān)鍵技術(shù)或工具。3.在癌癥基因組研究中,如何區(qū)分“驅(qū)動(dòng)突變”(DriverMutation)與“乘客突變”(PassengerMutation)?請(qǐng)列舉至少3種分析策略。4.什么是“圖基因組”(GraphGenome)?與傳統(tǒng)線性參考基因組相比,其優(yōu)勢(shì)是什么?目前在人類基因組研究中的應(yīng)用場(chǎng)景有哪些?5.宏基因組學(xué)中,“功能注釋”(FunctionalAnnotation)的主要流程是什么?常用的數(shù)據(jù)庫(kù)(如KEGG、COG、CAZy)分別側(cè)重哪些功能層面的注釋?四、論述題(每題15分,共30分)1.設(shè)計(jì)一個(gè)基于多組學(xué)數(shù)據(jù)的人類復(fù)雜疾病研究方案(如阿爾茨海默?。?,需包括研究目標(biāo)、實(shí)驗(yàn)設(shè)計(jì)(測(cè)序技術(shù)選擇)、數(shù)據(jù)分析流程(關(guān)鍵步驟與工具)及預(yù)期成果。2.近年來,人工智能(AI)在生物信息學(xué)中的應(yīng)用日益廣泛。請(qǐng)結(jié)合具體案例(如蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)、變異功能預(yù)測(cè)、基因表達(dá)調(diào)控模型),論述AI如何推動(dòng)基因組學(xué)與生物信息學(xué)的發(fā)展,并分析其當(dāng)前局限性及未來方向。答案一、單項(xiàng)選擇題1.C(三代測(cè)序單堿基錯(cuò)誤率通常為1%-15%,一代測(cè)序錯(cuò)誤率<0.1%,但HiFi模式可降至0.1%以下)2.B(UMI通過唯一標(biāo)簽區(qū)分同一轉(zhuǎn)錄本的不同拷貝,校正PCR擴(kuò)增偏倚)3.B(橫軸為染色體位置,縱軸為-Log10(P值),用于展示GWAS中各SNP的顯著性)4.A(Canu用于長(zhǎng)讀長(zhǎng)組裝的糾錯(cuò)和組裝;BWA是比對(duì)工具,GATK是變異檢測(cè),DESeq2是差異表達(dá))5.C(倒位可通過配對(duì)末端測(cè)序的跨度異?;蚍较虍惓z測(cè);短讀長(zhǎng)難以檢測(cè)大缺失,納米孔可識(shí)別插入,SNP不屬于SV)6.B(ATAC-seq通過轉(zhuǎn)座酶插入開放染色質(zhì)區(qū)域,定位轉(zhuǎn)錄因子結(jié)合位點(diǎn))7.B(分箱通過序列組成、覆蓋度等信息將宏基因組片段歸類到不同物種)8.D(ClinVar存儲(chǔ)變異與疾病的關(guān)聯(lián);dbSNP是變異位點(diǎn)數(shù)據(jù)庫(kù),gnomAD是人群頻率)9.A(Contig是連續(xù)無(wú)缺口的序列,Scaffold通過連接信息(如Hi-C、光學(xué)圖譜)確定Contig順序,含缺口)10.A(短讀長(zhǎng)可能同時(shí)映射到多個(gè)異構(gòu)體,導(dǎo)致定量困難)11.B(人類泛基因組計(jì)劃是補(bǔ)充參考基因組,而非替代)12.B(不同組學(xué)數(shù)據(jù)的維度、噪聲水平差異大,整合分析是主要挑戰(zhàn))13.A(TMB通常基于全外顯子組的非同義突變計(jì)數(shù),單位為突變數(shù)/Mb)14.A(Flye是長(zhǎng)讀長(zhǎng)組裝工具;BWA-MEM是比對(duì),STAR是RNA比對(duì),Salmon是定量)15.B(WGS可無(wú)偏檢測(cè)全基因組脫靶位點(diǎn),靈敏度最高)二、填空題1.環(huán)狀一致性測(cè)序(CCS);電流;堿基調(diào)用(Basecalling)2.微液滴分選;平板分選(或微孔分選)3.連續(xù)序列長(zhǎng)度中位數(shù)(N50);連續(xù)序列數(shù)量中位數(shù)(L50);核心基因完整性(BUSCO);BUSCO4.重復(fù);倒位;易位;短讀長(zhǎng)(或配對(duì)末端);長(zhǎng)讀長(zhǎng)(或直接比對(duì));光學(xué)圖譜(或物理圖譜)5.啟發(fā)式算法;動(dòng)態(tài)規(guī)劃算法;大規(guī)模序列比對(duì);小范圍精確比對(duì)三、簡(jiǎn)答題1.短讀長(zhǎng)測(cè)序:優(yōu)點(diǎn)是成本低、錯(cuò)誤率低(<0.1%)、數(shù)據(jù)量大;缺點(diǎn)是讀長(zhǎng)短(50-300bp),難以跨越重復(fù)序列,組裝時(shí)易產(chǎn)生缺口。長(zhǎng)讀長(zhǎng)測(cè)序:優(yōu)點(diǎn)是讀長(zhǎng)可達(dá)10-100kb,能跨越重復(fù)區(qū)域,提升組裝連續(xù)性;缺點(diǎn)是單堿基錯(cuò)誤率高(1%-15%),成本較高。二者互補(bǔ):短讀長(zhǎng)用于糾錯(cuò)(如用Illumina數(shù)據(jù)校正PacBio原始讀長(zhǎng)),長(zhǎng)讀長(zhǎng)用于解決重復(fù)區(qū)域組裝,最終獲得高質(zhì)量基因組(如T2T人類全基因組組裝結(jié)合了PacBioHiFi和納米孔長(zhǎng)讀長(zhǎng))。2.預(yù)處理流程:①原始數(shù)據(jù)過濾:去除低質(zhì)量讀段、接頭序列(工具:Fastp、Trimmomatic);②細(xì)胞barcode與UMI拆分:根據(jù)測(cè)序接頭分離不同細(xì)胞的讀段(工具:CellRanger、STARsolo);③比對(duì)到參考基因組:將讀段映射到基因組(工具:STAR、HISAT2);④UMI計(jì)數(shù):統(tǒng)計(jì)每個(gè)基因在每個(gè)細(xì)胞中的UMI數(shù)量,生成表達(dá)矩陣(工具:CellRanger、Salmon);⑤質(zhì)量控制:過濾低質(zhì)量細(xì)胞(如線粒體基因比例過高、基因數(shù)過少)(工具:Seurat、Scanpy)。3.區(qū)分策略:①頻率分析:驅(qū)動(dòng)突變?cè)谀[瘤樣本中高頻出現(xiàn)(如TP53在多種癌癥中高頻突變);②功能預(yù)測(cè):通過算法(如SIFT、PolyPhen-2)預(yù)測(cè)突變對(duì)蛋白功能的影響,驅(qū)動(dòng)突變多為功能喪失或獲得;③進(jìn)化樹分析:驅(qū)動(dòng)突變通常出現(xiàn)在腫瘤進(jìn)化樹的早期分支(克隆性突變),乘客突變多為晚期分支(亞克隆性);④實(shí)驗(yàn)驗(yàn)證:通過基因編輯(如CRISPR)在細(xì)胞或動(dòng)物模型中驗(yàn)證突變是否促進(jìn)增殖或轉(zhuǎn)移。4.圖基因組是一種非線性基因組表示方法,通過圖結(jié)構(gòu)(節(jié)點(diǎn)為序列片段,邊為連接關(guān)系)整合物種內(nèi)多個(gè)個(gè)體的遺傳變異(如SNP、SV)。優(yōu)勢(shì):避免傳統(tǒng)線性參考基因組的偏向性(如僅代表部分人群),更全面反映遺傳多樣性;提升變異檢測(cè)的準(zhǔn)確性(尤其是結(jié)構(gòu)變異)。應(yīng)用場(chǎng)景:人類泛基因組構(gòu)建(如HPRC計(jì)劃)、復(fù)雜疾病關(guān)聯(lián)分析(減少參考序列導(dǎo)致的假陽(yáng)性)、個(gè)性化基因組分析(更準(zhǔn)確的比對(duì)與注釋)。5.功能注釋流程:①基因預(yù)測(cè):通過宏基因組組裝或分箱后,使用工具(如Prodigal)預(yù)測(cè)開放閱讀框(ORF);②序列比對(duì):將ORF與功能數(shù)據(jù)庫(kù)比對(duì)(如BLASTp);③功能分類:根據(jù)比對(duì)結(jié)果注釋到通路、酶類或功能模塊。數(shù)據(jù)庫(kù)側(cè)重:KEGG(代謝通路與調(diào)控網(wǎng)絡(luò))、COG(同源基因家族功能分類)、CAZy(碳水化合物活性酶)、PFAM(蛋白結(jié)構(gòu)域)、eggNOG(進(jìn)化與功能注釋)。四、論述題1.研究方案(阿爾茨海默?。?研究目標(biāo):解析AD發(fā)病的多組學(xué)分子機(jī)制,識(shí)別潛在治療靶點(diǎn)。-實(shí)驗(yàn)設(shè)計(jì):-樣本:收集AD患者(早發(fā)/晚發(fā))、健康對(duì)照的血液(血漿cfDNA、外泌體RNA)、腦活檢組織(冷凍保存)。-測(cè)序技術(shù):①全基因組測(cè)序(WGS,IlluminaNovaSeq+PacBioHiFi)檢測(cè)germline/SomaticSV;②全外顯子測(cè)序(WES)分析編碼區(qū)變異;③單細(xì)胞RNA-seq(10xGenomics)分析腦區(qū)細(xì)胞類型特異性表達(dá);④ATAC-seq(bulk/單細(xì)胞)定位AD相關(guān)調(diào)控元件;⑤甲基化測(cè)序(WGBS)檢測(cè)差異甲基化區(qū)域(DMR)。-數(shù)據(jù)分析流程:-基因組學(xué):用GATK4+Manta檢測(cè)SNP/Indel/SV,結(jié)合gnomAD過濾人群多態(tài)性,用FATHMM-MKL預(yù)測(cè)功能突變;-轉(zhuǎn)錄組學(xué):scRNA-seq用Seurat聚類細(xì)胞類型,識(shí)別小膠質(zhì)細(xì)胞/神經(jīng)元的差異表達(dá)基因(DEG),用SCENIC推斷調(diào)控轉(zhuǎn)錄因子;-表觀組學(xué):ATAC-seq用MACS2調(diào)用峰,關(guān)聯(lián)DEG啟動(dòng)子區(qū)開放染色質(zhì);WGBS用Bismark比對(duì),用DSS識(shí)別DMR,關(guān)聯(lián)基因表達(dá);-多組學(xué)整合:用MOFA+(多組學(xué)因子分析)整合變異、表達(dá)、甲基化數(shù)據(jù),篩選關(guān)鍵調(diào)控模塊(如APOE通路、Tau蛋白相關(guān)基因)。-預(yù)期成果:鑒定AD特異性驅(qū)動(dòng)變異(如APP/PSEN1新突變)、細(xì)胞類型特異性表達(dá)特征(如小膠質(zhì)細(xì)胞炎癥通路激活)、表觀調(diào)控網(wǎng)絡(luò)(如SORL1基因甲基化與表達(dá)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論