版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
外顯子組測序在醫(yī)學(xué)研究中的應(yīng)用
一外顯子組測序技術(shù)簡介二外顯子組測序流程三外顯子組測序信息分析內(nèi)容四外顯子組測序的應(yīng)用方案一、外顯子組測序技術(shù)簡介
外顯子組序列僅占全基因組序列的1%左右,與人類85%致病基因突變相關(guān)。與全基因組測序相比,外顯子組測序不僅費用較低,而且測序覆蓋度更深,數(shù)據(jù)準(zhǔn)確性更高。外顯子測序是指利用序列捕獲技術(shù)將全基因組外顯子區(qū)域DNA捕捉并富集后,再進行高通量測序的基因組分析方法。二、外顯子組測序流程基因組DNA的隨機打斷DNA片段的末端修復(fù)和接頭的連接PCR擴增文庫DNA液相探針雜交捕獲目的片段PCR擴增捕獲的DNA片段測序文庫的檢測HiSeq2500測序生物信息分析三、外顯子組測序信息分析流程主要信息分析內(nèi)容歸類3.1、數(shù)據(jù)過濾與評估3.2、整體質(zhì)量評估3.3、SNP檢測與注釋3.4、InDel檢測與注釋3.5、高級分析3.1、數(shù)據(jù)過濾與評估過濾接頭。對含接頭的reads去除接頭序列。一條reads上N(未能確定出具體的堿基類型)的比例大于5%,則過濾掉該reads。過濾低質(zhì)量reads,過濾掉Q30<85%reads。3.1.1、原始數(shù)據(jù)過濾3.1.2、測序數(shù)據(jù)統(tǒng)計與評估測序質(zhì)量值分布圖堿基含量分布圖3.2、整體測序質(zhì)量評估3.2.1、測序深度統(tǒng)計注:橫坐標(biāo)代表測序深度,縱坐標(biāo)代表目標(biāo)區(qū)域上對應(yīng)深度的堿基數(shù)占總堿基數(shù)的百分比。目標(biāo)區(qū)域的單堿基分布近似服從泊松分布。3.2.2、外顯子捕獲統(tǒng)計TargetregionstatX1X2X3X4Length_of_target_region(Mb)1118.70118.70118.70118.70Reads_mapping_ref(singlereads)2182.95168.4897.7696.16Mapping_datasize(Mb)3137211263697769616Effective_sequences_on_target(Mb)592.0590.8666.8464.37Average_sequencing_depth_on_target747.3146.7543.0541.45Mismatch_rate_in_target_region8Mismatch_rate_in_all_effective_sequence9Base_covered_on_target(Mb)106904681566846437Coverage_of_target_region11Fraction_of_target_covered_with_at_least_20x12Fraction_of_target_covered_with_at_least_10x13Fraction_of_target_covered_with_at_least_4x14當(dāng)比對到參考基因組目標(biāo)區(qū)域的數(shù)據(jù)量在60%之上,認為外顯子捕獲效率合格。3.2.3、染色體覆蓋深度分布注:橫坐標(biāo)為染色體長度,縱坐標(biāo)為覆蓋深度取對數(shù)。3.3、SNP檢測及注釋3.3.1、SNP檢測SNP的檢測主要使用GATK軟件工具包實現(xiàn)。BMKIDSNPNumberTransitionNumberTransversionNumberTi/TvRatioHeterozygosityNumberHomozygosityNumberX19852546691723160822.11207400777854X28425165733992691172.13167179675337X3263326178220851062.0926436236890X4289954196145938092.0930446259508Total1556901TypeR01R02R03R04INTERGENIC449352380794113110125682INTRAGENIC34252896892975INTRON401739343966111218121865UPSTREAM244522135061056521DOWNSTREAM95551835652773230377UTR_3_PRIME395407112124UTR_5_PRIME21651891776850SPLICE_SITE_ACCEPTOR31361414SPLICE_SITE_DONOR61541921CDSNON_SYNONYMOUS_CODING19711899882925NON_SYNONYMOUS_START2100START_GAINED37834693100START_LOST8632STOP_GAINED2624108STOP_LOST5310SYNONYMOUS_CODING17721732923940SYNONYMOUS_STOP1100Other1068932183.3.2、SNP注釋3.3.3、突變特征突變頻譜圖注:橫坐標(biāo)為不同類型的突變,縱坐標(biāo)為不同類型突變對應(yīng)的頻率。3.3.3、突變特征突變位點上下文堿基偏好性注:橫坐標(biāo)為突變位點上下文的堿基位置,0為SNP突變位點,負數(shù)代表突變位點前的堿基,正數(shù)代表突變位點后的堿基,縱坐標(biāo)為不同堿基對應(yīng)的比例。從圖上可以看出,不同類型的SNP突變上下文具有不同的堿基偏好性。3.4、
InDel檢測及注釋3.4.1、
InDel檢測RegionR01R02R03R04TotalInsertion5168944234152331657392775Deletion57643510611670517840107838Heterozygosity89744788482858630639--Homozygosity195881644733523774--Total109332952953193834413200613TypeR01R02R03R04INTERGENIC48070416011357914755INTRAGENIC410337123117INTRON45413396821370114581UPSTREAM30602706759851DOWNSTREAM116331026535533851UTR_3_PRIME333174UTR_5_PRIME26524687106SPLICE_SITE_ACCEPTOR152364SPLICE_SITE_DONOR6833CDSCODON_DELETION151635CODON_INSERTION12502EXON_DELETED2672427393FRAME_SHIFT94922730CODON_DELETION151635CODON_INSERTION12502Other19241263.4.1、
InDel注釋3.5、高級分析3.5.1、基因融合注:最外圈表示人基因組及基因組上基因分布情況;文字代表發(fā)生基因融合的基因ID;紅色線條代表染色體間基因融合;綠色線條代表染色體內(nèi)基因融合。3.5.2、氨基酸替換預(yù)測ChrIDPosCodonsSubstitutionSNPTypePredictionGenechr1881627CTG-tTGL615LSynonymousTOLERATEDENSG00000188976chr111884555GAG-GgGE198GNonsynonymousTOLERATEDENSG00000011021chr112776344ATG-tTGM1LNonsynonymousTOLERATEDENSG00000188984chr112919111GAA-aAAE83KNonsynonymousDAMAGINGENSG00000120952chr116356501GCC-aCCA447TNonsynonymousTOLERATEDENSG00000186510注:
Codons:密碼子的變化情況;Substitution:氨基酸的替換信息;SNPType:SNP的類型;Prediction:預(yù)測結(jié)果(damaging/tolerated),TOLERATED表示這個突變是可以容忍的,即對蛋白質(zhì)功能沒有影響或影響很小,DAMAGING表示突變是有害的,即對蛋白質(zhì)功能有較大影響;
Gene
:發(fā)生替換所在的基因。3.5.3、樣品間差異表達基因COG分類統(tǒng)計COG數(shù)據(jù)庫是基于細菌、藻類、真核生物的系統(tǒng)進化關(guān)系構(gòu)建得到的,利用COG數(shù)據(jù)庫可以對基因產(chǎn)物進行直系同源分類。注:橫坐標(biāo)為COG各分類內(nèi)容,縱坐標(biāo)為基因數(shù)目。在不同的功能類中,基因所占比例多少反映對應(yīng)時期和環(huán)境下代謝或者生理偏向等內(nèi)容,可以結(jié)合研究對象在各個功能類的分布作出科學(xué)的解釋。差異基因GO注釋聚類圖
topGO有向無環(huán)圖3.5.4、樣品間差異表達基因GO分類統(tǒng)計差異基因KEGG通路示意圖3.5.5、樣品間差異表達基因KEGG注釋四、外顯子組測序的應(yīng)用思路4.1WES找尋孟德爾疾病致病基因思路全外顯子測序Whole-exomesequencing分析及預(yù)測候選基因突變致病性Analysisandpredictcandidatecausativevariats生物學(xué)功能研究Functionalresearch在多個家系或散發(fā)病例中進行突變篩查研究Mutat
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年甘肅省蘭州市心連心社會工作服務(wù)中心招聘筆試重點試題及答案解析
- 2025中鐵西北科學(xué)研究院有限公司評估中心招聘備考核心試題附答案解析
- AI城市智慧醫(yī)療布局在高中城市規(guī)劃健康教學(xué)中的應(yīng)用課題報告教學(xué)研究課題報告
- 2025中財科創(chuàng)綠色金融研究院招聘備考筆試題庫及答案解析
- 2025招商銀行上海分行社會招聘筆試重點題庫及答案解析
- 環(huán)保包裝機械2025年創(chuàng)新驅(qū)動發(fā)展可行性分析報告
- 2026四川廣元市昭化區(qū)射箭鎮(zhèn)人民政府招聘城鎮(zhèn)公益性崗位人員1人考試核心題庫及答案解析
- 2025黑龍江齊齊哈爾市龍江縣中醫(yī)醫(yī)院招聘編外人員11考試參考試題及答案解析
- 《CB 4204-2012船用腳手架安全要求》專題研究報告
- 2025北京大學(xué)電子學(xué)院招聘1名勞動合同制工作人員考試核心試題及答案解析
- 2025年70周歲以上老年人換長久駕照三力測試題庫(含答案)
- 羽毛的作用教學(xué)課件
- 知道智慧樹旅游資源鑒賞與開發(fā)滿分測試答案
- 胸花設(shè)計教學(xué)課件
- 跟腱斷裂護理查房
- 酒店安全巡檢管理辦法
- 私域流量培訓(xùn)
- ZLP630高處作業(yè)吊籃使用說明書
- 部編人教版三年級上冊道德與法治全冊教案
- 新疆和田縣多寶山鉛多金屬礦項目環(huán)境影響報告書
- 2025至2030年中國羥基酪醇行業(yè)全景調(diào)研及競爭格局預(yù)測報告
評論
0/150
提交評論