第4章 基因組測(cè)序與序列組裝_第1頁
第4章 基因組測(cè)序與序列組裝_第2頁
第4章 基因組測(cè)序與序列組裝_第3頁
第4章 基因組測(cè)序與序列組裝_第4頁
第4章 基因組測(cè)序與序列組裝_第5頁
已閱讀5頁,還剩46頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第四章基因組測(cè)序與序列組裝4.1DNA測(cè)序的方法4.2基因組測(cè)序與序列組裝4.3基因組測(cè)序的其他路線4.1DNA測(cè)序的方法4.1.1Maxam-Gilbert化學(xué)降解法(chemicaldegradationmethod)化學(xué)修飾DNA測(cè)序法,A.M.Maxam和W.Gilbert于1977年發(fā)明?;瘜W(xué)降解法主要用于測(cè)定短片段DNA的序列例如啟動(dòng)子測(cè)序化學(xué)降解法測(cè)序DNA模板有鏈內(nèi)堿基配對(duì)時(shí)也可用化學(xué)降解法測(cè)序化學(xué)降解法基本原理及步驟

i.首先對(duì)待測(cè)片段作末端標(biāo)記,用放射性32P-磷酸基團(tuán)標(biāo)記鏈的末端之一ii.進(jìn)行四組平行的反應(yīng):(G,A+G,C+T以及C)特異性切割

iii.最后進(jìn)行聚丙烯酰胺凝膠電泳和放射自顯影。比較G、A+G、C+T和C各個(gè)泳道,自下而上從自顯影片上就可讀出DNA序列

堿基特異的化學(xué)切割反應(yīng)堿基特異修飾方法GpH8.0,用硫酸二甲酯對(duì)N7進(jìn)行甲基化,使C8-C9鍵對(duì)堿基裂解有特殊敏感性A+GpH2.0哌啶甲酸可使嘌呤環(huán)的N原子位置脫嘌呤,并因此消弱腺嘌呤和鳥嘌呤的糖苷鍵C+T肼可打開嘧啶環(huán),后者重新環(huán)化成五元環(huán)后易除去C1.5mol/LNaCl存在時(shí),可用肼除去胞嘧啶6DNA標(biāo)記與分離:先放射性標(biāo)記DNA鏈5'端加入二甲基亞砜DMSO,加熱到90度,打開雙鏈電泳分離一條鏈比另一條鏈嘌呤核苷酸多,跑得慢,稱為重鏈純化一條鏈,分成4份,每樣都用一種切割試劑處理

7"G"反應(yīng)加入有限的硫酸二甲酯處理,使每個(gè)多聚核苷酸上只能修飾一個(gè)G殘基加入哌啶使鏈斷裂哌啶首先去除修飾的嘌呤環(huán),并在緊鄰所產(chǎn)生的無堿基位點(diǎn)上游的磷酸二酯鍵出切割DNA8化學(xué)降解法缺點(diǎn):

試劑含有毒性不易自動(dòng)化4.1.2鏈終止法(chainterminationmethod)1977年Sanger等人發(fā)明了利用DNA聚合酶的雙脫氧鏈終止原理測(cè)定核苷酸序列的方法,又稱為Sanger雙脫氧測(cè)序法此法更適合序列分析的自動(dòng)化最常用的一種測(cè)序方法,第一代測(cè)序儀采用的方法dNTP與ddNTP的分子結(jié)構(gòu)分別進(jìn)行反應(yīng)如何獲得單鏈DNA?1)將DNA克隆到質(zhì)粒載體中獲得測(cè)序模板DNA最常用的方法獲得的DNA通過熱變性或者堿變性轉(zhuǎn)變?yōu)閱捂淒NA進(jìn)行測(cè)序優(yōu)點(diǎn)是可雙向測(cè)序缺點(diǎn)是樣品可能有少量細(xì)菌的DNA或者RNA污染,會(huì)干擾測(cè)序如何獲得單鏈DNA?2)以M13載體克隆單鏈DNAM13噬菌體載體是專門為得到單鏈DNA測(cè)序模板而設(shè)計(jì)的。M13噬菌體本來含有單鏈DNA基因組,感染大腸桿菌的M13可轉(zhuǎn)變?yōu)殡p鏈復(fù)制型。M13噬菌體載體是雙鏈的,相當(dāng)于M13噬菌體的復(fù)制型。用含有待測(cè)序片段的M13噬菌體載體感染大腸桿菌,大腸桿菌分泌的噬菌體就含有單鏈DNA基因組。缺點(diǎn):只能用于短片段DNA,大于3kb的片段在克隆過程中會(huì)發(fā)生丟失和重排。如何獲得單鏈DNA?3)以噬菌粒(phagemid)載體克隆DNA這是一種改造過的質(zhì)??寺≥d體,含有兩個(gè)復(fù)制起點(diǎn),一個(gè)是質(zhì)粒自身的復(fù)制起點(diǎn),一個(gè)是單鏈DNA噬菌體基因組的復(fù)制起點(diǎn)當(dāng)大腸桿菌細(xì)胞中同時(shí)含有噬粒和輔助噬菌體時(shí),因?yàn)檩o助噬菌體攜帶的編碼噬菌體復(fù)制酶和外殼蛋白的基因可以激活噬菌粒上的噬菌體復(fù)制起始位點(diǎn),產(chǎn)生含單鏈的噬粒噬菌體優(yōu)點(diǎn):克隆片段可達(dá)10kb以上鏈終止法所用的DNA聚合酶高持續(xù)合成能力(processivity)

聚合酶由于自然原因終止反應(yīng)前所合成的多聚核苷酸的長度無5'→3'外切酶活性無3'→5'外切酶活性目前普遍采用的測(cè)序酶為Sequenase,來自T7噬菌體,除具有以上特點(diǎn),還具有其它特征,比如反應(yīng)快速引物決定待測(cè)模板DNA區(qū)域自動(dòng)化測(cè)序是在Sanger雙脫氧鏈終止法的基本原理上發(fā)展起來的:

1)熒光染料(fluorescentdye)標(biāo)記取代了放射性標(biāo)記,由于由于每種ddNTP帶有各自特定的熒光顏色,而簡化為由1個(gè)泳道同時(shí)判讀4種堿基

2)毛細(xì)管(capillarygel)電泳取代了平板膠(slabgel)電泳兩種形態(tài)的PAGE毛細(xì)管電泳有96個(gè)泳道,可同時(shí)進(jìn)行96次測(cè)序AutomatedDNAsequenceworkflowDNAtemplatepreparationCyclesequencing:384-wellplate,每個(gè)well中,加上4種dNTPs和四種帶不同熒光標(biāo)記的ddNTP,測(cè)序酶,模板DNA,單側(cè)引物,放于熱循環(huán)儀(thermocycler)上進(jìn)行反應(yīng)

60cycles:95oC30s50oC20s60oC4minAutomatedDNAsequenceworkflow(cont.)ExtensionproductpurificationethanolprecipitationCapillaryelectrophoresisDataanalysis21閱讀鏈終止實(shí)驗(yàn)所產(chǎn)生的序列4.1.3焦磷酸測(cè)序法(pyrosequencing)也叫454測(cè)序技術(shù)

不需要克隆得到DNA模板,不需要電泳或其他任何片段分離程序高通量的一種測(cè)序方法,一種二代測(cè)序技術(shù)

2023/2/124硫酸化酶螢光素酶氧化螢光素發(fā)出的可見光信號(hào)與加入核苷酸數(shù)成正比聚合酶5’-磷酰硫酸螢光素加apyrase雙磷酸酶降解未反應(yīng)的dNTPsSecondgenerationsequencers454

SolexaSOLiD50bp/80-100GbDenovosequencingRNA-seq,Re-sequencingChIP-seq,Meth-seqMetagenomicsDenovosequencingRNA-seqRe-sequencingChIP-seqRNA-seq“known”GenomeNovelgenome(s)Bothtypes400bp/400Mb120bp/40-60Gb高通量!第二代測(cè)序技術(shù)采用了高通量測(cè)序技術(shù),使測(cè)序通量大大提高,從Sanger測(cè)序法一次讀取一條序列到毛細(xì)管測(cè)序的一次讀取96條序列再到現(xiàn)在的一次讀取幾百萬條序列的實(shí)現(xiàn),這是對(duì)第一代測(cè)序技術(shù)的一次革命性的變革然而第二代測(cè)序技術(shù)并不完美,由于其在測(cè)序前要通過PCR手段對(duì)待測(cè)片段進(jìn)行擴(kuò)增,因此增加了測(cè)序的錯(cuò)誤率。并且其測(cè)序結(jié)果比較短,更適合重測(cè)序,而不太適用于沒有基因組序列的全新測(cè)序。4.1.4第三代測(cè)序技術(shù)Helicos公司的Heliscope單分子測(cè)序儀、PacificBiosciences公司的SMRT技術(shù)和OxfordNanoporeTechnologies公司正在研究的納米孔單分子技術(shù),被認(rèn)為是第三代測(cè)序技術(shù)又稱為下下一代的測(cè)序(next-next-generationsequencing)的直接測(cè)序方法這一測(cè)序技術(shù)是基于納米孔(nanopore)的單分子讀取技術(shù),不同于之前的兩代技術(shù),可以直接讀取序列信息,簡潔快速,成本更低廉2023/2/14.2基因組測(cè)序與組裝4.2.1一些術(shù)語覆蓋面(coverage)是指隨機(jī)測(cè)序中獲得的序列總長與單倍體基因組序列總長之比,coverage越大,遺漏的序列越少可以用P0=e-m計(jì)算,P0為丟失的概率,m為coverage如果m=1,P0=37%m=6,P0=0.25%m=8,P0=0.034%要使測(cè)序的覆蓋率達(dá)到99.99%,就必須使coverage達(dá)到8次以上讀序(read)

每次測(cè)序可獲得的DNA序列BAC末端序列(BAC-endsequences)

一個(gè)BAC克隆插入片段兩端的已測(cè)序的序列,不包括內(nèi)部序列。可用于確定BAC的排列方向以及重疊群(contig)在支架(scaffold)中的排列方向

重疊群(contig)一群相互重疊的克隆或DNA順序,可以是草圖順序或精確順序(finished),包括連續(xù)的(內(nèi)部無間隙)或不連續(xù)的(內(nèi)部含間隙)DNA順序支架(scaffold)一組已錨定在染色體上的重疊群,內(nèi)部含間隙或不含間隙.草圖序列(draftsequence)人類基因組測(cè)序計(jì)劃定義為經(jīng)PhredQ20軟件認(rèn)可覆蓋測(cè)序克隆片段3-4倍的DNA順序.含間隙或無間隙,排列方向和位置未定完成序列(finishedsequence)序列差錯(cuò)率(錯(cuò)誤堿基數(shù))低于0.01%的DNA序列,排列方向確定,內(nèi)部不含間隙,一般coverage達(dá)到8-104.2.2克隆重疊群測(cè)序與序列組裝克隆重疊群測(cè)序又稱為作圖法測(cè)序(map-basedsequence)或者克隆依次測(cè)序(clone-by-clone)

BAC-by-BACThemappedBAC-by-BACshotgunsequencingstrategyMajorstepsinBAC-by-BACshotgunsequencing(2-4kb)線蟲基因組采用克隆重疊群法測(cè)序4.2.3鳥槍法測(cè)序與序列組裝鳥槍法測(cè)序

將DNA分子打斷成小片段,測(cè)定每一段的序列,根據(jù)每個(gè)片段的重疊部分再組裝成主體序列可以不需要事先了解基因組信息,不需要構(gòu)建遺傳圖或物理圖,但不適合大基因組

全基因組鳥槍法測(cè)序應(yīng)用圖譜幫助主要序列組裝鳥槍法測(cè)序?qū)嵗?流感嗜血桿菌序列測(cè)定1)建立高度隨機(jī)、插入片段大小為2kb左右的基因組文庫??寺?shù)要達(dá)到一定數(shù)量,即經(jīng)末端測(cè)序的克隆片段的堿基總數(shù)應(yīng)達(dá)到基因組5倍以上。2)高效、大規(guī)模的末端測(cè)序。對(duì)文庫中每一個(gè)克隆,進(jìn)行兩端測(cè)序,流感嗜血桿菌基因組的測(cè)定完成,使用了14臺(tái)測(cè)序儀,用三個(gè)月時(shí)間完成了必需的28,643個(gè)測(cè)序反應(yīng),測(cè)序總長度達(dá)6倍基因組,得到140個(gè)contigs3)填補(bǔ)缺口。

42個(gè)物理間隙和99個(gè)序列間隙,建立插入片段為15-20kb的λ文庫以備缺口填補(bǔ)序列間隙(sequencegap)

測(cè)序時(shí)遺漏的序列,這些序列仍然保留在尚未挑選到的克隆中可以通過利用相鄰已知順序作為探針,篩選已有的基因組文庫,挑選陽性克隆重新測(cè)序關(guān)閉間隙

物理間隙(physicalgap)建基因組文庫時(shí)丟失的DNA序列,即基因組文庫中沒有這些序列的克隆物理間隙的填補(bǔ)需要利用其他載體或者宿主菌重新構(gòu)建一個(gè)基因組文庫,然后利用間隙兩側(cè)的序列作為探針,或者制備相應(yīng)的PCR引物,從新文庫篩選陽性克隆,重新測(cè)序高度重復(fù)序列造成的gap很難填補(bǔ)全基因組鳥槍法序列組裝過程利用插入片段大小不同的克隆兩端測(cè)序搭建支架4.2.4人類基因組測(cè)序與組裝序列草圖是采用物理圖與鳥槍法有機(jī)結(jié)合的技術(shù)路線完成的采集5個(gè)自愿者的DNA樣品構(gòu)建3種不同插入子大小的基因組文庫2Kb,10Kb和50Kb完成約2700萬次插入子末端測(cè)序,總長14800MbGeneBank下載104018個(gè)BAC末端順序PFP發(fā)表的公開數(shù)據(jù)主要為BAC克隆的順序,共4443.3Mb全基因組序列組裝方法和區(qū)間化組裝相結(jié)合進(jìn)行序列組裝Celera

genomics人類基因組的測(cè)序策略國際人類基因組測(cè)序策略

構(gòu)建BAC克隆↓限制性酶處理獲得指紋↓根據(jù)指紋重疊方法組建BAC克隆重疊群

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論