基因組學(xué)理論課 基因組學(xué)_第1頁(yè)
基因組學(xué)理論課 基因組學(xué)_第2頁(yè)
基因組學(xué)理論課 基因組學(xué)_第3頁(yè)
基因組學(xué)理論課 基因組學(xué)_第4頁(yè)
基因組學(xué)理論課 基因組學(xué)_第5頁(yè)
已閱讀5頁(yè),還剩70頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第1章基因組1.2基因組序列復(fù)雜性1.2.1C值與C值悖理基因組:一個(gè)物種單倍體染色體的數(shù)目及其所攜帶的全部基因稱(chēng)為該物種的基因組(genome)。

C值(Cvalue):是指一個(gè)單倍體基因組中DNA的總量,一個(gè)特定的種屬具有特征的C值。最小的:原核生物支原體基因組小于106bp;最大的:某些植物和兩棲類(lèi)基因組大于1011bp。圖總的趨勢(shì)是:隨著生物結(jié)構(gòu)與功能復(fù)雜性而增加生物的復(fù)雜性與基因組的大小并不完全成比例增加。如:蕨類(lèi)的低等植物Psilotum

nudum,其基因組大小為2.5×1012bp,相當(dāng)于模式植物擬南芥基因組的3000倍。

Cvalueparadox(C值悖理):C值的大小并不能完全說(shuō)明生物進(jìn)化的程度和遺傳復(fù)雜性的高低,也就是說(shuō),物種的C值和它進(jìn)化復(fù)雜性之間沒(méi)有嚴(yán)格的對(duì)應(yīng)關(guān)系。1.2.1序列復(fù)雜性序列復(fù)雜性:基因組中單拷貝的DNA序列稱(chēng)為單一序列,多拷貝的DNA序列稱(chēng)為重復(fù)序列,不同序列的DNA總長(zhǎng)稱(chēng)為復(fù)雜性(complexity)?;蚪M復(fù)雜性與基因組大小

真核生物基因組DNA組分為非均一性,可分為3種類(lèi)型:快速?gòu)?fù)性組分,居間復(fù)性組分和緩慢復(fù)性組分。

如果基因組中每一種基因只有一個(gè),即都是單拷貝序列,那么基因組愈大則基因組的復(fù)雜性愈大,復(fù)性速率愈小,C0t1/2與非重復(fù)序列的基因組大小呈正比。1.2.3基因組的序列組成單拷貝序列(uniquesequence)亦稱(chēng)非重復(fù)序列(nonrepetitivesequence):在一個(gè)基因組中只有一個(gè)拷貝(或2-3個(gè)拷貝)中度重復(fù)序列(moderatelyrepetitivesequence)高度重復(fù)序列(highlyrepetitivesequence)1.2.3基因組的序列組成高度重復(fù)序列

重復(fù)單位長(zhǎng)度在數(shù)個(gè)堿基對(duì)至數(shù)千堿基對(duì)之間,拷貝數(shù)幾百個(gè)至上百萬(wàn)個(gè)。高等真核生物高度重復(fù)序列DNA有如下一些特點(diǎn):它們都是由極其相似的重復(fù)拷貝首尾相連串接排列;在介質(zhì)氯化銫中作密度梯度離心時(shí),可形成特異的衛(wèi)星帶,故又稱(chēng)衛(wèi)星DNA(sateliteDNA);集中分布在染色體的特定區(qū)段,如著絲粒和近端粒區(qū)。中度重復(fù)序列其長(zhǎng)度(由100bp到幾千bp)和拷貝數(shù)差別很大,一般分散在整個(gè)基因組中。有多種類(lèi)型的中度重復(fù)序列,其表達(dá)產(chǎn)物常是細(xì)胞大量需要的,如rRNA、tRNA和組蛋白等。還有如哺乳類(lèi)的:短散在元件(shortinterspersednuclear,SINE),長(zhǎng)度在500bp以下,拷貝數(shù)可達(dá)10萬(wàn)以上。如Alu序列。長(zhǎng)散在元件(longinterspersednuclear,LINE),長(zhǎng)度在1000bp以下,拷貝數(shù)1萬(wàn)左右。類(lèi)似于逆轉(zhuǎn)錄酶基因,L1。1、rRNA基因真核生物的rRNA有28s、18s、5.8s和5s4種,其中28s、18s和5.8s3種的編碼基因串聯(lián)排列,組成一個(gè)轉(zhuǎn)錄單位,在人類(lèi)基因組中約有300個(gè)拷貝,分布在13、14、15、21和22號(hào)染色體上。5srRNA基因單獨(dú)為一個(gè)轉(zhuǎn)錄單位,在人類(lèi)基因組中約有2000個(gè)拷貝,位于1號(hào)染色體。rRNA基因可以作為一種遺傳標(biāo)志,在分子遺傳學(xué)中有重要的意義。2、tRNA基因:每一種tRNA基因的拷貝數(shù)有幾十到幾百個(gè)。同一種tRNA基因常常串聯(lián)在一起排列成基因簇,各個(gè)編碼tRNA基因之間也有間隔區(qū)有的tRNA基因編碼序列中插入有內(nèi)含子3、Alu家族:每個(gè)長(zhǎng)度約300bp,富含CG,因在其第170bp處有一個(gè)限制性?xún)?nèi)切酶AluI(AGCT)的位點(diǎn)而得名占人類(lèi)基因組的3%~6%,Alu家族分散于整個(gè)基因組的間隔序列中,多位于一些編碼基因的5’端和3’端的遠(yuǎn)端,個(gè)別的也有存在于內(nèi)含子中。Alu序列具有種屬特異性,其功能可能與hnRNA的加工成熟,DNA復(fù)制及轉(zhuǎn)錄調(diào)節(jié)有關(guān)。單一序列

不同生物基因組中單一序列與重復(fù)序列的比例差異很大:原核生物絕大部分為單一序列(90%)。低等真核生物,大部分(80%)為單一序列。動(dòng)物細(xì)胞中,中度重復(fù)序列與高度重復(fù)序列約占50%。大多數(shù)植物與兩棲類(lèi)單一序列只占基因組DNA的很少比例(20%)?;蛑饕挥趩我恍蛄胁糠稚锓N屬基因組的序列組成不同生物基因組序列組成不同生物基因組的序列組成差別極大,原核生物基因組重復(fù)序列的含量很少。真核生物中大型基因組有很高比例的重復(fù)序列,植物中多倍體的重復(fù)序列比例高于兩倍體物種。1.3基因與基因家族基因(gene):用來(lái)表示決定可遺傳的某一表型的遺傳物質(zhì)。

即由不同的DNA片段共同組成的一個(gè)完整的表達(dá)單元,有一個(gè)特定的表達(dá)產(chǎn)物,表達(dá)產(chǎn)物可以是RNA分子,亦可為多肽分子。組成基因的DNA成分包括:編碼初級(jí)轉(zhuǎn)錄物的全部序列;為正確啟動(dòng)轉(zhuǎn)錄及進(jìn)行轉(zhuǎn)錄物加工所必需的最低要求的DNA序列;調(diào)節(jié)轉(zhuǎn)錄速率所必需的DNA序列,如涉及轉(zhuǎn)錄的誘導(dǎo)與抑制的序列以及組織與發(fā)育專(zhuān)一性表達(dá)的序列。基因分為兩大類(lèi),即編碼RNA的基因與編碼蛋白質(zhì)的基因。1.3.1編碼RNA基因細(xì)胞中絕大多數(shù)的RNA分子都與遺傳信息的傳遞有關(guān),涉及前體RNA的加工與mRNA的翻譯;大多數(shù)編碼RNA的基因都是多拷貝;RNA基因大致可分為6個(gè)類(lèi)群:即rRNA基因、tRNA基因、scRNA基因、snRNA基因、snoRNA基因、小分子干擾RNA基因。rRNA基因約占總量的80%

真核生物:18S,5.8S,28S和5SrRNA;原核生物16S,23S和5SrRNA。tRNA基因約占總量的15%

真核生物每種tRNA基因的拷貝數(shù)從數(shù)個(gè)至數(shù)百個(gè)不等。scRNA基因:編碼小分子細(xì)胞質(zhì)RNA(small

cytoplasmicRNA,胞質(zhì)內(nèi)小RNA)。僅知3種類(lèi)型:7SLRNA、7SKRNA、4.5SRNA7SLRNA是細(xì)胞質(zhì)信號(hào)序列識(shí)別顆粒(signalsequencerecognitionpartcle,SRP)組裝的骨架SRP可與正在合成的多肽鏈信號(hào)肽序列結(jié)合,介導(dǎo)后者與內(nèi)質(zhì)網(wǎng)接觸真核生物蛋白質(zhì)合成后的定向運(yùn)輸SnRNA基因:

編碼小分子細(xì)胞核RNA(small

nuclerRNA,核內(nèi)小RNA)。它們始終與蛋白質(zhì)結(jié)合形成核蛋白復(fù)合物,即snRNP,參與mRNA前體的剪接加工。剪接復(fù)合體:snRNP+mRNA

真核生物mRNA的剪接機(jī)制---剪接分兩步:

5’位點(diǎn)剪斷與(分支點(diǎn))形成套索狀中間體同步進(jìn)行

3’位點(diǎn)剪斷和外顯子連接同步進(jìn)行。內(nèi)含子的切除snoRNA基因

編碼小分子核仁RNA(smallnuclearRNA,核仁小RNA)。作用場(chǎng)所主要位于核仁區(qū)其功能是修飾rRNA,如指定特定位置的堿基甲基化或?qū)⒛承A基轉(zhuǎn)變?yōu)榧倌蜞奏ぁiRNA

miRNA(microRNA,微小RNA)是小分子干擾RNA的主要活性形式,系由原miRNA(pri-miRNA)加工產(chǎn)生。

長(zhǎng)度22nt的成熟miRNA。

功能:促使靶mRNA的降解或阻止和干擾靶mRNA的翻譯。小分子干擾RNAsiRNA:產(chǎn)生于雙鏈RNA(主要來(lái)源于內(nèi)源轉(zhuǎn)座子、反向重復(fù)DNA、病毒mRNA、轉(zhuǎn)基因表達(dá)產(chǎn)物)。

功能:主要涉及基因沉默、阻止翻譯和染色體重建piRNA(pivi-interactingRNA):動(dòng)物中發(fā)現(xiàn)。

功能:抑制內(nèi)源逆轉(zhuǎn)座子的表達(dá),保持基因組的穩(wěn)定性。1.3.2編碼蛋白質(zhì)基因均由RNA聚合酶轉(zhuǎn)錄。斷裂基因(splitgene):外顯子(exon)和內(nèi)含子(intron)初級(jí)轉(zhuǎn)錄物:

------mRNA前體5’帽的形成

------mRNA前體3’-端切除及加polyA尾

-----內(nèi)含子被切除--------成熟的mRNA。1.3.3基因家族多基因家族(genefamily):是真核生物基因組的共同特征,它們來(lái)自一個(gè)共同的祖先,因基因加倍和趨異產(chǎn)生許多在DNA序列組成上基本一致而略有不同的成員。同一家族的基因成員在序列組成上相似,擔(dān)負(fù)類(lèi)似的生物學(xué)功能。如人體血紅蛋白的α-和β-球蛋白亞基組成了2個(gè)基因亞家族,其中α球蛋白基因有3個(gè)成員,β-球蛋白基因有5個(gè)成員。基因家族主要產(chǎn)生于祖先基因的重復(fù)及其突變。組蛋白基因家族超基因家族(supergenefamily):

系指起源于共同的祖先,由相似DNA序列組成的許多基因亞家族或相似的基因成員構(gòu)成的群體,它們具有相似的功能。如免疫球蛋白基因家族:

IgG,IgM,IgA,IgE,IgD聯(lián)合基因(unionofgenomicsequence)基因組中一段連續(xù)的DNA序列,編碼一組關(guān)聯(lián)的彼此重疊的功能產(chǎn)物。1.3.4異常結(jié)構(gòu)基因重疊基因(overlappinggene):

編碼序列彼此重疊的基因,含有不同蛋白質(zhì)的編碼序列。

病毒基因組、某些高等生物線(xiàn)粒體基因組和核基因組中發(fā)現(xiàn)。主要類(lèi)型:?jiǎn)蝹€(gè)的mRNA可編碼2種或多種蛋白質(zhì),如大腸桿菌噬菌體ΦΧ174基因組長(zhǎng)5386bp,共編碼11個(gè)基因。由不同的啟動(dòng)子轉(zhuǎn)錄的彼此重疊的mRNA,各自編碼不同的蛋白質(zhì)。如人類(lèi)核基因組INK4a/ARF座位有2個(gè)蛋白質(zhì)產(chǎn)物p19和p16。GenomeorganizationoftheSARS-CoV基因內(nèi)基因(genes-within-genes)

:常常一個(gè)基因的內(nèi)含子中包含其他基因。如人類(lèi)基因組神經(jīng)成纖維細(xì)胞瘤Ⅰ型基因的一個(gè)內(nèi)含子中含有3個(gè)較短的基因,分別為OGMP,EV12A和EV128。反義基因(antisencegene)

:與已知基因編碼序列互補(bǔ)的負(fù)鏈編碼的基因。人類(lèi)基因組中含有大約1600個(gè)反義基因。不對(duì)稱(chēng)轉(zhuǎn)錄(asymmetrictranscription)

在DNA分子雙鏈上某一區(qū)段,一股鏈用作模板指導(dǎo)轉(zhuǎn)錄,另一股鏈不轉(zhuǎn)錄;模板鏈并非永遠(yuǎn)在同一條單鏈上。5

3

3

5

模板鏈編碼鏈編碼鏈模板鏈結(jié)構(gòu)基因轉(zhuǎn)錄方向轉(zhuǎn)錄方向1.3.5假基因假基因(pseudogene):

系指來(lái)源于功能基因但已失去活性的DNA序列,有沉默的假基因,也有可轉(zhuǎn)錄的假基因。如編碼序列出現(xiàn)終止密碼子突變,或者插入和缺失某些核苷酸使mRNA移碼,造成翻譯中途停止或異常延伸,合成無(wú)活性的蛋白質(zhì)。第一類(lèi)假基因:稱(chēng)為重復(fù)的假基因。由重復(fù)產(chǎn)生的假基因其位置一般與起源的基因拷貝鄰近排列,保留著祖先基因的組成特點(diǎn),有些細(xì)胞器(線(xiàn)粒體)基因組的基因轉(zhuǎn)移至核基因組。第二類(lèi)假基因:稱(chēng)為加工的假基因。這類(lèi)假基因由RNA反轉(zhuǎn)錄為cDNA后再整合到基因組中。已不含原來(lái)基因的內(nèi)含子以及兩側(cè)序列;分散在整個(gè)基因組中;大多數(shù)為5′殘缺。第三類(lèi)假基因:為殘缺基因,它們?nèi)笔Я嘶蜷L(zhǎng)或短的基因片段,常常位于基因家族內(nèi)部,由不等交換及重排產(chǎn)生。第2章

遺傳圖繪制測(cè)序策略-----作圖法測(cè)序:

繪制高密度分子標(biāo)記遺傳圖和大分子DNA克隆重疊群(contig)覆蓋的基因組物理圖根據(jù)分子標(biāo)記所在的位置將遺傳圖和物理圖彼此銜接繪制基因組整合圖在此基礎(chǔ)上,將單個(gè)大分子DNA克隆逐個(gè)隨機(jī)測(cè)序,隨后進(jìn)行序列組裝。這是一種由上而下(uptodown)的測(cè)序策略。鳥(niǎo)槍法測(cè)序:全基因組鳥(niǎo)槍法隨機(jī)測(cè)序,隨后將序列重疊的片段構(gòu)建重疊群。以大分子DNA克隆為基準(zhǔn),將隨機(jī)測(cè)序搭建的重疊群歸并到所在的大分子克隆內(nèi)。最后以分子標(biāo)記為基點(diǎn)將歸并的鳥(niǎo)槍法DNA片段錨定到染色體上?!瑼TGCCGTAGGCCTAGCTAGGCCTAGCTCGGA……

………ATGCCGTAGGCCTAGCTCGGA……基因組DNABAC文庫(kù)根據(jù)物理圖譜正確定位的BAC或contig用于霰彈法測(cè)序的候選克隆用于霰彈法測(cè)序的亞克隆測(cè)序并組裝完整的基因組序列逐步克隆法(ClonebyClone)

全基因組霰彈法(WholeGenomeShot-gun)基因組DNA

霰彈法克隆測(cè)序并進(jìn)行全基因組序列組裝完整的基因組序列遺傳作圖(geneticmapping)

采用遺傳學(xué)分析方法將基因或其他DNA分子標(biāo)記標(biāo)定在染色體上構(gòu)建連鎖圖稱(chēng)之為遺傳連鎖圖(geneticlinkagemap)或遺傳圖(geneticmap)。這一方法包括雜交實(shí)驗(yàn),家系分析。遺傳圖的圖距單位為厘摩(cM),每單位厘摩定義為1%交換率。遺傳圖的繪制是人類(lèi)基因組研究的第一步,即以染色體上某一點(diǎn)為遺傳標(biāo)記,以與之相伴遺傳的特征為對(duì)象,經(jīng)連鎖分析,將編碼該特征的基因定位于染色體特定位置。cM值越大,兩者之間距離越遠(yuǎn)。通過(guò)遺傳圖分析,可大致了解各個(gè)基因或DNA片段之間的相對(duì)距離與方向,了解哪個(gè)基因更靠近著絲粒,哪個(gè)更靠近端粒等。遺傳距離是通過(guò)遺傳連鎖分析獲得的,研究中所使用的DNA標(biāo)志越多,越密集,所得到的遺傳連鎖圖的分辨率就越高。物理作圖(physicalmapping)

采用分子生物學(xué)技術(shù)直接將DNA分子標(biāo)記、基因或克隆標(biāo)定在基因組的實(shí)際位置所構(gòu)建的位置圖稱(chēng)之為物理圖。物理圖的距離依作圖方法而異,如輻射雜種(radiationhybrid)作圖的圖距單位為厘鐳(cR),限制性片段作圖與克隆作圖的圖距為DNA的分子長(zhǎng)度,即堿基對(duì)。由于方法的局限遺傳圖和物理圖均會(huì)產(chǎn)生某些偏差,通過(guò)共同的作圖標(biāo)記可以相互校正,由此獲得的基因組連鎖圖稱(chēng)之為基因組圖(genomemapping)。2.2遺傳作圖標(biāo)記2.2.1基因標(biāo)記

在經(jīng)典遺傳學(xué)中,研究一種性狀的遺傳必須要求同一性狀至少有2種不同的存在形式或稱(chēng)表型。如孟德?tīng)栐谘芯客愣剐誀畹倪z傳規(guī)律時(shí)就選用了如植株高與矮這種相對(duì)性狀,每個(gè)相對(duì)性狀都由一個(gè)不同的等位基因(allele)控制。HLA-B位點(diǎn)至少有60個(gè)等位基因。2.2.2DNA標(biāo)記DNA標(biāo)記:

基因之外的作圖工具統(tǒng)稱(chēng)為DNA標(biāo)記。限制性片段長(zhǎng)度多態(tài)性

(restrictionfragmentlengthpolymorphisms,RFLP)簡(jiǎn)單序列長(zhǎng)度多態(tài)性

(simplesequencelengthpolymorphisms,SSLPs)單核苷酸多態(tài)性

(singlenucleotidepolymorphisms.SNPs)A.限制性片段長(zhǎng)度多態(tài)性

(restrictionfragmentlengthpolymorphisms,RFLP)

其基本設(shè)想是,由于同源染色體同一區(qū)段DNA序列的差異,當(dāng)用限制酶處理時(shí),可產(chǎn)生長(zhǎng)度不同的限制性片段。這些DNA片段經(jīng)瓊脂糖凝膠電泳分離,可直接顯示不同個(gè)體同一位點(diǎn)DNA組成的差異。提供大量位點(diǎn)多態(tài)性信息。RELP被稱(chēng)為第一代分子標(biāo)記。DNA標(biāo)記特征:處于染色體上的位置相對(duì)固定;同一親本及其子代相同位點(diǎn)上的多態(tài)性片段特征不變;同一凝膠電泳可顯示不同多態(tài)性片段,具有共顯性特點(diǎn)。B.簡(jiǎn)單序列長(zhǎng)度多態(tài)性

(simplesequencelengthpolymorphisms,SSLPs)SSLP產(chǎn)生于重復(fù)序列的可變排列,同一位點(diǎn)重復(fù)序列的重復(fù)次數(shù)不同,表現(xiàn)出DNA序列的長(zhǎng)度變化。與RELP不同的是,SSLP具多等位性(multiallelic),每個(gè)SSLP都有多個(gè)長(zhǎng)度不一的變異體。分布具有多態(tài)性頻率高以及分布比較均勻的特點(diǎn),SSLP標(biāo)記又稱(chēng)為第二代分子標(biāo)記,有時(shí)稱(chēng)為SSR。小衛(wèi)星序列(minisatellite):可變串聯(lián)重復(fù)(variablenumberoftandemrepeats,VNTR),其重復(fù)單位為數(shù)十個(gè)核苷酸微衛(wèi)星序列(microsatellite):簡(jiǎn)單串聯(lián)重復(fù)(STR)重復(fù)單位為1~6個(gè)核苷酸,由10~50個(gè)重復(fù)單位串聯(lián)組成。平均每6kb有一個(gè)SSLP位點(diǎn),人類(lèi)基因組中,76%的重復(fù)序列為A、AC、AAAN、AAN或AG,豐度依次遞減。作圖中應(yīng)用最廣的重復(fù)序列為AG。微衛(wèi)星序列應(yīng)用較普遍,原因有二小衛(wèi)星序列在基因組中的分布很不均勻,大多集中在染色體的端部和著絲粒區(qū),而微衛(wèi)星則分布在整個(gè)基因組中,并且密度高;微衛(wèi)星序列便于PCR分析,當(dāng)PCR擴(kuò)增的DNA長(zhǎng)度少于300bp時(shí),反應(yīng)既快速又精確。C.單核苷酸多態(tài)性

(singlenucleotidepolymorphisms.SNPs)

基因組中單個(gè)核苷酸的突變,每個(gè)單核苷酸位置最多只有4種形式,A、T、C、G。某些群體在特定的單苷核酸位置只有2個(gè)或3個(gè)SNP,這些位點(diǎn)稱(chēng)為雙等位(biallele)或三等位(triallele)。

人類(lèi)基因組中位于基因內(nèi)部的SNP至少超過(guò)200,000,基因外部的點(diǎn)突變是基因內(nèi)部的10倍甚至更多,整個(gè)SNP數(shù)目約在1,000萬(wàn)左右。ATGCACACACACACACACATGCACACACACACACACACACATypeofvariationamongpopulationSNPSTR對(duì)某一特定的SNP,同一家系的成員可能有相同的基因型。如SNP在基因組中的數(shù)量極大,人群中幾乎任何2個(gè)個(gè)體的基因組都有許多SNP。SNP分子標(biāo)記具有分布密集的特點(diǎn),在親緣關(guān)系非常接近的生態(tài)型或種內(nèi)因遺傳漂變而隔離的群體,尤其在人類(lèi)不同種族的多態(tài)性檢測(cè)中被廣泛采用。又稱(chēng)為第三代分子標(biāo)記第3章

物理圖繪制物理作圖:

以DNA分子的序列排列為基礎(chǔ)的非遺傳學(xué)的作圖技術(shù)統(tǒng)稱(chēng)為物理作圖。物理作圖的方法和策略有多種多樣,常用的有:限制性作圖;基于克隆的基因組作圖;熒光原位雜交;序列標(biāo)簽位點(diǎn)作圖。3.1限制性作圖3.2基于克隆的基因組作圖3.2.1大分子DNA的克隆載體細(xì)菌人工染色體(bacterialartificialchromosome,BAC):

BAC載體源于大腸桿菌中天然的F質(zhì)粒。F質(zhì)粒有較大的克隆容量,可達(dá)300kb以上可采取類(lèi)似制備質(zhì)粒的方法直接提取克隆的DNA。3.2.2重疊群組建重疊群(contig):相互重疊的DNA片段組成的物理圖稱(chēng)為重疊群??寺≈丿B群的組建:最早采用的是染色體步移(chromosomewalking)法。首選從基因組文庫(kù)中挑取一個(gè)指定的或隨機(jī)的克隆,將該起始克隆的末端序列作為探針,在基因組文庫(kù)中尋找與之重疊的第二個(gè)克隆。再按同樣的操作程序?qū)ふ业谌齻€(gè)重疊的克隆,依次延伸,直到完成所需要的重疊群。該方法速度緩慢僅適合于小基因組及小區(qū)段染色體的物理圖繪制。Contig3.2.3指紋作圖克隆指紋(clonefingerprinting)排序:指紋:系指克隆的DNA序列所具有的特定的DNA片段組成。這些DNA片段可以通過(guò)不同的方法產(chǎn)生,經(jīng)凝膠電泳顯示后組成特定排列模式的DNA條帶,即指紋??寺≈讣y:每個(gè)克隆的DNA序列都具有特征性的指紋,這些指紋稱(chēng)為克隆指紋。如果兩個(gè)DNA克隆含有部分相同的指紋,那么這兩個(gè)克隆就含有部分重疊的DNA序列,它們?cè)诨蚪M中應(yīng)該相鄰排列。>20kb~300bpMolecularweightmarkerevery5thlane

BACclones培養(yǎng)提取BACDNAHindIII完全酶切

1%瓊脂糖凝膠電泳

指紋圖譜法

(WalkingbyFingerprintingdatabase)

挑取靠近空洞(gap)的種子克隆,酶切構(gòu)建其指紋圖譜,在FPC數(shù)據(jù)庫(kù)中進(jìn)行比對(duì),搜索含有此克隆的重疊克隆群信息,從中確定覆蓋空洞區(qū)域的克隆,達(dá)到延伸目的。限制性帶型(restrictionpatterns)指紋:

用不同限制性酶處理樣品,經(jīng)凝膠分離產(chǎn)生DNA條帶。如果2個(gè)克隆產(chǎn)生的DNA條帶有部分是相同的,說(shuō)明它們含有重疊的序列。HindIII完全酶切HindIII完全酶切FPC數(shù)據(jù)庫(kù)中比對(duì)CloneACloneBCloneCCABSTS作圖(STScontentmaping)指紋:當(dāng)需將某一克隆重疊群錨定到現(xiàn)有的已具有STS標(biāo)記的物理圖上時(shí),這一方法特別有效。因?yàn)镾TS是單一序列,并且序列已知。根據(jù)選定的某個(gè)STS序列設(shè)計(jì)專(zhuān)一性引物,可對(duì)大量的單個(gè)克隆進(jìn)行PCR檢測(cè),凡是能擴(kuò)增出條帶的克隆均含有序列重疊的插入子。3.4輻射雜種作圖構(gòu)建詳細(xì)的大基因組物理圖的主流技術(shù)為STS定位(STSmaping)的輻射雜種(radiationhybrid)作圖。主要原理是:基因組中單一序列

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論