下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、第5章 基因組序列詮釋,完成基因組測序僅僅是基因組計劃的第一步,更大的挑戰(zhàn)在于弄清: 基因組順序中所包含的全部遺傳信息是什么? 基因組作為一個整體如何行使其功能? 這兩項任務(wù)都必須依賴于對基因組順序的正確注解或詮釋(annotation),首先是從已知順序中搜尋基因。,5.1 搜尋基因,一旦獲取基因組的DNA順序后,不管它是來自某一區(qū)段還是一整條染色體,第一個任務(wù)就是從中查找基因,這是解讀整個基因組的基礎(chǔ)。查找基因有兩種常見的方法: 根據(jù)已知的順序人工判讀或計算機分析尋找與基因有關(guān)的序列; 進行實驗研究,看其能否表達基因產(chǎn)物及其對表型的影響。,5.1.1 根據(jù)順序分析搜尋基因,如果一段DNA順
2、序中含有編碼基因,那么這段順序的堿基序列就不會是隨機排列的,一定存在某些可以辨別的特征。目前還沒有一個能適用于所有情況的“基因序列”的標準,只能根據(jù)已知的某些規(guī)律來推測哪些順序可能是基因。,開放讀框,基因都含有開放讀框(open reading frames,ORFs),它們由一系列指令氨基酸的密碼子(codons)組成。開放讀框有一個起點,又稱起譯密碼(initiation codon):ATG;還有一個終點,又稱終止密碼(termination codon):TAA、TAG和TGA。從DNA順序中搜尋基因總是從第一個ATG開始,然后向下游尋找終止密碼。在開始這項工作之前,我們并不知道DNA
3、雙鏈中哪一條單鏈是編碼鏈,或稱正(+)鏈,也不知道準確的轉(zhuǎn)譯起始點在何處。由于每條鏈都有三種可能的讀框,兩條鏈共計6種讀框,計算機可以很快給出結(jié)果。 ORF掃描的關(guān)鍵是終止密碼在6種讀框中出現(xiàn)的頻率。如果DNA的堿基排列是隨機的,并且GC含量為50%,則三個終止密碼子:TAA、TAG和TGA出現(xiàn)的平均機率為每43= 64bp一次。假如GC比大于50%,因終止密碼中AT比例高,則每隔100-200bp才會出現(xiàn)一個終止密碼。隨機堿基排列的ORF長度預(yù)計不超過50個密碼子,即150bp,以ATG起始計算長度更短。大多數(shù)基因的ORF均多于50個密碼子,因此最可能的選擇應(yīng)該是ORF不少于100個密碼子的
4、讀框。,細菌基因組中缺少內(nèi)含子,非編碼序列僅占11%,對讀框的排查干擾較少。假定基因之間不存在重疊順序,也無基因內(nèi)基因(gene-within-gene),那么ORF閱讀出現(xiàn)差錯的最大可能性只會發(fā)生在非編碼區(qū)。細菌基因組的ORF閱讀相對比較簡單,錯誤的機率較少。 高等真核生物DNA的ORF閱讀比較復(fù)雜,其原因在于: 基因間存在大量非編碼序列(人類基因組中占70%); 絕大多數(shù)基因含有非編碼的內(nèi)含子。高等真核生物多數(shù)外顯子的長度少于100個密碼子,有些不到50個密碼子甚至更少,因此當(dāng)讀碼進入內(nèi)含子時很快遇上終止密碼,難以根據(jù)上述的ORF長度來判斷哪種讀框是正確的。,內(nèi)含子的出現(xiàn)給計算機判讀基因帶
5、來不少問題,在編寫ORF掃描程序時要作許多修改,必須加入一些相應(yīng)的規(guī)則: 密碼子偏愛 生物具有通用的64種密碼子,其中三種為終止密碼子,其余61種密碼子編碼20種氨基酸,除甲硫氨酸(Met)和色氨酸(Trp)各有1個密碼子外,其他氨基酸都擁有多個密碼子。編碼同一氨基酸的不同密碼子稱為同義密碼(synonym),其差別僅在密碼子的第三位堿基不同。不同種屬之間使用同義密碼的頻率有很大差異,如人類基因中,丙氨酸(Ale)密碼子多為GCA,GCC或GCT,而GCG很少使用。蘇氨酸(Thr)常用的密碼子為ACA,ACC或ACT,很少用ACG。高等植物207個基因的編碼順序,其中單子葉植物基因53個,雙子
6、葉植物基因154個,分屬6個單子葉和35個雙子葉種群。單子葉與雙子葉主群密碼子(majority codon)中第三個搖擺堿基的成員比例明顯不同。單子葉18種氨基酸中有16種氨基酸的密碼子搖擺堿基為G+C,而雙子葉中僅有7種氨基酸的密碼子搖擺堿基為G+C,或者說雙子葉密碼子搖擺堿基大多為A+T。這一現(xiàn)象稱為密碼子偏愛(codon bias),其產(chǎn)生的原因不明。特定種屬有特征性的密碼子偏愛,這些序列在編碼區(qū)常常出現(xiàn),非編碼區(qū)只保持平均的堿基分布水平。根據(jù)已有生物密碼子偏愛的資科在編寫相應(yīng)的計算機程序時可加入這些限制。,外顯子-內(nèi)含子邊界(exon-intron boundaries) 外顯子與內(nèi)
7、含子的邊界區(qū)有一些明顯的特征,如內(nèi)含子的5端或稱供體位(donor site)常見的順序為5-AGGTAAGT-3,3端又稱受體位(acceptor site)多為5-PyPyPyPyPyPyCAG -3(“Py”為嘧啶核苷酸,T或C)。這是判斷編碼順序的依據(jù)之一。由于外顯子-內(nèi)含子邊界順序常有例外,編寫通用的判讀程序時有不少困難,上述規(guī)律僅適用一定范圍。 上游控制順序(upstream control sequence) 幾乎所有的基因(或操縱子)上游都有調(diào)控序列,它們可與DNA結(jié)合蛋白作用控制基因表達。調(diào)控順序有明顯特點,在查找基因時可作為參考,特別是原核生物。真核生物基因上游的控制順序變
8、化較大,以此作為標志判別基因時應(yīng)當(dāng)謹慎。 上述這三種ORF掃描的方法適合所有高等真核生物基因組,可綜合運用。還有一種針對個別生物的策略,主要依據(jù)這些生物基因組特有的組成。例如脊椎動物基因組許多基因的上游都有CpG島(islands)。CpG島的長度約1kb,其CG比例顯著高于基因組平均水平。約56%的人類基因與上游的CpG島相連,在基因組順序掃描時,如發(fā)現(xiàn)CpG島有可能在其下游找到基因。,同源查詢,利用已存入數(shù)據(jù)庫中的基因順序與待查的基因組序列進行比較,從中查找可與之匹配的堿基順序及其比例用于界定基因的方法稱為同源查詢(homology search),它可彌補ORF掃描的不足。同源查詢的依據(jù)
9、是,現(xiàn)有生物的不同種屬之間具有功能或結(jié)構(gòu)相似的直系基因成員,它們在起源上一脈相承,其間存在保守的順序組成。同一物種中因基因重復(fù)產(chǎn)生的基因家族也有保守的序列特征。當(dāng)某一DNA順序含有這類基因時,通過與已報道的其他基因序列對比,可發(fā)現(xiàn)其中的相似性。這些相似性有以下表現(xiàn): 存在某些完全相同的序列; ORF讀框的排列類似,如等長的外顯子; ORF指令的氨基酸順序相同; 模擬的多肽高級結(jié)構(gòu)相似。 以上這些結(jié)果均可作為基因界定的指標,它們可單獨使用,亦可綜合考察。同源查詢還可提供基因功能的參考,目前這一技術(shù)已成為界定基因的主要工具之一。當(dāng)某一順序從數(shù)據(jù)庫中無法找到同源序列,又無法排除其不是基因的可能性時,
10、必須依靠實驗來進一步確認。在基因分類時這些缺少同源順序的ORF被稱為孤獨基因(orphan gene)。,5.1.2 實驗分析確認基因,任何基因都可轉(zhuǎn)錄為RNA拷貝,這是實驗確證基因的依據(jù)。真核生物中許多編碼蛋白質(zhì)的基因其轉(zhuǎn)錄的初級產(chǎn)物都有內(nèi)含子,加工后成為mRNA。根據(jù)mRNA的順序可以找到外顯子的位置以及整個基因的組成。由于mRNA的5端及3端各有一段非翻譯區(qū),基因的轉(zhuǎn)錄起點與終點有時并不準確,但不妨礙整個基因的界定。,分子雜交可確定DNA片段是否含表達順序,進行分子雜交實驗時,樣品中純化的RNA經(jīng)電泳分離,然后轉(zhuǎn)移到雜交膜上,這一過程稱為northern印跡(northern blott
11、ing)。將待測DNA樣品標記后與RNA雜交,如果RNA中含有DNA的轉(zhuǎn)錄產(chǎn)物,會給出明顯的信號。northern印跡分析要注意以下三方面: 當(dāng)某一基因的轉(zhuǎn)錄產(chǎn)物進行可變剪接時,由于連接的外顯子不同,會產(chǎn)生好幾條長度不一的雜交帶。此外,如果該基因是某一多基因家族的成員,也會出現(xiàn)多個信號。這兩種現(xiàn)象要設(shè)計其他實驗進一步區(qū)分。 基因的表達具有組織專一性及發(fā)育階段的差別,選擇的RNA樣品有時不一定含有該基因的產(chǎn)物。因此要盡可能多地收集各種發(fā)育時期及不同組織器官RNA,以免因人為原因而遺漏。, 不同基因的表達產(chǎn)物豐度差異很大,對低拷貝的表達產(chǎn)物要適當(dāng)提高RNA的上樣量。有些基因表達產(chǎn)物豐度極低,或表達
12、時期短暫不易提取,此時要考慮其他檢測方法。例如可根據(jù)已知的DNA順序設(shè)計引物從mRNA群體中擴增基因產(chǎn)物,再以DNA為探針與之雜交,這一方法稱為擬northern分析。 對northern雜交不易檢測到的基因可考慮采用另一種途徑驗證。一些親緣關(guān)系相近的物種,其基因的編碼區(qū)相似性較高,而非編碼區(qū)的同源性很低。如果某一物種的DNA順序與來自另一親緣種的DNA片段雜交產(chǎn)生陽性信號,該區(qū)段可能含有一個或多個基因。這種方法又稱為動物園雜交(zoo-blotting)。,DNA順序中基因位置的確定,northern分析和動物園雜交可判斷某一DNA區(qū)段是否含有基因,但不能給出基因在DNA順序中的確切位置。c
13、DNA的測序可以解決這一問題。將cDNA與基因組的DNA比較,即可確定基因所在的區(qū)域并找到外顯子-內(nèi)含子的邊界。兩種因素會干擾用cDNA篩選基因的工作:, 當(dāng)目標cDNA克隆在cDNA文庫中所占比例很低時,需要化費大量時間從很大的cDNA群體中篩選陽性克隆。有兩種可提高工作效率的方法,其一,將cDNA文庫先分成若干亞群,對這些經(jīng)“稀釋”過的亞群進行初篩。由于各亞群中稀有cDNA的比例有差別,可挑選雜交信號強的亞群進一步篩選。其二,cDNA均一化(cDNA normalization),是縮小低拷貝cDNA與高拷貝cDNA在cDNA文庫中比例差異的方法,通過抑制高拷貝cDNA數(shù)量,增加低拷貝cD
14、NA達到均一化的目的。cDNA均一化的基本原理是DNA復(fù)性動力學(xué)。DNA復(fù)性的速率取決于以下因素,即堿基組成、DNA克分子濃度和反應(yīng)溫度。在合適的條件下,可使大多數(shù)高拷貝cDNA復(fù)性成為雙鏈,但仍然有少量高拷貝單鏈cDNA保持游離狀態(tài),而大部分低拷貝與中拷貝單鏈cDNA均呈游離狀態(tài)。將反應(yīng)液通過羥基磷灰石層析柱,雙鏈cDNA被羥基磷灰石吸附,收集過柱的單鏈cDNA用于構(gòu)建cDNA文庫。經(jīng)均一化后,高拷貝cDNA的比例可降低一個數(shù)量級,而低拷貝cDNA可提高一個數(shù)量級。, 與mRNA反轉(zhuǎn)錄有關(guān)。mRNA分子的5-端或其他區(qū)域有時會產(chǎn)生二級結(jié)構(gòu),當(dāng)反轉(zhuǎn)錄酶以RNA為模板合成單鏈DNA時,如遇上RN
15、A二級結(jié)構(gòu)便會終止反應(yīng),從而產(chǎn)生殘缺的cDNA。高溫下合成cDNA的反轉(zhuǎn)錄酶可降低mRNA二級結(jié)構(gòu)的干擾,獲得全長的cDNA。另一種確保合成5完整cDNA的方法是,根據(jù)反轉(zhuǎn)錄單鏈cDNA 3-末端有一個額外的C堿基,可設(shè)計一種 5-端含幾個連續(xù)G的引物,將其加入反應(yīng)液中。反轉(zhuǎn)錄酶合成的單鏈cDNA 3-末端可與該引物互補,使cDNA 3-末端延伸。收集合成的全長單鏈cDNA,再用設(shè)計的引物擴增單鏈cDNA用于全長cDNA文庫的構(gòu)建。,采用RACE方法可獲得丟失的cDNA末端,由于一些未知的原因,cDNA文庫中有些插入子會丟失其5-或3-端順序,可采用cDNA末端快速擴增技術(shù) (rapid am
16、plification of cDNA end,RACE)方法尋找這些丟失的末端順序。根據(jù)殘缺cDNA內(nèi)部順序先合成一對引物,將mRNA環(huán)化后使其與引物復(fù)性,再經(jīng)PCR擴增。擴增產(chǎn)物再用第二對巢式引物PCR放大,可獲得mRNA 5-和3-端順序。,5.2 基因功能預(yù)測,確認DNA順序中的基因序列后,下一個問題是探知其功能,這是基因組研究中的一個難度很大的領(lǐng)域。一些已完成測序的基因組順序分析表明,我們所了解的基因組內(nèi)容比真實的情況少得多。如大腸桿菌與啤酒酵母,在未開始基因組測序前已經(jīng)完成了大量常規(guī)的遺傳學(xué)分析,當(dāng)時遺傳學(xué)家認為這兩種生物的大多數(shù)基因已經(jīng)通過突變鑒定,但實際上還有許多空白。大腸桿菌
17、編碼蛋白質(zhì)的4 288個基因中,以往知道的只有1 853個,僅占43%。至于啤酒酵母,所知更少,僅為30%。,5.2.1 計算機預(yù)測基因功能,計算機預(yù)測基因功能的依據(jù)仍然是同源性比較。同源基因都擁有一個共同的祖先基因,它們之間有許多相似的順序。同源基因可分為兩類: 種間同源基因或直系基因(orthologous gene) 這是指不同物種之間的同源基因,它們來自物種分隔之前的同一祖先。 種內(nèi)同源基因或平行基因(paralogous gene) 同一種生物內(nèi)部的同源基因,它們常常是多基因家族的不同成員,其共同的祖先基因可能存在于物種形成之后,也可能出現(xiàn)于物種形成之前。,同源基因一般不會有完全一致
18、的核苷酸順序,因為這兩個基因在出現(xiàn)后獨立地發(fā)生隨機突變,但它們有相似的順序組成,大部分未突變的核苷酸位置是相同的。當(dāng)一個新的基因序列被確認后,根據(jù)同源性可從數(shù)據(jù)庫中查找已知順序的同源基因。根據(jù)進化的相關(guān)性可從已知的同源基因推測新基因的功能。 根據(jù)同源性預(yù)測基因時必需注意以下幾點: 一般認為氨基酸的一致性或相似性在25%以上可視為同源基因; 同源性(homology)與相似性(similiarity)的含義不同,如氨基酸順序有80%的相似性不能稱為同源性,同源性只有“是”或“非”的差別; 一致性常指同一位置同一氨基酸在整個多肽序列中所占的比例,而相似性除一致性氨基酸外還包括可取代氨基酸的成員,因
19、此相似性氨基酸的比例總是高于一致性氨基酸。,同源性分析可以給出整個基因或其中某一區(qū)段功能的信息,同源查詢除了直接比較DNA順序外,還可將DNA順序翻譯為氨基酸順序。由于組成蛋白質(zhì)的氨基酸有20種,而DNA核苷酸只有4種,因此氨基酸順序的差異要比核苷酸的差異大得多(圖5.1)。以氨基酸順序進行同源性比較其結(jié)果更為準確,也更加可行。已有許多軟件可用于這項分析,常用的是BLAST。研究者只需將資料以正確格式的電子郵件發(fā)送到DNA資料庫BLAST服務(wù)站(BLAST server),很快就會得到回音。,有時在兩個無明顯親緣關(guān)系的基因之間會出現(xiàn)局部相似的區(qū)段。這種情況表明,兩個無親緣關(guān)系的蛋白質(zhì)可能具有相
20、似的功能,相似的順序是功能的核心區(qū)域。雖然基因本身無共同的祖先,但其功能域卻有共同的起源。它們都是古老祖先的后裔,在進化中一方面發(fā)生獨立突變,另一方面又因基因組重排成為新基因的組成部分。例如信號傳導(dǎo)蛋白,這類蛋白質(zhì)一般都有兩個基本的功能域,即接受信號的功能域和傳達信號的激酶域。如在植物抗病基因(R)中發(fā)現(xiàn)的LRR、NBS、Kinase(激酶)和TIR等功能域在許多真核生物參與信號傳導(dǎo)的蛋白質(zhì)中均存在。盡管在不同的蛋白質(zhì)中特定的功能域擔(dān)負的任務(wù)不同,但它們扮演的主要角色都與信號傳導(dǎo)有關(guān)(圖5.2)。,5.2.2 實驗確認基因功能,同源性分析并非萬靈藥方,對許多新基因的功能分析還必需依賴其他的實驗
21、手段進行補充,并將同源性研究的結(jié)果進一步外延。如何確定一個基因的功能是基因組計劃中最困難的問題之一。大多數(shù)分子生物學(xué)家認為,現(xiàn)有的技術(shù)與策略對于從基因組測序所獲得的大量未知基因的功能研究是遠遠不夠的?;虻墓δ苁且粋€過程,是從基因到表型的一系列反應(yīng)?,F(xiàn)在的基因功能研究與傳統(tǒng)的遺傳分析的路線正好相反,前者是從表型出發(fā)最終到達基因,后者是從基因出發(fā),直接推導(dǎo)表型。因此必需尋找一系列的實驗方法來鑒別與目標基因相關(guān)的表型。,基因失活是功能分析的主要手段,傳統(tǒng)的遺傳分析主要借助突變型研究表型變異的遺傳基礎(chǔ),利用紫外線誘導(dǎo)及化學(xué)試劑處理可使生物群體產(chǎn)生突變個體,也可從自然的群體中發(fā)現(xiàn)突變體。經(jīng)遺傳分析將突
22、變基因定位,然后觀察這一突變是否與改變的表型對應(yīng)。在此基礎(chǔ)上采用分子生物學(xué)方法進一步分離與克隆目標基因。所謂定位克隆(positional cloning)就是根據(jù)與突變位點連鎖的分子標記,然后通過物理圖尋找靶基因。 傳統(tǒng)遺傳學(xué)分析的原理同樣可用來設(shè)計從基因到表型的研究。如果我們能找到某種方法,根據(jù)待測基因的順序使生物體內(nèi)該基因失活,亦可鑒別由此產(chǎn)生的表型變異。,基因敲除 (gene knock-out),基因敲除(基因剔除)(gene knockout):將細胞基因組中某基因去除或使基因失去活性的技術(shù)。去除原核生物細胞、真核生物的生殖細胞、體細胞或干細胞基因組中的基因等。 廣義的基因敲除包括
23、:某個或某些基因的完全敲除、部分敲除、基因調(diào)控序列的敲除以及成段基因組序列的敲除。 指外源DNA與受體細胞基因組中序列相同或相近的基因發(fā)生同源重組,從而代替受體細胞基因組中的相同/相似的基因序列,整合入受體細胞的基因組中。 基因敲除是指將目標基因從基因組中刪除。比如有一段“序列”:“1234567890” (原基因),敲除后為:“1237890”,一般敲除載體還會在其中插入一段外源基因,如“ABC”,則新的基因為:“123ABC7890”;或者不插入基因直接連接,則為“1237890”。,基因敲除基本步驟,1. 胚胎干細胞(ETC)的獲得 基因敲除一般應(yīng)用于鼠,最常用的鼠的種系是129及其雜合
24、體,因為這類小鼠具有自發(fā)突變形成畸胎瘤和畸胎肉瘤的傾向,所以是基因敲除的理想實驗動物。 2. 基因載體的構(gòu)建 把目的基因和與細胞內(nèi)靶基因特異片段同源的DNA分子都重組到帶有標記基因(如neo基因,TK基因等)的載體上,此重組載體即為打靶載體。因基因打靶的目的不同,此載體有不同的設(shè)計方法,可分為替換性載體和插入型載體。如為了把某一外源基因引入染色體DNA的某一位點上,這種情況下應(yīng)設(shè)計的插入型載體要包括外源基因(即目的基因)、同源基因片段及標記基因等部分。如為了使某一基因失去其生理功能,這時所要設(shè)計的替換型打靶載體,應(yīng)包括含有此靶基因的啟動子及第一外顯子的DNA片段及標記基因等諸成分。,3. 目的
25、基因?qū)?將基因打靶載體通過一定的方式(常用電穿孔法)導(dǎo)入同源的胚胎干細胞(ES cell)中,使外源DNA與胚胎干細胞基因組中相應(yīng)部分發(fā)生同源重組,將打靶載體中的DNA序列整合到內(nèi)源基因組中從而得以表達。一般地,顯微注射命中率較高,但技術(shù)難度較大,電穿孔命中率比顯微注射低,但便于使用。 4. 用選擇性培養(yǎng)基篩選已擊中的細胞 篩選使用正、負選擇法,比如用G418篩選所有能表達neo基因的細胞,然后用Ganciclovir淘汰所有HSV-TK正常表達的細胞,剩下的細胞為命中的細胞。將篩選出來的靶細胞導(dǎo)入鼠的囊胚中,再將此囊胚植人假孕母鼠體內(nèi),使其發(fā)育成嵌合體小鼠。 5. 觀察生物學(xué)性狀的改變 通
26、過觀察嵌和體小鼠的生物學(xué)形狀的變化進而了解目的基因變化前后對小鼠的生物學(xué)性狀的改變,達到研究目的基因的目的。 (圖5.3),基因失活的表型效應(yīng)有時不易分辨,得到攜帶失活基因的品系與個體后,就該檢測突變體表型,以便指認未知基因的具體功能。生物表型范疇很廣,即使單細胞酵母,要確定一個未知基因?qū)Ρ硇偷呢暙I,也可列出很長的一串名單(表5.1)。至于高等生物,因其某些表型(如行為)具有難以捉摸的綜合性,區(qū)分其準確的功能更加棘手。如酵母3號染色體上有一個最長的基因(2 167個密碼子),具有典型的酵母偏愛密碼子特征,是一個標準的編碼基因而非含混的ORF,但該基因的失活對表型無任何影響。當(dāng)時推測這類基因可能
27、是冗余基因,或者說其蛋白質(zhì)產(chǎn)物涉及非必需的功能。最后證實,該基因的突變體生長在低pH值并含葡萄糖和乙酸的條件下是致死的,而正?;蚩赡褪苓@一環(huán)境。由此得知,這一基因編碼一個將乙酸鹽泵出細胞的蛋白質(zhì)。確切地說這是一個酵母細胞必需的功能基因,它在細胞受到乙酸危害時可誘導(dǎo)表達,但這種必需的功能從一般的表型檢測很難追蹤與判斷。,酵母中有85%的基因突變不產(chǎn)生致死效應(yīng),這些基因大多與新陳代謝有關(guān)。有時不同的突變會影響同一條代謝路線,但對表型影響程度很有限。Ramsdonk等(2001)設(shè)計了一種稱為酵母協(xié)同反應(yīng)功能分析(functional analysis by coresponses in yeas
28、t,F(xiàn)ANCY)的方法,通過同時檢測幾種代謝中間產(chǎn)物濃度的改變來判斷單個基因?qū)Υx路線的影響。有些突變可同時影響一種或幾種中間產(chǎn)物的濃度,但對其他中間產(chǎn)物濃度的影響不同,因而可對突變進行代謝效應(yīng)分類。,轉(zhuǎn)座子突變庫構(gòu)建,根據(jù)順序同源性尋找基因組中的編碼基因盡管可以獲得一些重要信息,但是仍不能確切地知道基因的具體功能。特別是一些在數(shù)據(jù)庫中無法查找到匹配順序的ORF,必需采取復(fù)雜的方法才能鑒定它們的功能。此外,在基因的表達調(diào)控中起重要作用的非編碼序列目前還未發(fā)現(xiàn)普遍適用的組成規(guī)律,這是基因組順序解讀這面臨的更大難題。現(xiàn)在人們已嘗試在植物中利用轉(zhuǎn)座子標簽法,通過構(gòu)建插入突變庫系統(tǒng)地分離與克隆功能基因
29、和調(diào)控順序(圖5.4)。,這一策略主要依據(jù)以下技術(shù): 1. 植物細胞具有全能性,可以從體細胞再生完整植株; 2. 已經(jīng)建立了一套成熟的轉(zhuǎn)基因系統(tǒng),使外源基因在轉(zhuǎn)基因植株中成功表達; 3. 植物中有許多轉(zhuǎn)座子系統(tǒng),它們的轉(zhuǎn)座機制已經(jīng)清楚,通過轉(zhuǎn)座子的隨機插入可獲得大量的突變型。根據(jù)插入的轉(zhuǎn)座子順序合成探針,可分離被破壞的位點,并分析它們的組成; 4. 轉(zhuǎn)座子可以發(fā)生回復(fù)突變,從插入的座位切離,使突變系重現(xiàn)野生型表型。 這一策略有時又稱為基因標簽(gene tagging),目前應(yīng)用最為成功的為玉米Ac-Ds轉(zhuǎn)座因子系統(tǒng)?;驑撕炌蛔儙斓墓ぷ髟砣缦拢? 將Ac因子轉(zhuǎn)座酶的編碼基因與組成型啟動子如
30、35S構(gòu)兼成嵌合基因表達載體,由于除去了轉(zhuǎn)座因子兩側(cè)的反向重復(fù)順序,轉(zhuǎn)座酶的編碼基因不能自我轉(zhuǎn)座。這一表達載體轉(zhuǎn)化細胞獲得的再生植株為A。 外顯子捕獲載體構(gòu)建 在轉(zhuǎn)座子的邊界順序與標記基因之間插入內(nèi)含子剪接受體順序,將它們轉(zhuǎn)化細胞獲得再生植株B。 將植株A與植株B雜交 在轉(zhuǎn)座酶的作用下來自植株B的轉(zhuǎn)座子可以切離與轉(zhuǎn)座。當(dāng)它們插入到某一外顯子中時,基因轉(zhuǎn)錄加工后有可能獲得含正確讀框的mRNA。根據(jù)突變表型與標記基因的共分離篩選轉(zhuǎn)化無性系,通過自交可得到純合的不含轉(zhuǎn)座酶基因的插入突變系。 增強子捕獲載體 將核心啟動子TATA盒框與標記基因編碼順序連接,然后在其兩側(cè)安裝轉(zhuǎn)座子邊界,轉(zhuǎn)化細胞獲得再生植
31、株C。將植株A與植株C雜交,在轉(zhuǎn)座酶作用下來自植株C的轉(zhuǎn)座子可以轉(zhuǎn)移到增強子下游啟動標記基因表達。采取類似的方法分離純合的插入突變系,進一步檢測增強子組織特異性表達場所。,上述方法用于擬南芥的基因打靶(gene targeting)取得了很好的效果,并已應(yīng)用于水稻、玉米等作物的功能基因分離。但它們也有兩點不利之處: 插入突變往往是隱性的,必須建立自交的F2代群體才能找到突變株系; 植物基因組有大量的冗余基因,它們可取代突變基因的功能,很多突變的效果不易鑒定。已有一種改進的方法,即采用功能增益突變路線。基因的過量表達對同一表型也會產(chǎn)生影響,而且常常表現(xiàn)為顯性。將某個強啟動子(或增強子)插入轉(zhuǎn)座子
32、邊界內(nèi)部,當(dāng)它們轉(zhuǎn)移到某一基因附近時,可促使基因異常表達,當(dāng)代即可觀測到突變,也沒有冗余基因干擾問題。,內(nèi)含子歸巢突變,原核生物與真核生物有兩種分布非常廣泛的內(nèi)含子,即群內(nèi)含子(groupintron)和群內(nèi)含子(groupintron),它們能自我催化切除內(nèi)部的內(nèi)含子。群內(nèi)含子有一個開放讀框,編碼一個多功能的蛋白質(zhì)(intron-encoded protein,IEP),兼有內(nèi)切核酸酶、逆轉(zhuǎn)錄酶及成熟酶的活性。當(dāng)內(nèi)含子與相連的外顯子一道轉(zhuǎn)錄時,成熟酶可將其從前體mRNA中剪切下來。 IEP可促使群RNA形成能自我剪接的空間構(gòu)型,而內(nèi)切核酸酶和逆轉(zhuǎn)錄酶活性可將從前體mRNA切離的內(nèi)含子RNA通
33、過類似逆轉(zhuǎn)錄轉(zhuǎn)座子整合的方式插入到基因組另一靶位,這一過程又稱為內(nèi)含子歸巢。,利用內(nèi)含子歸巢的特性,將它們插入到大腸桿菌質(zhì)粒載體中,另外再將人類HIV病毒和CCR5基因靶位DNA構(gòu)建到另一載體中。當(dāng)這兩類載體在大腸桿菌或人類體外培養(yǎng)細胞中相遇時,內(nèi)含子RNA可以逆剪接方式插入到HIV和CCR5 DNA靶位中,而且表現(xiàn)為某種隨機性。當(dāng)內(nèi)含子反向插入基因內(nèi)部時,由于不表達IEP,成為永久性整合。當(dāng)內(nèi)含子插入方向與IEP轉(zhuǎn)錄方向一致時,內(nèi)含子可以繼續(xù)轉(zhuǎn)移破壞其他位點。這一系統(tǒng)可望用于缺少同源重組系統(tǒng)生物的功能基組研究。,基因的超表達用于功能檢測,基因功能的檢測除了使其失活(loss of funct
34、ion)觀察表型變異外,另一種方法則是讓其過量表達,即功能增益(gain of function)。因為正常情況下基因產(chǎn)物的數(shù)量是限定的,必須與其他產(chǎn)物達到平衡。基因產(chǎn)物的不足與過量都會破壞這種平衡,并表現(xiàn)生長與發(fā)育的異常。,有兩種技術(shù)可使細胞中某一基因過量表達:增加基因的拷貝數(shù)(multicopy)和采用強啟動子促使基因超表達。Simonet等以老鼠為實驗對象,挑選了一些有興趣的ES cell,并找到其全長cDNA,這些基因編碼的蛋白質(zhì)均分泌到血液中(圖5.5)。表達載體含有肝組織專一性強啟動子及上述基因,獲得轉(zhuǎn)基因老鼠(transgenic mouse)后,根據(jù)所用的基因制備探針追蹤表型。
35、實驗揭示,轉(zhuǎn)基因老鼠的骨骼質(zhì)地密度要比正常鼠高得多。研究結(jié)果提供了兩點重要啟示,一是待測基因的功能顯然同骨骼合成有關(guān),其次控制骨骼密度基因的發(fā)現(xiàn)可用來治療人類骨骼疏松癥(osteoporosis),這是一種脆性骨骼病(fragile-bone disease)。,反義RNA,這是與基因功能增益相反的一種策略,它可干擾正?;虻谋磉_使表型產(chǎn)生變異。反義RNA (antisense RNA)最初是在原核生物中發(fā)現(xiàn)的,通過與復(fù)制起始點的互作控制細菌中非兼容性質(zhì)粒的復(fù)制,現(xiàn)已證實真核生物細胞也有反義RNA的存在。反義RNA中基因的負鏈編碼,可與正義RNA (sense RNA)或DNA編碼順序結(jié)合,干
36、擾mRNA的轉(zhuǎn)錄、加工和轉(zhuǎn)運,調(diào)控基因的表達。有三種類型的反義RNA,其作用機制略有不同:,型反義RNA主要干擾翻譯的起始與延伸,可與翻譯起始順序及編碼序列結(jié)合形成雙鏈RNA,隨之被細胞降解; 型反義RNA與mRNA的引導(dǎo)順序結(jié)合,阻止核糖體的附著使翻譯無法啟動; 型反義RNA的作用類似衰減調(diào)控,當(dāng)它與mRNA形成雙鏈分子后使RNA多聚酶脫離模板終止轉(zhuǎn)錄。 為了研究未知基因的功能??蓪⒒虻木幋a順序反向插入表達載體,然后轉(zhuǎn)化目標生物。獲得轉(zhuǎn)基因個體或品系后,進一步分析表達的反義RNA在生理生化或形態(tài)發(fā)生中所起的作用,由此判別未知基因的功能。,5.2.3 其他的基因功能研究方法,基因失活與過量表
37、達是研究基因功能的基本方法,但并非只有這兩種技術(shù)才能提供基因功能的信息。還有其他一些方法可將基因失活及過量表達所獲知的結(jié)果進一步延伸與深化,對蛋白質(zhì)活性進行綜合研究。 有許多蛋白質(zhì)必須與其他蛋白質(zhì)互作才能表現(xiàn)其功能。如果已經(jīng)鑒定了這類蛋白質(zhì)的某些成員,則可采用特別的分子生物學(xué)方法來分離與其互作的其他蛋白質(zhì)。假如某一未知蛋白與已知的膜信號傳導(dǎo)蛋白互作,則未知蛋白的功能也必定涉及信號傳導(dǎo)。有兩種常用的方法適于這方面的研究: 噬菌體外顯(phage display), 酵母雙雜交(yeast two hybrid system)。,噬菌體外顯,該實驗要求一種特別的載體,它們來自M13這樣的桿狀噬菌體
38、。檢測的基因與噬菌體外殼蛋白基因融合,表達后可產(chǎn)生融合外殼蛋白,當(dāng)噬菌體遇到可與融合外殼蛋白互作的蛋白質(zhì)時會發(fā)生聚合。獲得“外顯”(displayed)噬菌體后,可純化融合蛋白用于其他的組合測試。更有效的方法是構(gòu)建一個“外顯”噬菌體文庫,這樣可同時檢測大量的基因表達產(chǎn)物。,噬菌體外顯操作程序, 用于噬菌體外顯(phage display)的克隆載體是噬菌體基因組,在編碼外殼蛋白基因的內(nèi)部有一限制性酶切位點,可插入外源DNA。最初采用的是f1桿狀噬菌體,現(xiàn)在已擴大到包括噬菌體在內(nèi)的不同噬菌體。將編碼待測蛋白質(zhì)的DNA順序插入到外殼蛋白基因內(nèi)部,保持原有讀框順序,由此可產(chǎn)生一個融合蛋白。被重組噬菌
39、體感染的大腸桿菌在大量繁殖噬菌體顆粒后,在外殼蛋白中含有一段外源的多肽。 將許多不同的DNA順序插入到外殼蛋白基因內(nèi)部的克隆位點可構(gòu)建噬菌體外顯庫。轉(zhuǎn)化受體細胞后,細菌可涂抹在固體培養(yǎng)基中,由此產(chǎn)生噬菌斑。噬菌斑可轉(zhuǎn)移到硝酸纖維薄膜上,再與其他檢測蛋白質(zhì)溫浴。如果檢測蛋白質(zhì)可與外顯噬菌體互作,說明這兩種蛋白質(zhì)可以結(jié)合。,酵母雙雜交,工作原理涉及轉(zhuǎn)錄因子與啟動子之間的互作。轉(zhuǎn)錄因子的蛋白必須同基因上游的區(qū)段結(jié)合,然后激活RNA多聚酶將基因拷貝成RNA。轉(zhuǎn)錄因子有兩個重要的功能區(qū)域,一個與DNA結(jié)合,另一個同RNA多聚酶激活有關(guān)。在酵母雙雜交系統(tǒng)中,編碼這兩個功能域的DNA片段是分開的,分別構(gòu)建到
40、兩個獨立的表達載體。在其中一個表達載體中,與DNA結(jié)合的功能域的基因片段常與待研究的已知的蛋白質(zhì)連接成融合基因。另一個表達載體中,激活的功能域與許多未知的cDNA連接,也將表達為融合蛋白。這兩個表達載體在同一個細胞中相遇時,如果與DNA結(jié)合區(qū)融合的蛋白質(zhì)同激活區(qū)融合的蛋白質(zhì)之間存在互作關(guān)系,便會形成聚合物,可啟動報告基因的表達(圖5.6)。,開放讀框順序標簽,開放讀框順序標簽 (open reading frame sequence tags,OST) 已經(jīng)完成基因組測序的多細胞生物在基因注解時遇到的最大困難是,如何鑒別外顯子以及可變剪接的類型。線蟲中預(yù)測的基因數(shù)18 959個,檢測到EST的
41、基因為9 356個。另外已知的完成測序的基因為784個,其中有637個與EST重疊,147個未發(fā)現(xiàn)EST。因此可由實驗確定的基因數(shù)為9 503個,尚有9 888個預(yù)測的基因未經(jīng)驗證。Reboul等為了檢測根據(jù)EST和外顯子/內(nèi)含子規(guī)律注解的基因是否真實,設(shè)計了一個稱為開放讀框順序標簽的程序(OST)檢測基因產(chǎn)物。挑選1 222個未經(jīng)驗證的和376個已知有EST的預(yù)測基因按照外顯子設(shè)計雙向引物,從線蟲高質(zhì)量cDNA文庫中檢測PCR產(chǎn)物,結(jié)果證實大多數(shù)的預(yù)測基因是正確的,也有未能檢測到的基因。從這一實驗的陽性與陰性結(jié)果推算線蟲的總基因數(shù)應(yīng)為17 387個,比原預(yù)測數(shù)少8%。將PCR產(chǎn)物進行測序,有
42、12%的基因mRNA剪接方式與預(yù)期的不符。,5.3 從基因組到細胞,即使每個基因都已鑒別,每項功能亦已確定,還有許多問題仍需解答。其中最重要也是最困難的任務(wù)在于了解基因組作為一個整體如何工作,如何指令與協(xié)調(diào)細胞中各種不同的生化活性。描述與闡明基因組的生物學(xué)將要花費研究者未來數(shù)十年的時間。目前人們已試圖著手探明基因在不同組織中表達的模式哪些基因打開,哪些基因關(guān)閉以及不同發(fā)育階段基因表達的狀態(tài),特別是有關(guān)人類疾病基因的調(diào)控方式。,5.3.1 轉(zhuǎn)錄物組,基因表達的第一步: 將DNA轉(zhuǎn)錄為RNA拷貝。因此鑒別某一細胞或組織中特定基因的轉(zhuǎn)錄物是最直接的確定基因是否表達的方法。通常采用的是分子雜交,將基因
43、的DNA片段轉(zhuǎn)移到雜交膜上,然后從需要研究的組織或器官中分離mRNA,反轉(zhuǎn)錄為cDNA后再進行標記與基因片段雜交,從雜交信號判斷表達的基因成員及其轉(zhuǎn)錄物的豐度。,DNA芯片分析,確定單個基因的表達與否是一項并不困難的實驗,但要分析細胞中整個轉(zhuǎn)錄物的組成(transcriptome,轉(zhuǎn)錄物組)及其表達狀況,情況就要復(fù)雜得多。目前采用較多的技術(shù)為DNA芯片(DNA chips)或微陣(microassay)檢測。設(shè)計DNA芯片的目的是提高雜交分析的效率,使成千上萬個樣品可同時平行進行雜交實驗。 DNA芯片在篩選SNP和比較不同細胞RNA群體的研究中應(yīng)用十分廣泛,在DNA測序方面也有潛在的價值。,一
44、塊DNA芯片可同時與大量DNA探針雜交,每個探針都有不同的順序,位于芯片上的確定位置。用于雜交的探針可以是合成的寡聚核甘酸,也可以是cDNA。最早的技術(shù)比較粗糙,只是將寡聚核苷酸或cDNA點播在一塊顯微鏡蓋玻片或一小塊尼龍雜交膜上形成一個排列微陣。用這一技術(shù)只能達到較低的樣品密度,一個18mm18mm面積微陣排列可包含6 400個樣品。在經(jīng)過一番技術(shù)改良之后,使點播的樣品數(shù)達到更高的密度。這一方法是在芯片表面原位直接合成寡聚核苷酸,合成的順序由每次加入反應(yīng)的dNTP底物決定。根據(jù)設(shè)置的程序在芯片的每個點上加入預(yù)先的經(jīng)光激活的dNTP,依次完成特定的反應(yīng)。由于每步反應(yīng)中芯片樣品的位置及加入的dN
45、TP都是已知的,因而整個芯片所有寡聚核苷酸順序都有可知的序列。,上述方法制備的芯片其密度可達一百萬個/cm2寡聚核苷酸,如用這種芯片篩選SNP,假定設(shè)計的寡聚核苷酸每個SNP都有兩個等位形式,一次實驗即可找到50萬個多態(tài)性位點。DNA芯片的操作并不復(fù)雜,將DNA芯片與標記的靶DNA雜交,然后掃描芯片表面。凡是可與靶DNA雜交的位置都會出現(xiàn)雜交信號,找到雜交位置即可知道所含的順序。同位素標記只可用于低密度微點陣雜交,可通過電子磷顯像(phosphorimaging)進行檢測。高密度芯片必須采用熒光標記,使用激光掃描或熒光共聚焦顯微鏡尋找雜交信號。,采用微陣雜交技術(shù)分析老鼠DNA甲基化酶基因缺陷型成纖維細胞中13 000個基因的差別表達時發(fā)現(xiàn),其中有10%的基因出現(xiàn)上調(diào),包括許多與細胞周期調(diào)控有關(guān)的基因。由于一次實驗可同時檢測成千上萬個基因的表達譜,可提供大量有關(guān)基因相互作用的信息。 利用DNA芯片雜交分析高等動物基因表達譜時有一點必須注意,由于大量基因都含有可變剪接的產(chǎn)物,不同的mRNA中可能含有共同的外顯子。因此制備的DNA芯片樣品最好采用單
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 貨架安全培訓(xùn)知識課件
- 貨品苫墊技術(shù)
- 2026年廣州工程技術(shù)職業(yè)學(xué)院高職單招職業(yè)適應(yīng)性測試模擬試題有答案解析
- 財經(jīng)課件直播平臺
- 智能健康管理系統(tǒng)開發(fā)與應(yīng)用
- 2026年廣西藍天航空職業(yè)學(xué)院單招綜合素質(zhì)考試模擬試題帶答案解析
- 財稅規(guī)劃課件
- 醫(yī)院臨床口腔醫(yī)學(xué)操作規(guī)范
- 2026年合肥科技職業(yè)學(xué)院單招綜合素質(zhì)筆試模擬試題帶答案解析
- 2026年湖南司法警官職業(yè)學(xué)院單招綜合素質(zhì)筆試備考試題帶答案解析
- 白車身輕量化設(shè)計技術(shù)
- 華師 八年級 數(shù)學(xué) 下冊《17.2 平行四邊形的判定 》課件
- 主板維修課件
- 2026中央紀委國家監(jiān)委機關(guān)直屬單位招聘24人考試筆試模擬試題及答案解析
- 2026年內(nèi)蒙古化工職業(yè)學(xué)院單招職業(yè)適應(yīng)性考試必刷測試卷附答案解析
- GB 46750-2025民用無人駕駛航空器系統(tǒng)運行識別規(guī)范
- 電力絕緣膠帶施工方案
- 醫(yī)院2024年度內(nèi)部控制風(fēng)險評估報告
- 直招軍官考試試卷及答案
- 西游記之女兒國教學(xué)課件
- 2025-2026學(xué)年外研版(三起)三年級英語上冊(全冊)教案(附目錄)
評論
0/150
提交評論