版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、第一節(jié)第一節(jié) 基因序列結(jié)構(gòu)的生物信息學(xué)基因序列結(jié)構(gòu)的生物信息學(xué)檢索和比對(duì)分析檢索和比對(duì)分析第1頁(yè)/共77頁(yè)就是在數(shù)據(jù)庫(kù)中對(duì)基因序列或就是在數(shù)據(jù)庫(kù)中對(duì)基因序列或DNADNA序列進(jìn)行序列進(jìn)行 比對(duì)分析,以其能夠推測(cè)出其結(jié)構(gòu)、功能及在比對(duì)分析,以其能夠推測(cè)出其結(jié)構(gòu)、功能及在進(jìn)化上的聯(lián)系進(jìn)化上的聯(lián)系. .比對(duì)方法:比對(duì)方法: 1. 1. 雙重比對(duì)雙重比對(duì) 2. 2. 多序列比對(duì)多序列比對(duì)直接的數(shù)量關(guān)系直接的數(shù)量關(guān)系進(jìn)化上曾具有共同祖先進(jìn)化上曾具有共同祖先基因或基因或DNADNA序列比對(duì)序列比對(duì)第2頁(yè)/共77頁(yè)序列比對(duì)的結(jié)果:序列比對(duì)的結(jié)果:取代取代插入插入缺失缺失Mouse:GGKDSCQGDSGGP
2、VVCNG-QLQGVVSWGDGCAQKNKPGVYTKVYNYVKWIKNTIAANCrayfish: GGKDSCQGDSGGPLAASDTGSTYLAGIVSWGYGCARPGYPGVYTEVSYHVDWIKANAV-缺失?缺失?保守序列保守序列保守序列:保守序列:可能是共同進(jìn)化的標(biāo)志可能是共同進(jìn)化的標(biāo)志可能并不代表功能的重要性可能并不代表功能的重要性插入?插入?當(dāng)兩個(gè)序列非常相似時(shí),是否一定當(dāng)兩個(gè)序列非常相似時(shí),是否一定說(shuō)明它們具有相似的功能?說(shuō)明它們具有相似的功能?第3頁(yè)/共77頁(yè)NCBI數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)NCBI首先創(chuàng)建首先創(chuàng)建GenBank數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù) 于于19911991年開發(fā)了年
3、開發(fā)了Entrez數(shù)據(jù)庫(kù)檢索系統(tǒng),該系統(tǒng)整合了數(shù)據(jù)庫(kù)檢索系統(tǒng),該系統(tǒng)整合了GenBank、EMBL、PIR和和SWISS-PROT等數(shù)據(jù)庫(kù)的序列信等數(shù)據(jù)庫(kù)的序列信息以及息以及MEDLINEMEDLINE有關(guān)序列的文獻(xiàn)信息,并通過(guò)相關(guān)鏈接,將有關(guān)序列的文獻(xiàn)信息,并通過(guò)相關(guān)鏈接,將他們有機(jī)地結(jié)合在一起他們有機(jī)地結(jié)合在一起NCBI還提供了其他數(shù)據(jù)庫(kù),包括在線人類孟德爾遺傳還提供了其他數(shù)據(jù)庫(kù),包括在線人類孟德爾遺傳( (OMIM)、三維蛋白結(jié)構(gòu)的分子模型數(shù)據(jù)庫(kù)()、三維蛋白結(jié)構(gòu)的分子模型數(shù)據(jù)庫(kù)(MMDB)、人)、人類基因序列集成(類基因序列集成(UniGene)、人類基因組基因圖譜)、人類基因組基因圖
4、譜(GMHG)、生物門類()、生物門類(Toxonomy) 等數(shù)據(jù)庫(kù)等數(shù)據(jù)庫(kù)第4頁(yè)/共77頁(yè)第5頁(yè)/共77頁(yè)1. 1. 各種數(shù)據(jù)庫(kù)的介紹各種數(shù)據(jù)庫(kù)的介紹(1) Nucleotide該數(shù)據(jù)庫(kù)由國(guó)際核苷酸序列數(shù)據(jù)庫(kù)成員美國(guó)該數(shù)據(jù)庫(kù)由國(guó)際核苷酸序列數(shù)據(jù)庫(kù)成員美國(guó)國(guó)立衛(wèi)生研究院國(guó)立衛(wèi)生研究院GenBank、日本、日本DNADNA數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)( (DDBJ) )和英國(guó)和英國(guó)Hinxton Hall的歐洲分子生物學(xué)的歐洲分子生物學(xué)實(shí)驗(yàn)室數(shù)據(jù)庫(kù)實(shí)驗(yàn)室數(shù)據(jù)庫(kù)( (EMBL)三部分?jǐn)?shù)據(jù)組成)三部分?jǐn)?shù)據(jù)組成三個(gè)組織每天交換各自數(shù)據(jù)庫(kù)中的新增序列三個(gè)組織每天交換各自數(shù)據(jù)庫(kù)中的新增序列實(shí)現(xiàn)數(shù)據(jù)共享實(shí)現(xiàn)數(shù)據(jù)共享第6頁(yè)/
5、共77頁(yè)(2) Genome即基因組數(shù)據(jù)庫(kù),提供了多種基因組、完全染即基因組數(shù)據(jù)庫(kù),提供了多種基因組、完全染色體、重疊序列圖譜以及一體化基因物理圖譜色體、重疊序列圖譜以及一體化基因物理圖譜(3) Structures即結(jié)構(gòu)數(shù)據(jù)庫(kù)或稱分子模型數(shù)據(jù)庫(kù)即結(jié)構(gòu)數(shù)據(jù)庫(kù)或稱分子模型數(shù)據(jù)庫(kù)( (MMDB) ),包含來(lái)自包含來(lái)自X X線晶體學(xué)和三維結(jié)構(gòu)的實(shí)驗(yàn)數(shù)據(jù)線晶體學(xué)和三維結(jié)構(gòu)的實(shí)驗(yàn)數(shù)據(jù)NCBI已經(jīng)將結(jié)構(gòu)數(shù)據(jù)交叉鏈接到書目信息、序列數(shù)據(jù)庫(kù)和已經(jīng)將結(jié)構(gòu)數(shù)據(jù)交叉鏈接到書目信息、序列數(shù)據(jù)庫(kù)和NCBI的的Taxonomy中運(yùn)用中運(yùn)用NCBI的的3D結(jié)構(gòu)瀏覽器和結(jié)構(gòu)瀏覽器和Cn3D,可以,可以很容易地從很容易地從En
6、trez獲得分子的分子結(jié)構(gòu)間相互作用的圖像獲得分子的分子結(jié)構(gòu)間相互作用的圖像第7頁(yè)/共77頁(yè)(4) Taxonomy即生物學(xué)門類數(shù)據(jù)庫(kù),可以按生物學(xué)門類進(jìn)行檢即生物學(xué)門類數(shù)據(jù)庫(kù),可以按生物學(xué)門類進(jìn)行檢索或?yàn)g覽其核苷酸序列、蛋白質(zhì)序列、結(jié)構(gòu)等索或?yàn)g覽其核苷酸序列、蛋白質(zhì)序列、結(jié)構(gòu)等(5) PopSet包含研究一個(gè)人群、一個(gè)種系發(fā)生或描述人群包含研究一個(gè)人群、一個(gè)種系發(fā)生或描述人群變化的一組組聯(lián)合序列變化的一組組聯(lián)合序列PopSet既包含了核酸序列數(shù)據(jù)又包含了蛋白質(zhì)既包含了核酸序列數(shù)據(jù)又包含了蛋白質(zhì)序列數(shù)據(jù)序列數(shù)據(jù)第8頁(yè)/共77頁(yè)(7) (7) 文獻(xiàn)數(shù)據(jù)庫(kù)文獻(xiàn)數(shù)據(jù)庫(kù)PubMed:生物醫(yī)藥科學(xué)的檢索
7、系統(tǒng)生物醫(yī)藥科學(xué)的檢索系統(tǒng) OMIM:孟德爾遺傳學(xué)數(shù)據(jù)庫(kù)是人類基因和基孟德爾遺傳學(xué)數(shù)據(jù)庫(kù)是人類基因和基因疾病的目錄數(shù)據(jù)庫(kù)因疾病的目錄數(shù)據(jù)庫(kù)其他:書目,雜志,文章引用匹配等其他:書目,雜志,文章引用匹配等該數(shù)據(jù)庫(kù)包括原文信息、圖片和參考信息,該數(shù)據(jù)庫(kù)包括原文信息、圖片和參考信息,同時(shí)還可以鏈接到同時(shí)還可以鏈接到Entrez系統(tǒng)系統(tǒng)MEDLINE數(shù)數(shù)據(jù)庫(kù)中相關(guān)文獻(xiàn)和序列信息據(jù)庫(kù)中相關(guān)文獻(xiàn)和序列信息 第9頁(yè)/共77頁(yè)2. NCBI數(shù)據(jù)庫(kù)檢索數(shù)據(jù)庫(kù)檢索 在檢索框中輸入檢索詞,檢索詞間默認(rèn)邏輯關(guān)在檢索框中輸入檢索詞,檢索詞間默認(rèn)邏輯關(guān)系為系為AND,檢索規(guī)則基本同,檢索規(guī)則基本同PubMed 可以通過(guò)下
8、拉菜單選擇記錄的顯示格式,通常選擇可以通過(guò)下拉菜單選擇記錄的顯示格式,通常選擇GenBank Report格式或格式或FASTA Report格式。格式。當(dāng)選擇當(dāng)選擇GenBank Report格式后,屏幕顯示較完整的基因記錄,包格式后,屏幕顯示較完整的基因記錄,包括:基因位點(diǎn)括:基因位點(diǎn)( (Locus)、基因定義)、基因定義( (Definition)、基因存取號(hào))、基因存取號(hào)( (Accession)、)、 核酸編號(hào)核酸編號(hào)( (NID )、關(guān)鍵詞)、關(guān)鍵詞( (Keywords)、)、 來(lái)源來(lái)源( (Source)、組織分類)、組織分類( (Organism) )、參考文獻(xiàn)、參考文獻(xiàn)(
9、 (Reference) )、 著者著者( (Author)、題目)、題目( (Title)、期刊)、期刊( (Journal)、)、Medline存取號(hào)存取號(hào)( (Medline)、序列特征)、序列特征( (Features)、基因)、基因( (Gene)、)、CDS(cDNA)、)、等位基因等位基因( (Allele) 對(duì)等的肽對(duì)等的肽( (Mat-Peptide )、計(jì)算堿基數(shù))、計(jì)算堿基數(shù)( (Base Count)、原序列)、原序列( (Origin)。)。而而FASTA Report格式僅包括檢出序列的簡(jiǎn)要特征描述。格式僅包括檢出序列的簡(jiǎn)要特征描述。第10頁(yè)/共77頁(yè)例如:人例如:
10、人EPOEPO基因序列檢索基因序列檢索輸入關(guān)鍵詞,選擇合適的程序輸入關(guān)鍵詞,選擇合適的程序第11頁(yè)/共77頁(yè)向下拉尋找符合目標(biāo)的條目向下拉尋找符合目標(biāo)的條目第12頁(yè)/共77頁(yè)點(diǎn)擊此條打開連接點(diǎn)擊此條打開連接第13頁(yè)/共77頁(yè)向下拉尋找關(guān)注的內(nèi)容向下拉尋找關(guān)注的內(nèi)容第14頁(yè)/共77頁(yè)凡是連接的地方都可以點(diǎn)擊查看凡是連接的地方都可以點(diǎn)擊查看可以直接拷貝保存相關(guān)內(nèi)容可以直接拷貝保存相關(guān)內(nèi)容第15頁(yè)/共77頁(yè)Entrez: 是一個(gè)用以整合是一個(gè)用以整合NCBI數(shù)據(jù)庫(kù)中信息的數(shù)據(jù)庫(kù)中信息的搜尋和檢索工具搜尋和檢索工具 3. 3. NCBI數(shù)據(jù)庫(kù)搜索工具數(shù)據(jù)庫(kù)搜索工具 BLAST:是一個(gè)是一個(gè)NCBINC
11、BI開發(fā)的序列相似搜索程序,還可作開發(fā)的序列相似搜索程序,還可作為鑒別基因和遺傳特點(diǎn)的手段為鑒別基因和遺傳特點(diǎn)的手段 NCBI提供的附加軟件工具有:開放閱讀框?qū)ひ捚魈峁┑母郊榆浖ぞ哂校洪_放閱讀框?qū)ひ捚鳎∣RF Finder),),電子電子PCR,和序列提交工具,和序列提交工具,Sequin和和BankIt Entrez的一個(gè)強(qiáng)大和獨(dú)特的特點(diǎn)的一個(gè)強(qiáng)大和獨(dú)特的特點(diǎn)是檢索相關(guān)的序列,結(jié)構(gòu),和參考是檢索相關(guān)的序列,結(jié)構(gòu),和參考文獻(xiàn)的能力文獻(xiàn)的能力 第16頁(yè)/共77頁(yè)Entrez:第17頁(yè)/共77頁(yè)BLAST:第18頁(yè)/共77頁(yè)BLAST程序程序程序程序 數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù) 查詢查詢 內(nèi)容內(nèi)容Blastp
12、 蛋白質(zhì)蛋白質(zhì) 蛋白質(zhì)蛋白質(zhì) 使用取代矩陣尋找較遠(yuǎn)的關(guān)系:使用取代矩陣尋找較遠(yuǎn)的關(guān)系: 可以進(jìn)行可以進(jìn)行SEG過(guò)濾過(guò)濾Blastn 核苷酸核苷酸 核苷酸核苷酸 尋找較高分值的匹配,對(duì)較遠(yuǎn)關(guān)系尋找較高分值的匹配,對(duì)較遠(yuǎn)關(guān)系 不太適用不太適用Blastx 核苷酸核苷酸 蛋白質(zhì)蛋白質(zhì) 對(duì)于新的對(duì)于新的DNA序列和序列和ESTs的分析極的分析極 (翻譯)(翻譯) 為有用為有用Tblastn 蛋白質(zhì)蛋白質(zhì) 核苷酸核苷酸 對(duì)于尋找數(shù)據(jù)庫(kù)中沒(méi)有標(biāo)注的編碼對(duì)于尋找數(shù)據(jù)庫(kù)中沒(méi)有標(biāo)注的編碼 (翻譯)(翻譯) 區(qū)極為有用區(qū)極為有用Tblastx 核苷酸核苷酸 核苷酸核苷酸 對(duì)于分析對(duì)于分析EST極為有用極為有用 (
13、翻譯)(翻譯) (翻譯)(翻譯) 第19頁(yè)/共77頁(yè)點(diǎn)擊核酸序列點(diǎn)擊核酸序列blast,在框內(nèi)輸入序列:,在框內(nèi)輸入序列:第20頁(yè)/共77頁(yè)選擇搜索條件:選擇搜索條件:第21頁(yè)/共77頁(yè)選擇特殊程序:選擇特殊程序:第22頁(yè)/共77頁(yè)比較兩個(gè)序列之間的相似性:比較兩個(gè)序列之間的相似性:第23頁(yè)/共77頁(yè) 以上僅簡(jiǎn)介了以上僅簡(jiǎn)介了NCBI相關(guān)數(shù)據(jù)庫(kù)及工具軟相關(guān)數(shù)據(jù)庫(kù)及工具軟件關(guān)于其他數(shù)據(jù)庫(kù)及軟件工具等信息見書中件關(guān)于其他數(shù)據(jù)庫(kù)及軟件工具等信息見書中第二十五章表第二十五章表1-51-5。第24頁(yè)/共77頁(yè)第二節(jié)第二節(jié) 基因轉(zhuǎn)錄起始點(diǎn)的鑒定基因轉(zhuǎn)錄起始點(diǎn)的鑒定第25頁(yè)/共77頁(yè)主要內(nèi)容:主要內(nèi)容:一、
14、基因轉(zhuǎn)錄起始點(diǎn)的序列特征一、基因轉(zhuǎn)錄起始點(diǎn)的序列特征二、基因轉(zhuǎn)錄起始點(diǎn)的序列分析二、基因轉(zhuǎn)錄起始點(diǎn)的序列分析第26頁(yè)/共77頁(yè)一、基因轉(zhuǎn)錄起始點(diǎn)的序列特征一、基因轉(zhuǎn)錄起始點(diǎn)的序列特征 TATA box CAAT box GC box 增強(qiáng)子增強(qiáng)子 順式作用元件順式作用元件 結(jié)構(gòu)基因結(jié)構(gòu)基因-GCGC-CAAT-TATA轉(zhuǎn)錄起始點(diǎn)轉(zhuǎn)錄起始點(diǎn)1. 1. 真核基因及其調(diào)控元件真核基因及其調(diào)控元件第27頁(yè)/共77頁(yè)II 型啟動(dòng)子的型啟動(dòng)子的TSS:沒(méi)有明確的保守序列沒(méi)有明確的保守序列有一種趨勢(shì),即有一種趨勢(shì),即mRNA 的第一個(gè)堿基是的第一個(gè)堿基是A,其側(cè)翼堿基傾向于是嘧啶其側(cè)翼堿基傾向于是嘧啶與與m
15、RNA第一個(gè)堿基對(duì)應(yīng)的位置標(biāo)記為第一個(gè)堿基對(duì)應(yīng)的位置標(biāo)記為-1 -1區(qū)區(qū)-3 +5-3 +5區(qū)域被稱作起始子區(qū)域被稱作起始子 ( (initiator) )2. 2. 轉(zhuǎn)錄起始點(diǎn)(轉(zhuǎn)錄起始點(diǎn)(TSS)+10+20Start site-10-20-30-40+1ATGATG-3+5Initiator Initiator PyPy2 2CAPyCAPy5 5第28頁(yè)/共77頁(yè)二、基因轉(zhuǎn)錄起始點(diǎn)的序列分析思考:思考:轉(zhuǎn)錄起始點(diǎn)轉(zhuǎn)錄起始點(diǎn) ( (TSS) )位于基因編碼序列的位于基因編碼序列的5 5 端端基因編碼區(qū)是指能體現(xiàn)在多肽鏈中的核苷酸基因編碼區(qū)是指能體現(xiàn)在多肽鏈中的核苷酸序列序列多肽鏈?zhǔn)且远嚯?/p>
16、鏈?zhǔn)且詍RNA為模板經(jīng)翻譯合成的為模板經(jīng)翻譯合成的因此,因此,分析鑒定分析鑒定TSS的方法都是以的方法都是以cDNA為切入點(diǎn)為切入點(diǎn)第29頁(yè)/共77頁(yè)1. 1. cDNA克隆測(cè)序克隆測(cè)序AAAAAnAAAAAnAAAAAnmRNA反轉(zhuǎn)錄酶AAAAAnOligo (dT)15-18TTTTT15-18cDNA第一鏈CCCCCTTTTT15-18cDNA第一鏈nCCCCnGGGGcDNA第二鏈克隆擴(kuò)增,5端測(cè)序分析反轉(zhuǎn)錄酶的末端轉(zhuǎn)移酶活性O(shè)ligo (dG)15-18mRNA與線性載體相連接要求:cDNA的5端完整無(wú)缺第30頁(yè)/共77頁(yè)2. 2. cDNA末端快速擴(kuò)增技術(shù)末端快速擴(kuò)增技術(shù)( (RA
17、CE) )傳統(tǒng)的傳統(tǒng)的RACE:AAAAAnmRNAAAAAAnTTTTT15-18cDNAmRNA-53-反轉(zhuǎn)錄酶Oligo (dT)15-18末端轉(zhuǎn)移酶dGTPTTTTT15-18nGGGGG錨定PCR擴(kuò)增TTTTT15-18nGGGGGnCCCCC錨定引物特異引物PCR產(chǎn)物第31頁(yè)/共77頁(yè)Deep-RACE: 用寡核苷酸替代mRNA的5端帽結(jié)構(gòu)以及發(fā)光標(biāo)記巢氏PCR引物實(shí)現(xiàn)高通量鑒定轉(zhuǎn)錄起始點(diǎn) AAAAAn5-p 帽mRNA牛小腸磷酸酶 (CIP)AAAAAn5-帽煙草酸焦磷酸酶 (TAP) AAAAAn5-將5-RACE adaptor (寡核苷酸)加到脫帽RNA分子上AAAAAn5
18、-RACE adaptor (寡核苷酸)反轉(zhuǎn)錄酶10nt 隨機(jī)引物第32頁(yè)/共77頁(yè)5-RACE adaptor5-RACE adaptor5-RACE adaptor5-RACE adaptor長(zhǎng)短不同的cDNA隨機(jī)引物用10nt隨機(jī)引物與5-RACE引物進(jìn)行PCR擴(kuò)增5-RACE adaptor5-RACE adaptor5-RACE adaptor5-RACE adaptorPCR產(chǎn)物隨機(jī)引物以5-RACE引物和5端甩尾的基因特異性反向引物進(jìn)行巢氏PCR 5-RACE adaptor以5-RACE發(fā)光標(biāo)記引物對(duì)PCR混合物直接進(jìn)行一次性測(cè)序分析基因轉(zhuǎn)錄起始點(diǎn)第33頁(yè)/共77頁(yè)3.3.連續(xù)
19、分析基因轉(zhuǎn)錄起始點(diǎn)連續(xù)分析基因轉(zhuǎn)錄起始點(diǎn) 在RACE的基礎(chǔ)上,通過(guò)在轉(zhuǎn)錄本5 端引入一個(gè)特殊的II型限制性核酸內(nèi)切酶識(shí)別位點(diǎn),實(shí)現(xiàn)了基因5 端短片段串聯(lián)連接產(chǎn)物一次測(cè)序分析多個(gè)基因轉(zhuǎn)錄起始點(diǎn)的目的主要有兩種方法:主要有兩種方法:5 端連續(xù)分析基因表達(dá)(5 -end serial analysis of gene expression, 5 SAGE)帽分析基因表達(dá)(cap analysis gene expression, CAGE)第34頁(yè)/共77頁(yè)(1) 5 SAGE5SAGE是在PCR過(guò)程中將MmeI酶切位點(diǎn)引物cDNA的5端,通過(guò)酶切和連接獲得不同短片段重復(fù)序列,并對(duì)重復(fù)序列進(jìn)行測(cè)序獲
20、得大量片段序列信息 不同序列的短片段代表不同基因的轉(zhuǎn)錄起始點(diǎn) (TSS) MmeI:是一種特殊的II型限制性核酸內(nèi)切酶識(shí)別的序列不是回文結(jié)構(gòu),而是不對(duì)稱的DNA序列5-TCCRAC-3(R代表G或A)在識(shí)別位點(diǎn)下游1820堿基處切開雙鏈DNA 第35頁(yè)/共77頁(yè)GpppAAAAAAAAnmRNA用BAP和TAP處理AAAAAAAAnp在RNA的5端加上寡核苷酸帽AAAAAAAAn5XhoIMmeI反轉(zhuǎn)錄酶RT5AAAAAAAAn5cDNAPCRBiotin-標(biāo)記引物隨機(jī)引物55BiotinMmeI酶切消化520 mer5Biotin親和素用親和素-生物素,可以將5-端片段與其他片段分離開第36
21、頁(yè)/共77頁(yè)520 mer連接5Biotin5Biotin520 merPCR擴(kuò)增55Biotin5Biotin5XhoI酶切消化自身連接串聯(lián)體測(cè)序分析第37頁(yè)/共77頁(yè)(2) CAGECAGE與5SAGE非常相似所不同的是:CAGE不需要在RNA上加接頭,而是用oligo(dT)引物先進(jìn)行第一鏈cDNA的合成然后通過(guò)捕獲帽結(jié)構(gòu),將含有MmeI和另一內(nèi)切酶位點(diǎn)如XmaJI的linker加到單鏈全長(zhǎng)cDNA的3末端 第38頁(yè)/共77頁(yè)AAAAAAnCapmRNA反轉(zhuǎn)錄酶Oligo (dT)1518AAAAAAnCapTTTTTTTncDNA捕獲5-帽結(jié)構(gòu)單鏈linker連接TTTTTTTnBio
22、tincDNA第二鏈的合成TTTTTTTnAAAAAAnMmeIXmaJIMmeI酶切親和素20 mer用親和素-生物素,可以將5-端片段與其他片段分離開第39頁(yè)/共77頁(yè)連接第二個(gè)linkerXbaIXmaJIXmaJI, Xbal酶切消化PCR(用linker1和linker2作引物)Linker 1Linker 2純化,串聯(lián)連接,克隆20 merXmaJI和XbaI是同尾酶:XmaJI:CCTAGGXbaI: TCTAGA串聯(lián)體測(cè)序分析第40頁(yè)/共77頁(yè)第三節(jié)第三節(jié) 啟動(dòng)子的結(jié)構(gòu)及功能分析啟動(dòng)子的結(jié)構(gòu)及功能分析第41頁(yè)/共77頁(yè)主要內(nèi)容:主要內(nèi)容:一、啟動(dòng)子的結(jié)構(gòu)分析一、啟動(dòng)子的結(jié)構(gòu)分析
23、二、啟動(dòng)子的功能分析二、啟動(dòng)子的功能分析第42頁(yè)/共77頁(yè)啟動(dòng)子(啟動(dòng)子(promoter)是一段能被蛋白質(zhì)識(shí)別的、參與特定基因轉(zhuǎn)錄調(diào)控的DNA序列II型啟動(dòng)子通常位于結(jié)構(gòu)基因的上游共通序列(consensus sequence)是其特征性序列共通序列和啟動(dòng)子所處的位置是研究啟動(dòng)子的重要線索第43頁(yè)/共77頁(yè)+10+20Start site-10-20-30-40+1ATGATG-3+5Initiator Initiator 共通序列共通序列例如:原核基因的共通序列:-10區(qū):Pribnow box(T77A76T60A61A56T82序列)-35區(qū):T69T79G61A56C54A54 序列
24、 真核基因的共通序列: 真核基因啟動(dòng)子在-50區(qū)域附近(大約5%30%基因啟動(dòng)子在-25-30區(qū)域)有TATA box(TATAAA序列)TATAATTTGACA第44頁(yè)/共77頁(yè)一、啟動(dòng)子的結(jié)構(gòu)分析一、啟動(dòng)子的結(jié)構(gòu)分析主要方法:主要方法:利用利用PCR技術(shù)克隆啟動(dòng)子技術(shù)克隆啟動(dòng)子利用核酸利用核酸- -蛋白質(zhì)相互作用方法研究啟動(dòng)子蛋白質(zhì)相互作用方法研究啟動(dòng)子生物信息學(xué)預(yù)測(cè)啟動(dòng)子生物信息學(xué)預(yù)測(cè)啟動(dòng)子第45頁(yè)/共77頁(yè)(一)利用(一)利用PCRPCR技術(shù)克隆啟動(dòng)子技術(shù)克隆啟動(dòng)子特異性基因序列基因上游序列基因組DNA根據(jù)基因序列合成一條反向引物正向引物用隨機(jī)引物PCR擴(kuò)增隨機(jī)引物特異引物克隆及測(cè)序分
25、析注意:真核基因有內(nèi)含子,應(yīng)該根據(jù)mRNA序列設(shè)計(jì)特異性引物特異性引物盡可能靠近基因的5端1. 1. 根據(jù)已知基因序列直接進(jìn)行根據(jù)已知基因序列直接進(jìn)行PCR擴(kuò)增擴(kuò)增第46頁(yè)/共77頁(yè)2. 2. 利用利用TSS釣取啟動(dòng)子釣取啟動(dòng)子AAAAAAnCap 5-mRNA反轉(zhuǎn)錄AAAAAAnTTTTTTncDNA插入載體,克隆擴(kuò)增Cap 5-以基因特異引物與載體引物配對(duì)PCR擴(kuò)增5-測(cè)序分析基因轉(zhuǎn)錄起始點(diǎn)序列以TSS序列為引物,基因組序列為模板,與隨機(jī)引物配對(duì)進(jìn)行TSS上游序列的PCR擴(kuò)增第47頁(yè)/共77頁(yè)3. 3. 利用環(huán)狀利用環(huán)狀PCR釣取啟動(dòng)子釣取啟動(dòng)子基因組DNA酶切消化基因組DNA片段直接環(huán)化
26、連接加上接頭后環(huán)化連接根據(jù)基因上游序列設(shè)計(jì)一對(duì)反向互補(bǔ)引物PCR擴(kuò)增根據(jù)接頭序列設(shè)計(jì)引物PCR擴(kuò)增克隆測(cè)序分析克隆測(cè)序分析接頭第48頁(yè)/共77頁(yè)(二)利用核酸(二)利用核酸- -蛋白質(zhì)互作方法研究啟動(dòng)子蛋白質(zhì)互作方法研究啟動(dòng)子啟動(dòng)子是一段能被蛋白質(zhì)識(shí)別和結(jié)合的DNA序列,因此,能夠檢測(cè)核酸-蛋白質(zhì)相互作用的研究方法都可以用于啟動(dòng)子的研究中 主要方法:足跡法(酶足跡法,化學(xué)足跡法)電泳遷移率變動(dòng)實(shí)驗(yàn)(EMSA)染色體免疫沉淀(ChIP)第49頁(yè)/共77頁(yè)1. 1. 用足跡法研究啟動(dòng)子用足跡法研究啟動(dòng)子足跡法(Footprinting)利用DNA電泳條帶連續(xù)性中斷的圖譜特點(diǎn)判斷與蛋白質(zhì)結(jié)合的DNA
27、區(qū)域 基本流程:DNA與蛋白質(zhì)相互作用切割DNA凝膠電泳分析電泳圖譜蛋白與未標(biāo)記的競(jìng)爭(zhēng)DNA結(jié)合蛋白與標(biāo)記的DNA結(jié)合凝膠電泳放射自顯影第50頁(yè)/共77頁(yè)(1 1)酶足跡法)酶足跡法 ( (Enzymatic footprinting) ) 利用能切割DNA的酶處理DNA-蛋白質(zhì)混合物,然后通過(guò)電泳進(jìn)行分析 DNase I足跡法足跡法 (DNase I footprinting) 是一種利用DNase I 隨機(jī)切割雙鏈DNA,從而確定DNA結(jié)合蛋白在DNA上結(jié)合位點(diǎn)的方法 核酸外切酶核酸外切酶IIIIII足跡法足跡法 (Exonucleoase III footprinting) 是利用核酸外
28、切酶III(Exo III)的35外切酶活性從3末端切割雙鏈DNA的特性,確定蛋白質(zhì)在DNA上的結(jié)合位點(diǎn)的常用方法 第51頁(yè)/共77頁(yè)DNase I 足跡法足跡法dsDNA單鏈末端標(biāo)記DNA結(jié)合蛋白DNase I酶切消化(控制反應(yīng)時(shí)間)產(chǎn)生長(zhǎng)短不同的片段但蛋白質(zhì)結(jié)合區(qū)被保護(hù)第52頁(yè)/共77頁(yè)蛋白質(zhì)結(jié)合區(qū)MNo-proPro-DNA對(duì)在凝膠上出現(xiàn)空白區(qū)域的DNA進(jìn)行克隆測(cè)序,即可確定結(jié)合蛋白質(zhì)的DNA序列變性凝膠電泳第53頁(yè)/共77頁(yè)(2 2)化學(xué)足跡法)化學(xué)足跡法 ( (Chemical footprinting) ) 是利用能切斷DNA骨架的化學(xué)試劑處理DNA-蛋白質(zhì)復(fù)合物,從而通過(guò)化學(xué)試劑
29、無(wú)法接近結(jié)合蛋白質(zhì)的DNA區(qū)域而確定DNA的蛋白質(zhì)結(jié)合位點(diǎn)主要方法:羥自由基足跡法 體內(nèi)足跡法第54頁(yè)/共77頁(yè)1 1)羥自由基足跡法)羥自由基足跡法(Hydroxyl radical footprinting) 化學(xué)試劑羥自由基利用化學(xué)試劑產(chǎn)生的羥自由基攻擊DNA分子表面脫氧核糖骨架使DNA斷裂當(dāng)DNA結(jié)合蛋白將脫氧核糖遮蓋時(shí),自由羥基無(wú)法攻擊而使這個(gè)區(qū)域的DNA受到保護(hù) 電泳圖譜上出現(xiàn)空白區(qū)的地方就是結(jié)合蛋白質(zhì)的DNA變性凝膠電泳第55頁(yè)/共77頁(yè)2 2)體內(nèi)基足跡法)體內(nèi)基足跡法(In vivo footprinting) 用化學(xué)試劑對(duì)活細(xì)胞進(jìn)行體內(nèi)處理,使DNA在細(xì)胞內(nèi)受到化學(xué)修飾,然
30、后裂解細(xì)胞,用化學(xué)法或酶法進(jìn)行足跡實(shí)驗(yàn)。 甲基化干擾實(shí)驗(yàn)甲基化干擾實(shí)驗(yàn) (Methylation interference assay) 是利用化學(xué)試劑如硫酸二甲酯(Dimethyl sulfate, DMS)對(duì)活細(xì)胞DNA進(jìn)行甲基化修飾,從而干擾蛋白質(zhì)與DNA的結(jié)合。 乙基化干擾實(shí)驗(yàn)乙基化干擾實(shí)驗(yàn) (Ethylation interference assay) 是利用化學(xué)試劑對(duì)活細(xì)胞DNA進(jìn)行乙基化修飾,從而干擾蛋白質(zhì)與DNA的結(jié)合。 第56頁(yè)/共77頁(yè)化學(xué)試劑提取DNADNase I 或化學(xué)試劑變性凝膠電泳分析切割DNA化學(xué)修飾對(duì)蛋白質(zhì)與DNA的結(jié)合有干擾,因此,體內(nèi)足跡實(shí)驗(yàn)也叫干擾實(shí)驗(yàn)電
31、泳圖譜需與未修飾的DNA樣品進(jìn)行比較,在未修飾樣品中出現(xiàn)空白區(qū)的位置是體內(nèi)發(fā)生化學(xué)修飾的DNA區(qū)域正常對(duì)照化學(xué)修飾提取DNA第57頁(yè)/共77頁(yè)2. 2. 用電泳遷移率變動(dòng)實(shí)驗(yàn)研究啟動(dòng)子用電泳遷移率變動(dòng)實(shí)驗(yàn)研究啟動(dòng)子電泳遷移率變動(dòng)實(shí)驗(yàn)電泳遷移率變動(dòng)實(shí)驗(yàn) (Electrophoretic mobility shift assay, EMSA)是利用結(jié)合蛋白質(zhì)的DNA片段在凝膠中遷移滯后的特點(diǎn),通過(guò)電泳分離研究核酸-蛋白質(zhì)互作的方法又稱為凝膠阻滯實(shí)驗(yàn)(Gel retardation assay)第58頁(yè)/共77頁(yè)細(xì)胞蛋白質(zhì)提取物標(biāo)記的DNA片段蛋白質(zhì)與DNA結(jié)合蛋白質(zhì)-DNA復(fù)合物電泳遷移滯后凝膠電
32、泳顯影滯后條帶表明DNA是與蛋白質(zhì)結(jié)合的區(qū)域第59頁(yè)/共77頁(yè)3. 3.用染色體免疫沉淀技術(shù)研究啟動(dòng)子用染色體免疫沉淀技術(shù)研究啟動(dòng)子染色體免疫沉淀染色體免疫沉淀(Chromatin immunoprecipitation, ChIP)是在保持蛋白質(zhì)與染色體DNA結(jié)合的同時(shí),將染色體切割成小片段并沉淀下來(lái) 非變性非變性ChIP:是先用核酸酶處理細(xì)胞核,將染色體消化成碎片,然后用合適的抗體將結(jié)合有蛋白質(zhì)的染色體片段通過(guò)免疫沉淀選擇出來(lái),再以PCR或核酸雜交技術(shù)對(duì)DNA序列進(jìn)行分析 變性變性ChIP:是先用甲醛處理細(xì)胞,使蛋白質(zhì)與DNA在細(xì)胞內(nèi)發(fā)生交聯(lián),然后分離染色體并進(jìn)行剪切,用特異性抗體與DNA
33、結(jié)合蛋白相結(jié)合,以沉淀法分離DNA-蛋白質(zhì)復(fù)合體 前面章節(jié)已介紹,這里不再詳述第60頁(yè)/共77頁(yè)(三)生物信息學(xué)預(yù)測(cè)啟動(dòng)子(三)生物信息學(xué)預(yù)測(cè)啟動(dòng)子真核基因組的測(cè)序正在以不斷增長(zhǎng)的速度進(jìn)行著,目前已經(jīng)可以獲得大約50個(gè)完整真核生物基因組的序列信息,預(yù)計(jì)在未來(lái)幾年內(nèi)將會(huì)完成更多的基因組測(cè)序工作對(duì)基因組注釋工作中最難的就是精確鑒定和描繪啟動(dòng)子,因此,啟動(dòng)子的預(yù)測(cè)就顯得非常重要 預(yù)測(cè)啟動(dòng)子的切入點(diǎn)啟動(dòng)子的結(jié)構(gòu)特征啟動(dòng)子在染色體上的位置第61頁(yè)/共77頁(yè)1. 1. 啟動(dòng)子的結(jié)構(gòu)特征啟動(dòng)子的結(jié)構(gòu)特征典型啟動(dòng)子核心啟動(dòng)子:一般在TSS上游-35區(qū)域以內(nèi)近端啟動(dòng)子:一般涉及TSS上游幾百個(gè)堿基遠(yuǎn)端啟動(dòng)子:一
34、般涉及TSS上游幾千個(gè)堿基 含有增強(qiáng)子或沉默子一些特征性的結(jié)構(gòu) TSS附近的CG島經(jīng)常出現(xiàn)在啟動(dòng)子中共通序列 (consensus sequence)第62頁(yè)/共77頁(yè)2. 2. 啟動(dòng)子的預(yù)測(cè)分析啟動(dòng)子的預(yù)測(cè)分析EPD (Eukaryotic promoter databases)TRRD (Transcription regulatory regions databases)基因轉(zhuǎn)錄起始點(diǎn)數(shù)據(jù)庫(kù) (DBTSS) 啟動(dòng)子數(shù)據(jù)庫(kù)啟動(dòng)子數(shù)據(jù)庫(kù) 這些數(shù)據(jù)庫(kù)主要通過(guò)計(jì)算機(jī)識(shí)別、判斷及分析,在數(shù)據(jù)庫(kù)中尋找啟動(dòng)子的特異性特征結(jié)構(gòu)。第63頁(yè)/共77頁(yè)二、啟動(dòng)子的功能分析二、啟動(dòng)子的功能分析啟動(dòng)子通常是基因上
35、游參與基因轉(zhuǎn)錄調(diào)控的DNA序列。由于啟動(dòng)子中的順式作用元件在基因的特異性表達(dá)中發(fā)揮重要作用,因此,可以通過(guò)連接報(bào)告基因研究啟動(dòng)子的功能。1. 1. 報(bào)告基因報(bào)告基因 ( (Reporter gene) )是研究者們?yōu)榱酥圃煲环N可在細(xì)胞培養(yǎng)條件下或動(dòng)植物體內(nèi)作為篩選標(biāo)志的易檢測(cè)信號(hào),通過(guò)分子生物學(xué)操作將發(fā)光蛋白或酶的編碼基因附加到一個(gè)感興趣基因上或插入基因調(diào)控序列下游,從而監(jiān)測(cè)感興趣基因的表達(dá)或分析基因調(diào)控序列的活性 。第64頁(yè)/共77頁(yè)常用的報(bào)告基因常用的報(bào)告基因熒光蛋白編碼基因:綠色熒光蛋白 (GFP)紅色熒光蛋白 (dsRed)蛋白酶:熒光素酶 (luciferase)-半乳糖苷酶能催化熒
36、光素 (luciferin)發(fā)生氧化反應(yīng)發(fā)光能使細(xì)菌在X-gal存在條件下變成藍(lán)色第65頁(yè)/共77頁(yè)2. 2. 報(bào)告基因的應(yīng)用報(bào)告基因的應(yīng)用監(jiān)測(cè)基因的轉(zhuǎn)染效率監(jiān)測(cè)基因的轉(zhuǎn)染效率 報(bào)告基因與目的基因分別插入各自啟動(dòng)子下游,實(shí)現(xiàn)報(bào)告基因的組成性表達(dá)模式監(jiān)控目的基因的表達(dá)監(jiān)控目的基因的表達(dá) 報(bào)告基因與目的基因融合共同受控于一個(gè)啟動(dòng)子,報(bào)告基因的表達(dá)即代表目的基因的表達(dá)研究啟動(dòng)子的活性研究啟動(dòng)子的活性 報(bào)告基因插入被研究啟動(dòng)子下游,通過(guò)觀察報(bào)告基因的表達(dá)情況推測(cè)啟動(dòng)子活性第66頁(yè)/共77頁(yè)啟動(dòng)子捕獲技術(shù) (promoter trapping):是一種研究啟動(dòng)子活性的篩選方法基本流程:構(gòu)建啟動(dòng)子捕獲載體觀察報(bào)告基因的表達(dá) 報(bào)告基因MCSori候選啟動(dòng)子序列插入MCS轉(zhuǎn)染細(xì)胞觀察報(bào)告基因的表達(dá)啟動(dòng)子捕獲載體第67頁(yè)/共77頁(yè)第四節(jié)第四節(jié) 編碼序列結(jié)構(gòu)分析編碼序列結(jié)構(gòu)分析 第68頁(yè)/共77頁(yè)編碼序列編碼序列 ( (coding sequence) ): 通常是指能體現(xiàn)在蛋白質(zhì)氨基酸序列中的基因信息 主要內(nèi)容主要內(nèi)容一、基因編碼序列的結(jié)構(gòu)特征一、基因編碼序列的結(jié)構(gòu)特征二、基因編碼序列的結(jié)構(gòu)分析二、基因編碼序列的結(jié)構(gòu)分析第69頁(yè)/共77頁(yè)一、基因編碼序列的結(jié)構(gòu)特征一、基因編碼序列的結(jié)構(gòu)特征基因的編碼序列具有一些特征性序列比如:開放閱讀框架蛋白質(zhì)翻譯的起始密碼子和終止密碼子真核基因
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026四川成都東部新區(qū)蘆霞衛(wèi)生院編外人員招聘3人備考題庫(kù)及完整答案詳解1套
- 2026云南保山市瑞積中學(xué)招聘9人備考題庫(kù)及答案詳解(易錯(cuò)題)
- 2026天津市北方人力資源管理顧問(wèn)有限公司津南分公司招聘實(shí)習(xí)生備考題庫(kù)有答案詳解
- 2026廣東廣州市中山市教體系統(tǒng)第一期招聘事業(yè)單位人員117人備考題庫(kù)及一套完整答案詳解
- 2026河北保定工數(shù)聯(lián)合(雄安)大數(shù)據(jù)科技有限公司招聘3人備考題庫(kù)及一套參考答案詳解
- 2026云南西雙版納州勐海縣消防救援局招聘城鎮(zhèn)公益性崗位人員2人備考題庫(kù)及答案詳解參考
- 2025北京林業(yè)大學(xué)自聘勞動(dòng)合同制人員3名備考題庫(kù)及1套完整答案詳解
- 2026河北保定市定州市第二醫(yī)院醫(yī)養(yǎng)中心招聘?jìng)淇碱}庫(kù)及答案詳解(奪冠系列)
- 2026樟樹順銀新春招聘?jìng)淇碱}庫(kù)及完整答案詳解
- 2026廣西百色市田陽(yáng)區(qū)選調(diào)事業(yè)單位人員27人備考題庫(kù)及參考答案詳解
- 西醫(yī)內(nèi)科學(xué)復(fù)習(xí)重點(diǎn)筆記
- 2023年運(yùn)動(dòng)控制工程師年度總結(jié)及下一年展望
- 8、中醫(yī)科診療技術(shù)操作規(guī)范
- 夾套管施工方案
- 地面人工開挖施工方案
- 物業(yè)房屋中介合作協(xié)議
- 新郎父親在婚禮上的精彩講話稿范文(10篇)
- (山東)通風(fēng)與空調(diào)工程施工資料表格大全(魯TK001-057)
- 大鵬新區(qū)保護(hù)與發(fā)展綜合規(guī)劃(2013-2020)
- 戰(zhàn)略成本1-6章toc經(jīng)典案例
- DB37-T 5026-2022《居住建筑節(jié)能設(shè)計(jì)標(biāo)準(zhǔn)》
評(píng)論
0/150
提交評(píng)論