版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
應用UCSC/Ensembl查找基因啟動子(promoter)、內含子、
外顯子序列啟動子的甲基化,轉錄因子與啟動子的結合調控基因的表達等研究領域一直較為熱門。本文圖文形式講解了啟動子的概念,利用UCSC如何查找一個基因的啟動子序列,以及外卜顯子和內含子序列的顯示。有彳艮多關于此方面的文章由于寫作在早期,近年來查詢數(shù)據(jù)庫網(wǎng)站的改版使得這些文章有些落伍,使用起來也不方便。本文是最新的關于查詢啟動子方法的文章,創(chuàng)作于2009/10/14,大家可以完全按此操作。在講述某個基因的啟動子查詢之間,我們有必要對基礎知識進行一下復習和總結。先看一下中心法則:ReplicatkinGWTranscriptionTranslationDNA1)RNAProtein^Reverse如忑酣配就觀曲s.gn.oi啟動子是在DNA轉錄為RNA這一步過程中發(fā)揮作用的,在此要與DNA自身復制起始點(稱作復制子)和由mRNA翻譯為蛋白質時的翻譯起始點(以起始密碼子ATG為標志)區(qū)別開來。DNAsequence-specifictranscriptionfactorsTBP(TATA-bindingprotein)定義:啟動子是參與特定基因轉錄及其調控的DNA序列。包含核心啟動子區(qū)域和調控區(qū)域。核心啟動子區(qū)域產(chǎn)生基礎水平的轉錄,調控區(qū)域能夠對不同的環(huán)境條件作出應答,對基因的表達水平做出相應的調節(jié)。啟動子是RNA聚合酶特異性識別和結合的部位。啟動子方向性,位于轉錄起始點上游,本身并不被轉錄。DNA鏈上與RNA鏈的第一個核苷酸對應的堿基標記為+1(如下圖),由此堿基向上游(5’端)數(shù)的堿基順序數(shù)為負(-1,-2,......),向下游(3’端)數(shù)的堿基為正(+2,+3,)-35-10+15h-TAGTGTATTCACATCATAGAAGCACTCTAQAATA^GTCCACG-33r-ATCACATAACTGTACTATCTTCGTGACATGAIATAACAGTTATCCAGGTCC-5*1轉漫RNAy-ACCUCCACG一-3’.?扈動子的部位及其與特條澈澡*弱gEsmm區(qū)域:啟動子的范圍非常大,可以包含轉錄起始位點上游2000bp,有些特定基因的轉錄區(qū)內部也存在著轉錄因子的結合位點,因此也屬于啟動子范圍??偨Y起來,也就是說啟動子約在與mRNA所對應的DNA序列之前約2000個左右的堿基。明白了啟動子的含義之后,我們以大鼠(rattusnorvegicus)的結締組織生長因子(CTGF)為例,應用UCSC基因組瀏覽器開始查找該基因的啟動子序列。網(wǎng)址為/
UCSCGenomeBiomform^lks進入UCSC的主頁后,在其左側(如上圖)點擊第一項GenomeBrowser,進入基因組瀏覽器入口,如下圖Ahcurtibt]-S|!bkhwIi掙Fw叩呻勺在Organism的下拉菜單中選擇Rat,在assembly的下拉菜單中選擇最新日期Nov.2004,在position框中鍵入CTGF,imagewidth選擇默認即可,如下圖所示:
chdegeflemsasstmbKorsearchterminiagewidthrnlainmalHiRat,麗<血由-■[ktgf|jSOO|拭i泌11C&Hc瞄i■-k>mwdiebrcwsCTnswiuttrfaeetettiflgstotheirdefsmhs利d牛普懷叫*屈_[conligtwt統(tǒng)加日ndd德口啊用拋長用fir.:.p&他血*:om,cn然后點擊Submit,返回的頁面如下:KnownGene'r?KoJL:E偵戲£樣」M,QMLL¥H3:"T"*i:m-EOEJiecTiveE北住grawciifaEEor匚T<3f而二clamE.!jL3£"*-CcaMCEi'reExa^ucffEffweiT-iZEOTpsenuiaDf-OIKjSgF少m占e巳網(wǎng)“隊丁4部凹-罅欣的羽4■W^Tl2±s.-uUblAf:口!:曲i恤廿p?e>E?LKJRePSeqGeneseaEBezTive-tissuefaet*-prHciisiDEXon-RatRefSeqGenesa^fll*典牡必-晝H9TEE-點—r1,1:e~J!:f£!!21:S3n!i]l?H32!aT9d-艾AT日=且”1整十土小7a^fll*典牡必-晝H9TEE-點—r1,1:e~J!:f£!!21:S3n!i]l?H32!aT9d-艾AT日=且”1整十土小7擋1皓n=emc-鼠??贚EeL」N寸丁TH加■而-匚TGF.m..5JC心mWWLF.-j12堡:業(yè)-(SH.以(MM§海C&M(KKtNH場g[3KCS1&15-D41eojtse^tive■eubjcCE^^EtITD.a^-2rC3X&li-a+2fflAnitetlVe!:lS3JrG:WLbEft■己MM*e自巳羿!IAGraBEC-tTlveCdEiDecriVE:tg詢“WEgMiiza■町CDilfi2573hQg扣撲”N口皿的1?頃*4?7U?TlSSECT.LSSi;±CMZiftZTIW2*E3?^11W6=草心gm.teT153J4”,村!曹■lVD"a^qm*時gr-a^chOiwtbWW比SS^rWthTiwthSasie-5-hGor:4Gt?tarcDEEa^^arF占「■MMCa?f--arEa-Qi-arpzE^Jzrn-EpriNziiLrjic-zRaiAlignedmR5ASearchResultsJ^A^-CHlMrVCQi[Fll5PB.E^1?1F1?NAfCICQDErEC^1TEffEWtllf-BCCdT■-標北1anMFveg-iffa?stiiwwHr^sspuqNflvtB£昕膈z>2穌臨的占Xon-RatAlignedmR5ASeaixhResults結果顯示該基因的已知序列和相關mRNA序列,點擊KnownGene中的第一個序列,出現(xiàn)包含這序列的圖解概要。為了獲得這個區(qū)域更清晰的圖像,可以點擊緊靠zoomout的1.5X按鈕,如下圖:
J^A^-CHlMrVCQi[Fll5PB.E^1?1F1?NAfCICQDErEC^1TEffEWtllf-BCCdT■G-m*B?nirPCRCMvtnEnii^ciPDF"t'tSCBiwlHeronRatXe.G-m*B?nirPCRCMvtnEnii^ciPDF"I加II場任G、睥tpoSiy中村<p印][fe蟲I竺Jr,i.LH牛:苴竺fj對于KnownGenes(已知基因)和預測的基因路徑來說,一般的慣例是以一個高的垂直線或塊狀表示每個編碼外顯子,以短的垂直線或塊狀表示5Z端和3,端非翻譯區(qū)。起連接作用的內含子以非常細的線條表示。翻譯的方向由沿著細線的箭頭指示。1【W(wǎng)I4⑶769101113山郊心EiqCmE,bdowsdpressrefreshIqaimtradzdispkyedTtarks1【W(wǎng)I4⑶769101113山郊心EiqCmE,bdowsdpressrefreshIqaimtradzdispkyedTtarkswithLetsofHaitiuiBaiaosasiically噸dispSa%'edinnusiecosapACtirndfs口ggULSSGBWgoadKd?Bns^P^sition|dm?=GoaePredictionTrarksXnoNTlRrfSrqCkpctCOMCAST[d?H"yht^HKDijutE^fSrqMG匚歹ECdens^*JM誅vSGPGe—GesiejdGeiw頗3**本例的搜尋目的來說,默認設置不是理想的設置。按照視圖利用頁面底部的TrackControls按鈕,將一些路徑設置為hide模式(即不顯示),其他設置為dense模式(所有資料密集在一條直線上);另一些路徑設置為full模式(每個特征有一個分開的線條,最多達300)。在考慮這些路徑內究竟存在那些資料之前,對這些路徑的內容和表現(xiàn)做一個簡要的討論是必要的,許多這些討論是由外界提供給UCSC的。EnsemblGenePredictions路徑由Ensembl提供。Ensembl基因通過許多方法來預測,包括與已知mRNA和蛋白質進行同源性比較。若查詢啟動子區(qū)域,我們需要將EnsemblGenes選擇為dense或full模式,點擊Refresh,即刷新,出現(xiàn)下圖:圖中多出了EnsemblGenes的預測路徑,我們在紅框中圈出。點擊用于表達該序列的任何方塊出現(xiàn)以下頁面:ChrlCul2>ipi-111iw]lq3151迎安區(qū)11口SSSCA整Chri:STSMarkersG?<pCtS?£1S27S^|g斯時GapLocationsUCSCKttownBAsedonUniFro-t>andGeitB-ankmRNfi事浚8寫。叫MarkersonGenetiWL3芝。09。|andRadiationHybridHapsOtherRefSeqIton-RatRefSeaGenesRatmRNFlsfromGenBankiiB023066BC972563l=lF120275Sp1icedESTSConserwationmousehum#nd03opossumchickenx._tropica1isrr-opica1isMethsl8%SNP5RepeatMaskerX.tropicalis<fiug.2005/xenlroS>Fi1ignmentHet???>>>>>>>>>>???>>>>>>>>>>>???>>>>>>>>>>>>>??>>>>>>>>??????>>>>>>>??>>??>>>>>>>>>?????>>>>>HumanCMar.3906/hgl?>fllsgnmentNet1IIISimpleNuc1ici*Po1wmorphistks<abSNFbuiidi£5>RepeatingElement^byRepeatMasker點擊紅框中的條形深色方塊(不是EnsemblGenes文字)HomeGenameAG*nofh0BrowserBhtG■眼SorterPCRSes&jonEnsemblGenePredictions(E>SR?<OTOGOOOD20528-EnsecnbtS5)EnsemblGeneLink:EnsemblTranscript:通赤還EasemblProteis:EN5RNO頗0000205#PcsiKonr£&】:21處70粕點1打心找B^tad:lpl2GenomicSize:311*Strand:-Alt^rnat?Name:ENSRNOGOOOOOO擔缶6CDSStart:completeCDSEnd:8晦letuLinkstosequence:Predk心Prcitcin[r?用c]fdmRNAfromgenomicsequcnce.^G?somicSegyen^/froa]assenibk在此,我們選擇并點擊Linktosequence中的GenomicSequence,即顯示基因組序列,出現(xiàn)以下窗口:Hwn*Gtiwfn”Gvncm*BsrtaTTdbl*iGavwSortutTCRS^sikmFAQHWGmViHkSequfm-t*玳Gen?GetGunatiikSequenceXearGen?Notefyou世血dpfdcf?睥DNAfiaimcrtihaa?eeMHadk&粉金m,tn-(beTable由口言址出她板o>u中世知心d虻印白眥磨Seefufuctftctric^allR^ionOplians:曰PthmetLRa史舟切KM0bom^*■'1jkLoiii回CDSEw?臼"心苴MML..國Larg■?OtoeFASTArecordperecu?OOneFA$TAr?wdpw(專曲日袖g)with§sfliaIw^s-wstmun(Si曲d9gadcnvawcam⑴□$pfeUTC血CDSjmtu4ancron林g沖FASTAKrardwN*ifVfeatWflK箱4kbegpEEngprendrfachrcm&wmrqodupVteoEHH如Ertsvomarea<S&d.theym<YXtrupraC-rd.boortfeiSeqiieak^#F<om2』tLBgOptional?Momnvpcreg.ceIIB/cte?infewfriz*心偵腔5@ease:L】Kw耐堆加比ABhpfKtcasteCAlkwsrcuewwvv+e;isvLibs+<omtrill
,Cktaik矣21&甯日上理C1t&N
在該窗口中,終于出現(xiàn)了promoter的字樣了,哈哈,快要大功告成了啊。在此我們當然要選擇它了,并將其改為2000bp(具體多少bp合適,可根據(jù)文獻資料和實驗目的獲取,有的基因可能在其上游戲幾百bpwwvv+e;isvLibs+<omtrill
,同時另外一個非常重要的就是序列顯示方式了,這里我們在SequenceFormattingOptions選項里進行選擇。我們選擇上圖紅框里的內容,即外顯子大寫,其余的小寫,也就是說mRNA的外顯子大寫,其余上下游非編碼區(qū)以及內含子均為小寫。選擇完后提交,返回如下序列頁面:>rn4_ensGsne_ENSGINOTO0000020528range=chrl:21327099-213322155ttccctgtggcttcccacatsgtttggactttaaaaaaaaaaaatcstcammgmggacagcaaasgegtgaggccaagttgcctatsatacacatgtsgctattcacataacttggaatgttctttctttaaataggaactctchgacctettetetttgaggasatgtttggaasgaacattgsataacaatgttggaaatccttcctgcactccagmgactgetcacacttccagccactcgcaccgtteBetgttgacatgtgactgcactgtbcbgcctgtggetggettbbcbbggtaattgtgtgcagatgatgcggtumgetacttgaagtggttmgetcccttcccccaccgcccctccgttaattgtccatggatggactgBaaaagttgt:mmmactggccaatttaaatggacccttttcatgttataagtetgcagtatgetgttcccccaaBetagtettegesgatatactCBcetttaacttatactcagmagcaccaactstgagmggamgccactcttgggtgtmmucagmagtbbmtgatgtagtattsggggabgcatgggatggcctagaatetetctacctmumatgggaattggacacacacacacacacacacacacacacacacacacacacacacggggggggggagggagsgagagsgsgagagagsgagagsgagmgmgmgmgmgmgmgsgmgmgmmtaaatagtscaggttctmmatgaatgcatbgtacbtgsbbcgagtccttbcbgsBBCtBBgtBgcaatgttBagsBBgmgmgmchmgattaggtacactgtttacatttaacatcaaaggcaccgactBBgcctgttctttccttgacttbBccaccctccbctagcctgcabgeestttgagtagummgmgggettcatcacttgtagacacttggmgamgtcagtmmmm甘七gettagettatagetgggttacagetbgacacabccgt11seegetttgetgtcatgtaaseamgtget11acttcaaaacagamumaactccaacagcatcgttagattatgggttttaggatssgtBBaaaaaasagcctgaacctctgtaumgccatgtttmmmatatctcaactgmacccccactggcctccttccttctgettetttettetcccaccctatgttccctgacacttaxzctseegaacacagetmt11ggtctgmacccataaacttattttcctmmmmmctccatgcccagtcattgtccttccctctctggaccttgaagacabgtccttacataaBgagggctgaaaaatctccctaggaacatgcatctttatagtcctggetttcatatcttttBgccBccabbbsseggttmtctccagtgaccaaaaatcaaacgcctgtatttcagatacBgaatttgcacatsggcattttgggcggggagggggtstttcBBatgactBtsagcBcctttetcctctcagtagsacatccamgagactmumgtcccatgaaggaaaaaaaatctaaaacagtgaaaaagaagta11111gaa111ctaggggcccgtggtatetgcctcttcagetacttgmgtcttgagaaatttttatatcagtageesgaactggtmaagcgattttta^gaagggabgattegagasataatccttgttcatgtat11ctmmgttatatttcatumggamgggtgcgamgmggmtmumgmgmmmgttttBettettggtgttgtgetggabbcbcbscgcctttttttttcttcctggccagetmmmgtgtgeesgetttttcagaeggaggsatgtggagtgtcaaggggtcbggatcbateeggtgtgmgttgatgaggcaggaaggtggggaggmatgcgmggaatgtccctgtttgtgtaggactccattcagttctttggcgageeggeegcccggagcgtataaasgeesgegeeB「「「卜『CACAGCTCTTCTCTCCAAGAAGACTCAGCCAGACCCACTCCAGCICCGAC第一個大寫字母以后就是mRNA序列,之前的小寫字母序列即為啟動子區(qū)域了。大家在做后序的甲基化分析、轉錄因子結合位點分析等便可以復制下來了。剛才我們提到第
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 小型股份企業(yè)財務制度
- 寺廟籌建財務制度
- xx醫(yī)院財務制度
- 外資代表處財務制度
- 分店財務制度
- 農(nóng)村環(huán)衛(wèi)人員評分制度
- 平臺車輛調派管理制度(3篇)
- 校園食品加工衛(wèi)生管理制度(3篇)
- 畢業(yè)活動游戲策劃方案(3篇)
- 畫室超市活動方案策劃(3篇)
- 醫(yī)院醫(yī)療糾紛案例匯報
- 重癥醫(yī)學科進修匯報
- 2025年基金會招聘筆試本科院校沖刺題庫
- 2025至2030鑄鐵產(chǎn)業(yè)行業(yè)市場深度研究及發(fā)展前景投資可行性分析報告
- 機電設備安裝工程中電梯系統(tǒng)全生命周期質量管控體系
- 2025年高校行政管理崗位招聘面試指南與模擬題
- 醫(yī)療售后服務課件
- 返修管理課件
- 2025中考九年級語文《標點符號》復習練習題
- 去極端化法治宣傳課件
- T/CCOA 7-2020低菌小麥粉
評論
0/150
提交評論