版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、生物信息學(xué),核酸序列的一般分析,主講教師:王 莉,主要內(nèi)容:,一、基因組DNA簡介 二、序列格式轉(zhuǎn)化 三、DNA序列分析 四、序列翻譯、ORF查找 五、限制性內(nèi)切酶分析 六、引物設(shè)計 七、RNA二級結(jié)構(gòu)分析,一、基因組DNA簡介 遺傳信息存貯在4種字符組成的核酸序列中 “天書”用遺傳語言書寫的人類遺傳藍(lán)本 包含的信息量巨大 更重要的是目前人類對它了解甚少 天書中只有4個字符(堿基A、T、G、C) 既沒有段落,也沒有標(biāo)點(diǎn)符號 是一個長度為3109的一維序列。,科學(xué)家對這本天書了解最多的部分就是遺傳密碼 或者說掌握了DNA對蛋白質(zhì)編碼的規(guī)律 關(guān)于密碼子 (1)密碼子的使用是非隨機(jī)的 如果密碼子的第
2、一、第二位堿基是A、U, 那么第三位將盡可能使用G、C;反之亦然。 如果三位都用G、C,則配對容易,分解難; 三位都用A、U,則相反。 一般地說,高表達(dá)的基因,要求翻譯速度快, 要求密碼子和反密碼子配對快、分開也快。,(2)密碼子的使用有一定的統(tǒng)計規(guī)律 對同義密碼子的使用存在著偏愛 不同種屬偏愛的密碼子不同 人類基因組: 密碼子第三位取A、U的情況占90% 而第三位取G、C僅占10%,密碼子的使用偏性與基因功能、蛋白質(zhì)結(jié)構(gòu)相關(guān),(3)密碼子中的密碼 三個堿基的位置與所編碼的氨基酸性質(zhì)存在著聯(lián)系 例如: 芳香族氨基酸以U作為第一位堿基 中間位置堿基的性質(zhì)與氨基酸是親疏水性相關(guān) 疏水氨基酸的密碼子
3、,其第二位堿基是U 親水氨基酸的密碼子,其第二位堿基是A 第二位堿基是G、C的密碼子所編碼的氨基酸 親水性、疏水性居中。,人類基因組信息: 編碼區(qū)域只占1%-3% 對于非編碼序列,尚不清楚其含義或功能 非編碼區(qū)域?qū)τ谏顒泳哂兄匾囊饬x 包括內(nèi)含子、簡單重復(fù)序列、移動元件、偽基因 重復(fù)序列: 衛(wèi)星(satellite)DNA 小衛(wèi)星(mini-satellite)DNA 微衛(wèi)星(micro-satellite) 順式調(diào)控元件: 啟動子、增強(qiáng)子、沉默子,關(guān)于生物復(fù)雜性: 生物的復(fù)雜性不僅僅是基因的數(shù)目 人類基因約為30000個 線蟲有20000個基因,230000/220000=2100001
4、03000,基因組計劃帶來的希望: 實(shí)驗(yàn)數(shù)據(jù)的積累速度在迅速地增加 計算機(jī)科學(xué)和技術(shù)也在不斷地發(fā)展,單個基因組分析: 基因序列 基因功能 基因的表達(dá)調(diào)控 基因產(chǎn)物 基因多態(tài)性,比較基因組分析: 物種關(guān)系 物種進(jìn)化 物種起源,二、序列格式轉(zhuǎn)化,各種軟件為了自己的需要,通常對序列格式有一定的要求,給我們的使用帶來了一定的困難。格式轉(zhuǎn)換軟件可以將不同格式數(shù)據(jù)轉(zhuǎn)換以方便使用。很多綜合性軟件可以進(jìn)行序列格式轉(zhuǎn)換,如DNAstar,seqverter等。,常見序列格式: (1)FASTA格式(又稱Pearson格式) 是比較簡單而使用最多的序列格式。序列以號開頭,其后是單行的關(guān)于序列的描述信息,最后是序列
5、。例子: 10KD_VIGUN P18646 vigna unguiculata 10 kda protein precursor MEKKSIAGLCFLFLVLFVAQEVVVQSEAKTCENLVDTYRGPCFTTGSCDDHCKNKEHLLS,(2)Genbank格式(GenBank flatfile,GBFF) 最廣泛地用于表示生物序列的格式之一,也是DDBJ/EMBL/GenBank交換數(shù)據(jù)時采用的格式。 例如: LOCUS AB094638_1 146 bp DNA 13-APR-2006 BASE COUNT 38 a 17 c 43 g 48 t 0 others ORIG
6、IN 1 gttttaatgt gttgccttgg ttgagtggtg aagctggtta gggtagcgtg taaaacatgg 61 tgggtagatt aatgctttgt gtcaccatgc cgtttggttc gattaatgta atcataagga 121 gagaccataa gttatgaata cgcaga,(3)EBML格式 與GBFF格式的主要區(qū)別是:每行左端均有由兩個大寫字母組成的識別標(biāo)志,是GenBank識別標(biāo)志的縮寫。另外,序列的序號在右側(cè)。 (4)GCG格式:是商業(yè)性的GCG軟件包的專用格式。,最新下載 *下載后直接安裝即可,Seqverter,
7、三、DNA序列分析 基因序列 基因表達(dá)調(diào)控信息 尋找基因涉及到兩個方面的工作 : 識別與基因相關(guān)的特殊序列信號 預(yù)測基因的編碼區(qū)域 結(jié)合兩個方面的結(jié)果確定基因的位置和結(jié)構(gòu) 基因表達(dá)調(diào)控信息隱藏在基因的上游區(qū)域,在組成上具有一定的特征,可以通過序列分析識別這些特征。,1. DNA序列分析步驟,在DNA序列中,除了基因之外,還包含許多其它信息,這些信息大部分與核酸的結(jié)構(gòu)特征相關(guān)聯(lián),通常決定了DNA與蛋白質(zhì)或者DNA與RNA的相互作用。 存放這些信息的DNA片段稱為功能位點(diǎn) 如啟動子(Promoter)、基因終止序列(Terminator sequence)、剪切位點(diǎn)(Splice site)等。,
8、發(fā)現(xiàn)重復(fù)序列,數(shù)據(jù)庫搜索,分析功能位點(diǎn),序列組成統(tǒng)計分析,綜合分析,一個基本的DNA序列分析方案,2. 核苷酸關(guān)聯(lián)分析,對于一個給定的基因組,最簡單的計算就是統(tǒng)計DNA序列中各類核苷酸出現(xiàn)的頻率 對于隨機(jī)分布的DNA序列,每種核苷酸的出現(xiàn)是均勻分布的 出現(xiàn)頻率各為0.25。 而真實(shí)基因組的核苷酸分布則是非均勻的,酵母基因組核苷酸出現(xiàn)頻率,在統(tǒng)計過程中,如果同時計算DNA的正反兩條鏈,則根據(jù)堿基配對原則,A和T、C和G的出現(xiàn)頻率相同。 如果僅統(tǒng)計一條鏈,則雖然A和T、C和G的出現(xiàn)頻率不同,但是非常接近。,兩聯(lián)核苷酸頻率:,不同基因組中兩個連續(xù)核苷酸出現(xiàn)的頻率也是不相同的 4種核苷酸可以組合成16
9、種兩聯(lián)核苷酸,酵母基因組兩聯(lián)核苷酸頻率表,對酵母基因組兩聯(lián)核苷酸的統(tǒng)計結(jié)果 其中核苷酸對出現(xiàn)頻率最高的達(dá)到0.119 而出現(xiàn)頻率最低的只有0.028,三聯(lián)核苷酸基因密碼子:,在進(jìn)行編碼區(qū)域識別時,常常需要對三聯(lián)核苷酸進(jìn)行統(tǒng)計分析,這實(shí)際上是分析密碼子的使用偏性。 由于密碼子的簡并性(degeneracy),每個氨基酸至少對應(yīng)1種密碼子,最多有6種對應(yīng)的密碼子。 在基因中,同義密碼子的使用并不是完全一致的。 不同物種、不同生物體的基因密碼子使用存在著很大的差異,基因密碼子的使用與基因編碼的蛋白的結(jié)構(gòu)和功能有關(guān),與基因表達(dá)的生理功能有著密切的聯(lián)系 蛋白的三級結(jié)構(gòu)與密碼子使用概率有密切的關(guān)系 通過對
10、密碼子的聚類分析,可以很清晰地將具有不同三級結(jié)構(gòu)蛋白質(zhì)的編碼基因分成不同的類,而具有相似三級結(jié)構(gòu)蛋白的編碼基因則大致聚在同一類中,從而證明基因密碼子的使用偏性與蛋白質(zhì)三級結(jié)構(gòu)具有密切的相關(guān)性。 在不同物種中,類型相同的基因具有相近的同義密碼子使用偏性 對于同一類型的基因由物種引起的同義密碼子使用偏性的差異較小,3. 功能位點(diǎn)分析,功能位點(diǎn)(functional site) 與特定功能相關(guān)的位點(diǎn),是生物分子序列上的一個功能單元,或者是生物分子序列上一個較短的片段。 功能位點(diǎn)又稱為功能序列(functional sequence)、序列模式(motif)、信號(signal)等。 核酸序列中的功能
11、位點(diǎn)包括轉(zhuǎn)錄因子結(jié)合位點(diǎn)、轉(zhuǎn)錄剪切位點(diǎn)、翻譯起始位點(diǎn)等。 在蛋白質(zhì)序列分析中,常使用序列模式這個名詞,蛋白質(zhì)的序列模式往往與蛋白質(zhì)結(jié)構(gòu)域或者作用部位有關(guān)。,功能位點(diǎn)示意,基因組序列中若干個相鄰的功能位點(diǎn)組合形成功能區(qū)域(functional region)。 功能位點(diǎn)分析的任務(wù) 發(fā)現(xiàn)功能位點(diǎn)特征 識別功能位點(diǎn),四、序列翻譯、ORF查找,對于一條新的核酸序列,除了對數(shù)據(jù)庫進(jìn)行類似性檢索和同源性比較外,還有許多其他分析內(nèi)容。例如:計算DNA的堿基組成、檢索內(nèi)部重復(fù)序列、檢索DNA的特殊位點(diǎn)或信號、開放讀框的查找、鑒定DNA的編碼區(qū)和翻譯基因序列等。,基因編碼區(qū)是指可以由核糖體翻譯成蛋白質(zhì)的序列,它
12、的5端有轉(zhuǎn)錄和翻譯的起始位點(diǎn),3端有終止位點(diǎn)。基因的起始位點(diǎn)通常是ATG,終止位點(diǎn)為TAA、TAG、TGA。 一個起始和終止密碼子之間的序列稱為一個開放閱讀框(Open Reading Frame,簡稱ORF),它是一個潛在的蛋白質(zhì)編碼區(qū)。,對于任何給定的核酸序列(單鏈DNA或mRNA),根據(jù)密碼子的起始位置,可以按照三種方式進(jìn)行閱讀。 例如,序列ATTCGATCGCAA 這三種閱讀順序稱為閱讀框(reading frames),CAA,A,ATT,CGA,TCG,A,TTC,GAT,CGC,AA,TCG,ATC,GCA,(1),(3),(2),AT,基因可變剪切示意圖,gene A,基因可變
13、剪切示意圖,序列翻譯、ORF查找,1. Generunner 2. 在線的ORF finder /gorf/gorf.html,功能: 序列編輯與類似序列查找、建立自己的序列數(shù)據(jù)庫進(jìn)行查找、序列比較、序列翻譯、蛋白序列分析等,還包括DNA分析常用到的一些功能,如堿基百分組成、分子量計算等。,Generunner,/gorf/gorf.html,ORF finder,輸入序列 在Enter GI or ACCESSION 后面的框中輸入公共序列的gi號或ACCESSION號 在or seque
14、nce in FASTA format 后面的框中輸入完整的序列 設(shè)置序列范圍 在FROM: TO: 后面的框中輸入進(jìn)行ORF查找的序列范圍 Genetic codes 可以選擇采用何種遺傳編碼 按OrfFind 按鈕即可執(zhí)行,限制性內(nèi)切酶是在許多細(xì)菌體內(nèi)發(fā)現(xiàn)的能識別和切割外源DNA的核酸酶。細(xì)菌自身的DNA因其限制型內(nèi)切酶的識別位點(diǎn)被相應(yīng)的DNA甲基化酶所甲基化,而不被內(nèi)切酶所水解。限制型內(nèi)切酶的這種作用使之成為遺傳工程實(shí)驗(yàn)的重要工具酶之一。,五、限制性內(nèi)切酶分析,每一種限制性內(nèi)切酶都有特定的DNA識別順序,并且呈回文排列。確定DNA酶切位點(diǎn)是基因操作的必不可少的步驟,因此DNA序列分析軟件
15、包大多整合有檢索酶切位點(diǎn)的程序。這些程序附帶一個酶切位點(diǎn)的數(shù)據(jù)庫文件,根據(jù)這個文件對序列作酶切位點(diǎn)的查找。,RESTRICTION ANALYSIS DNAssist 1.02 DFW 2.21 Generunner 下載地址: /dna.html,限制性內(nèi)切酶分析常用軟件,Dnastar,序列格式轉(zhuǎn)換 限制性內(nèi)切酶分析 序列拼接,下載網(wǎng)址:,從原理來說,引物的設(shè)計和分析并不是DNA序列分析的一個基本方法,但是在分子生物學(xué)研究中常常需要用到。我們主要介紹針對PCR的引物設(shè)計。,六、引物設(shè)計,引物設(shè)計的標(biāo)準(zhǔn)有: 引物的長度通常為20-30個堿基
16、引物避免有發(fā)卡結(jié)構(gòu) 引物避免有彼此之間的互補(bǔ)配對 兩個引物之間避免有類似序列,引物與核酸序列數(shù)據(jù)庫的其他序列無明顯類似 引物5端能加上合適的酶切位點(diǎn) 引物組成均勻,避免含有相同堿基的多聚體,兩個引物的GC含量近似,可見,引物設(shè)計包含序列組成的計算、序列對DNA序列數(shù)據(jù)庫的類似性檢索、兩個序列的比較、堿基互補(bǔ)配對和發(fā)卡結(jié)構(gòu)分析以及酶切位點(diǎn)檢索等基本的DNA序列分析過程。事實(shí)上,許多PCR引物設(shè)計程序會略過或簡化上述的某些過程。,Primer Premier 5.0,下載 安裝 執(zhí)行安裝程序即可 *下載的為demo版,只能對它的示例序列進(jìn)行操作 在C盤下找到WIN.INI,將vspace=DU改為
17、vspace=PU便可以使用全部功能。,功能 可以簡單地通過手動拖動鼠標(biāo)以擴(kuò)增出相應(yīng)片段所需的引物,而在手動的任何時候,下面顯示各種參數(shù)的改變和可能的二聚體、異二聚體、發(fā)夾結(jié)構(gòu)等。也可以給定條件,讓軟件自動搜索引物,并將引物分析結(jié)果顯示出來。而且進(jìn)行這些操作非常簡單。,Primer Premier 5.0,其他引物設(shè)計軟件:,Primer3 /genome_software/other/primer3.html DNAClub http:/www.bio-,引物長度20-30個,最好不要超過30個; Tm=(A+T)X 2+(G+C)X 4
18、,退火溫度為Tm-7 G+C%=40-60% 5、3 引物退火溫度最好相等; 四個相同的堿基相連最好不要出現(xiàn); 引物的最后一個避免為T。,實(shí)際引物設(shè)計采用的幾條原則,無論是mRNA、rRNA還是tRNA,它們的功能最終是由它們的折疊結(jié)構(gòu)來決定的,盡管這種折疊的結(jié)構(gòu)依賴于它的序列,但是它不僅僅由序列來確定。當(dāng)前準(zhǔn)確測定RNA折疊結(jié)構(gòu)還有賴于X射線衍射技術(shù),但是很難獲得RNA分子晶體,所以測定的結(jié)構(gòu)非常少。因此,人們希望能通過RNA的序列來預(yù)測其結(jié)構(gòu),首先是二級結(jié)構(gòu)。,七、RNA二級結(jié)構(gòu)分析,RNA分子通過分子內(nèi)的堿基配對而折疊,堿基對的氫鍵以及它們形成的局部螺旋的堆積力起著穩(wěn)定的作用,即降低折疊結(jié)構(gòu)的自由能。RNA中能形成的堿基對包括GC,AU、GU,他們分別有3個,2個,和一個氫鍵。分子的螺旋區(qū)形成莖(stem),那些不構(gòu)成互補(bǔ)配對的單鏈堿基形成環(huán)(loop)。因此,預(yù)測
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 醫(yī)院臨床藥房禮儀與藥品服務(wù)
- 醫(yī)院護(hù)理禮儀與溝通
- 2026年保定職業(yè)技術(shù)學(xué)院高職單招職業(yè)適應(yīng)性考試備考題庫有答案解析
- 護(hù)理學(xué)科交叉融合與挑戰(zhàn)
- 醫(yī)院檔案管理員檔案管理禮儀
- 護(hù)理崗位禮儀規(guī)范與實(shí)施
- 眼科疾病微創(chuàng)手術(shù)技術(shù)解析
- 2026年菏澤醫(yī)學(xué)??茖W(xué)校高職單招職業(yè)適應(yīng)性測試模擬試題有答案解析
- 臨床檢驗(yàn)技術(shù)培訓(xùn)與規(guī)范
- 護(hù)理專業(yè)學(xué)生的臨床實(shí)習(xí)管理與評價
- 當(dāng)兵心理測試試題及答案
- 2025年湖南省公務(wù)員錄用考試《行測》試題及答案解析
- 影視產(chǎn)業(yè)國際化發(fā)展路徑-洞察及研究
- 2025年電氣工程師專業(yè)基礎(chǔ)《供配電》真題及答案
- 國開2025年《行政領(lǐng)導(dǎo)學(xué)》形考作業(yè)1-4答案
- 2025年物理天津會考試題及答案
- 2025年國家開放大學(xué)《數(shù)據(jù)分析與統(tǒng)計學(xué)基礎(chǔ)》期末考試備考試題及答案解析
- 吊水魚專業(yè)知識培訓(xùn)內(nèi)容課件
- 汽車產(chǎn)業(yè)自動駕駛政策法規(guī)2025年研究報告
- 口岸安全聯(lián)合防控工作制度
- 水處理設(shè)備維護(hù)課件
評論
0/150
提交評論