生物信息學實驗.ppt_第1頁
生物信息學實驗.ppt_第2頁
生物信息學實驗.ppt_第3頁
生物信息學實驗.ppt_第4頁
生物信息學實驗.ppt_第5頁
已閱讀5頁,還剩77頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、生物信息學實驗,實習1:常用生物信息中心瀏覽及查詢 一、 實習目標: 1、了解NCBI、DDBJ、EMBL上網(wǎng)的方法自學各網(wǎng)站相關介紹。 2、了解北大生物信息學中心等幾大中文生物信息學網(wǎng)站。 3、利用NCBI的Entrenz查詢系統(tǒng)和EBI的SRS檢索文獻和核酸或蛋白質序列。 1、生物信息學網(wǎng)站瀏覽,NCBI 輸入網(wǎng)址(/),/,2)European Molecular Biology Laboratory 輸入網(wǎng)址:http:/www.ebi.ac.uk/embl/,3) DDBJ (DN

2、A Data Bank of Japan )輸入網(wǎng)址:http:/www.ddbj.nig.ac.jp/,4)北大生物信息學中心 網(wǎng)頁,2、查詢,1)Entrez (/Entrez/)查詢,(1)查詢編碼擬南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列 選擇gene 輸入arabidopsis phyE,點擊下圖1標題phytochrome E那一行,arabidopsis phyE(光敏色素E)基因位于的染色體,由網(wǎng)頁可知該基因位于擬南芥: Arabidopsis thaliana chromosome 4,(2)查詢編

3、碼擬南芥(arabidopsis)phyE(光敏色素E)基因的核酸序列,選中: nucleotide 輸入: arabidopsis phyE,點擊右下角Arabidopsis thaliana(29),點擊3標題搜索結果,由搜索結果知: 序列編號: ACCESSION : NM_117923 堿基 : 3648 bp,點擊FASTA,,huo,編碼擬南芥(arabidopsis)phyE(光敏色素E)基因mRNA的Fasta格式序列,點擊該處顯示蛋白質的編碼信息,點擊該網(wǎng)頁中的 NP-193547.4 獲得其蛋白質的序列,獲得蛋白質:LOCUS NP_193547 1112 aa linea

4、r PLN 28-MAY-2011可知氨基酸數(shù)目:1112aa,由記錄查找過程知: 該基因位于擬南芥的第四條染色體上 由3648堿基構成;編碼1112個氨基酸。 accession號是多少? arabidopsis phyEmRNA的accession號:NM_117923,(2) 查詢ID號為AAH05255的蛋白質序列并最終獲得它的Fasta格式序列,AAH05255的蛋白質,它來源于什么物種? Homo sapiens (human) 包含有多少個氨基酸? 110aa 是什么蛋白? Protein 1.110 /product=“insulin” (胰島素),由搜索結果知:Protein

5、 1.110 /product=“insulin” (胰島素),AAH05255的蛋白質的Fasta格式序列,3)查詢一篇關于phyA的查考文獻,選中: Pubmed 輸入: Arabidopsis phyA,有關phyA的一篇文獻,文獻名稱:Arabidopsisphytochrome a is modularly structured to integrate the multiple features that are required for a highly sensitized phytochrome. 作者名字:Oka Y,Ono Y,Toledo-Ortiz G,Kokaji

6、K,Matsui M,Mochizuki N,Nagatani A 雜志名稱: Plant Cell. 出版日期:2012 Jul;24(7):2949-62. Epub 2012 Jul 27.,實習二 BLAST和Fasta的使用 一、實習目標 1掌握BLAST的基本功能并可熟練使用 2了解FastA的基本功能及使用方法 1BLAST 用NCBI中的BLAST在線工具搜索與其相匹配的序列。,點擊進入NCBI的主界面,點BLAST,點擊Basic BLAST下的protein blast,瀏覽,選中文件中名為Rho文件,搜索結果如下:,BLAST結果逐條顯示,由網(wǎng)頁結構顯示:accessio

7、n NP_000530.1的序列相識度最高為100%,點擊第一條進入NP_000530.1,點擊GENE ID: 6010 RHO 獲得其序列信息,搜索的序列來自于Homo sapiens的rhodopsin(視紫紅質)相似度到達100%,實習三 基因預測Genscan 和 ORF Finder 一 實習目標: 1、掌握ORF Finder 對原核生物基因組進行基因預測。 2、能夠利用genscan進行基因預測。 3、能夠對預測的結果進行分析。 1. Genscan的使用 1.1、從NCBI下載基因序列核酸序列,保存其fasta格式到記事本(H.sapiens ENO3),NCBI下載H.sa

8、piens ENO3基因序列核酸序列,H.sapiens ENO3基因序列核酸序列其fasta格式,2.使用genscan進行基因預測:輸入網(wǎng)址: /GENSCAN.html,Organism選中: Vertebrate Print option選中: Predicted CDS and peptide 將搜索到的H.sapiens ENO3基因序列核酸序列輸入到方框內,Predict genes/exons結果輸出,起始位置、終止位置,該基因起始外顯子從1624堿基處開始,到1708堿基處結束;接著有7個中間外顯子;終止外顯子在6837堿基處結束,其后還

9、有polyA信號,中間外顯子,起始外顯子,終止外顯子,H.sapiens ENO3所編碼的蛋白質序列,H.sapiens ENO3基因的CDS,2. ORF Finder 的使用,1.到ORF Finder進行基因預測 要求:通過簡單的文字描述和圖片記錄預測過程;分析預測結果:預測出Rickettsia conorii 包含多少個長度大于300bp 的基因?列舉幾個它們在基因組中的起始終止位置?是正鏈還是負鏈?長度是多少?它們分別編碼多少個氨基酸?有無重疊基因?(提示:列表說明),輸入網(wǎng)址:/gorf/gorf.html進入以下界面:,Myc

10、oplasma capricolum 基因組核酸序列預測結果:,點擊(例子1),無重疊序列,點擊(例子2),有重疊序列,有重疊序列,點擊(例子3),Rickettsia conorii分析預測結果,預測出Rickettsia conorii 包含多少個長度大于300bp 的基因?,實習4:多重序列對位- Clustal X及蛋白質結構預測Swiss-mode 一、實習目標: 1. 掌握Clustal X的基本功能及使用 2了解Clustal X 的使用范圍及優(yōu)缺點。 3學會使用Swiss-model 做簡單的預測工作。,二、實習內容: 1.ClustalX 進行多重序列比對,從“開始”啟動“程

11、序”中的clustalx-windows-xp-2.0進入如圖多重序列比對界面,點擊“file”中的 “Load Sequences”在C盤中找到p53mRNA,序列上傳后的最初界面,還沒有進行比對,在“Aligment”中選擇“Aligment parameter”中的“multiqle Aligment parameter”查看設置參數(shù),參數(shù)界面;點擊“OK”,點擊,點擊Aligment下的“Do Complete Aligment”進行多重序列比對,點擊“OK”即可,會生成兩個文件,對比完后的“CLUSTALX”,P53-mrna對比前后,以同樣的步驟p53-protein進行多重序列比對,對比完后的“CLUSTALX”,P53-protein比對前后,六個文件,六個文件:比對文本 dnd文件,P53-mrna對比前后,P53-protein比對前后,2.進入Swiss-model網(wǎng)頁,

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論