版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領
文檔簡介
1、A,1,生物信息學數(shù)據(jù)庫 核酸序列數(shù)據(jù)庫 蛋白質(zhì)序列數(shù)據(jù)庫 蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫 基因組數(shù)據(jù)庫 生物信息學數(shù)據(jù)庫的分類,A,2,生物信息學數(shù)據(jù)庫 歐洲分子生物學實驗室的EMBL http:/www.embl-heidelberg.de 美國生物技術(shù)信息中心的GenBank /Genbank/ 日本國立遺傳研究所的DDBJ http:/www.ddbj.nig.ac.jp/searches-e.html 核酸序列數(shù)據(jù)庫,A,3,GenBank數(shù)據(jù)庫結(jié)構(gòu),作用:了解序列數(shù)據(jù)庫的格式,有助于更好地提高數(shù)據(jù)庫檢索的效率和準確性。 DDBJ數(shù)據(jù)庫的內(nèi)容和格
2、式與GenBank相同,此處不作詳細介紹。 分別介紹EMBL和GenBank的數(shù)據(jù)庫結(jié)構(gòu),A,4,GenBank數(shù)據(jù)庫數(shù)據(jù)注釋(/genbank/ ),GenBank庫包含所有已知的核酸序列和蛋白質(zhì)序列, 以及與它們相關(guān)的文獻著作和生物學注釋。 NCBI可提供廣泛的數(shù)據(jù)查詢、序列相似性搜索以及其它分析服務。 數(shù)據(jù)庫 序列文件:注釋內(nèi)容文章 索引文件:檢索目錄文摘,A,5,GenBank數(shù)據(jù)庫結(jié)構(gòu),完整的 GenBank數(shù)據(jù)庫包括序列文件,索引文件以及其它有關(guān)文件。 索引文件是根據(jù)數(shù)據(jù)庫中作者、參考文獻等建立的,用于數(shù)據(jù)庫查詢。 GenPept是由GenB
3、ank中的核酸序列翻譯而得到的蛋白質(zhì)序列數(shù)據(jù)庫 數(shù)據(jù)格式為FastA。,A,6,GenBank數(shù)據(jù)庫結(jié)構(gòu),GenBank中最常用的是序列文件。 序列文件的基本單位:是序列條目,包括核苷酸堿基排列順序和注釋兩部分。 生物信息資源中心通過計算機網(wǎng)絡提供該數(shù)據(jù)庫文件。 注釋條目:文章的格式,(/genbank/,A,7,Genbank,A,8,Genbank 查找頁面,A,9,D31716,描述部分,A,10,CDs are recurring units in polypeptide chains (sequence and structure motifs
4、), the extents of which can be determined by comparative analysis. Molecular evolution uses such domains as building blocks and these may be recombined in different arrangements to make different proteins with different functions.,CD s編碼序列,含終止密碼子 polyA_signal 多聚A信號,A,11,D31716,特性表,序列本身,關(guān)鍵字,CDs are r
5、ecurring units in polypeptide chains,A,12,D31716,序列本身,A,13,A,14,序列結(jié)束,4859 bp,A,15,D31716,A,16,GenBank數(shù)據(jù)記錄,A,17,GenBank數(shù)據(jù)記錄,A,18,GenBank數(shù)據(jù)庫結(jié)構(gòu),GenBank序列文件由單個的序列條目組成。 序列條目由字段組成,每個字段由關(guān)鍵字起始,后面為該字段的具體說明。 字段分若干次子字段,以次關(guān)鍵字或特性表說明符開始。 每個序列條目以雙斜杠“/”作結(jié)束標記,A,19,GenBank數(shù)據(jù)庫結(jié)構(gòu),序列條目的格式非常重要,關(guān)鍵字從第一列開始,次關(guān)鍵字從第三列開始,特性表說明符
6、從第五列開始。 每個字段可占一行,也可以占若干行。 若一行中寫不下時,繼續(xù)行以空格開始,A,20,GenBank數(shù)據(jù)庫,物種:GenBank 庫里的數(shù)據(jù)按來源于大約100,000個物種,其中56%是人類的基因組序列(所有序列中的34%是人類的EST序列) 記錄:每條GenBank數(shù)據(jù)記錄包含對序列的簡要描述,它的科學命名,物種分類名稱,參考文獻,序列特征表,及序列本身,A,21,GenBank數(shù)據(jù)庫,序列特征表:包含對序列生物學特征注釋如:編碼區(qū)、轉(zhuǎn)錄單元、重復區(qū)域、突變位點或修飾位點等 分類:所有數(shù)據(jù)記錄被劃分為如細菌類、病毒類、靈長類、嚙齒類,以及EST數(shù)據(jù)、基因組測序數(shù)據(jù)、大規(guī)?;蚪M序
7、列數(shù)據(jù)等16類,其中EST數(shù)據(jù)等又被分成若干文件,A,22,注釋內(nèi)容,序列條目關(guān)鍵字: LOCUS (代碼), DEFINITION (說明), ACCESSION(編號), NID符(核酸標識), KEYWORDS (關(guān)鍵詞), SOURCE (數(shù)據(jù)來源), REFERENCE (文獻), FEATURES (特性表), BASE COUNT (堿基組成) ORIGIN (堿基排列順序)。 新版的核酸序列數(shù)據(jù)庫將引入新的關(guān)鍵詞SV (序列版本號),用“編號.版本號”表示,并取代關(guān)鍵詞NID,A,23,LOCUS,LOCUS (代碼):是該序列條目的標記,或者說標識符, 蘊涵這個序列的功能:如
8、HUMCYCLOX表示人的環(huán)氧化酶。 序列長度 類型 種屬來源 錄入日期等 說明字段是有關(guān)這一序列的簡單描述,A,24,ACCESSION,ACCESSION (編號):具有唯一性和永久性,在文獻中引用這個序列時,應該以此編號為準。,A,25,KEYWORDS,KEYWORDS (關(guān)鍵詞)字段:由該序列的提交者提供,包括 該序列的基因產(chǎn)物 其它相關(guān)信息,A,26,SOURCE,SOURCE (數(shù)據(jù)來源)字段:說明該序列是從什么生物體、什么組織得到的 次關(guān)鍵字ORGANISM (種屬):指出該生物體的分類學地位,A,27,REFERENCE,REFERENCE(文獻)字段:說明該序列中的相關(guān)文獻
9、,包括 AUTHORS (作者), TITLE (題目)及 JOURNAL(雜志名)等, 以次關(guān)鍵詞列出。 MEDLINE的代碼:該代碼實際上是個超文本鏈接,點擊它可以直接調(diào)用上述文獻摘要。 一個序列可有多篇文獻,以不同序號表示,并給出該序列中哪一部分與文獻有關(guān)。,A,28,FEATURES,FEATURES (特性表):具有特定的格式,用來詳細描述序列特性。 特性表中帶有/db-xref/標志的字符可以連接到其它數(shù)據(jù)庫,如分類數(shù)據(jù)庫(taxon 9606), 以及蛋白質(zhì)序列數(shù)據(jù)庫(PID:g181254)。 序列中各部分的位置都在表中標明,5非編碼區(qū),編碼區(qū),3非編碼區(qū),多聚腺苷酸重復區(qū)域等
10、。 翻譯所得信號肽以及最終蛋白質(zhì)產(chǎn)物 堿基含量字段,給出序列中的堿組成,A,29,ORIGIN,ORIGIN行是序列的引導行 下面便是堿基序列 以雙斜杠行“/”結(jié)束。,A,30,GenBank數(shù)據(jù)庫數(shù)據(jù)庫格式,FASTA格式 gi|1293613|gb|U49845.1|SCU49845 Saccharomyces cerevisiae TCP1-beta gene, partial cds; and Axl2p (AXL2) and Rev7p (REV7) genes, complete cds GATCCTCCATATACAACGGTATCTCCACCTCAGGTTTAGATCTCAAC
11、AACGGAACCATTGCCGACATGAGACAGTTAGGTATCGTCGAGAGTTACAAGCTAAAACGAGCAGTAGTCAGCTCTGCATCTGAAGCCGCTGAAGTTCTACTAAGGGTGGATAACATCATCCGTGCAAGACCAAGAACCGCCAATAGACAACATATGTAACATATTTAGGATATACCTCGAAAATAATAAACCGCCACACTGTCATTATTATAATTAGAAACAGAACGCAAAAATTATCCACTATATAATTCAAAGACGCGAAAAAAAAAGAACAACGCGTCATAGAACTTTTGGCAATTC
12、GCGTCACAAATAAATTTTGGCAACTTATGTTTCCTCTTCGAGCAGTACTCGAGCCCTGTCTCAAGAATGTAATAATACCCATCGTAGGTATGGTTAAAGATAGCATCTCCACAACCTCAAAGCTCCTTGCCGAGAGTCGCCCT (該序列沒有完全列出),A,31,GenBank數(shù)據(jù)庫數(shù)據(jù)庫格式(1),FASTA格式:將一個DNA或者蛋白質(zhì)序列表示為一個帶有一些標記的核苷酸或氨基酸字符串。 大于號()表示一個新文件的開始 結(jié)束用(/) FASTA格式并沒有什么特殊的要求。,A,32,FASTA格式序列的提交,A,33,GenBank數(shù)據(jù)庫
13、數(shù)據(jù)庫格式(1),FASTA格式特點: 只存儲了最少量的信息 它將所存儲的信息轉(zhuǎn)化為簡單的字符串 人和計算機對其存儲的信息都具有極大的可讀性 FASTA格式在許多分子生物學軟件包中得到廣泛應用。,A,34,GenBank數(shù)據(jù)庫數(shù)據(jù)庫格式(2),GenBank純文本文件格式(GenBank flatfile, GBFF): GenBank、EMBL、DDBJ每天都相互同步更新各自的數(shù)據(jù)庫,它們是怎樣交換數(shù)據(jù)的呢?,A,35,GBFF文件格式,GBFF是GenBank數(shù)據(jù)庫的基本信息單位, 是最為廣泛使用的生物信息學序列格式之一。,A,36,LOCUS SCU49845 5028 bp DNA P
14、LN 21-JUN-1999 DEFINITION Saccharomyces cerevisiae TCP1-beta gene, partial cds, and Axl2p (AXL2) and Rev7p (REV7) genes, complete cds. ACCESSION U49845 VERSION U49845.1 GI:1293613 KEYWORDS . SOURCE bakers yeast. ORGANISM Saccharomyces cerevisiae Eukaryota; Fungi; Ascomycota; Hemiascomycetes; Sacchar
15、omycetales; Saccharomycetaceae; Saccharomyces. REFERENCE 1 (bases 1 to 5028) AUTHORS Torpey,L.E., Gibbs,P.E., Nelson,J. and Lawrence,C.W. TITLE Cloning and sequence of REV7, a gene whose function is required for DNA damage-induced mutagenesis in Saccharomyces cerevisiae JOURNAL Yeast 10 (11), 1503-1
16、509 (1994) MEDLINE 95176709 REFERENCE 2 (bases 1 to 5028) AUTHORS Roemer,T., Madden,K., Chang,J. and Snyder,M. TITLE Selection of axial growth sites in yeast requires Axl2p, a novel plasma membrane glycoprotein JOURNAL Genes Dev. 10 (7), 777-793 (1996) MEDLINE 96194260 REFERENCE 3 (bases 1 to 5028)
17、AUTHORS Roemer,T. TITLE Direct Submission JOURNAL Submitted (22-FEB-1996) Terry Roemer, Biology, Yale University, New Haven, CT, USA FEATURES Location/Qualifiers source 1.5028 /organism=Saccharomyces cerevisiae /db_xref=taxon:4932 /chromosome=IX /map=9 CDS 1.206 /codon_start=3 /product=TCP1-beta /pr
18、otein_id=AAA98665.1 /db_xref=GI:1293614 /translation=SSIYNGISTSGLDLNNGTIADMRQLGIVESYKLKRAVVSSASEA AEVLLRVDNIIRARPRTANRQHM gene 687.3158 /gene=AXL2 CDS 687.3158 /gene=AXL2 /note=plasma membrane glycoprotein /codon_start=1 /function=required for axial budding pattern of S.cerevisiae /product=Axl2p /protein_id=AAA98666.1 /db_xref=GI:1293615 /translation=MTQLQISLLLTATISLLHLVVATPYEAYPIGKQYPPVARVNESF (有部分序列未列出) VDFSNKSNVNVGQVKDIHGRIPEML BASE COUNT 1510 a
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年中職第二學年(旅游服務與管理)旅游產(chǎn)品設計基礎測試題及答案
- 2025年高職(機電一體化技術(shù))傳感器應用技術(shù)綜合測試題及答案
- 行政助理職業(yè)發(fā)展指南
- 社群營銷培訓課件
- 2026四川巴中市公安局招聘警務輔助人員47人備考題庫有完整答案詳解
- 2025財達證券股份有限公司資產(chǎn)管理業(yè)務委員會招聘2人備考題庫及答案詳解一套
- 2026四川宜賓銘星中醫(yī)醫(yī)院人才招募中醫(yī)醫(yī)生、外科醫(yī)生、編碼員備考題庫有完整答案詳解
- 2026中國科學院軟件研究所天基綜合信息系統(tǒng)全國重點實驗室招聘94人備考題庫含答案詳解
- 2026浙江溫州市廣播電視監(jiān)測中心招聘編外合同制人員1人備考題庫參考答案詳解
- 2026云南大理州劍川縣文化和旅游局招聘2人備考題庫及答案詳解一套
- 2025年中小學教師正高級職稱評聘答辯試題(附答案)
- 現(xiàn)代企業(yè)管理體系架構(gòu)及運作模式
- 2025年江蘇省泰州市保安員理論考試題庫及答案(完整)
- 公司酶制劑發(fā)酵工工藝技術(shù)規(guī)程
- 2025省供銷社招聘試題與答案
- 大數(shù)據(jù)分析在供熱中的應用方案
- 污泥安全管理制度范本
- 開題報告范文基于人工智能的醫(yī)學像分析與診斷系統(tǒng)設計
- 大黃附子細辛湯課件
- 單位內(nèi)部化妝培訓大綱
- 高校行政管理流程及案例分析
評論
0/150
提交評論