第二章 生物數(shù)據(jù)庫(kù)介紹_第1頁(yè)
第二章 生物數(shù)據(jù)庫(kù)介紹_第2頁(yè)
第二章 生物數(shù)據(jù)庫(kù)介紹_第3頁(yè)
第二章 生物數(shù)據(jù)庫(kù)介紹_第4頁(yè)
第二章 生物數(shù)據(jù)庫(kù)介紹_第5頁(yè)
已閱讀5頁(yè),還剩44頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、第二章第二章 生物數(shù)據(jù)庫(kù)介紹生物數(shù)據(jù)庫(kù)介紹生物分子數(shù)生物分子數(shù)據(jù)高速增長(zhǎng)據(jù)高速增長(zhǎng)分子生物學(xué)及相關(guān)領(lǐng)分子生物學(xué)及相關(guān)領(lǐng)域研究人員迅速獲得域研究人員迅速獲得最新實(shí)驗(yàn)數(shù)據(jù)最新實(shí)驗(yàn)數(shù)據(jù)建立生物分子數(shù)據(jù)庫(kù)建立生物分子數(shù)據(jù)庫(kù)n生物信息數(shù)據(jù)庫(kù)特征生物信息數(shù)據(jù)庫(kù)特征n數(shù)據(jù)庫(kù)的更新速度不斷加快,數(shù)據(jù)量呈指數(shù)增長(zhǎng)數(shù)據(jù)庫(kù)的更新速度不斷加快,數(shù)據(jù)量呈指數(shù)增長(zhǎng)趨勢(shì)趨勢(shì)n數(shù)據(jù)庫(kù)使用頻率增長(zhǎng)更快數(shù)據(jù)庫(kù)使用頻率增長(zhǎng)更快n數(shù)據(jù)庫(kù)的復(fù)雜程度不斷增加數(shù)據(jù)庫(kù)的復(fù)雜程度不斷增加n數(shù)據(jù)庫(kù)網(wǎng)絡(luò)化數(shù)據(jù)庫(kù)網(wǎng)絡(luò)化n面向應(yīng)用面向應(yīng)用n先進(jìn)的軟硬件配置先進(jìn)的軟硬件配置n分子生物信息數(shù)據(jù)庫(kù)分類(lèi)分子生物信息數(shù)據(jù)庫(kù)分類(lèi)n序列數(shù)據(jù)庫(kù)序列數(shù)據(jù)庫(kù)n核酸序列數(shù)

2、據(jù)庫(kù)核酸序列數(shù)據(jù)庫(kù)n蛋白質(zhì)序列數(shù)據(jù)庫(kù)蛋白質(zhì)序列數(shù)據(jù)庫(kù)n基因組數(shù)據(jù)庫(kù)基因組數(shù)據(jù)庫(kù)n結(jié)構(gòu)數(shù)據(jù)庫(kù):主要指蛋白質(zhì)三維空間結(jié)構(gòu)數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù):主要指蛋白質(zhì)三維空間結(jié)構(gòu)數(shù)據(jù)庫(kù)n功能數(shù)據(jù)庫(kù):主要指蛋白質(zhì)和核酸功能注釋的數(shù)據(jù)庫(kù)功能數(shù)據(jù)庫(kù):主要指蛋白質(zhì)和核酸功能注釋的數(shù)據(jù)庫(kù)n由上述由上述3類(lèi)數(shù)據(jù)庫(kù)和文獻(xiàn)資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫(kù)類(lèi)數(shù)據(jù)庫(kù)和文獻(xiàn)資料為基礎(chǔ)構(gòu)建的二次數(shù)據(jù)庫(kù)n序列數(shù)據(jù)庫(kù)來(lái)自序列測(cè)定,基因組數(shù)據(jù)庫(kù)來(lái)自基序列數(shù)據(jù)庫(kù)來(lái)自序列測(cè)定,基因組數(shù)據(jù)庫(kù)來(lái)自基因組作圖,結(jié)構(gòu)數(shù)據(jù)庫(kù)來(lái)自因組作圖,結(jié)構(gòu)數(shù)據(jù)庫(kù)來(lái)自X射線(xiàn)衍射和核磁共射線(xiàn)衍射和核磁共振等結(jié)構(gòu)測(cè)定。這些數(shù)據(jù)庫(kù)是分子生物學(xué)的基本振等結(jié)構(gòu)測(cè)定。這些數(shù)據(jù)庫(kù)是分子生物學(xué)

3、的基本數(shù)據(jù)資源,稱(chēng)為基本數(shù)據(jù)庫(kù)、初始數(shù)據(jù)庫(kù),也稱(chēng)數(shù)據(jù)資源,稱(chēng)為基本數(shù)據(jù)庫(kù)、初始數(shù)據(jù)庫(kù),也稱(chēng)一次數(shù)據(jù)庫(kù)一次數(shù)據(jù)庫(kù)n一次數(shù)據(jù)庫(kù)中的數(shù)據(jù)直接來(lái)源于實(shí)驗(yàn)獲得的原始一次數(shù)據(jù)庫(kù)中的數(shù)據(jù)直接來(lái)源于實(shí)驗(yàn)獲得的原始數(shù)據(jù),只經(jīng)過(guò)簡(jiǎn)單的歸類(lèi)整理和注釋數(shù)據(jù),只經(jīng)過(guò)簡(jiǎn)單的歸類(lèi)整理和注釋n根據(jù)生命科學(xué)不同研究領(lǐng)域的實(shí)際需要,對(duì)基因根據(jù)生命科學(xué)不同研究領(lǐng)域的實(shí)際需要,對(duì)基因組圖譜、核酸和蛋白質(zhì)序列、蛋白質(zhì)結(jié)構(gòu)以及文組圖譜、核酸和蛋白質(zhì)序列、蛋白質(zhì)結(jié)構(gòu)以及文獻(xiàn)等數(shù)據(jù)進(jìn)行分析、整理、歸納、注釋?zhuān)瑯?gòu)建出獻(xiàn)等數(shù)據(jù)進(jìn)行分析、整理、歸納、注釋?zhuān)瑯?gòu)建出具有特殊生物學(xué)意義和專(zhuān)門(mén)用途數(shù)據(jù)庫(kù)稱(chēng)為具有特殊生物學(xué)意義和專(zhuān)門(mén)用途數(shù)據(jù)庫(kù)稱(chēng)為二次二次數(shù)

4、據(jù)庫(kù)數(shù)據(jù)庫(kù)n二次數(shù)據(jù)庫(kù)是對(duì)原始生物分子數(shù)據(jù)進(jìn)行整理、分二次數(shù)據(jù)庫(kù)是對(duì)原始生物分子數(shù)據(jù)進(jìn)行整理、分類(lèi)的結(jié)果,是在一級(jí)數(shù)據(jù)庫(kù)、實(shí)驗(yàn)數(shù)據(jù)和理論分類(lèi)的結(jié)果,是在一級(jí)數(shù)據(jù)庫(kù)、實(shí)驗(yàn)數(shù)據(jù)和理論分析的基礎(chǔ)上針對(duì)特定的應(yīng)用目標(biāo)而建立的析的基礎(chǔ)上針對(duì)特定的應(yīng)用目標(biāo)而建立的n一次數(shù)據(jù)庫(kù)的數(shù)據(jù)量大,更新速度快,用戶(hù)面廣,一次數(shù)據(jù)庫(kù)的數(shù)據(jù)量大,更新速度快,用戶(hù)面廣,通常需要高性能的計(jì)算機(jī)服務(wù)器、大容量的磁盤(pán)通常需要高性能的計(jì)算機(jī)服務(wù)器、大容量的磁盤(pán)空間和專(zhuān)門(mén)的數(shù)據(jù)庫(kù)管理系統(tǒng)支撐;空間和專(zhuān)門(mén)的數(shù)據(jù)庫(kù)管理系統(tǒng)支撐;n二次數(shù)據(jù)庫(kù)的容量則小得多,更新速度也不像一二次數(shù)據(jù)庫(kù)的容量則小得多,更新速度也不像一次數(shù)據(jù)庫(kù)那樣快,也可以不

5、用大型商業(yè)數(shù)據(jù)庫(kù)軟次數(shù)據(jù)庫(kù)那樣快,也可以不用大型商業(yè)數(shù)據(jù)庫(kù)軟件支持,這類(lèi)針對(duì)不同問(wèn)題開(kāi)發(fā)的二次數(shù)據(jù)庫(kù)的件支持,這類(lèi)針對(duì)不同問(wèn)題開(kāi)發(fā)的二次數(shù)據(jù)庫(kù)的最大特點(diǎn)是使用方便,特別適用于計(jì)算機(jī)使用經(jīng)最大特點(diǎn)是使用方便,特別適用于計(jì)算機(jī)使用經(jīng)驗(yàn)不太豐富的生物學(xué)家驗(yàn)不太豐富的生物學(xué)家序列數(shù)據(jù)庫(kù)序列數(shù)據(jù)庫(kù)n核酸序列數(shù)據(jù)庫(kù)核酸序列數(shù)據(jù)庫(kù)n國(guó)際上權(quán)威的核酸序列數(shù)據(jù)庫(kù)國(guó)際上權(quán)威的核酸序列數(shù)據(jù)庫(kù)n歐洲分子生物學(xué)實(shí)驗(yàn)室的歐洲分子生物學(xué)實(shí)驗(yàn)室的EMBLnhttp:/www.embl-heidelberg.de/n美國(guó)生物技術(shù)信息中心的美國(guó)生物技術(shù)信息中心的GenBankn

6、/Web/Genbank/index.htmln日本遺傳研究所的日本遺傳研究所的DDBJnhttp:/www.ddbj.nig.ac.jp/n目前,這三個(gè)數(shù)據(jù)庫(kù)已建立數(shù)據(jù)交換協(xié)議,每日目前,這三個(gè)數(shù)據(jù)庫(kù)已建立數(shù)據(jù)交換協(xié)議,每日同時(shí)更新核酸序列資料,對(duì)用戶(hù)而言,在任意一同時(shí)更新核酸序列資料,對(duì)用戶(hù)而言,在任意一個(gè)數(shù)據(jù)庫(kù)中查詢(xún)數(shù)據(jù)或向任意一個(gè)數(shù)據(jù)庫(kù)中投送個(gè)數(shù)據(jù)庫(kù)中查詢(xún)數(shù)據(jù)或向任意一個(gè)數(shù)據(jù)庫(kù)中投送數(shù)據(jù)基本上是等價(jià)的,對(duì)于特定的查詢(xún),三個(gè)數(shù)數(shù)據(jù)基本上是等價(jià)的,對(duì)于特定的查詢(xún),三個(gè)數(shù)據(jù)庫(kù)的響應(yīng)結(jié)果一樣據(jù)庫(kù)的響應(yīng)結(jié)果一樣n 三個(gè)數(shù)據(jù)庫(kù)相互合作,三個(gè)數(shù)據(jù)庫(kù)相互合作,數(shù)據(jù)庫(kù)中數(shù)據(jù)基本一致數(shù)據(jù)庫(kù)中數(shù)據(jù)基本一致n

7、GenBankn美國(guó)核酸數(shù)據(jù)庫(kù)美國(guó)核酸數(shù)據(jù)庫(kù)n全稱(chēng):全稱(chēng):GenBank Genetic Sequence data Bankn美國(guó)國(guó)立衛(wèi)生研究院維護(hù)的基因序列數(shù)據(jù)庫(kù),美國(guó)國(guó)立衛(wèi)生研究院維護(hù)的基因序列數(shù)據(jù)庫(kù),匯集并注釋了所有公開(kāi)的核酸序列,由位于馬匯集并注釋了所有公開(kāi)的核酸序列,由位于馬里蘭州里蘭州Bethesda的美國(guó)國(guó)立衛(wèi)生研究院下屬?lài)?guó)的美國(guó)國(guó)立衛(wèi)生研究院下屬?lài)?guó)立生物技術(shù)信息中心建立立生物技術(shù)信息中心建立n從從1979年開(kāi)始建設(shè),年開(kāi)始建設(shè),1982年正式運(yùn)行年正式運(yùn)行nGenBank數(shù)據(jù)庫(kù)包含了所有已知的核酸序列數(shù)據(jù)庫(kù)包含了所有已知的核酸序列和蛋白質(zhì)序列,以及與它們相關(guān)的文獻(xiàn)著和蛋白質(zhì)序

8、列,以及與它們相關(guān)的文獻(xiàn)著作和生物學(xué)解釋作和生物學(xué)解釋n主要目標(biāo):收集世界范圍內(nèi)已發(fā)表和自行主要目標(biāo):收集世界范圍內(nèi)已發(fā)表和自行投送的核苷酸序列以及相關(guān)的文獻(xiàn)資料,投送的核苷酸序列以及相關(guān)的文獻(xiàn)資料,為大規(guī)模的核苷酸序列數(shù)據(jù)建立檔案為大規(guī)模的核苷酸序列數(shù)據(jù)建立檔案nNCBI:National Center for Biotechnology Information,美國(guó)國(guó)家生物技術(shù)信息中心美國(guó)國(guó)家生物技術(shù)信息中心n為儲(chǔ)存和分析分子生物學(xué)、生物化學(xué)、遺傳學(xué)知識(shí)創(chuàng)為儲(chǔ)存和分析分子生物學(xué)、生物化學(xué)、遺傳學(xué)知識(shí)創(chuàng)建自動(dòng)化系統(tǒng);建自動(dòng)化系統(tǒng);n從事研究基于計(jì)算機(jī)的信息處理過(guò)程的高級(jí)方法,用從事研究基于計(jì)

9、算機(jī)的信息處理過(guò)程的高級(jí)方法,用于分析生物學(xué)上重要的分子和化合物的結(jié)構(gòu)與功能;于分析生物學(xué)上重要的分子和化合物的結(jié)構(gòu)與功能;n促進(jìn)生物學(xué)研究人員和醫(yī)護(hù)人員應(yīng)用數(shù)據(jù)庫(kù)和軟件;促進(jìn)生物學(xué)研究人員和醫(yī)護(hù)人員應(yīng)用數(shù)據(jù)庫(kù)和軟件; n努力協(xié)作以獲取世界范圍內(nèi)的生物技術(shù)信息努力協(xié)作以獲取世界范圍內(nèi)的生物技術(shù)信息 nNCBI的主要服務(wù)功能的主要服務(wù)功能nPubMed:美國(guó)國(guó)家圖書(shū)館的一項(xiàng)服務(wù),包括美國(guó)國(guó)家圖書(shū)館的一項(xiàng)服務(wù),包括1950年以年以來(lái)生物醫(yī)學(xué)所有文獻(xiàn)記錄,同時(shí)提供文獻(xiàn)全文相關(guān)鏈接來(lái)生物醫(yī)學(xué)所有文獻(xiàn)記錄,同時(shí)提供文獻(xiàn)全文相關(guān)鏈接nEntrez:數(shù)據(jù)庫(kù)查詢(xún)和檢索系統(tǒng),提供各種核酸序列、數(shù)據(jù)庫(kù)查詢(xún)和檢索系

10、統(tǒng),提供各種核酸序列、蛋白質(zhì)序列、基因組數(shù)據(jù)及各種文獻(xiàn)數(shù)據(jù)庫(kù)的檢索,可蛋白質(zhì)序列、基因組數(shù)據(jù)及各種文獻(xiàn)數(shù)據(jù)庫(kù)的檢索,可設(shè)定多種搜索條件,默認(rèn)方式為設(shè)定多種搜索條件,默認(rèn)方式為“與與”nBLAST:最基本的局部序列比對(duì)排列搜索工具,是常用最基本的局部序列比對(duì)排列搜索工具,是常用的序列相似性查詢(xún)工具,主要包括核酸序列的比對(duì),蛋的序列相似性查詢(xún)工具,主要包括核酸序列的比對(duì),蛋白質(zhì)序列的比對(duì)等白質(zhì)序列的比對(duì)等nOMIM:關(guān)于人類(lèi)基因和遺傳疾病的分類(lèi)數(shù)據(jù)庫(kù),收集關(guān)于人類(lèi)基因和遺傳疾病的分類(lèi)數(shù)據(jù)庫(kù),收集了已知的人類(lèi)基因以及由于這些基因突變而導(dǎo)致的遺傳了已知的人類(lèi)基因以及由于這些基因突變而導(dǎo)致的遺傳疾病疾病

11、nGenBank介紹介紹n是最早的是最早的DNA序列數(shù)據(jù)庫(kù),對(duì)每個(gè)序列,相關(guān)數(shù)序列數(shù)據(jù)庫(kù),對(duì)每個(gè)序列,相關(guān)數(shù)據(jù)包括序列名稱(chēng)、序列、位點(diǎn)、關(guān)鍵字、來(lái)源、據(jù)包括序列名稱(chēng)、序列、位點(diǎn)、關(guān)鍵字、來(lái)源、生物種類(lèi)、參考文獻(xiàn)、注釋等生物種類(lèi)、參考文獻(xiàn)、注釋等n最常用的是序列文件,序列文件基本單位為序最常用的是序列文件,序列文件基本單位為序列條目,包括核苷酸堿基排列順序和注釋兩部列條目,包括核苷酸堿基排列順序和注釋兩部分分nLOCUS:給出序列條目的名稱(chēng),也稱(chēng)為標(biāo)識(shí)符,包括序列給出序列條目的名稱(chēng),也稱(chēng)為標(biāo)識(shí)符,包括序列長(zhǎng)度,類(lèi)型等長(zhǎng)度,類(lèi)型等nDEFINITION:給出該序列的功能給出該序列的功能nACCES

12、SION :序列編號(hào),具有唯一性和永久性序列編號(hào),具有唯一性和永久性nKEYWORDS :關(guān)鍵字字段,由序列提交這提供,包括序列關(guān)鍵字字段,由序列提交這提供,包括序列的基因產(chǎn)物及其他相關(guān)信息(如何得到,從何處得到等)的基因產(chǎn)物及其他相關(guān)信息(如何得到,從何處得到等)nREFERENCE:參考文獻(xiàn)字段,包括參考文獻(xiàn)字段,包括AUTHORS,TITLE,JOURNAL,PUBMEDnFEATURES:序列特性表,詳細(xì)描述序列的特性序列特性表,詳細(xì)描述序列的特性nORIGIN :堿基序列字段,給出序列中的堿基組成,以堿基序列字段,給出序列中的堿基組成,以/結(jié)束結(jié)束nEMBL(The European

13、 Molecular Biology Laboratory):歐洲分子生物學(xué)實(shí)驗(yàn)室歐洲分子生物學(xué)實(shí)驗(yàn)室n1974年由歐洲年由歐洲14個(gè)國(guó)家加上亞洲的以色列共同發(fā)起建個(gè)國(guó)家加上亞洲的以色列共同發(fā)起建立,現(xiàn)在由歐洲立,現(xiàn)在由歐洲30個(gè)成員國(guó)政府支持組成個(gè)成員國(guó)政府支持組成n目的在于促進(jìn)歐洲國(guó)家之間的合作來(lái)發(fā)展分子生物學(xué)的目的在于促進(jìn)歐洲國(guó)家之間的合作來(lái)發(fā)展分子生物學(xué)的基礎(chǔ)研究和改進(jìn)儀器設(shè)備、教育工作等基礎(chǔ)研究和改進(jìn)儀器設(shè)備、教育工作等n目前已發(fā)展成歐洲最重要和最核心的目前已發(fā)展成歐洲最重要和最核心的分子生物學(xué)分子生物學(xué)基礎(chǔ)研基礎(chǔ)研究和教育培訓(xùn)機(jī)構(gòu)究和教育培訓(xùn)機(jī)構(gòu)nEMBL數(shù)據(jù)庫(kù)基本單位:序列條目,

14、包括核苷酸堿數(shù)據(jù)庫(kù)基本單位:序列條目,包括核苷酸堿基排列順序和注釋基排列順序和注釋nID:序列名稱(chēng)序列名稱(chēng)nDE:序列簡(jiǎn)單說(shuō)明序列簡(jiǎn)單說(shuō)明nAC:序列編號(hào)序列編號(hào)nSV:序列版本號(hào)序列版本號(hào)nKW:與序列相關(guān)的關(guān)鍵詞與序列相關(guān)的關(guān)鍵詞nOS:序列來(lái)源的物種名序列來(lái)源的物種名nOC:序列來(lái)源的物種學(xué)名和分類(lèi)學(xué)位置序列來(lái)源的物種學(xué)名和分類(lèi)學(xué)位置nRN:相關(guān)文獻(xiàn)編號(hào)或遞交序列的注冊(cè)信息相關(guān)文獻(xiàn)編號(hào)或遞交序列的注冊(cè)信息nRA:相關(guān)文獻(xiàn)作者或遞交序列的作者相關(guān)文獻(xiàn)作者或遞交序列的作者nRT:相關(guān)文獻(xiàn)題目相關(guān)文獻(xiàn)題目nRL:相關(guān)文獻(xiàn)雜志名或遞交序列的作者單位相關(guān)文獻(xiàn)雜志名或遞交序列的作者單位nRX :相關(guān)

15、文獻(xiàn)相關(guān)文獻(xiàn)Mediline引文代碼引文代碼nRC :相關(guān)文獻(xiàn)注釋相關(guān)文獻(xiàn)注釋nRP :相關(guān)文獻(xiàn)其他注釋相關(guān)文獻(xiàn)其他注釋nCC :關(guān)于序列的注釋信息關(guān)于序列的注釋信息nDR :相關(guān)數(shù)據(jù)庫(kù)交叉引用號(hào)相關(guān)數(shù)據(jù)庫(kù)交叉引用號(hào)nFH :序列特征表起始序列特征表起始nFT :序列特征表子項(xiàng)序列特征表子項(xiàng)nSQ :堿基種類(lèi)統(tǒng)計(jì)數(shù)堿基種類(lèi)統(tǒng)計(jì)數(shù)nDDBJ (DNA Data Bank of Japan),日本日本DNA數(shù)據(jù)數(shù)據(jù)庫(kù),于庫(kù),于1984年建立年建立n主要向研究者收集主要向研究者收集DNA序列信息并賦予其數(shù)據(jù)存序列信息并賦予其數(shù)據(jù)存取號(hào),信息來(lái)源主要是日本的研究機(jī)構(gòu),亦接受取號(hào),信息來(lái)源主要是日本的研

16、究機(jī)構(gòu),亦接受其他國(guó)家呈遞的序列其他國(guó)家呈遞的序列n數(shù)據(jù)庫(kù)通過(guò)數(shù)據(jù)庫(kù)通過(guò)WWW環(huán)球網(wǎng),匿名環(huán)球網(wǎng),匿名FTP,e-mail或或Gopher方式為廣大研究人員服務(wù)。方式為廣大研究人員服務(wù)。 n蛋白質(zhì)序列數(shù)據(jù)庫(kù)蛋白質(zhì)序列數(shù)據(jù)庫(kù)nGenBanknSWISS-PROTnhttp:/www.ebi.ac.uk/swissprot/ nPIRn/ nSWISS-PROT:是經(jīng)過(guò)注釋的蛋白質(zhì)序列數(shù)據(jù)庫(kù),也是注釋最齊是經(jīng)過(guò)注釋的蛋白質(zhì)序列數(shù)據(jù)庫(kù),也是注釋最齊全的蛋白序列數(shù)據(jù)庫(kù),建立于全的蛋白序列數(shù)據(jù)庫(kù),建立于1986年,年,1987年起由日內(nèi)瓦大學(xué)年起由日內(nèi)瓦大

17、學(xué)(University of Geneva)醫(yī)學(xué)生物化學(xué)系和醫(yī)學(xué)生物化學(xué)系和 EMBL 數(shù)據(jù)館數(shù)據(jù)館(現(xiàn)在的現(xiàn)在的歐洲生物信息研究所歐洲生物信息研究所EBI)共同維護(hù)共同維護(hù)n數(shù)據(jù)庫(kù)由蛋白質(zhì)序列條目構(gòu)成,每個(gè)條目包含蛋白質(zhì)序列、引用數(shù)據(jù)庫(kù)由蛋白質(zhì)序列條目構(gòu)成,每個(gè)條目包含蛋白質(zhì)序列、引用文獻(xiàn)信息、分類(lèi)學(xué)信息、注釋等,注釋中包括蛋白質(zhì)的功能、轉(zhuǎn)文獻(xiàn)信息、分類(lèi)學(xué)信息、注釋等,注釋中包括蛋白質(zhì)的功能、轉(zhuǎn)錄后修飾、特殊位點(diǎn)和區(qū)域、二級(jí)結(jié)構(gòu)、四級(jí)結(jié)構(gòu)、與其它序列錄后修飾、特殊位點(diǎn)和區(qū)域、二級(jí)結(jié)構(gòu)、四級(jí)結(jié)構(gòu)、與其它序列的相似性、序列殘缺與疾病的關(guān)系、序列變異體和沖突等信息的相似性、序列殘缺與疾病的關(guān)系、

18、序列變異體和沖突等信息nSWISS-PROT中盡可能減少了冗余序列,并與其它中盡可能減少了冗余序列,并與其它30多個(gè)數(shù)據(jù)建多個(gè)數(shù)據(jù)建立了交叉引用,其中包括核酸序列庫(kù)、蛋白質(zhì)序列庫(kù)和蛋白質(zhì)結(jié)立了交叉引用,其中包括核酸序列庫(kù)、蛋白質(zhì)序列庫(kù)和蛋白質(zhì)結(jié)構(gòu)庫(kù)等。利用序列提取系統(tǒng)構(gòu)庫(kù)等。利用序列提取系統(tǒng)(SRS)可以方便地檢索可以方便地檢索SWISS-PROT和其它和其它EBI的數(shù)據(jù)庫(kù)。的數(shù)據(jù)庫(kù)。SWISS-PROT只接受直接測(cè)序獲得的蛋白只接受直接測(cè)序獲得的蛋白質(zhì)序列,序列提交可以在其質(zhì)序列,序列提交可以在其Web頁(yè)面上完成頁(yè)面上完成nPIR(Protein Information resouce):是

19、一個(gè)集是一個(gè)集成了關(guān)于蛋白質(zhì)功能預(yù)測(cè)數(shù)據(jù)的公共資源的數(shù)據(jù)成了關(guān)于蛋白質(zhì)功能預(yù)測(cè)數(shù)據(jù)的公共資源的數(shù)據(jù)庫(kù),目的是支持基因組庫(kù),目的是支持基因組/蛋白質(zhì)組研究蛋白質(zhì)組研究n其出現(xiàn)先于核酸數(shù)據(jù)庫(kù),其出現(xiàn)先于核酸數(shù)據(jù)庫(kù),1960年左右年左右,Dayhoff 和其同事們搜集了當(dāng)時(shí)所有已知的氨基酸序列,和其同事們搜集了當(dāng)時(shí)所有已知的氨基酸序列,編著了編著了蛋白質(zhì)序列與結(jié)構(gòu)圖冊(cè)蛋白質(zhì)序列與結(jié)構(gòu)圖冊(cè)。從這本圖冊(cè)。從這本圖冊(cè)中的數(shù)據(jù),演化為后來(lái)的蛋白質(zhì)信息資源數(shù)據(jù)庫(kù)中的數(shù)據(jù),演化為后來(lái)的蛋白質(zhì)信息資源數(shù)據(jù)庫(kù)nPIR與其他組織合作,共同構(gòu)成了與其他組織合作,共同構(gòu)成了PIR-國(guó)際蛋白國(guó)際蛋白質(zhì)序列數(shù)據(jù)庫(kù)質(zhì)序列數(shù)據(jù)庫(kù)

20、(PSD)一個(gè)主要的已預(yù)測(cè)的一個(gè)主要的已預(yù)測(cè)的蛋白質(zhì)數(shù)據(jù)庫(kù),包括蛋白質(zhì)數(shù)據(jù)庫(kù),包括250,000個(gè)蛋白個(gè)蛋白n除了蛋白質(zhì)序列數(shù)據(jù)以外,除了蛋白質(zhì)序列數(shù)據(jù)以外,PIR還包含以下信還包含以下信息:息:n蛋白質(zhì)名稱(chēng)、蛋白質(zhì)的分類(lèi)、蛋白質(zhì)的來(lái)源;蛋白質(zhì)名稱(chēng)、蛋白質(zhì)的分類(lèi)、蛋白質(zhì)的來(lái)源;n關(guān)于原始數(shù)據(jù)的參考文獻(xiàn);關(guān)于原始數(shù)據(jù)的參考文獻(xiàn);n蛋白質(zhì)功能和蛋白質(zhì)的一般特征,包括基因表達(dá)、蛋白質(zhì)功能和蛋白質(zhì)的一般特征,包括基因表達(dá)、翻譯后處理、活化等;翻譯后處理、活化等;n序列中相關(guān)的位點(diǎn)、功能區(qū)域序列中相關(guān)的位點(diǎn)、功能區(qū)域nPIR提供三種類(lèi)型的檢索服務(wù):提供三種類(lèi)型的檢索服務(wù):n基于文本的交互式查詢(xún),用戶(hù)通過(guò)

21、關(guān)鍵字進(jìn)行數(shù)據(jù)查詢(xún)基于文本的交互式查詢(xún),用戶(hù)通過(guò)關(guān)鍵字進(jìn)行數(shù)據(jù)查詢(xún)n標(biāo)準(zhǔn)的序列相似性搜索,包括標(biāo)準(zhǔn)的序列相似性搜索,包括BLAST、FASTA等等n結(jié)合序列相似性、注釋信息和蛋白質(zhì)家族信息的高級(jí)搜結(jié)合序列相似性、注釋信息和蛋白質(zhì)家族信息的高級(jí)搜索,包括按注釋分類(lèi)的相似性搜索、結(jié)構(gòu)域搜索等索,包括按注釋分類(lèi)的相似性搜索、結(jié)構(gòu)域搜索等 n基因組數(shù)據(jù)庫(kù)基因組數(shù)據(jù)庫(kù)nGDB(Gene DataBase)n nAceDBnGDB:為人類(lèi)基因組計(jì)劃為人類(lèi)基因組計(jì)劃(HGP)保存和處理基因組圖譜數(shù)據(jù),保存和處理基因組圖譜數(shù)據(jù),目標(biāo)是構(gòu)建關(guān)于人類(lèi)基因組的百科全書(shū)目標(biāo)是構(gòu)建關(guān)于

22、人類(lèi)基因組的百科全書(shū)n除了構(gòu)建基因組圖譜之外,還開(kāi)發(fā)了描述序列水平的基因除了構(gòu)建基因組圖譜之外,還開(kāi)發(fā)了描述序列水平的基因組內(nèi)容的方法,包括序列變異和其它對(duì)功能和表型的描述組內(nèi)容的方法,包括序列變異和其它對(duì)功能和表型的描述n目前目前GDB包括包括n人類(lèi)基因組區(qū)域人類(lèi)基因組區(qū)域(包括基因、克隆、包括基因、克隆、amplimers PCR 標(biāo)記、斷點(diǎn)標(biāo)記、斷點(diǎn)breakpoints、細(xì)胞遺傳標(biāo)記細(xì)胞遺傳標(biāo)記cytogenetic markers、易碎位點(diǎn)易碎位點(diǎn)fragile sites、EST序列序列、綜合區(qū)域綜合區(qū)域syndromic regions、contigs和重復(fù)序列和重復(fù)序列)n人類(lèi)

23、基因組圖譜人類(lèi)基因組圖譜(包括細(xì)胞遺傳圖譜、連接圖譜、放射性雜交圖譜、包括細(xì)胞遺傳圖譜、連接圖譜、放射性雜交圖譜、content contig圖譜和綜合圖譜等圖譜和綜合圖譜等)n人類(lèi)基因組內(nèi)的變異人類(lèi)基因組內(nèi)的變異(包括突變和多態(tài)性包括突變和多態(tài)性,加上等位基因頻率數(shù)據(jù)加上等位基因頻率數(shù)據(jù))n數(shù)據(jù)庫(kù)以對(duì)象模型來(lái)保存數(shù)據(jù),提供基于數(shù)據(jù)庫(kù)以對(duì)象模型來(lái)保存數(shù)據(jù),提供基于Web的數(shù)據(jù)對(duì)象的數(shù)據(jù)對(duì)象檢索服務(wù),用戶(hù)可搜索各種類(lèi)型的對(duì)象,并以圖形方式觀檢索服務(wù),用戶(hù)可搜索各種類(lèi)型的對(duì)象,并以圖形方式觀看基因組圖譜看基因組圖譜 nAceDB:一種線(xiàn)蟲(chóng)一種線(xiàn)蟲(chóng)C.elegans數(shù)據(jù)庫(kù),是一種被廣泛應(yīng)用的數(shù)據(jù)庫(kù),

24、是一種被廣泛應(yīng)用的管理和提供基因組數(shù)據(jù)的工具組管理和提供基因組數(shù)據(jù)的工具組n1991年由年由Richard Durbin和Jean Thierry-Mieg首先提供,首先提供,用來(lái)支持和整理用來(lái)支持和整理C.elegans領(lǐng)域中的大范圍序列和物理圖領(lǐng)域中的大范圍序列和物理圖譜譜n庫(kù)內(nèi)資源包括限制性圖譜,基因結(jié)構(gòu)信息,柯斯質(zhì)粒圖譜,庫(kù)內(nèi)資源包括限制性圖譜,基因結(jié)構(gòu)信息,柯斯質(zhì)粒圖譜,序列數(shù)據(jù),參考文獻(xiàn)等序列數(shù)據(jù),參考文獻(xiàn)等n該數(shù)據(jù)庫(kù)通過(guò)專(zhuān)門(mén)的軟件該數(shù)據(jù)庫(kù)通過(guò)專(zhuān)門(mén)的軟件ACEDB來(lái)管理并瀏覽,該軟件提來(lái)管理并瀏覽,該軟件提供一個(gè)圖形界面,使用戶(hù)能從大到整個(gè)基因組小到物理序供一個(gè)圖形界面,使用戶(hù)能從

25、大到整個(gè)基因組小到物理序列的各個(gè)層次考察基因組數(shù)據(jù)列的各個(gè)層次考察基因組數(shù)據(jù)n結(jié)構(gòu)數(shù)據(jù)庫(kù)結(jié)構(gòu)數(shù)據(jù)庫(kù)nPROSITEnhttp:/www.expasy.ch/prosite/ nPDBn/pdb/home/home.donSCOPnhttp:/scop.mrc-lmb.cam.ac.uk/scop/ nCOG/COG/nPROSITE:收集了生物學(xué)中有顯著意義的蛋白質(zhì)位點(diǎn)和序收集了生物學(xué)中有顯著意義的蛋白質(zhì)位點(diǎn)和序列模式,并能根據(jù)這些位點(diǎn)和模式快速可靠地鑒別一個(gè)未列模式,并能根據(jù)這些位點(diǎn)和模式快速可靠地鑒別一

26、個(gè)未知功能的蛋白質(zhì)序列應(yīng)該屬于哪一個(gè)蛋白質(zhì)家族知功能的蛋白質(zhì)序列應(yīng)該屬于哪一個(gè)蛋白質(zhì)家族n例如,某個(gè)蛋白質(zhì)與已知功能蛋白質(zhì)的整體序列相似性很低,但例如,某個(gè)蛋白質(zhì)與已知功能蛋白質(zhì)的整體序列相似性很低,但由于功能的需要保留了與功能密切相關(guān)的序列模式,這樣就可通由于功能的需要保留了與功能密切相關(guān)的序列模式,這樣就可通過(guò)過(guò)PROSITE的搜索找到隱含的功能模體,因此是序列分析的有效的搜索找到隱含的功能模體,因此是序列分析的有效工具工具nPROSITE中涉及的序列模式包括酶的催化位點(diǎn)、配體結(jié)合中涉及的序列模式包括酶的催化位點(diǎn)、配體結(jié)合位點(diǎn)、與金屬離子結(jié)合的殘基、二硫鍵的半胱氨酸、與小位點(diǎn)、與金屬離子結(jié)

27、合的殘基、二硫鍵的半胱氨酸、與小分子或其它蛋白質(zhì)結(jié)合的區(qū)域等分子或其它蛋白質(zhì)結(jié)合的區(qū)域等n除了序列模式之外,除了序列模式之外,PROSITE還包括由多序列比對(duì)構(gòu)建的還包括由多序列比對(duì)構(gòu)建的序列譜,能更敏感地發(fā)現(xiàn)序列與序列譜,能更敏感地發(fā)現(xiàn)序列與profile的相似性的相似性nPDB:是國(guó)際上唯一的生物大分子結(jié)構(gòu)數(shù)據(jù)檔案庫(kù),是國(guó)際上唯一的生物大分子結(jié)構(gòu)數(shù)據(jù)檔案庫(kù),由美國(guó)由美國(guó)Brookhaven國(guó)家實(shí)驗(yàn)室建立國(guó)家實(shí)驗(yàn)室建立n數(shù)據(jù)來(lái)源于數(shù)據(jù)來(lái)源于X光晶體衍射和核磁共振光晶體衍射和核磁共振(NMR)的數(shù)據(jù),的數(shù)據(jù),經(jīng)過(guò)整理和確認(rèn)后存檔而成經(jīng)過(guò)整理和確認(rèn)后存檔而成n目前目前PDB數(shù)據(jù)庫(kù)的維護(hù)由結(jié)構(gòu)生物信息學(xué)研究合作數(shù)據(jù)庫(kù)的維護(hù)由結(jié)構(gòu)生物信息學(xué)研究合作組織組織(RCSB)負(fù)責(zé),負(fù)責(zé),RCSB的主服務(wù)器和世界各地的的主服務(wù)器和世界各地的鏡像服務(wù)器提供數(shù)據(jù)庫(kù)的檢索和下載,以及關(guān)于鏡像服務(wù)器提供數(shù)據(jù)庫(kù)的檢索和下載,以及關(guān)于PDB數(shù)據(jù)文件格式和其它文檔的說(shuō)明,另外,數(shù)據(jù)文件格式和其它文檔的說(shuō)明,另外,PDB數(shù)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論