生物學(xué)數(shù)據(jù)庫(kù)及其檢索_第1頁(yè)
生物學(xué)數(shù)據(jù)庫(kù)及其檢索_第2頁(yè)
生物學(xué)數(shù)據(jù)庫(kù)及其檢索_第3頁(yè)
生物學(xué)數(shù)據(jù)庫(kù)及其檢索_第4頁(yè)
生物學(xué)數(shù)據(jù)庫(kù)及其檢索_第5頁(yè)
已閱讀5頁(yè),還剩63頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、會(huì)計(jì)學(xué)1生物學(xué)數(shù)據(jù)庫(kù)及其檢索生物學(xué)數(shù)據(jù)庫(kù)及其檢索一、什么是數(shù)據(jù)庫(kù)?一、什么是數(shù)據(jù)庫(kù)?數(shù)據(jù)庫(kù)(database) 是一類用于存儲(chǔ)和管理數(shù)據(jù)的計(jì)算機(jī)文檔,是統(tǒng)一管理的相關(guān)數(shù)據(jù)的集合,其儲(chǔ)存形式有利于數(shù)據(jù)信息的檢索與調(diào)用。二、生物學(xué)數(shù)據(jù)庫(kù)二、生物學(xué)數(shù)據(jù)庫(kù) 在生物信息學(xué)者們的努力下,人類基因組序列數(shù)據(jù)連同其它多種模式生物的序列數(shù)據(jù)及各自相應(yīng)的基因結(jié)構(gòu)與功能信息皆可供眾多生物學(xué)家們免費(fèi)接入與使用。humanArabidopsisThermotoga maritimaEscherichia coliBuchnerasp. APSRickettsia prowazekiiUreaplasma urealyt

2、icumBacillus subtilisDrosophila melanogasterThermoplasma acidophilumPlasmodium falciparumHelicobacter pylori mouseCaenorhabitis elegansratBorrelia burgorferiBorrelia burgorferiAquifex aeolicusNeisseria meningitidis Z2491Mycobacterium tuberculosis 模式生物基因組計(jì)劃模式生物基因組計(jì)劃virusesplasmidsbacteriafungiplantsa

3、lgaeinsectsmollusksreptilesbirdsmammalsGenome sizes in nucleotide pairs (base-pairs)10410810510610710111010109bony fishamphibians生物學(xué)數(shù)據(jù)庫(kù)的分類生物學(xué)數(shù)據(jù)庫(kù)的分類根據(jù)數(shù)據(jù)存放類型:根據(jù)數(shù)據(jù)存放類型:序列(三維)結(jié)構(gòu)文獻(xiàn)序列特征基因組圖譜表達(dá)譜 。根據(jù)數(shù)據(jù)存儲(chǔ)的根據(jù)數(shù)據(jù)存儲(chǔ)的具體內(nèi)容:具體內(nèi)容:一級(jí)數(shù)據(jù)庫(kù)二級(jí)數(shù)據(jù)庫(kù)專用數(shù)據(jù)庫(kù)(一)一級(jí)數(shù)據(jù)庫(kù)和二級(jí)數(shù)據(jù)庫(kù)(一)一級(jí)數(shù)據(jù)庫(kù)和二級(jí)數(shù)據(jù)庫(kù)一級(jí)數(shù)據(jù)庫(kù)(一級(jí)數(shù)據(jù)庫(kù)(Primary database):庫(kù)中的主要內(nèi)容來(lái)源于實(shí)驗(yàn)室操

4、作所得到的原始數(shù)據(jù)(例如:測(cè)序得到的序列、X射線晶體衍射所得到的三維結(jié)構(gòu)數(shù)據(jù)等),也包含一些基本的說(shuō)明(序列所屬的物種、類型、序列發(fā)表的文獻(xiàn)出處等)。核酸序列數(shù)據(jù)庫(kù)GenBank, EMBL, DDBJ及蛋白結(jié)構(gòu)數(shù)據(jù)庫(kù)PDB就是典型的一級(jí)數(shù)據(jù)庫(kù)。二級(jí)數(shù)據(jù)庫(kù)(二級(jí)數(shù)據(jù)庫(kù)( Secondary database ):在一級(jí)數(shù)據(jù)庫(kù)的信息基礎(chǔ)上進(jìn)行計(jì)算機(jī)加工處理并增加了許多的人為注釋而構(gòu)成的(例如:NCBI的RefSeq數(shù)據(jù)庫(kù)等)。ATTGACTAPrimary vs. Secondary DatabasesACGTGCTTGACACGTGAATTGACTATATAGCCGACGTGCACGTGCAC

5、GTGCTTGACATTGACATTGACACGTGACGTGACGTGAATTGACTAATTGACTAATTGACTAATTGACTATATAGCCGTATAGCCGTATAGCCGTATAGCCGGenBankTATAGCCGTATAGCCGTATAGCCGTATAGCCGATGACATTGAGAATTATTCCGAGAATTCCGAGAATTATTCCGAGAATTCCSequencingCentersGAGAATTCCGAGAATTCCUniGeneRefSeqGenomeAssemblyLabsCuratorsAlgorithmsTATAGCCGAGCTCCGATACCGATGAC

6、AA(二)如何查找與研究相關(guān)的生物學(xué)資源(二)如何查找與研究相關(guān)的生物學(xué)資源1 利用公共搜索引擎利用公共搜索引擎2 了解重要的生物信息學(xué)門戶站點(diǎn)了解重要的生物信息學(xué)門戶站點(diǎn)3 利用利用Nucleic Acid Research雜志每年的數(shù)據(jù)雜志每年的數(shù)據(jù)庫(kù)專輯、網(wǎng)絡(luò)服務(wù)器專輯。庫(kù)專輯、網(wǎng)絡(luò)服務(wù)器專輯。第二節(jié)第二節(jié) 常用數(shù)據(jù)庫(kù)常用數(shù)據(jù)庫(kù)Chapter 2n常用數(shù)據(jù)庫(kù)常用數(shù)據(jù)庫(kù)類類 型型名名 稱稱網(wǎng)網(wǎng) 址址 核核酸酸序序 列列一次數(shù)據(jù)庫(kù)一次數(shù)據(jù)庫(kù)Genebank/Genbank/EMBLhttp:/www.ebi.ac.uk/embl/DDBJh

7、ttp:/www.ddbj.nig.ac.jp/Welcome.html.ja/基因組基因組一次數(shù)據(jù)庫(kù)一次數(shù)據(jù)庫(kù)GDB/蛋蛋白白質(zhì)質(zhì)序序 列列一次數(shù)據(jù)庫(kù)一次數(shù)據(jù)庫(kù)SWISS-PROT/sprot/PIR/TrEMBLhttp:/www.ebi.ac.uk/trembl/UniProt/index.shtml/MIPShttp:/mips.gsf.de/GenPept/pub/genpe

8、pt/NRL-3D/general/software/packages/nrl_3d/nrl_3d.html/復(fù)合數(shù)據(jù)庫(kù)復(fù)合數(shù)據(jù)庫(kù)NRDBhttp:/www.nrdb.co.uk/OWLhttp:/www.bioinf.manchester.ac.uk/dbbrowser/OWL/SWISS-PROTTrEMBLhttp:/www.ebi.ac.uk/clustr/ 二次數(shù)據(jù)庫(kù)二次數(shù)據(jù)庫(kù)PROSITE/prosite/PRINTShttp:/www.bioinf.man.ac.uk/dbbrowser/PRINTS/BL

9、OCKS/Pfamhttp:/pfam.sanger.ac.uk/IDENTIFY/identify/COGs/COG/ProDomhttp:/www.toulouse.inra.fr/prodom.html/結(jié)結(jié) 構(gòu)構(gòu)一次數(shù)據(jù)庫(kù)一次數(shù)據(jù)庫(kù)PDB/pdb/home/home.doMMDB/Structure/MMDB/mmdb.shtml/ 二次數(shù)據(jù)庫(kù)二次數(shù)據(jù)庫(kù)DSSP

10、http:/www.sander.embl-heidelberg.de/dssp/HSSPhttp:/www.sander.embl-heidelberg.de/hssp/FSSPhttp:/www.ebi.ac.uk/dali/fssp/PSdb/geigel/PSdb/PSdb.html/ 結(jié)構(gòu)分類結(jié)構(gòu)分類SCOPhttp:/scop.mrc-lmb.cam.ac.uk/scop/CATH/latest/index.html/PDBsumhttp:/www.ebi.ac.uk/thornton-srv/databa

11、ses/pdbsum/ 分類分類二次數(shù)據(jù)庫(kù)二次數(shù)據(jù)庫(kù)ProtoMap蛋白質(zhì)組蛋白質(zhì)組 蛋白質(zhì)組蛋白質(zhì)組 氨基酸索引氨基酸索引AAindexhttp:/www.genome.ad.jp/dbget/蛋白質(zhì)間功能關(guān)蛋白質(zhì)間功能關(guān)系系Predictome/蛋白質(zhì)組分析蛋白質(zhì)組分析Proteome Analysishttp:/www.ebi.ac.uk/integr8/EBI-Integr8-HomePage.do/二維凝膠電泳二維凝膠電泳GELBANK/SWISS-2D

12、PAGE /ch2d/酵母蛋白質(zhì)定位酵母蛋白質(zhì)定位YPL.dbhttp:/ypl.tugraz.at/模式生物蛋白質(zhì)模式生物蛋白質(zhì)組組Bioknowledge Librnaryhttp:/www.biobase- Data LibraryDDBJ (DNA Data Bank of Japan)三大基因數(shù)據(jù)庫(kù)之間的關(guān)系三大基因數(shù)據(jù)庫(kù)之間的關(guān)系Genbank庫(kù)包含了所有已知的核酸序列和蛋白質(zhì)序列,以及與它們相關(guān)的文獻(xiàn)著作和生物學(xué)注釋。它是由美國(guó)國(guó)立生物技術(shù)信息中心(National Center of Biotechnology Information,N

13、CBI)建立和維護(hù)的。 Genbank網(wǎng)址:/Genbank/1. GenbankuGenbank數(shù)據(jù)直接來(lái)源數(shù)據(jù)直接來(lái)源 測(cè)序工作者提交的序列、測(cè)序中心提交的大量測(cè)序工作者提交的序列、測(cè)序中心提交的大量EST序列序列、其它測(cè)序數(shù)據(jù)以及與其它數(shù)據(jù)機(jī)構(gòu)協(xié)作交換的數(shù)據(jù)。、其它測(cè)序數(shù)據(jù)以及與其它數(shù)據(jù)機(jī)構(gòu)協(xié)作交換的數(shù)據(jù)。uGenbank內(nèi)容內(nèi)容 所有已知的核酸序列和蛋白質(zhì)序列,還包括對(duì)序列的簡(jiǎn)所有已知的核酸序列和蛋白質(zhì)序列,還包括對(duì)序列的簡(jiǎn)要描述、科學(xué)命名、物種分類名稱、參考文獻(xiàn)、序列特征表要描述、科學(xué)命名、物種分類名稱、參考文獻(xiàn)、序列特征表等輔助信

14、息。等輔助信息。uGenbank對(duì)數(shù)據(jù)記錄的處理對(duì)數(shù)據(jù)記錄的處理 劃分為劃分為 細(xì)菌類、病毒類、靈長(zhǎng)類、嚙齒類,細(xì)菌類、病毒類、靈長(zhǎng)類、嚙齒類, EST數(shù)據(jù)數(shù)據(jù)、基因組測(cè)序數(shù)據(jù)、大規(guī)?;蚪M序列數(shù)據(jù)等、基因組測(cè)序數(shù)據(jù)、大規(guī)?;蚪M序列數(shù)據(jù)等16類。類。/Genbank/Genbank由由美國(guó)國(guó)立生物美國(guó)國(guó)立生物技術(shù)信息中心技術(shù)信息中心(NCBI)建立維建立維護(hù),其主頁(yè)如護(hù),其主頁(yè)如圖所示。圖所示。NCBI 簡(jiǎn)介簡(jiǎn)介當(dāng)今世界最大的基于當(dāng)今世界最大的基于Internet的用于分的用于分子生物學(xué)研究的生物醫(yī)學(xué)研究中心子生物學(xué)研究的生物醫(yī)學(xué)研究中心2

15、. EMBL核酸序列數(shù)據(jù)庫(kù)核酸序列數(shù)據(jù)庫(kù) 1982年創(chuàng)建,由年創(chuàng)建,由歐洲生物信息學(xué)研究所歐洲生物信息學(xué)研究所(European Bioinformaties Institute, EBI)管理維護(hù)。使用序列管理維護(hù)。使用序列提取系統(tǒng)提取系統(tǒng)(SRS)進(jìn)行查詢檢索,利用基于網(wǎng)絡(luò)的進(jìn)行查詢檢索,利用基于網(wǎng)絡(luò)的WEBIN工具,或利用工具,或利用Sequin軟件向軟件向EMBL核酸序列核酸序列數(shù)據(jù)庫(kù)提交序列。數(shù)據(jù)庫(kù)提交序列。 EMBL網(wǎng)址:網(wǎng)址: http:/www.ebi.ac.uk/embl/ SRS的網(wǎng)址:的網(wǎng)址: http:/srs.ebi.ac.uk/ WEBIN網(wǎng)址:網(wǎng)址: http:/

16、www.ebi.ac.uk/webin-align/webinalign_help.html/ Sequin網(wǎng)址:網(wǎng)址: http:/www.ebi.ac.uk/Sequin/3. DDBJ數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)二、蛋白質(zhì)數(shù)據(jù)庫(kù)二、蛋白質(zhì)數(shù)據(jù)庫(kù)Swiss-Prot數(shù)據(jù)庫(kù)網(wǎng)站主頁(yè)數(shù)據(jù)庫(kù)網(wǎng)站主頁(yè)2. PIR PIR的子數(shù)據(jù)庫(kù):的子數(shù)據(jù)庫(kù): 蛋白質(zhì)序列數(shù)據(jù)庫(kù)(蛋白質(zhì)序列數(shù)據(jù)庫(kù)(PIR-PSD) 蛋白質(zhì)分類數(shù)據(jù)庫(kù)(蛋白質(zhì)分類數(shù)據(jù)庫(kù)(iProClass) 非冗余的蛋白質(zhì)參考資料數(shù)據(jù)庫(kù)(非冗余的蛋白質(zhì)參考資料數(shù)據(jù)庫(kù)(PIR-NREF)PIR數(shù)據(jù)庫(kù)按照數(shù)據(jù)性質(zhì)和注釋層次分四個(gè)部分:數(shù)據(jù)庫(kù)按照數(shù)據(jù)性質(zhì)和注釋層次分四個(gè)部

17、分: PIR1序列已經(jīng)驗(yàn)證,注釋最為詳盡序列已經(jīng)驗(yàn)證,注釋最為詳盡; PIR2為尚未確定的冗余序列;為尚未確定的冗余序列; PIR3序列既未檢驗(yàn),也未注釋;序列既未檢驗(yàn),也未注釋; PIR4序列來(lái)自其它渠道,既未驗(yàn)證,也無(wú)注釋。序列來(lái)自其它渠道,既未驗(yàn)證,也無(wú)注釋。美國(guó)國(guó)家生物醫(yī)學(xué)研究基金會(huì)與國(guó)際蛋白質(zhì)信息中心美國(guó)國(guó)家生物醫(yī)學(xué)研究基金會(huì)與國(guó)際蛋白質(zhì)信息中心(PIR-InternationalPIR-International)共同維護(hù)。)共同維護(hù)。PIRPIR是第一個(gè)蛋白質(zhì)分類和功能注釋數(shù)據(jù)庫(kù)是第一個(gè)蛋白質(zhì)分類和功能注釋數(shù)據(jù)庫(kù) 3.TrEMBL是一個(gè)經(jīng)計(jì)算機(jī)注釋的蛋白質(zhì)數(shù)據(jù)庫(kù),采用是一個(gè)經(jīng)計(jì)算

18、機(jī)注釋的蛋白質(zhì)數(shù)據(jù)庫(kù),采用SWISS-PROT數(shù)據(jù)庫(kù)格式。數(shù)據(jù)庫(kù)格式。主要包含從主要包含從EMBL/ Genbank/DDBJ三大核三大核酸數(shù)據(jù)庫(kù)中根據(jù)編碼序列翻譯的、尚未集成酸數(shù)據(jù)庫(kù)中根據(jù)編碼序列翻譯的、尚未集成到到SWISS-PROT數(shù)據(jù)庫(kù)中的蛋白質(zhì)序列。數(shù)據(jù)庫(kù)中的蛋白質(zhì)序列。TrEMBL為為SWISS-PROT數(shù)據(jù)庫(kù)及時(shí)提供補(bǔ)數(shù)據(jù)庫(kù)及時(shí)提供補(bǔ)充。充。 TrEMBL網(wǎng)址:網(wǎng)址:http:/www.ebi.ac.uk/trembl/4. UniProt UniProt將將SWISS-PROT、PIR、TrEMBL三個(gè)數(shù)據(jù)庫(kù)合并。通過(guò)文本三個(gè)數(shù)據(jù)庫(kù)合并。通過(guò)文本檢索、序列相似檢索以及檢索、序列

19、相似檢索以及UniProt Ftp網(wǎng)站可獲得蛋白質(zhì)序列。網(wǎng)站可獲得蛋白質(zhì)序列。UniProt網(wǎng)站主頁(yè)網(wǎng)站主頁(yè)UniProt包含包含UniProtKB、UniRef 和和UniParc 3個(gè)部個(gè)部分:分:(1)UniProtKB數(shù)據(jù)庫(kù)(數(shù)據(jù)庫(kù)(UniProt Knowledgebase):蛋白質(zhì)序列、功能、分類、交叉):蛋白質(zhì)序列、功能、分類、交叉引用等信息存取中心;引用等信息存取中心;(2)UniRef數(shù)據(jù)庫(kù)(數(shù)據(jù)庫(kù)(UniProt Reference Clusters):為提高檢索的速度,將緊密相關(guān)的蛋白質(zhì)序列合):為提高檢索的速度,將緊密相關(guān)的蛋白質(zhì)序列合并到同一條記錄中。目前,根據(jù)序列相

20、似程度可將并到同一條記錄中。目前,根據(jù)序列相似程度可將UniRef數(shù)據(jù)庫(kù)分為數(shù)據(jù)庫(kù)分為UniRef100、UniRef90和和UniRef50 3個(gè)子庫(kù)個(gè)子庫(kù)(3)UniParc(UniProt Archive):儲(chǔ)存大量蛋白):儲(chǔ)存大量蛋白質(zhì)研究的歷史信息。質(zhì)研究的歷史信息。UniProt網(wǎng)址:網(wǎng)址:/index.shtml5. GenPept數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)GenPept數(shù)據(jù)庫(kù)特點(diǎn)數(shù)據(jù)庫(kù)特點(diǎn) 由由Genebank數(shù)據(jù)庫(kù)的核酸序列經(jīng)翻譯后產(chǎn)生數(shù)據(jù)庫(kù)的核酸序列經(jīng)翻譯后產(chǎn)生。GenPept數(shù)據(jù)量大,隨核酸數(shù)據(jù)庫(kù)的更新而更新數(shù)據(jù)量大,隨核酸數(shù)據(jù)庫(kù)的更新

21、而更新,但未經(jīng)實(shí)驗(yàn)證實(shí),也未有詳細(xì)注釋。,但未經(jīng)實(shí)驗(yàn)證實(shí),也未有詳細(xì)注釋。(二)蛋白質(zhì)序列二次數(shù)據(jù)庫(kù)(二)蛋白質(zhì)序列二次數(shù)據(jù)庫(kù) 1.PROSITEn PROSITE是蛋白質(zhì)家族保守區(qū)域和功能位點(diǎn)數(shù)是蛋白質(zhì)家族保守區(qū)域和功能位點(diǎn)數(shù)據(jù)庫(kù),也是第一個(gè)蛋白質(zhì)序列二次數(shù)據(jù)庫(kù),據(jù)庫(kù),也是第一個(gè)蛋白質(zhì)序列二次數(shù)據(jù)庫(kù),收錄蛋白收錄蛋白質(zhì)家族中同源序列多重比對(duì)所確定的保守性區(qū)域質(zhì)家族中同源序列多重比對(duì)所確定的保守性區(qū)域:如:如酶活性位點(diǎn)、配體結(jié)合位點(diǎn)、金屬離子結(jié)合位點(diǎn)、其酶活性位點(diǎn)、配體結(jié)合位點(diǎn)、金屬離子結(jié)合位點(diǎn)、其它蛋白質(zhì)結(jié)合位點(diǎn)等已知具有重要生物學(xué)功能蛋白質(zhì)它蛋白質(zhì)結(jié)合位點(diǎn)等已知具有重要生物學(xué)功能蛋白質(zhì)位點(diǎn)

22、和序列模式。位點(diǎn)和序列模式。n PROSITE數(shù)據(jù)庫(kù)組成數(shù)據(jù)庫(kù)組成 包含包含Prosite(數(shù)據(jù)文件)和(數(shù)據(jù)文件)和PrositeDoc(說(shuō)明(說(shuō)明文件)兩個(gè)文件數(shù)據(jù)庫(kù)。文件)兩個(gè)文件數(shù)據(jù)庫(kù)。PROSITE數(shù)據(jù)庫(kù)主頁(yè)數(shù)據(jù)庫(kù)主頁(yè)/nPROSITE數(shù)據(jù)庫(kù)作用數(shù)據(jù)庫(kù)作用:可確定一段新蛋白質(zhì)序列中:可確定一段新蛋白質(zhì)序列中包含的功能位點(diǎn)以及其歸屬的蛋白質(zhì)家族。包含的功能位點(diǎn)以及其歸屬的蛋白質(zhì)家族。nPROSITE的網(wǎng)址:的網(wǎng)址:http:/www.expasy.ch/prosite/ 或或 /prosite/nP

23、ROSITE的中國(guó)鏡像網(wǎng)址的中國(guó)鏡像網(wǎng)址是:是:/prosite/2.PRINTS PRINTS蛋白質(zhì)指紋圖譜數(shù)據(jù)庫(kù)蛋白質(zhì)指紋圖譜數(shù)據(jù)庫(kù)將多個(gè)保守的將多個(gè)保守的序列模式作為識(shí)別蛋白質(zhì)家族的特征序列模式作為識(shí)別蛋白質(zhì)家族的特征,與,與PROSITE數(shù)據(jù)庫(kù)的單個(gè)序列模式相比,數(shù)據(jù)庫(kù)的單個(gè)序列模式相比,PRINTS具有更好的識(shí)具有更好的識(shí)別率。別率。PRINTS 網(wǎng)址:網(wǎng)址:http:/www.bioinf.man.ac.uk/dbbrowser/PRINTS/3.BLOCKSu 序列模塊(序列模塊(block):):是通過(guò)序列比對(duì)得到是通過(guò)序列比對(duì)得到的若干蛋

24、白質(zhì)序列中的若干蛋白質(zhì)序列中具有較高相似性的序列片段具有較高相似性的序列片段。u BLOCKS由通過(guò)自動(dòng)檢測(cè)由通過(guò)自動(dòng)檢測(cè)PROSITE數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)和和PRINTS蛋白質(zhì)指紋圖譜數(shù)據(jù)庫(kù)蛋白質(zhì)指紋圖譜數(shù)據(jù)庫(kù)中蛋白質(zhì)家族高中蛋白質(zhì)家族高度保守區(qū)域產(chǎn)生的序列模塊組成。度保守區(qū)域產(chǎn)生的序列模塊組成。 u BLOCKS的網(wǎng)址:的網(wǎng)址:/PDB數(shù)據(jù)庫(kù)主頁(yè)數(shù)據(jù)庫(kù)主頁(yè)/pdb/home/home.don PDB數(shù)據(jù)庫(kù)作用數(shù)據(jù)庫(kù)作用 提供序列詳細(xì)信息、原子坐標(biāo)、三提供序列詳細(xì)信息、原子坐標(biāo)、三維結(jié)構(gòu)、交叉檢索等與結(jié)構(gòu)相關(guān)的信息。維結(jié)

25、構(gòu)、交叉檢索等與結(jié)構(gòu)相關(guān)的信息。2. MMDB(Molecular Modeling Database)n 是是Entrez的組成部分。的組成部分。n 只收錄通過(guò)只收錄通過(guò)X射線晶體衍射和核磁共振實(shí)驗(yàn)測(cè)射線晶體衍射和核磁共振實(shí)驗(yàn)測(cè)定的生物大分子結(jié)構(gòu)數(shù)據(jù)。定的生物大分子結(jié)構(gòu)數(shù)據(jù)。n 增加了附加信息如增加了附加信息如:大分子的生物學(xué)功能及產(chǎn)大分子的生物學(xué)功能及產(chǎn)生機(jī)制、分子進(jìn)化歷史、生物大分子之間關(guān)系等。生機(jī)制、分子進(jìn)化歷史、生物大分子之間關(guān)系等。n 具有生物大分子三維結(jié)構(gòu)模型展示、結(jié)構(gòu)分具有生物大分子三維結(jié)構(gòu)模型展示、結(jié)構(gòu)分析和結(jié)構(gòu)比較等功能析和結(jié)構(gòu)比較等功能2.HSSP (Homology-D

26、erived Secondary Structure of Protein) n是一個(gè)蛋白質(zhì)同源序列比對(duì)數(shù)據(jù)庫(kù),將相似序列是一個(gè)蛋白質(zhì)同源序列比對(duì)數(shù)據(jù)庫(kù),將相似序列的蛋白質(zhì)聚集成結(jié)構(gòu)同源的家族,并隱含二級(jí)結(jié)構(gòu)的蛋白質(zhì)聚集成結(jié)構(gòu)同源的家族,并隱含二級(jí)結(jié)構(gòu)和空間結(jié)構(gòu)信息。和空間結(jié)構(gòu)信息。nHSSP用于分析蛋白質(zhì)保守區(qū)域、確定序列模式用于分析蛋白質(zhì)保守區(qū)域、確定序列模式及蛋白的折疊、進(jìn)化關(guān)系、分子設(shè)計(jì)等研究。及蛋白的折疊、進(jìn)化關(guān)系、分子設(shè)計(jì)等研究。nHSSP的網(wǎng)址是:的網(wǎng)址是:http:/www.sander.embl-heidelberg.de/hssp/2. CATH n CATH數(shù)據(jù)庫(kù)層次數(shù)據(jù)

27、庫(kù)層次: 類型層次類型層次:分為:分為 主類、主類、 主類、主類、 - 類(類( / 型和型和 + 型)型)、低二級(jí)結(jié)構(gòu)類、低二級(jí)結(jié)構(gòu)類4類。類。 構(gòu)架層次構(gòu)架層次:依據(jù)由:依據(jù)由螺旋和螺旋和折疊形成的超二級(jí)結(jié)構(gòu)排列方折疊形成的超二級(jí)結(jié)構(gòu)排列方式進(jìn)行分類,而不考慮它們之間的連接關(guān)系。式進(jìn)行分類,而不考慮它們之間的連接關(guān)系。 拓?fù)鋵哟瓮負(fù)鋵哟危簽槎?jí)結(jié)構(gòu)的形狀和二級(jí)結(jié)構(gòu)間的聯(lián)系。:為二級(jí)結(jié)構(gòu)的形狀和二級(jí)結(jié)構(gòu)間的聯(lián)系。 同源性層次同源性層次:通過(guò)序列比較和結(jié)構(gòu)比較確定。:通過(guò)序列比較和結(jié)構(gòu)比較確定。 序列層次序列層次:根據(jù)序列同源性不同分為:根據(jù)序列同源性不同分為S、O、L、I、D五種五種。n CATH的網(wǎng)址的網(wǎng)址:/latest/index.html/3. PDBsum n 通過(guò)對(duì)通過(guò)對(duì)PDB數(shù)據(jù)庫(kù)中所有蛋白質(zhì)結(jié)構(gòu)信息進(jìn)行總結(jié)數(shù)據(jù)庫(kù)中所有蛋白質(zhì)結(jié)構(gòu)信息進(jìn)行總結(jié)和分析,給出蛋白質(zhì)的主鏈數(shù)目、配體、金屬離子、二和分析,給出蛋白質(zhì)的主鏈數(shù)目、配體、金屬離子、二級(jí)結(jié)構(gòu)、折疊圖等相關(guān)信息。級(jí)結(jié)構(gòu)、折疊圖等相關(guān)信息。n 提供檢索蛋白質(zhì)各級(jí)結(jié)構(gòu)

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論