版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
后基因組時(shí)代的生物信息學(xué)第1頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院2§8.1
引言隨著人類基因組計(jì)劃的順利進(jìn)行,人類全基因組測(cè)序工作已經(jīng)完成。測(cè)序工作的完成并不代表基因組計(jì)劃的結(jié)束,相反標(biāo)志著“后基因組信息學(xué)”的開始。基因組學(xué)研究也由結(jié)構(gòu)基因組轉(zhuǎn)向了功能基因組的研究,通過對(duì)基因組的分析來了解生物體的功能成為后基因組時(shí)代的主要目標(biāo)。第2頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院3人們愈來愈認(rèn)識(shí)到,基因與蛋白質(zhì)很少單獨(dú)起作用,它們傾向于組成相互作用網(wǎng)絡(luò)來行使生物學(xué)功能。特別是我們看到這樣的局面,鑒定了基因組大部分基因之后,我們?nèi)匀粺o法僅僅憑序列信息來推斷基因的功能。對(duì)功能的研究必須分析其相互作用的網(wǎng)絡(luò),或者更準(zhǔn)確地說,把基因組或蛋白質(zhì)組看作一個(gè)系統(tǒng)來進(jìn)行分析。第3頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院4所以,后基因組生物信息學(xué)有時(shí)也稱為功能基因組系統(tǒng)學(xué)。功能基因組系統(tǒng)學(xué)的出現(xiàn),是生物信息學(xué)領(lǐng)域的一個(gè)重大變化,它由主要以整理、儲(chǔ)存、分析生物學(xué)數(shù)據(jù)或知識(shí)轉(zhuǎn)變?yōu)榫C合多種生物分子及其相互作用的知識(shí)來了解生物系統(tǒng)的功能。第4頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院5后基因組生物信息學(xué)在研究方法上的重大變化也標(biāo)志著生物學(xué)的研究正在經(jīng)歷一場(chǎng)革命。如果說過去生物學(xué)研究主要以生物實(shí)驗(yàn)來進(jìn)行,那么對(duì)于具有復(fù)雜網(wǎng)絡(luò)的系統(tǒng)功能的分析,離開了理論分析和指導(dǎo),幾乎無法進(jìn)行實(shí)驗(yàn)。因此,生物學(xué)尤其是分子生物學(xué)的研究方法將轉(zhuǎn)變?yōu)樵诶碚摲治龅闹笇?dǎo)下,將實(shí)驗(yàn)與理論相結(jié)合的研究過程,理論生物學(xué)的出現(xiàn)就成為必然。第5頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院6基因組信息學(xué)是為了處理基因組計(jì)劃產(chǎn)生的大量數(shù)據(jù)而誕生的,它的主要任務(wù)是支持實(shí)驗(yàn)工作。后基因組生物信息學(xué)是以綜合為特征的,其研究意義比基因組信息學(xué)更為深刻。后基因組生物信息學(xué)定義為對(duì)一系列生物學(xué)知識(shí)的綜合,包括從基因組信息到對(duì)生命基本規(guī)律的理解等方面。如果說,基因組信息學(xué)是以對(duì)各種生物分子進(jìn)行分析,獲取有關(guān)生物知識(shí)的話,則后基因組生物信息學(xué)的研究使我們進(jìn)入對(duì)生命基本規(guī)律的認(rèn)識(shí)。第6頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院7§8.2后基因組生物信息學(xué)基本概念8.2.1歷史的機(jī)遇當(dāng)前生物學(xué)的狀況可以類比17世紀(jì)時(shí)的物理學(xué),正處于科學(xué)公式化的階段。生物學(xué)仍是一門經(jīng)驗(yàn)性學(xué)科,只擁有很少的原理來預(yù)測(cè)各種生物學(xué)現(xiàn)象。19世紀(jì)開始的遺傳細(xì)胞學(xué)技術(shù),20世紀(jì)發(fā)展起來的分子生物學(xué)最終使收集生物學(xué)基本數(shù)據(jù)成為可能。人們期望隨之會(huì)產(chǎn)生類似開普勒定理的經(jīng)驗(yàn)規(guī)律、類似牛頓定律的基本原理和類似玻爾H量子論的重要理論。第7頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院88.2.2生物還原論與生物綜合論還原論成為20世紀(jì)后半葉生物學(xué)發(fā)展的主流。按照還原論的方法,為了研究生物系統(tǒng)某一方面的功能,只需尋找并鑒定出與此功能直接相關(guān)的基因或蛋白質(zhì)即可。基因組計(jì)劃揭開了綜合論研究方法的序幕。綜合論方法研究基因和各種生物大分子是怎樣通過網(wǎng)絡(luò)調(diào)控方式形成一個(gè)生物系統(tǒng)的。雖然還原論方法研究生物學(xué)問題取得巨大成功,但在后基因組時(shí)代我們需要綜合全部生物信息重構(gòu)生物體,綜合論研究思路將成為生物學(xué)研究的主流。第8頁/共101頁圖8-1生物學(xué)研究中的還原論和綜合論方法第9頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院10物理學(xué)和化學(xué)中,基本粒子如何組裝成物質(zhì),元素如何組成化合物的一般規(guī)律已經(jīng)被發(fā)現(xiàn)。但在生物學(xué)研究中,我們還未能取得這種令人鼓舞的進(jìn)展。實(shí)際上,我們至今還不清楚基因組上的信息是否足以建立一個(gè)完整的生物體系。在物理學(xué)基本粒子的標(biāo)準(zhǔn)模型中,包括有兩類基本粒子:物質(zhì)組成和作用力介質(zhì)。換句話說,只有各組成部分的信息是不夠的,各部分之間的相互作用信息是非常重要的(如物理學(xué)中作用力介質(zhì))。基因組包含了其組成部分的信息,但很難說它含有各部分間相互作用的信息。第10頁/共101頁圖8-2物理學(xué)、化學(xué)和生物學(xué)的基本原理對(duì)比第11頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院128.2.3層次抽提除相互作用概念外,層次抽提是另外一個(gè)重要的概念。如圖8-3所示,半胱氨酸在原子層次上是由碳、氮、氧、氫和硫原子組成的網(wǎng)絡(luò)結(jié)構(gòu),但是在分子層次上,則被抽象為字母C,同其它19種抽象過的字母(氨基酸)一起構(gòu)成了蛋白質(zhì)一級(jí)序列。在網(wǎng)絡(luò)層面上,蛋白質(zhì)被抽象為一種符號(hào),Ras,各個(gè)符號(hào)(蛋白質(zhì))之間的連線代表著一種通路。后基因組生物信息學(xué)的一個(gè)重要思想是從分子網(wǎng)絡(luò)層次研究生物學(xué)。第12頁/共101頁圖8-3層次抽提的概念第13頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院14傳統(tǒng)生物學(xué)關(guān)注的是一個(gè)一個(gè)的通路,而后基因組生物信息學(xué)則希望研究各個(gè)通路之間的相互作用,構(gòu)成一個(gè)復(fù)雜的相互作用網(wǎng)絡(luò),從而從更高的層面上理解生命過程。通俗地說:傳統(tǒng)生物學(xué)看到的是樹木,后基因組生物信息學(xué)則看到的是森林。圖8-4為細(xì)胞內(nèi)多種信號(hào)傳導(dǎo)通路在相互作用網(wǎng)絡(luò)視角的示意圖。圖8-5顯示了構(gòu)建網(wǎng)絡(luò)的部分方法。第14頁/共101頁圖8-4在網(wǎng)絡(luò)層面對(duì)細(xì)胞內(nèi)生命過程的理解第15頁/共101頁圖8-5構(gòu)建網(wǎng)絡(luò)的方法示例第16頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院17網(wǎng)絡(luò)從結(jié)構(gòu)上可分為指數(shù)式網(wǎng)絡(luò)和自由標(biāo)度網(wǎng)絡(luò)。指數(shù)式網(wǎng)絡(luò)是均勻的,大部分節(jié)點(diǎn)有近似相同的連接數(shù)。自由標(biāo)度網(wǎng)絡(luò)是不均勻的,大多數(shù)節(jié)點(diǎn)只有一個(gè)或兩個(gè)連接,但少數(shù)節(jié)點(diǎn)有大量連接,從而保證系統(tǒng)是全部連通的。第17頁/共101頁圖8-6指數(shù)式網(wǎng)絡(luò)和自由標(biāo)度網(wǎng)絡(luò)的差異第18頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院198.2.4后基因組生物信息學(xué)的重大挑戰(zhàn)后基因組生物信息學(xué)是生物信息學(xué)中具有極大挑戰(zhàn)性的領(lǐng)域。給定一個(gè)生物的全基因組,剩下的問題就是如何在計(jì)算機(jī)上重構(gòu)這個(gè)生物體的功能體系。這個(gè)問題包括對(duì)所有組成部分(基因和其它生物分子)之間連線(相互作用)的預(yù)測(cè)。傳統(tǒng)的看法是基因組是生命的藍(lán)圖,包含了構(gòu)建生物體的全部信息。第19頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院20但現(xiàn)在更加合理的看法是基因組只是細(xì)胞中分子之間相互作用的整個(gè)網(wǎng)絡(luò)的一部分?;蚪M只是細(xì)胞指令的大倉庫,相互作用網(wǎng)絡(luò)本身才是那個(gè)所謂的指令系統(tǒng),這個(gè)系統(tǒng)遵循固有程序引導(dǎo)發(fā)育過程,并產(chǎn)生生殖細(xì)胞。后基因組生物信息學(xué)是以對(duì)一系列生物學(xué)知識(shí)的綜合為特征的。是在網(wǎng)絡(luò)觀點(diǎn)下、在分子網(wǎng)絡(luò)層次上研究和理解生命的基本規(guī)律。第20頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院218.2.5后基因組研究對(duì)象的多層次性后基因組研究對(duì)象是多層次的,人們從包括基因組(Genome)、轉(zhuǎn)錄組(Transcriptome)、蛋白質(zhì)組(Proteome)、相互作用組(Interactome)、定位組(Localizome)、折疊子組(foldome)、代謝組(Metabolome)、表型組(Phenome)等方面,從組的角度研究各類生物學(xué)過程。如果說基因組問題涉及遺傳圖譜(Geneticmap)、限制性圖譜(Restrictionmap)和物理圖譜(Physicalmap),那么其它所有的組涉及功能圖譜(Functionalmaps)。第21頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院228.2.6功能基因組發(fā)展趨勢(shì)功能基因組學(xué)發(fā)展的一個(gè)最新和重要領(lǐng)域是系統(tǒng)生物學(xué)(SystemsBiology),系統(tǒng)生物學(xué)研究問題有如下三個(gè)特點(diǎn):1、更好整合生物過程不同階段的分散數(shù)據(jù)如整合基因組、轉(zhuǎn)錄組、蛋白質(zhì)組和代謝組的數(shù)據(jù),得到對(duì)生物學(xué)過程的總體認(rèn)識(shí)。另外一個(gè)方面是為了滿足整合數(shù)據(jù)庫的復(fù)雜查詢。2、對(duì)復(fù)雜生物過程的更好模擬包括蛋白質(zhì)折疊和復(fù)雜系統(tǒng)建模(如信號(hào)/代謝通路和發(fā)病機(jī)理)3、生物過程動(dòng)態(tài)研究從一個(gè)通路的成分到一個(gè)通路的動(dòng)力學(xué)第22頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院238.2.7系統(tǒng)生物學(xué)研究框架要解決生物體重構(gòu)問題,首先要用計(jì)算機(jī)將有關(guān)相互作用的生物學(xué)知識(shí)計(jì)算機(jī)化,然后設(shè)計(jì)一些新實(shí)驗(yàn)。圖8-7描述了功能基因組學(xué)實(shí)驗(yàn),在這些實(shí)驗(yàn)中應(yīng)用了活細(xì)胞對(duì)于各種環(huán)境變化的應(yīng)激反應(yīng),還融合了全基因組序列和不完全的生物學(xué)知識(shí),所有這些都被用來揭示潛在的相互作用關(guān)系。利用這樣一個(gè)全新水平的信息技術(shù),也許將來的某一天我們可以解決生物體重構(gòu)問題。第23頁/共101頁圖8-7系統(tǒng)生物學(xué)實(shí)驗(yàn)框架第24頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院258.2.8功能基因組系統(tǒng)學(xué)正如前面所述,在相互作用網(wǎng)絡(luò)背景下闡釋“功能”是功能基因組系統(tǒng)學(xué)的一個(gè)主要特點(diǎn)。另外一個(gè)特點(diǎn)是復(fù)雜系統(tǒng)的思想,把生物體看作一個(gè)復(fù)雜系統(tǒng)進(jìn)行研究。主要有三個(gè)特征:1多層次數(shù)據(jù)整合
整合包括基因組、蛋白質(zhì)組、轉(zhuǎn)錄、表達(dá)和調(diào)控路徑等方面數(shù)據(jù)2系統(tǒng)的復(fù)雜性特點(diǎn)具有復(fù)雜系統(tǒng)的自組織、自調(diào)控和突變等特點(diǎn)3信息學(xué)分析采用信息學(xué)方法對(duì)多種數(shù)據(jù)進(jìn)行分析是功能基因組系統(tǒng)學(xué)的又一特點(diǎn)第25頁/共101頁圖9-8顯示了基于信息學(xué)方法、整合多層次數(shù)據(jù)在網(wǎng)絡(luò)層面研究細(xì)胞內(nèi)復(fù)雜生物過程的基本思想。圖8-8基于知識(shí)的網(wǎng)絡(luò)預(yù)測(cè)第26頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院27§8.3分子相互作用的網(wǎng)絡(luò)分析8.3.1“功能”的新涵義在單個(gè)分子層次,比如說當(dāng)一個(gè)氨基酸序列與那些蛋白質(zhì)激酶高度相似時(shí),可以認(rèn)為其功能被鑒定出來。在細(xì)胞功能層次,只有當(dāng)對(duì)應(yīng)的被磷酸化的靶蛋白被鑒定出來,甚至需要弄清楚該蛋白在生化途徑中扮演的角色,才說其功能是已知的?,F(xiàn)在認(rèn)為功能是分子間相互作用或相互作用關(guān)系的一種屬性。第27頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院288.3.2后基因組時(shí)代對(duì)功能的理解變化分子生物學(xué)中心法則總結(jié)了序列水平遺傳信息的流動(dòng):熱動(dòng)力學(xué)原理建立了單個(gè)蛋白質(zhì)分子遺傳信息的流動(dòng)方式:第28頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院29傳統(tǒng)的觀點(diǎn)認(rèn)為,這種流動(dòng)是在適宜的生理?xiàng)l件下自發(fā)產(chǎn)生的,基因組本身包含蛋白質(zhì)結(jié)構(gòu)的所有必需信息。這些觀點(diǎn)過于簡(jiǎn)單并有太多的還原論色彩,任何一種生物學(xué)功能都涉及分子相互作用網(wǎng)絡(luò),分子相互作用信息比單分子信息更加重要。因此,必須從新的角度理解信息的流動(dòng)。啟示:應(yīng)該在更高的分子網(wǎng)絡(luò)而不是單個(gè)分子層面分析生物學(xué)功能。第29頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院308.3.3分子相互作用的網(wǎng)絡(luò)分析
分子網(wǎng)絡(luò)在單個(gè)分子層面,生物學(xué)功能信息編碼在序列信息里,即在核酸和氨基酸序列里。在分子網(wǎng)絡(luò)層面,生物學(xué)功能信息編碼在分子相互作用網(wǎng)絡(luò)信息里。我們?cè)谝话阋饬x上定義“網(wǎng)絡(luò)”這個(gè)術(shù)語。網(wǎng)絡(luò)包含元素和元素之間的二元關(guān)系(圖8-9)。元素可以是分子或基因,二元關(guān)系是分子相互作用、遺傳相互作用或其他的兩個(gè)元素之間的關(guān)系。第30頁/共101頁圖8-9網(wǎng)絡(luò)表示。網(wǎng)絡(luò)包括一組元素(點(diǎn))和一組而元關(guān)系(邊)。第31頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院32
網(wǎng)絡(luò)的分類網(wǎng)絡(luò)可以分為兩類,一類來自生物學(xué)知識(shí),另一類來自對(duì)二元關(guān)系的計(jì)算。通路是分子相互作用形成的網(wǎng)絡(luò)。如代謝途徑、信號(hào)轉(zhuǎn)導(dǎo)通路、細(xì)胞循環(huán)通路、發(fā)育途徑及其它調(diào)控途徑。分子復(fù)合物也是一種分子相互作網(wǎng)絡(luò)?;蚪M是基因的網(wǎng)絡(luò),表示基因在染色體上的物理次序。第32頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院33圖8-9也顯示了通過二元關(guān)系計(jì)算得到的網(wǎng)絡(luò)。近鄰表示特定分子或基因的相似關(guān)系。序列相似性分析是典型的近鄰網(wǎng)絡(luò)的例子—查詢序列與多個(gè)序列通過序列相似性的二元關(guān)系相互連接。聚類表示完整的一類分子或基因的相似關(guān)系。典型的例子是通過聚類分析獲得分類,所有成對(duì)元素的相似性分?jǐn)?shù)在某種程度上用來確定相似性分類。層級(jí)樹是層次聚類分析的結(jié)果,不斷改變序列相似性閾值得到不同的聚類結(jié)果。第33頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院34
網(wǎng)絡(luò)的比較網(wǎng)絡(luò)是一個(gè)圖,是頂點(diǎn)和連接頂點(diǎn)的邊的集合。圖G包括頂點(diǎn)集V和邊集E,G=(V,E)。圖8-10顯示了網(wǎng)絡(luò)比較的例子:通路—通路、通路—基因組、基因組—基因組以及聚類—同路的比較。生物學(xué)比較問題就簡(jiǎn)化為尋找兩圖之間的共同子圖或同構(gòu)的子圖。假定我們希望知道來自不同物種的兩個(gè)生化途徑是否具有任何相似性,這不是簡(jiǎn)單地基于單個(gè)分子的序列相似性而是基于分子之間的連接線路模式的相似性。這可被稱做局部通路比對(duì)。第34頁/共101頁圖8-10網(wǎng)絡(luò)比較的例子第35頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院36在分子網(wǎng)絡(luò)比較問題中(圖8-11),假定兩個(gè)圖中有結(jié)點(diǎn)的對(duì)應(yīng)關(guān)系,我們希望確認(rèn)局部相關(guān)的區(qū)域。圖9-11為已知兩個(gè)網(wǎng)絡(luò)及其對(duì)應(yīng)關(guān)系下的一種啟發(fā)式網(wǎng)絡(luò)比較。讓我們考慮兩個(gè)圖G1=(V1,E1)和G2=(V2,E2)第36頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院37和一組對(duì)應(yīng)關(guān)系。一般來說,一個(gè)圖中的結(jié)點(diǎn)可以對(duì)應(yīng)于另一個(gè)圖中的多個(gè)結(jié)點(diǎn),對(duì)應(yīng)關(guān)系還可以是多對(duì)多,但是所有的對(duì)應(yīng)關(guān)系仍然用成對(duì)(二元)關(guān)系來表示。如果集合包括n對(duì)對(duì)應(yīng)關(guān)系,問題就變成依據(jù)一定的距離來對(duì)這n個(gè)數(shù)據(jù)點(diǎn)進(jìn)行聚類。聚類后可以發(fā)現(xiàn)在通路意義下的對(duì)應(yīng)關(guān)系,顯然和一般的序列比對(duì)有本質(zhì)的差別。網(wǎng)絡(luò)比較在更高層次給我們提供兩個(gè)系統(tǒng)的相似或?qū)?yīng)關(guān)系,使我們可以在系統(tǒng)水平、網(wǎng)絡(luò)層面對(duì)生物過程進(jìn)行分析。第37頁/共101頁圖8-11網(wǎng)絡(luò)比較的啟發(fā)式算法第38頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院39
二元關(guān)系和演繹一條邊表示一種二元關(guān)系,一條路徑是一種推導(dǎo)步驟,一個(gè)圖是所有可能的推導(dǎo)步驟組成的完整網(wǎng)絡(luò)。一旦不同類型的數(shù)據(jù)和知識(shí)依照二元關(guān)系組織起來,它們可用于路徑的自動(dòng)計(jì)算。下表是三種二元關(guān)系的總結(jié)。相關(guān)的二元關(guān)系被分成三種類型:事實(shí)關(guān)系、相似性關(guān)系和功能關(guān)系。事實(shí)關(guān)系表示不同數(shù)據(jù)庫錄入的數(shù)據(jù)之間最繁瑣的連接,以交叉參考的生物學(xué)數(shù)據(jù)庫形式儲(chǔ)存。通過序列或結(jié)構(gòu)數(shù)據(jù)庫的比較,計(jì)算得出相似關(guān)系。更為重要的二元關(guān)系是以相互作用形式多樣體現(xiàn)的功能關(guān)系。第39頁/共101頁關(guān)系類型內(nèi)容舉例事實(shí)關(guān)系數(shù)據(jù)庫錄入數(shù)據(jù)事實(shí)數(shù)據(jù)和文獻(xiàn)數(shù)據(jù)核酸序列和氨基酸序列蛋白質(zhì)序列和三維結(jié)構(gòu)相似性關(guān)系計(jì)算相似性序列、三維結(jié)構(gòu)相似性計(jì)算互補(bǔ)性三維結(jié)構(gòu)互補(bǔ)性功能關(guān)系分子反應(yīng)底物—產(chǎn)物關(guān)系分子相互作用分子通路,分子復(fù)合物遺傳相互作用正向共表達(dá)基因負(fù)向共表達(dá)基因染色體關(guān)系基因位置相關(guān)性進(jìn)化關(guān)系直系同源和共生同源基因表8-1二元關(guān)系類型第40頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院418.3.4幾個(gè)應(yīng)用實(shí)例元素是分子和基因,二元關(guān)系是分子相互作用、遺傳相互作用和其它分子或基因的相互作用。網(wǎng)絡(luò)是KEGG(基因和基因組京都百科全書,http://www.genome.ad.jp/kegg)最獨(dú)特的特征。表8-2總結(jié)了不同類型網(wǎng)絡(luò)的實(shí)際應(yīng)用。通路圖包括代謝途徑、調(diào)控途徑和分子復(fù)合物的信息?;蚪M圖譜是染色體上基因的一維網(wǎng)絡(luò)。表達(dá)圖譜表示基因組中所有基因依賴于環(huán)境和時(shí)間的表達(dá),其中包括基因調(diào)控網(wǎng)絡(luò)如正向和負(fù)向共表達(dá)基因的聚類。直系同源組的表達(dá)是不同生物體中屬于同一功能單元的直系同源基因的集合。第41頁/共101頁網(wǎng)絡(luò)類型KEGG數(shù)據(jù)內(nèi)容通路通路圖譜代謝途徑,調(diào)控通路,復(fù)合物基因組基因組圖譜基因在染色體上的位置比較基因組圖譜聚類表達(dá)圖譜微陣列差異基因表達(dá)譜近鄰直系同源組表通路種基因功能單元層級(jí)數(shù)基因分類基因的層次分類生物學(xué)分類分子的層次分類疾病分類疾病的層次分類表8-2KEGG中的網(wǎng)絡(luò)數(shù)據(jù)表示第42頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院43圖8-12顯示:一組在基因組中位置相關(guān)的基因?qū)?yīng)于代謝途徑的一個(gè)功能單元。通過基因組—通路比較可以發(fā)現(xiàn)這一點(diǎn)。第43頁/共101頁圖8-12基因組-通路比較,基因組物理位置上關(guān)聯(lián)的基因與代謝途徑中
功能上關(guān)聯(lián)的基因產(chǎn)物之間相關(guān)第44頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院45圖8-13顯示了一類特定類型蛋白質(zhì),/折疊蛋白在代謝途徑中搜索的結(jié)果,這是KEGG中另一種網(wǎng)絡(luò)比較即層級(jí)樹—通路比較的例子。它表明結(jié)構(gòu)相似的酶催化連續(xù)的反應(yīng),提示基因復(fù)制在代謝途徑形成中的作用。第45頁/共101頁圖8-13層級(jí)樹—通路比較,顯示進(jìn)化上關(guān)聯(lián)的基因和代謝途徑
中功能上關(guān)聯(lián)的基因產(chǎn)物之間相關(guān)第46頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院47從全基因組預(yù)測(cè)完整的生化網(wǎng)絡(luò)的網(wǎng)絡(luò)預(yù)測(cè)問題是極具挑戰(zhàn)性的課題。和基于知識(shí)的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)一樣,基于知識(shí)的生化網(wǎng)絡(luò)預(yù)測(cè)也有望隨著已知生化途徑和復(fù)合物知識(shí)的積累變得愈來愈有效。下表比較了結(jié)構(gòu)預(yù)測(cè)和網(wǎng)絡(luò)預(yù)測(cè)問題。第47頁/共101頁蛋白質(zhì)折疊問題生物體重建問題預(yù)測(cè)結(jié)構(gòu)預(yù)測(cè)—從氨基酸序列預(yù)測(cè)蛋白質(zhì)結(jié)構(gòu)網(wǎng)絡(luò)預(yù)測(cè)—從全基因組序列預(yù)測(cè)完整的生化網(wǎng)絡(luò)知識(shí)已知的蛋白質(zhì)三維結(jié)構(gòu)已知的生化途徑和復(fù)合物基于知識(shí)的預(yù)測(cè)反向折疊(Threading)網(wǎng)絡(luò)重建從頭預(yù)測(cè)能量最小化路經(jīng)計(jì)算擾動(dòng)狀態(tài)預(yù)測(cè)蛋白質(zhì)工程通路工程表8-3蛋白質(zhì)折疊和生物體重建問題的比較第48頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院49§8.4幾種生化網(wǎng)絡(luò)8.4.1代謝網(wǎng)絡(luò)代謝網(wǎng)絡(luò)粗分為中間代謝和次級(jí)代謝:中間代謝是反應(yīng)途徑的核心部分,在許多生物體中是保守的。圖8-14顯示中間代謝的核心部分:糖酵解、三羧酸循環(huán)和戊糖磷酸途徑。每個(gè)節(jié)點(diǎn)是一個(gè)化合物,旁邊顯示其名稱,每個(gè)邊是化合物之間的酶催化的化學(xué)反應(yīng)。第49頁/共101頁圖8-14將糖酵解、三羧酸循環(huán)和戊糖磷酸途徑看作化合物網(wǎng)絡(luò)。每個(gè)圓
圈表示一個(gè)化合物,圓圈內(nèi)部數(shù)字表示該化合物的碳原子數(shù)第50頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院51這些核心途徑不是一個(gè)孤立的網(wǎng)絡(luò)。它與其它代謝網(wǎng)絡(luò)有大量的連接,還有一些與細(xì)胞轉(zhuǎn)運(yùn)系統(tǒng)連接。帶陰影的節(jié)點(diǎn)是12個(gè)代謝前體,是中間代謝中許多重要的生化合成途徑的起始點(diǎn)。第51頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院528.4.2基因組視角代謝網(wǎng)絡(luò)代謝是化合物網(wǎng)絡(luò),也是酶的網(wǎng)絡(luò)。圖8-14的糖酵解網(wǎng)絡(luò)部分用酶的基因符號(hào)表示就成為一個(gè)代謝的基因視角網(wǎng)絡(luò)。這里,一個(gè)結(jié)點(diǎn)是一個(gè)酶,用標(biāo)有EC編號(hào)的方框表示。一條邊是兩個(gè)酶的連接,包括兩者之間的化合物,分別為一個(gè)酶的產(chǎn)物和另一個(gè)酶的底物。由于每個(gè)生物體中酶的網(wǎng)絡(luò)等價(jià)于編碼酶的基因的網(wǎng)絡(luò),這個(gè)圖示在把基因組信息添加到代謝途徑知識(shí)上最為有用,有助于推導(dǎo)生物體的代謝情況。第52頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院53圖8-15中所示的糖酵解途徑中,代謝途徑中有三段是位置相關(guān)的成組基因。從丙酮酸到乙酰輔酶A,最后一步反應(yīng)被EC、2和等3個(gè)基因產(chǎn)物催化,他們都在一個(gè)操縱子結(jié)構(gòu)中。第53頁/共101頁圖8-15將糖酵解看作酶的網(wǎng)絡(luò)(基因的產(chǎn)物)。每個(gè)方框是一個(gè)酶,方框里
面是EC編號(hào)第54頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院558.4.3蛋白質(zhì)相互作用網(wǎng)絡(luò)代謝是生化途徑中一個(gè)相對(duì)熟知的部分,除了次級(jí)代謝外,它可用小分子化合物之間的化學(xué)反應(yīng)的簡(jiǎn)單邏輯來解釋。相比之下,有許多其它有待確定的各種各樣的網(wǎng)絡(luò),尤其是來自全基因組序列的分析。這些途徑涉及到蛋白質(zhì)相互作用,比簡(jiǎn)單的化學(xué)反應(yīng)遠(yuǎn)遠(yuǎn)復(fù)雜。第55頁/共101頁圖8-16蛋白質(zhì)相互作用的概念歸納第56頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院57研究所有不同分子之間的相互作用是一項(xiàng)極其復(fù)雜的任務(wù)。我們這里做一個(gè)簡(jiǎn)化,只考慮蛋白質(zhì)的二元相互作用,這可能是研究代謝網(wǎng)絡(luò)的可行辦法。圖8-16顯示了蛋白質(zhì)二元相互作用的概念。有蛋白質(zhì)之間的直接相互作用如結(jié)合意義下的相互作用,包括生物大分子復(fù)合物的形成,磷酸化的共價(jià)修飾,糖基化等。有蛋白質(zhì)之間的間接相互作用,如兩個(gè)酶由連續(xù)的化學(xué)反應(yīng)間接地相互作用。另一種重要的蛋白質(zhì)之間的間接的相互作用類型是基因表達(dá),一個(gè)蛋白質(zhì)的信息被傳遞到另一個(gè)蛋白質(zhì)要經(jīng)過依賴分子模板(基因)的蛋白質(zhì)的合成過程。第57頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院58圖8-17顯示了從全基因組序列預(yù)測(cè)或重建蛋白質(zhì)相互作用網(wǎng)絡(luò)的策略。首先,所有生化網(wǎng)絡(luò)的知識(shí)保存在一如KEGG的參考數(shù)據(jù)庫中。然后,參考基因組中基因的類別進(jìn)行基于知識(shí)的預(yù)測(cè)。接著,依據(jù)二元關(guān)系集合的路經(jīng)計(jì)算,預(yù)測(cè)網(wǎng)絡(luò)。第58頁/共101頁圖8-17從基因組信息重建網(wǎng)絡(luò)的策略第59頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院608.4.4基因調(diào)控網(wǎng)絡(luò)基因表達(dá)調(diào)控網(wǎng)絡(luò)的概念是遺傳決定論的自然延伸。這種觀點(diǎn)認(rèn)為特定基因表達(dá)的有序網(wǎng)絡(luò)決定諸如一個(gè)胚胎如何發(fā)育或一個(gè)細(xì)胞如何應(yīng)答外界刺激。基因組不僅包括基因的模板,也包括決定基因表達(dá)網(wǎng)絡(luò)的調(diào)控信號(hào)。第60頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院61相比之下,現(xiàn)在的觀點(diǎn)恰好相反?;虮磉_(dá)是蛋白質(zhì)相互作用的一種方式,細(xì)胞用它來限制和選擇蛋白質(zhì)。調(diào)控信號(hào)是恢復(fù)蛋白信號(hào)的指令。何時(shí)、何地以及如何恢復(fù)這種指令由細(xì)胞中相互作用分子的網(wǎng)絡(luò)決定。第61頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院628.4.5復(fù)雜系統(tǒng)生命本質(zhì)上是一個(gè)開放體系,如果將生物體隔離于動(dòng)態(tài)環(huán)境,必然產(chǎn)生生物體是穩(wěn)定的結(jié)論。以蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)為例,現(xiàn)在更傾向于認(rèn)為結(jié)構(gòu)是分子相互作用動(dòng)態(tài)過程的一部分。第62頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院63二元關(guān)系和演繹(路徑計(jì)算)的概念和它在KEGG中的實(shí)際應(yīng)用,可能僅僅是對(duì)基因組和生化網(wǎng)絡(luò)靜態(tài)方面的應(yīng)用。目前,已有模擬代謝網(wǎng)絡(luò)的時(shí)間依賴行為的嘗試,例如微分方程組和Petri網(wǎng)絡(luò)。生物網(wǎng)絡(luò)的集體行為來自網(wǎng)絡(luò)中以及與動(dòng)態(tài)環(huán)境的復(fù)雜的非線性相互作用,我們有必要揭示這種相互作用并理解網(wǎng)絡(luò)行為的一般規(guī)律。第63頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院64后基因組信息學(xué)研究定位在分子網(wǎng)絡(luò)層面,從分子或基因相互作用網(wǎng)絡(luò)的角度來理解單個(gè)細(xì)胞的行為。相互作用網(wǎng)絡(luò)的構(gòu)建及網(wǎng)絡(luò)一般規(guī)律的理解將成為生物學(xué)的主流。這實(shí)際上是所謂的復(fù)雜系統(tǒng)的一個(gè)例子。最終,生物復(fù)雜系統(tǒng)自組織的高級(jí)層次如腦功能、生態(tài)學(xué)乃至人類文明,可能都與基因組信息學(xué)相聯(lián)系,從而成為后基因組生物信息學(xué)的主題。第64頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院65系統(tǒng)結(jié)點(diǎn)邊蛋白質(zhì)三維結(jié)構(gòu)原子原子相互作用生物體分子分子彈相互作用腦細(xì)胞細(xì)胞相互作用生態(tài)系統(tǒng)生物體生物體相互作用文明人人相互作用表8-4復(fù)雜系統(tǒng)的示例第65頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院66§8.5蛋白質(zhì)—蛋白質(zhì)相互作用研究進(jìn)展8.5.1研究意義蛋白質(zhì)—蛋白質(zhì)相互作用在諸如DNA復(fù)制、轉(zhuǎn)錄、剪切和轉(zhuǎn)譯,到分泌、細(xì)胞周期的控制、代謝、細(xì)胞宏觀結(jié)構(gòu)和酶復(fù)合物形成等生命過程都是一基本問題。大的細(xì)胞結(jié)構(gòu)如細(xì)胞骨架、有絲分裂、紡錘體的形成,小的結(jié)構(gòu)如核仁、中心體和著絲點(diǎn)的形成等過程中,蛋白—蛋白相互作用都起著關(guān)鍵作用。除此而外,還有大量短暫蛋白—蛋白相互作用控制或調(diào)控許多細(xì)胞過程。第66頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院67例如,激酶、磷酸酶、糖基轉(zhuǎn)移酶、酰基轉(zhuǎn)移酶和蛋白酶等其作用物時(shí)間均很短暫。這種蛋白修飾酶涉及到大量基本生命過程,如細(xì)胞生長、細(xì)胞循環(huán)、代謝途徑和信號(hào)轉(zhuǎn)導(dǎo)等。第67頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院68蛋白—蛋白相互作用還與疾病有關(guān),因此這一問題的研究還有潛在的醫(yī)療價(jià)值。與基因組相比,蛋白質(zhì)組更加易變。蛋白質(zhì)形成大的相互作用網(wǎng)絡(luò),進(jìn)行調(diào)控和相互支持。為了理解細(xì)胞的機(jī)制,簡(jiǎn)單地羅列蛋白是不夠的,必須搞清楚全部的相互作用。第68頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院698.5.2實(shí)驗(yàn)手段傳統(tǒng)地有遺傳學(xué)、生化、生物物理等技術(shù)。最有效手段是酵母雙雜交系統(tǒng),還有關(guān)聯(lián)mRNA表達(dá)譜,二維凝膠電泳,生物質(zhì)譜儀分析蛋白復(fù)合物。外加從基因組上下文比較預(yù)測(cè)的相互作用(基因融合、基因近鄰、基因共存和形態(tài)發(fā)生等方法)。已研究酵母、幽門螺桿菌的相互作用譜,也有人發(fā)展軟件用圖更加直觀地圖示這些網(wǎng)絡(luò)。第69頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院709.5.3理論方法由于實(shí)驗(yàn)技術(shù)不僅費(fèi)時(shí)、強(qiáng)度大、假陽性大,而且遠(yuǎn)遠(yuǎn)不能滿足理論工作的要求。所以,有必要發(fā)展理論的預(yù)測(cè)方法,預(yù)測(cè)蛋白質(zhì)對(duì)間有無相互作用。第70頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院71結(jié)構(gòu)基因組學(xué)方法基本思想:如果兩蛋白或兩蛋白功能域的相互作用模式已知,那么可以推測(cè):其它結(jié)構(gòu)同源物(特別是具有結(jié)構(gòu)相似的活性位點(diǎn))之間也會(huì)有同樣的相互作用。第71頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院72Park等分析了PDB庫中多肽鏈內(nèi)功能域間的相互作用。他們用5個(gè)小于5?的原子間的接觸作為閾值確定PDB輸入條中SCOP功能域間的相互作用。在1.48版SCOP庫中,已知結(jié)構(gòu)蛋白的功能域分成771個(gè)超家族。其中,334個(gè)不同超家族的278種相互作用發(fā)生在同鏈功能域間,91%的超家族僅與一個(gè)或兩個(gè)超家族有聯(lián)系。也有少數(shù)復(fù)雜情形下,一個(gè)超家族會(huì)與多達(dá)14種不同的超家族有聯(lián)系。用Park工作可以預(yù)測(cè)結(jié)構(gòu)未知的多肽鏈中功能域間的相互作用。第72頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院73
從基因組序列預(yù)測(cè)過去兩三年來,已發(fā)展了一系列從基因組序列預(yù)測(cè)蛋白間相互作用的方法。大致歸納為三類。(1)從基因表達(dá)水平的關(guān)聯(lián)預(yù)測(cè)思路:如果兩多肽鏈為同一蛋白或蛋白復(fù)合物的一部分,它們常常作為相互作用對(duì)在DNA水平一起表達(dá)或調(diào)控。方法:通過基因關(guān)聯(lián)表達(dá)數(shù)據(jù)的分析可以預(yù)測(cè)同一蛋白或蛋白復(fù)合物中多肽鏈之間的相互作用。使用范圍:該法只適用于同一蛋白或蛋白復(fù)合物中兩多肽鏈,因?yàn)橐话銇碚f兩相互作用蛋白對(duì)在基因表達(dá)水平并無關(guān)聯(lián)。第73頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院74(2)尋找基因的保守近鄰或同一操縱子中的共存基因Ouzonis和Karp分析E.coli的代謝途徑,發(fā)現(xiàn)同一蛋白的不同亞基在基因組中幾乎總是相鄰的(超過90%)。方法:通過尋找不同基因組間基因順序的保守性,或者通過尋找兩個(gè)蛋白的基因,它們?cè)谀骋换蚪M中相鄰,在另一基因組中是單一基因的兩部分,可以預(yù)測(cè)處于同一蛋白上的兩亞基間的相互作用。第74頁/共101頁圖8-18基因近鄰法示意圖第75頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院76Dandekar等研究了9個(gè)細(xì)菌基因組直系同源對(duì)的基因順序的保守性,發(fā)現(xiàn)盡管基因順序的保守性很差,但還是有大量保守的基因?qū)?。這些保守基因?qū)幋a的蛋白有直接的物理相互作用。Dandekar等從每一基因組中找到了100個(gè)蛋白用于以基因順序?yàn)榛A(chǔ)的相互作用的預(yù)測(cè)。Huynen估計(jì)大約有63%的保守相鄰基因的結(jié)構(gòu)復(fù)合物有直接的相互作用。第76頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院77大多數(shù)基因的前后近鄰一般是變化的,但也有一些基因在多個(gè)基因組中有高度保守的近鄰(如trpA和trpB),這種保守性是由于基因產(chǎn)物的物理或功能相互作用引起。當(dāng)然,這種保守性并不具有普遍性。Lathe注意到:盡管基因近鄰千變?nèi)f化,但在同一功能相關(guān)基因集合中上下文會(huì)有共存基因出現(xiàn)。他們將這種在高級(jí)組織水平的保守基因簇稱為Uber-operon。然后用于討論轉(zhuǎn)譯、鞭毛蟲蛋白和ABC運(yùn)輸操縱子中的基因近鄰問題。這一概念可以用于功能注釋和蛋白質(zhì)相互作用預(yù)測(cè)。第77頁/共101頁圖8-19不同生物體中色氨酸操縱子的結(jié)構(gòu)
第78頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院79箭頭表示轉(zhuǎn)錄的方向。黑線表示通過插入基因組序列對(duì)操縱子的割裂。雙黑線表示大于50個(gè)基因的割裂?;蚓幋a的蛋白質(zhì)如下:trpA,色氨酸合成酶α鏈;trpB,色氨酸合成酶β鏈;trpC,吲哚-3-丙三醇磷酸合成酶;trpD,氨基苯甲酸磷酸核糖基轉(zhuǎn)移酶;trpE,氨基苯甲酸合成酶I;trpF,氨基苯甲酸磷酸核糖基異構(gòu)酶;trpG,氨基苯甲酸合成酶II;基因數(shù)字在基因組上按順序排列。trpA-trpB基因?qū)υ?個(gè)基因組中保守。第79頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院80Overbeek等則主要研究在染色體上相互近鄰的代謝途徑中基因簇中基因產(chǎn)物間的相互作用。他們定義了一系列量對(duì)基因進(jìn)行分簇,然后借助一個(gè)或多個(gè)PCBBH或PCH,建立蛋白對(duì)之間的功能耦合。Overbeek給出了一系列通路(如purinebiosynthesis,Glycolysispathway等)中基因簇中各蛋白相互作用的耦合分值?;蚍执卦诩?xì)菌中很常見,使用大量基因組的保守基因簇可以預(yù)測(cè)其它基因組中的基因或蛋白質(zhì)之間的相互作用。第80頁/共101頁圖8-20PCBBHs和PCHs定義示意圖第81頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院82(3)用基因融合法預(yù)測(cè)蛋白—蛋白相互作用一般認(rèn)為,基因融合是進(jìn)化過程中功能水平選擇壓力作用的必然結(jié)果。其基本原理:進(jìn)化過程中,基因可以融合(fusion)成一個(gè)較大的“CompositeGene”,也可分裂(fission)成較小的“ComponentGene”。在一個(gè)基因組中出現(xiàn)的“CompositeGene”(也叫RosettastoneSequence)可以推測(cè)在其它基因組中ComponentGenes之間的功能相互作用。第82頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院83比如在E.coli中DNA旋轉(zhuǎn)酶GyrA和GyrB在yeast中熔入單一肽鏈中成為拓?fù)洚悩?gòu)酶II,這樣一來我們可以推測(cè)E.coli中GyrA和GyrB有相互作用(圖8-21)。對(duì)E.coli的4290個(gè)蛋白搜索發(fā)現(xiàn)6809個(gè)候選相互作用對(duì)。第83頁/共101頁圖8-21基因融合法原理示意圖第84頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院85Enright使用BLAST確定蛋白間的直系同源物,發(fā)現(xiàn)EC,HI,MJ和SC中的64個(gè)融合事件。Huynen發(fā)現(xiàn)63%的預(yù)測(cè)涉及物理相互作用,15%為同一代謝途徑的基因,即功能相互作用。Marcotte等使用Pfam和ProDom蛋白質(zhì)家族庫中所列的遠(yuǎn)親同源物確定蛋白質(zhì)功能域間的同源性。這一方法假定:如果一蛋白中出現(xiàn)兩功能域,那么來自這兩家族中的所有功能域均相互作用。第85頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院86這一方法存在較大的假陽性和假陰性。假陰性(丟失真實(shí)相互作用)的原因是許多蛋白—蛋白相互作用由其它機(jī)制導(dǎo)致,這種情況中無法找到Compositeprotein或Rosettastone序列。假陽性(假相互作用)可能是由于功能(或基因)有熔合,但相互作用只是功能意義上的,而非真正的物理相互作用。第86頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院87一般來說,以同一調(diào)控約束(換句話說:染色體上近鄰或處于同一肽鏈)為基礎(chǔ)的蛋白相互作用預(yù)測(cè)方法僅限于對(duì)同一蛋白(或復(fù)合物)亞單位,同一代謝途徑中的蛋白有效。第87頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院88
使用種系發(fā)生輪廓法預(yù)測(cè)蛋白—蛋白相互作用假定功能相關(guān)的蛋白以關(guān)聯(lián)形式進(jìn)化,那么在機(jī)體的同一子集中的蛋白會(huì)有同源性。一般地,功能相關(guān)蛋白并無氨基酸序列上的相似性,傳統(tǒng)的序列比對(duì)技術(shù)不能使用。對(duì)每一蛋白構(gòu)建一種系發(fā)生輪廓。該輪廓有n個(gè)輸入基因組,用1表示第n個(gè)基因組有給定蛋白的同源物,0表示沒有。第88頁/共101頁2023/3/23BIOINFORMATICS數(shù)理與生物工程學(xué)院89以RL7(ribosomeprotein),F(xiàn)lgL(flagellarstructureprotein)和HIS5(histidinebiosyntheticprotein)為例,建立種系發(fā)生輪廓。結(jié)果表明:具有相似輪廓的蛋白在功能上相關(guān)。因此,可以說:通過蛋白的種系發(fā)生輪廓描述組織中同源物的有/無,比較該輪廓是識(shí)別有蛋白相互作用復(fù)合物或通路的有效工具。第89頁/共101頁圖8
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 幼兒園安全檢查及隱患整改實(shí)施方案
- 醫(yī)院病案管理委員會(huì)工作制度
- 有限空間作業(yè)審批制度
- 食品配送中心管理方案
- 外墻涂料吊繩施工方案
- 小學(xué)心理援助項(xiàng)目實(shí)施方案范本
- 社交網(wǎng)絡(luò)推廣與營銷執(zhí)行方案
- 基坑防護(hù)方案
- 公司辦公設(shè)備采購清單及預(yù)算方案
- 常用理氣方劑治療方案解析
- 資產(chǎn)管理部2025年工作總結(jié)與2025年工作計(jì)劃
- 科技成果轉(zhuǎn)化技術(shù)平臺(tái)
- 下腔靜脈濾器置入術(shù)的護(hù)理查房
- 基建人員考核管理辦法
- 2025體育與健康課程標(biāo)準(zhǔn)深度解讀與教學(xué)實(shí)踐
- 礦山救援器材管理制度
- 2025西南民族大學(xué)輔導(dǎo)員考試試題及答案
- T/CSPSTC 17-2018企業(yè)安全生產(chǎn)雙重預(yù)防機(jī)制建設(shè)規(guī)范
- 2025年《三級(jí)物業(yè)管理師》考試復(fù)習(xí)題(含答案)
- 《數(shù)據(jù)與管理》課件
- 2025屆北京市西城區(qū)北京四中高考英語二模試卷含答案
評(píng)論
0/150
提交評(píng)論