生物網(wǎng)絡(luò)分析及比對概述_第1頁
生物網(wǎng)絡(luò)分析及比對概述_第2頁
生物網(wǎng)絡(luò)分析及比對概述_第3頁
生物網(wǎng)絡(luò)分析及比對概述_第4頁
生物網(wǎng)絡(luò)分析及比對概述_第5頁
已閱讀5頁,還剩32頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

生物網(wǎng)絡(luò)分析及比對概述生物網(wǎng)絡(luò)分析及比對概述生物網(wǎng)絡(luò)分析及比對概述V:1.0精細整理,僅供參考生物網(wǎng)絡(luò)分析及比對概述日期:20xx年X月生物網(wǎng)絡(luò)分析及比對概述收稿日期:2016-03-10通信作者:路東方(1991~),男,碩士研究生,研究方向為生物信息學(xué)等.E-mail:ludongfang@路東方(上海大學(xué)計算機工程與科學(xué)學(xué)院,上海200072)摘要:生物網(wǎng)絡(luò)是復(fù)雜網(wǎng)絡(luò),也是以系統(tǒng)科學(xué)的思想研究生命科學(xué)的橋梁。網(wǎng)絡(luò)中的節(jié)點可以是蛋白質(zhì),基因,RNA或DNA等,網(wǎng)絡(luò)的邊對應(yīng)節(jié)點之間的物理、生化或功能上的相互作用。生物分子之間的相互作用并不是一成不變的,反映在基因調(diào)控網(wǎng)絡(luò)上,則節(jié)點之間的邊會因時間、空間或外部環(huán)境的變化而發(fā)生變化。網(wǎng)絡(luò)比較和分析是生物網(wǎng)絡(luò)的研究重點。網(wǎng)絡(luò)中生物分子及其相互作用的顯著變化,形成差異性網(wǎng)絡(luò),這種差異性變化對細胞信號傳導(dǎo)、細胞發(fā)育、環(huán)境壓力、藥物治療以及疾病狀態(tài)的轉(zhuǎn)變具有重大的參考價值。本文對生物網(wǎng)絡(luò)進行總結(jié),并介紹近年來采用的不同分析方法。關(guān)鍵詞:生物網(wǎng)絡(luò);基因調(diào)控;差異性網(wǎng)絡(luò);中圖分類號:文獻標(biāo)志碼:AAsurveyof

biologicalnetworkanalysisandcomparisonLuDongfang(SchoolofComputerEngineeringandScience,ShanghaiUniversity,Shanghai200072,China)Abstract:Biologicalnetworkisnotonlyacomplexnetwork,butalsotobridgeresearchideaoflifeofsystemscience.Thenodesinthenetworkcanbeproteingene,RNA,orDNA,betweenthephysicalnetworkedgecorrespondingtonodes,biochemicalinteractionorfunction.Theinteractionbetweenthebiologicalmoleculesisnotimmutableandfrozen,reflectedinthegenetheregulationofthenetwork,thenodebetweenthesidebecauseofthetime,spaceorchangesintheexternalenvironmentchanges.Thecomparisonandanalysisofthenetworkisthefocusofresearchonbiologicalnetworks.Significantchangesinbiomolecularnetworksandtheirinteractionsintheformationofdifferentnetwork,changethedifferenceofcellsignaltransduction,cellgrowth,environmentalpressurechange,drugtherapyanddiseasestatusisofgreatreferencevalue.Thispapersummarizesthebiologicalnetwork,andintroducesthedifferentanalysismethodsusedinrecentyears.Keywords:biologicalnetworks;generegulation;differentialnetwork1背景介紹生物網(wǎng)絡(luò)是復(fù)雜網(wǎng)絡(luò),也是以系統(tǒng)科學(xué)的思想研究生命科學(xué)的橋梁[1,2]。網(wǎng)絡(luò)中的節(jié)點可以是蛋白質(zhì),基因,RNA或DNA等,網(wǎng)絡(luò)的邊對應(yīng)節(jié)點之間的物理、生化或功能上的相互作用。目前備受關(guān)注的包括基因調(diào)控網(wǎng)絡(luò)[3-6](generegulatorynetwork)、蛋白質(zhì)相互作用網(wǎng)絡(luò)[7-10](protein-proteinnetwork)、轉(zhuǎn)錄調(diào)控網(wǎng)絡(luò)[11-13](transcriptionregulatorynetwork)、代謝網(wǎng)絡(luò)[14-15](metabolicnetwork)等。生物分子之間的相互作用并不是一成不變的,反映在基因調(diào)控網(wǎng)絡(luò)上,則節(jié)點之間的邊會因時間、空間或外部環(huán)境的變化而發(fā)生變化,或者說,生物網(wǎng)絡(luò)中的邊具有不確定性,只是以一定的概率存在,在特定的情況下,生物網(wǎng)絡(luò)具有“重布線”(rewiring)的能力。而且,網(wǎng)絡(luò)中不僅節(jié)點之間存在依賴關(guān)系,邊之間也存在依賴關(guān)系,即一種調(diào)控關(guān)系的出現(xiàn)或消失往往伴隨著其它調(diào)控關(guān)系的消失或出現(xiàn)。所以生物網(wǎng)絡(luò)是屬性依賴網(wǎng)絡(luò)(DependencyNetwork)。21世紀(jì)是系統(tǒng)科學(xué)的時代,如何通過生物實驗數(shù)據(jù)挖掘出生物網(wǎng)絡(luò)的潛在變化,一直是以系統(tǒng)的方法研究生命現(xiàn)象的熱點和難點[16]。據(jù)美國國家醫(yī)學(xué)圖書館PubMed數(shù)據(jù)庫的統(tǒng)計,研究生物網(wǎng)絡(luò)的文獻一直呈上升趨勢,特別是2000年以來,更是以每五年翻一番的速度在增長。其中,通過網(wǎng)絡(luò)研究干細胞的文獻也在近幾年急劇上升(圖1)。歷年與生物網(wǎng)絡(luò)有關(guān)的文獻數(shù)圖1生物網(wǎng)絡(luò)相關(guān)研究近年受到越來越多的關(guān)注(PubMed,2016.2.15)網(wǎng)絡(luò)比較和分析是生物網(wǎng)絡(luò)的研究重點。2000年以來,國內(nèi)外眾多研究機構(gòu),包括中國科學(xué)院數(shù)學(xué)與系統(tǒng)科學(xué)研究院及上海生命科學(xué)研究院[17]、中國科技大學(xué)[18]、電子科技大學(xué)[19]、西安電子科技大學(xué)[20],以及麻省理工學(xué)院小組[21-23]、斯坦福大學(xué)[24]、英國帝國理工學(xué)院[25-26]等都在這一領(lǐng)域做出了杰出的貢獻。然而,我們更希望了解“生物系統(tǒng)(網(wǎng)絡(luò))的哪些部分最容易受到擾動的影響”的答案??茖W(xué)界于是展開了差異性網(wǎng)絡(luò)分析的研究。網(wǎng)絡(luò)中生物分子及其相互作用的顯著變化,形成差異性網(wǎng)絡(luò)(DifferentialNetwork),這種差異性變化對細胞信號傳導(dǎo)、細胞發(fā)育、環(huán)境壓力、藥物治療以及疾病狀態(tài)的轉(zhuǎn)變具有重大的參考價值[27]。近年來,各種差異性網(wǎng)絡(luò)分析通過測量不同條件下的生物網(wǎng)絡(luò)并進行比較,確定不同網(wǎng)絡(luò)間相互作用模塊的增加、減少或更改[28]。類似于差異表達分析,差異性網(wǎng)絡(luò)分析主要針對不同實驗條件下兩個網(wǎng)絡(luò)的“減法”過程[29]。該減法過程過濾了普遍存在的相互作用(即“看家”相互作用),通過選擇性地提取相關(guān)研究條件或表型的相互作用,降低了代表性靜態(tài)網(wǎng)絡(luò)的復(fù)雜性[30-32],但差異性網(wǎng)絡(luò)分析致力于網(wǎng)絡(luò)的動態(tài)“重布線”,這于靜態(tài)網(wǎng)絡(luò)是無法完成的。如前文所述,由于生物網(wǎng)絡(luò)的特殊生物學(xué)意義,網(wǎng)絡(luò)的邊在具有不確定性的同時,網(wǎng)絡(luò)拓撲又具有典型的屬性依賴關(guān)系,簡單地進行“減法”很難完成差異性的度量。大多數(shù)的生物網(wǎng)絡(luò)差異性的分析方法依賴于不同的相關(guān)性來衡量網(wǎng)絡(luò)中頂點對之間的關(guān)聯(lián)強度,其研究的重點在于相關(guān)性的度量和差異性指標(biāo)的提取、差異性度量方法和先驗知識的融合。Zhang提出差異依賴網(wǎng)絡(luò)(DDN),應(yīng)用Lasso算法提取特征來表示網(wǎng)絡(luò)的局部結(jié)構(gòu),通過機器學(xué)習(xí)局部網(wǎng)絡(luò)結(jié)構(gòu)以檢測有統(tǒng)計學(xué)意義的拓撲變化的轉(zhuǎn)錄網(wǎng)絡(luò)[33];RyanGill等人通過基因芯片數(shù)據(jù),構(gòu)建不同條件下的網(wǎng)絡(luò),并進行差異分析,該方法的核心是以計算的連通分?jǐn)?shù)代表基因相關(guān)性或基因之間的相互作用的強度,然后根據(jù)這個分?jǐn)?shù),確定兩個網(wǎng)絡(luò)的整體模塊化結(jié)構(gòu)是否不同,一組特定基因的連通性是否發(fā)生改變,以及某一個基因的連通性是否發(fā)生變化[34];TreyIdeker等人則特別關(guān)注了“差異性相互作用”的打分,提出基于統(tǒng)計學(xué)信息建立定量的差異評分[35];Przulj提出采用圖元(graphlet)[36]及圖元向量提取網(wǎng)絡(luò)節(jié)點間的拓撲關(guān)系,研究生物網(wǎng)絡(luò)與隨機網(wǎng)絡(luò)的拓撲結(jié)構(gòu)差異,國內(nèi)劉文斌等人則在此基礎(chǔ)上定義了二種節(jié)點變化的差距度量方法,并以此挖掘網(wǎng)絡(luò)中模塊內(nèi)和模塊間的變化基因簇[37]。2015年提出的DINGO[38]考慮到跨組數(shù)據(jù)之間的保守關(guān)系,通過將網(wǎng)絡(luò)分解為全局和種群特異性成分,聯(lián)合估計特異性種群的條件依賴關(guān)系,基于通路的基因組學(xué)進行差異性網(wǎng)絡(luò)分析和推理差異網(wǎng)絡(luò);在最新的研究中,Diffany[39]是一個本體驅(qū)動的框架,用以推斷、可視化和分析任意條件下網(wǎng)絡(luò)狀況的具體變化,它提出了一個綜合的標(biāo)準(zhǔn)化方法,該方法可以通過一個統(tǒng)一的角度來分析并促進兩個網(wǎng)絡(luò)的可比性。先驗知識正逐漸融入到生物網(wǎng)絡(luò)的差異性分析中。KDDN是一個知識融合的差異屬性依賴網(wǎng)絡(luò)方法,可以集成數(shù)據(jù)和先驗知識同時構(gòu)建通用的和差異性網(wǎng)絡(luò),它試圖通過機械論的原理為網(wǎng)絡(luò)“重布線”提供新的見解[40];發(fā)表在2016年P(guān)SB上的文獻[41]將先驗知識用于網(wǎng)絡(luò)推導(dǎo),利用先驗知識為依賴關(guān)系帶來的額外信息,明顯提高了結(jié)果的可解釋性,且識別的目標(biāo)基因依賴于特定的條件。綜上所述,生物網(wǎng)絡(luò)是研究生物機體的重要途徑,其核心問題是屬性依賴網(wǎng)絡(luò)的距離度量、特異性屬性依賴子網(wǎng)的提取?;趩渭毎麛?shù)據(jù),在構(gòu)建生物網(wǎng)絡(luò)的基礎(chǔ)上研究特異性屬性依賴,其網(wǎng)絡(luò)距離度量方法、特異性屬性依賴關(guān)系的評價指標(biāo)是關(guān)鍵。2生物網(wǎng)絡(luò)構(gòu)建2.1生物網(wǎng)絡(luò)重建概念生物的基因組序列類似于含有一系列組件的電路,不同的是許多組件之間關(guān)系、組件自身的功能仍然有許多是不明確的。系統(tǒng)生物學(xué)的一個方面就是致力于解決這些不明確(謎團)。半個世紀(jì)中基因?qū)W、分子生物學(xué)和生物化學(xué)方面的研究進展,使得在已經(jīng)被熟悉研究(well-studied)的細胞功能(如新陳代謝)領(lǐng)域,能夠進行基因組水平的生物網(wǎng)絡(luò)重構(gòu)(這里的重建reconstruction應(yīng)該意指構(gòu)建一個網(wǎng)絡(luò)去還原原本的實際生物過程)。一個有著效用良好的(quality-controlled)的重建網(wǎng)絡(luò)能將生物體在基因組水平進行數(shù)學(xué)建模。因此產(chǎn)生了一系列基于自底向上這一原則的方法來進行系統(tǒng)生物學(xué)研究。Bottom-up系統(tǒng)生物有助于在基因組水平解釋和理解“基因型-表現(xiàn)型關(guān)系”。一個生物體的所有基因型包含著決定生物體形式和功能的信息,因此,理解和使用“基因型-表現(xiàn)型”關(guān)系是系統(tǒng)生物學(xué)的基石。 圖2生物分子到生物體與電子元器件到收音機的類比 重建網(wǎng)絡(luò)的過程其實就是根據(jù)bottom-up方法推斷網(wǎng)絡(luò)結(jié)構(gòu)的過程。生物學(xué)家和化學(xué)家在分子層面確定它們之間反應(yīng),同時將輸入輸出特殊化(characterize)。輸出往往是屬于所有的生物體而不是某一特定生物,應(yīng)該手動確定一個某一個反應(yīng)是否屬于某一特定網(wǎng)絡(luò)成為一個最耗時的過程。使用計算工具和算法來進行網(wǎng)絡(luò)的重建成為一個重要的課題。重建出來網(wǎng)絡(luò)往往不具有完全網(wǎng)絡(luò)的所有特性,因此標(biāo)準(zhǔn)系統(tǒng)確認技術(shù)被用于擴展模型適應(yīng)性和推斷網(wǎng)絡(luò)遺失內(nèi)容。2.2蛋白質(zhì)相互作用網(wǎng)絡(luò)研究蛋白質(zhì)相互作用網(wǎng)絡(luò)進化,在蛋白質(zhì)層次上,主要是研究蛋白質(zhì)相互作用網(wǎng)絡(luò)對蛋白質(zhì)個體進化性質(zhì)的影響。其中,頗具爭議并且被研究最多的問題便是探討蛋白質(zhì)相互作用是否會減慢蛋白質(zhì)進化速率。早在2002年,通過評估酵母同線蟲中的直系同源蛋白的進化距離,F(xiàn)raser等[42]發(fā)現(xiàn),在酵母蛋白質(zhì)相互作用網(wǎng)絡(luò)中,蛋白連接度(與該蛋白質(zhì)發(fā)生相互作用的蛋白質(zhì)數(shù)目)與其進化速率呈顯著負相關(guān).他們進一步指出,那些具有更多相互作用對象的蛋白質(zhì)之所以進化更慢是因為它們承受了更強烈的選擇壓力.但這些蛋白質(zhì)之所以承受更強烈的選擇壓力不是因為它們對生物體更重要,而是因為它們的氨基酸序列中有更多的位點參與了更多的相互作用.在隨后幾年,蛋白連接度同其進化速率的關(guān)系受到了學(xué)術(shù)界的廣泛關(guān)注。2003年,使用另一種進化距離計算方法,利用在進化上更近的參考物種和可信度更高的相互作用數(shù)據(jù)集[43]。2005年,通過對高質(zhì)量的酵母和線蟲相互作用數(shù)據(jù)集分別作分析,Agrafioti等[44]再次肯定了Bloom等關(guān)于蛋白質(zhì)表達水平在蛋白連接度同其進化速率負相關(guān)中起重要作用的觀點。他們又進一步將蛋白質(zhì)功能、參與的生物學(xué)過程和細胞組分等因素引入了分析。2007年,Kim等[45]將研究視野擴展到整個網(wǎng)絡(luò),研究蛋白質(zhì)在整個網(wǎng)絡(luò)中的位置與其自身所受選擇壓力的關(guān)系。通過衡量種內(nèi)單核苷酸多態(tài)性、種間序列分歧以及檢測基因組結(jié)構(gòu)變量來衡量蛋白質(zhì)所受的選擇壓力,發(fā)現(xiàn)處于正向選擇的蛋白質(zhì)趨向于定位在相互作用網(wǎng)絡(luò)的外圍。由此推測,這種現(xiàn)象的出現(xiàn)是由于網(wǎng)絡(luò)外圍蛋白暴露面較多或者有更多的對外界環(huán)境變化的適應(yīng)性事件發(fā)生??梢灶A(yù)見,作者觀察到的這種現(xiàn)象對網(wǎng)絡(luò)數(shù)據(jù)的完整性和質(zhì)量應(yīng)該很敏感??v觀近些年來蛋白質(zhì)相互作用網(wǎng)絡(luò)聚類研究的發(fā)展,人們借助復(fù)雜網(wǎng)絡(luò)、圖論以及信息論等理論和方法取得了豐碩的成果。但隨著研究的深入和認識的加深,在蛋白質(zhì)相互作用網(wǎng)絡(luò)的聚類研究中還有許多亟待解決的問題,蘊藏著極大的研究潛力。雖然目前借助聚類分析對蛋白質(zhì)相互作用網(wǎng)絡(luò)的拓撲結(jié)構(gòu)已經(jīng)有了一定程度的了解,但對于這種結(jié)構(gòu)的形成機理以及進化和自然選擇在蛋白質(zhì)相互作用網(wǎng)絡(luò)拓撲結(jié)構(gòu)形成方面所起的作用還不十分清楚。因此將聚類分析與生物的進化過程相結(jié)合研究蛋白質(zhì)相互作用網(wǎng)絡(luò)的拓撲結(jié)構(gòu)形成將是今后的研究趨勢之一。其次,隨著系統(tǒng)生物學(xué)研究的不斷深入和生物學(xué)網(wǎng)絡(luò)整合程度的不斷加深,蛋白質(zhì)相互作用網(wǎng)絡(luò)的聚類研究也將更多地考慮基因調(diào)控、信號轉(zhuǎn)導(dǎo)、代謝等其他網(wǎng)絡(luò)的信息和網(wǎng)絡(luò)間的聯(lián)系。因此整合各種生物網(wǎng)絡(luò)的信息,并根據(jù)生物體的特點,考慮網(wǎng)絡(luò)中存在的正負反饋環(huán)的影響,從系統(tǒng)生物學(xué)角度進行蛋白質(zhì)相互作用網(wǎng)絡(luò)的聚類研究將成為今后研究的一個重要方向。2.3基因調(diào)控網(wǎng)絡(luò)基因調(diào)控網(wǎng)絡(luò)(GeneRegulatoryNetworks,GRN)是一種表示基因間復(fù)雜調(diào)控關(guān)系的生物網(wǎng)絡(luò),也是理解基因功能的最重要手段之一。通過構(gòu)建基因調(diào)控網(wǎng)絡(luò)可以全面分析和了解基因之間的相互作用關(guān)系,認識并掌握細胞生命活動的運作機制,已成為生物信息學(xué)和系統(tǒng)生物學(xué)的一個研究熱點。近年來,基因調(diào)控網(wǎng)絡(luò)越來越多地應(yīng)用到疾病基因預(yù)測、藥物靶標(biāo)的篩選等領(lǐng)域,并對疾病早期診斷、個性化治療、藥物研制產(chǎn)生了深遠的影響。因此,基因調(diào)控網(wǎng)絡(luò)構(gòu)建及其應(yīng)用在理論與實踐兩方面均具有重要的價值和意義。基因調(diào)控網(wǎng)絡(luò)中節(jié)點間的調(diào)控作用是有向的,有促進和抑制兩種,因此,基因調(diào)控網(wǎng)絡(luò)可以用有向圖來表示。所有生物的生長發(fā)育和分化過程,以及對外部環(huán)境的反應(yīng),都與各種相關(guān)基因有條不紊的表達有著至關(guān)重要的關(guān)系。從理論上講,基因表達調(diào)控可以發(fā)生在遺傳信息傳遞過程的各個水平上?;蛘{(diào)控研究的重點主要有DNA水平上的調(diào)控、轉(zhuǎn)錄水平上的表達調(diào)控以及翻譯水平上的表達調(diào)控。其中轉(zhuǎn)錄調(diào)控是基因表達調(diào)控中最重要、最復(fù)雜的一個環(huán)節(jié),也是當(dāng)前研究的重點。最早的基因調(diào)控網(wǎng)絡(luò)模型可以追溯到20世紀(jì)60年代Jacob和Monod關(guān)于乳糖操縱子的調(diào)控研究[46]。隨著近幾十年的發(fā)展,發(fā)展的基因調(diào)控網(wǎng)絡(luò)數(shù)學(xué)模型主要有有向圖、布爾網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)模型、微分方程模型、隨機模型、混合模型等。相對來講,有向圖和布爾網(wǎng)絡(luò)是較為簡單的模型,對系統(tǒng)的模擬是定性的、較為粗糙的;貝葉斯網(wǎng)絡(luò)是一種概率模型,可以定量地、隨機地描述調(diào)控網(wǎng)絡(luò);微分方程則可以定量、精確地預(yù)測系統(tǒng)的行為,但隨著網(wǎng)絡(luò)規(guī)模增大,面臨參數(shù)估計及計算難度大的問題;隨機模型能夠?qū)W(wǎng)絡(luò)中物種分子數(shù)目進行精細的擬合,但是同樣由于計算量較大,往往難于應(yīng)用到實際大型網(wǎng)絡(luò)中去。所有的這些模型,都是在一定假設(shè)的基礎(chǔ)上,對原有的生物過程進行了簡化。3差異網(wǎng)絡(luò)分析差異分析對于揭示生命體的生長、發(fā)育和衰老過程及疾病發(fā)生具有重大的意義,基于網(wǎng)絡(luò)的差異分析方法已經(jīng)成為系統(tǒng)生物學(xué)的一個研究熱點。網(wǎng)絡(luò)節(jié)點往往通過與局部結(jié)構(gòu)作用實現(xiàn)某種功能,其與局部結(jié)構(gòu)的關(guān)系變化,很可能影響其功能。在生物網(wǎng)絡(luò)中,節(jié)點往往通過與局部結(jié)構(gòu)作用實現(xiàn)功能,其與局部結(jié)構(gòu)的關(guān)系發(fā)生變化,可能會影響其功能。因此,如何理解和刻畫網(wǎng)絡(luò)節(jié)點的局部結(jié)構(gòu)特征及變化,對于認識生物系統(tǒng)的結(jié)構(gòu)和功能的關(guān)系具有非常重要的意義。將不同條件下獲得的數(shù)據(jù)構(gòu)建靜態(tài)網(wǎng)絡(luò),可以用于解釋各種基因調(diào)控機制。然而,基因調(diào)控網(wǎng)絡(luò)是動態(tài)的,在不同的特定條件下,網(wǎng)絡(luò)表現(xiàn)出不同的調(diào)控模式,當(dāng)然也就有不同的轉(zhuǎn)錄網(wǎng)絡(luò)拓撲結(jié)構(gòu)。因此,研究轉(zhuǎn)錄網(wǎng)絡(luò)的拓撲結(jié)構(gòu)變化可以促進對細胞發(fā)育的理解,并對某些疾病的病理生理過程提供新的見解,這有助于確定的關(guān)鍵基因,也可以作為生物標(biāo)志物或藥物靶標(biāo)。 2009年,B.Zhang等人介紹一個差異依賴網(wǎng)絡(luò),提出DDN算法,以檢測有統(tǒng)計學(xué)意義的拓撲變化的轉(zhuǎn)錄網(wǎng)絡(luò)。這個依賴于局部的模型通過一組條件概率,應(yīng)用Lasso算法(Lasso的基本思想是在回歸系數(shù)的絕對值之和小于一個常數(shù)的約束條件下,使殘差平方和最小化,從而能夠產(chǎn)生某些嚴(yán)格等于0的回歸系數(shù),得到可以解釋的模型),來表示網(wǎng)絡(luò)的局部結(jié)構(gòu)。隨后進行的置換檢驗,估計每個學(xué)習(xí)的局部結(jié)構(gòu)的統(tǒng)計學(xué)意義。在模擬數(shù)據(jù)集測試中,該算法準(zhǔn)確地檢測到所有的基因與網(wǎng)絡(luò)拓撲變化。本文將該方法應(yīng)用于雌激素依賴的T-47D雌激素受體陽性(ER+)的乳腺癌細胞系的數(shù)據(jù)集和人類及小鼠胚胎干細胞的數(shù)據(jù)集。在這兩個實驗中使用基因芯片數(shù)據(jù),產(chǎn)生了有意義的生物結(jié)果。作者認為,DDN適合于基因調(diào)控網(wǎng)絡(luò),也適用于具有類似特征的其他生物網(wǎng)絡(luò)。DN通過網(wǎng)絡(luò)活性和拓撲結(jié)構(gòu)對有向圖的分析提供了系統(tǒng)級的視角,該方法提取網(wǎng)絡(luò)節(jié)點間的拓撲關(guān)系,以推斷網(wǎng)絡(luò)活性。網(wǎng)絡(luò)活性的分析依賴于偏相關(guān)理論(偏相關(guān)是指當(dāng)兩個變量同時與第三個變量相關(guān)時,將第三個變量的影響剔除,只分析另外兩個變量之間相關(guān)程度)。該局部依賴模型通過Lasso選取自變量個數(shù),來學(xué)習(xí)局部網(wǎng)絡(luò)結(jié)構(gòu)。然后對兩個不同條件下的局部依賴模塊執(zhí)行置換檢驗,并賦予相應(yīng)的P-value。同時,指出網(wǎng)絡(luò)中表現(xiàn)出網(wǎng)絡(luò)拓撲結(jié)構(gòu)變化的“熱點”基因。最后,提取和可視化該DDN。2010年,Gill等人提出了使用與基因或模塊相關(guān)聯(lián)的分?jǐn)?shù),來評估網(wǎng)絡(luò)的整體差異性[47]。2011年,Roy等人在基因上述DDN的基礎(chǔ)上,延伸出了多重條件下的動態(tài)網(wǎng)絡(luò)學(xué)習(xí)的方法[48]。 2015年,B.Zhang等人在基于DDN的基礎(chǔ)上,融合了先驗知識,提出基于知識融合的kDDN算法[49]。生物網(wǎng)絡(luò)建模作為系統(tǒng)生物學(xué)的一個主要研究目標(biāo)及有效的工具,有助于了解細胞中基因產(chǎn)物的協(xié)調(diào)性。事實上,生物網(wǎng)絡(luò)是動態(tài)且上下文相關(guān)的。為了系統(tǒng)的描述某些活躍的調(diào)節(jié)組分和機制,建模工具必須能夠從隨機的波動背景中有效識別有意義的“重布線”(rewiring)。然而,差異性網(wǎng)絡(luò)的構(gòu)建不能依賴于現(xiàn)有的知識,結(jié)合先驗知識的數(shù)據(jù)驅(qū)動方式則更能有效提高網(wǎng)絡(luò)推理的魯棒性和生物相關(guān)性。盡管如此,仍有很多未解決的障礙,主要包括:解空間大但樣本小,網(wǎng)絡(luò)的高復(fù)雜性,不完善的先驗知識,缺乏有意義的評判標(biāo)準(zhǔn)以及啟發(fā)式結(jié)構(gòu)參數(shù)的學(xué)習(xí)等。本文中制定的差異性依賴網(wǎng)絡(luò),將條件數(shù)據(jù)和先驗知識作為一個凸優(yōu)化問題,提出了一個可以通過不同條件下數(shù)據(jù)推斷保守的(conserved)生物網(wǎng)絡(luò)和有意義“重布線”(rewiring)的學(xué)習(xí)算法(“重布線”事件的驗證是基于已發(fā)表的文獻結(jié)果)。同時,使用一種新的抽樣方案根據(jù)隨機理論來估計預(yù)期的錯誤率。該方案充分利用了挖掘了集成數(shù)據(jù)知識的好處。文章通過仿真數(shù)據(jù)證明和驗證了該方法性能,然后,對酵母細胞系和乳腺癌基因芯片數(shù)據(jù)進行分析,得到了不錯的生物結(jié)果。4展望與總結(jié)問題生物網(wǎng)絡(luò)已經(jīng)成為生物學(xué)基本研究對象之一。過去的一個世紀(jì)里,在簡化原則的指導(dǎo)下,生物研究多專注于單個細胞分子結(jié)構(gòu)和功能的探索,積累了大量知識,與此同時,人們也越來越清晰的意識到,蛋白很少單獨發(fā)揮作用,細胞狀態(tài)的改變往往涉及多個基因的表達變化,例如復(fù)雜疾病一般是多基因致病[50-56]。得益于高通量實驗技術(shù)和組學(xué)的發(fā)展,研究人員可在全基因組水平同時觀測成千上萬基因或蛋白的表達變化情況,生物學(xué)研究對象也由單基因轉(zhuǎn)變成為特定功能基因集合。然而基因集合本身并不能揭示其背后機制,為了回答基因是如何組織的,因果關(guān)系怎樣的問題,人們傾向于用分子相互作用網(wǎng)絡(luò)描述特定細胞狀態(tài),如疾病網(wǎng)絡(luò)表征疾病生理狀態(tài),藥物作用網(wǎng)絡(luò)和藥物代謝網(wǎng)絡(luò)刻畫藥物作用后細胞反應(yīng),近年來,生物網(wǎng)絡(luò)成為生物學(xué)研究新的“寵兒”。正如基因不是單獨發(fā)揮作用一樣,生物網(wǎng)絡(luò)之間存在著相互依存關(guān)系,一個重要體現(xiàn)是信號傳導(dǎo)通路之間的串?dāng)_,這就導(dǎo)致細胞對外界刺激做出非線性應(yīng)激反應(yīng),并進一步影響細胞免疫、代謝、疾病發(fā)生、發(fā)展和疾病并發(fā)等多個生物過程,同時是藥物設(shè)計,尤其是小分子激酶抑制劑類藥物效果預(yù)測必須考慮的重要因素。一個重要的科學(xué)問題是信號通路之間的串?dāng)_“密度”有多大,目前生物研究普遍采用的“分而治之”的研究策略是否可行。 系統(tǒng)生物學(xué)經(jīng)歷了從單個分子到通路再到單個細胞水平以及細胞群落的過程。在這種尺度能夠?qū)蛐?表現(xiàn)型之間的關(guān)系進行前所未有的闡述[57-61]。為建立全面的基因組水平重建網(wǎng)絡(luò)模型,必須使用盡量多的獨立數(shù)據(jù),數(shù)種工作流已經(jīng)被設(shè)計來完成數(shù)據(jù)到計算模型的對接。使用新的數(shù)據(jù)流基于對這些工作流修正構(gòu)建的重建網(wǎng)絡(luò)飛速地增長,越來越多的生物性質(zhì)被加入到網(wǎng)絡(luò)分析中,如蛋白質(zhì)結(jié)構(gòu)。如今系統(tǒng)生物學(xué)面臨的挑戰(zhàn)就是如何使用現(xiàn)有的大數(shù)據(jù)來進一步提高我們對生物學(xué)的理解。致謝感謝王嬌老師辛勤的授課以及對我研究的大力支持,在此表示感謝!參考文獻:[1]鐵流,李亦學(xué):‘系統(tǒng)生物學(xué)的現(xiàn)狀與展望’,中國科學(xué)基金,2005,19,(5),pp.282-286[2]勝利:‘系統(tǒng)生物學(xué)研究進展’,中國科學(xué)院院刊,2004,19,(1),pp.31-34[3] DavidsonE,LevinM;Levin(April2005)."Generegulatorynetworks".Proc.Natl.Acad.Sci.U.S.A.102(14):4935.doi:10.1073/pnas.0502024102.PMC556010.PMID15809445[4] FlorianLeitner,MartinKrallinger,SushilTripathi,MartinKuiper,AstridL?greidandAlfonsoValencia,Miningcis-RegulatoryTranscriptionNetworksfromLiterature,ProceedingsofBioLINKSpecialInterestGroup,5-12,ISBM/ECCB,2013[5] VibhorKumar,MasafumiMuratani,NirmalaArulRayan,PetraKraus,ThomasLufkin,HuckHuiNgandShyamPrabhakar,Uniform,optimalsignalprocessingofmappeddeep-sequencingdata,Naturebiotechnology,2013[6] ChuD,ZabetNR,MitavskiyB;Zabet;Mitavskiy(April2009)."Modelsoftranscriptionfactorbinding:sensitivityofactivationfunctionstomodelassumptions".J.Theor.Biol.257(3):419–29.doi:10.1016/j.jtbi.2008.11.026.PMID19121637.[7] DeLasRivas,J;Fotanillo,C.(2010)."Protein-proteininteractionsessentials:keyconceptstobuildingandanalyzinginteractomenetworks.".PLoSComputBiol6(6):e1000807.doi:10.1371/journal.pcbi.1000807.PMC2891586.PMID20589078[8] Herce,HenryD.;Deng,Wen;Helma,Jonas;Leonhardt,Heinrich;Cardosoa,M.Cristina(2013)."Visualizationandtargeteddisruptionofproteininteractionsinlivingcells".NatureCommunications4:2660.doi:10.1038/ncomms3660.PMC3826628.PMID24154492[9] Cooper,G.M.(2000).Thecell:amolecularapproach(2nded.).WashingtonDC:ASMPress.ISBN0-87893-106-6.[10]MacPherson,R.E.;Ramos,S.V.;Vandenboom,R.;Roy,B.D.;Peters,S.J.(2013)."SkeletalmusclePLINproteins,ATGLandCGI-58,interactionsatrestandfollowingstimulatedcontraction.".AmericanJournalofPhysiology.Regulatory,IntegrativeandComparativePhysiology304(8):R644–50.[11]周超平,李鑫輝.單細胞轉(zhuǎn)錄組研究進展[J].ProgressinBiochemistryandBiophysics,2013,40(12):1193-1200.[12]吳松鋒,朱云平,賀福初.轉(zhuǎn)錄組與蛋白質(zhì)組比較研究進展[J].生物化學(xué)與生物物理進展,2005,32(2):99-105.[13]張艷君,朱志峰,陸融,等.基因表達轉(zhuǎn)錄分析中內(nèi)參基因的選擇[J][J].生物化學(xué)與生物物理進展,2007,34(5):546-550.[14]趙靜,俞鴻,駱建華,等.應(yīng)用復(fù)雜網(wǎng)絡(luò)理論研究代謝網(wǎng)絡(luò)的進展[J].科學(xué)通報,2006,51(11):1241-1248.[15]王暉,馬紅武,趙學(xué)明.基因組尺度代謝網(wǎng)絡(luò)研究進展[J].生物工程學(xué)報,2010,26(10):1340-1348.[16]郭杏,高琳,and陳新:‘生物網(wǎng)絡(luò)比對的模型與算法’,軟件學(xué)報,2010,21,(9),pp.2089-2106[17]Li,Z.,Zhang,S.,Wang,Y.,Zhang,X.S.,andChen,L.:‘Alignmentofmolecularnetworksbyintegerquadraticprogramming’,Bioinformatics,2007,23,(13),pp.1631-1639[18]Liang,Z.,Xu,M.,Teng,M.,andNiu,L.:‘Comparisonofproteininteractionnetworksrevealsspeciesconservationanddivergence’,BMCBioinformatics,2006,7,(1),pp.457[19]Guo,Z.,Li,Y.,Gong,X.,Yao,C.,Ma,W.,Wang,D.,Li,Y.,Zhu,J.,Zhang,M.,andYang,D.:‘Edge-basedscoringandsearchingmethodforidentifyingcondition-responsiveprotein–proteininteractionsub-network’,Bioinformatics,2007,23,(16),pp.2121-2128[20]趙建邦,董安國,and高琳:‘一種用于生物網(wǎng)絡(luò)數(shù)據(jù)的頻繁模式挖掘算法’,電子學(xué)報,2010,38,(8),pp.1803-1807[21]Chindelevitch,L.,Liao,C.S.,andBerger,B.:‘Localoptimizationforglobalalignmentofproteininteractionnetworks’,PacSympBiocomput,2010,15,pp.123-132[22]Liao,C.S.,Lu,K.,Baym,M.,Singh,R.,andBerger,B.:‘IsoRankN:spectralmethodsforglobalalignmentofmultipleproteinnetworks’,Bioinformatics,2009,25,(12),pp.i253-i258[23]Singh,R.,Xu,J.,andBerger,B.:‘Globalalignmentofmultipleproteininteractionnetworkswithapplicationtofunctionalorthologydetection’,ProceedingsoftheNationalAcademyofSciences,2008,105,(35),pp.12763-12768[24]Flannick,J.,Novak,A.,Do,C.,Srinivasan,B.,andBatzoglou,S.:‘Automaticparameterlearningformultiplelocalnetworkalignment’,JournalofComputationalBiology,2009,16,(8),pp.1001-1022[25]Hayes,W.,Sun,K.,andPr?ulj,N.:‘Graphlet-basedmeasuresaresuitableforbiologicalnetworkcomparison’,Bioinformatics,2013,29,(4),pp.483-491[26]Kuchaiev,O.,andPr?ulj,N.:‘Integrativenetworkalignmentrevealslargeregionsofglobalnetworksimilarityinyeastandhuman’,Bioinformatics,2011,27,(10),pp.1390-1396[27]Xie,J.,Zhou,Z.,Ma,J.,Xiang,C.,Nie,Q.,andZhang,W.:‘GraphicsProcessingUnit-BasedAlignmentofProteinInteractionNetworks’,IETSystemsBiology,2015,9,(4),pp.120-127[28]Zhang,S.,Xie,J.,Xia,Y.,Yu,S.,Gu,Z.,Feng,R.,Luo,G.,Wang,D.,Wang,K.,Jiang,M.,Cheng,X.,Huang,H.,Zhang,W.,andWen,T.:‘LK6/Mnk2aisanewkinaseofalphasynucleinphosphorylationmediatingneurodegeneration’,ScientificReports,2015,12564[29]Mitra,K.,Carvunis,A.R.,Ramesh,S.K.,andIdeker,T.:‘Integrativeapproachesforfindingmodularstructureinbiologicalnetworks’,NatureReviewsGenetics,2013,14,(10),pp.719-732[30] Lichtenberg,U.D.,Jensen,L.J.,Brunak,S.,andBork,P.:‘Dynamiccomplexformationduringtheyeastcellcycle’,Science,2005,307,(5710),pp.724-727[31] Ideker,T.,andKrogan,N.J.:‘Differentialnetworkbiology’,MolecularSystemsBiology,2012,8:565[32] Bandyopadhyay,S.,Mehta,M.,Kuo,D.,Sung,M.-K.,Chuang,R.,andJaehnig,E.:‘RewiringofgeneticnetworksinresponsetoDNAdamage’,Science,2010,330,(6009),pp.1385-1389[33] Zhang,B.,Li,H.,Riggins,R.B.,Zhan,M.,Xuan,J.,Zhang,Z.,Hoffman,E.P.,Clarke,R.,andWang,Y.:‘Differentialdependencynetworkanalysistoidentifycondition-specifictopologicalchangesinbiologicalnetworks’,Bioinformatics,2009,25,(4),pp.526-532[34] Gill,R.,Datta,S.,andDatta,S.:‘Astatisticalframeworkfordifferentialnetworkanalysisfrommicroarraydata’,BMCBioinformatics,2010,11:95[35] Bean,G.J.,andIdeker,T.:‘Differentialanalysisofhigh-throughputquantitativegeneticinteractiondata’,GenomeBiology,2012,13:R123[36] Pr?ulj,N.:‘Biologicalnetworkcomparisonusinggraphletdegreedistribution’,Bioinformatics,2007,23,(2),pp.e177-e183[37] 肖碧玉,李先斌,and劉文斌:‘基于圖元向量的差異共表達分析研究’,電子學(xué)報,2015,43,(10),pp.2009-2013[38] Ha,M.J.,Baladandayuthapani,V.,andDo,K.-A.:‘DINGO:differentialnetworkanalysisingenomics’,Bioinformatics,2015,31,(21),pp.3413-3420[39] Landeghem,S.V.,Parys,T.V.,Dubois,M.,Inzé,D.,andPeer,Y.V.d.:‘Diffany:anontology-drivenframeworktoinfer,visualiseandanalysedifferentialmolecularnetworks’,BMCBioinformatics,2016,17:18[40] Tian,Y.,Zhang,B.,Hoffman,E.P.,Clarke,R.,Zhang,Z.,andShih,l.-M.:‘KDDN:anopen-sourceCytoscapeappforconstructingdifferentialdependencynetworkswithsignificantrewiring’,Bioinformatics,2015,31,(2),pp.287-289[41] Speyer,G.,Kiefer,J.,Dhruv,H.,Berens,M.,andKim,S.:‘Knowledge-assistedapproachtoidentifypathwayswithdifferentialdependencies’,PacSympBiocomput,2016,21,pp.33-44[42]FraserHB,HirshAE,SteinmetzLM,etal.Evolutionaryrateintheproteininteractionnetwork.Science,2002,296(5568):750~752[43]JordanIK,WolfYI,KooninEV.Nosimpledependencebetweenproteinevolutionrateandthenumberofprotein-proteininteractions:onlythemostprolificinteractorstendtoevolveslowly.BMCEvolBiol,2003,3(1):1[44]AgrafiotiI,SwireJ,AbbottJ,etal.ComparativeanalysisoftheSaccharomycescerevisiaeandCaenorhabditiselegansproteinnteractionnetworks.BMCEvolBiol,2005,5(1):23[45]KimPM,KorbelJO,GersteinMB.Positiveselectionattheproteinnetworkperiphery:Evaluationintermsofstructuralconstraintsandcellularcontext.ProcNatlAcadSciUSA,2007,104(51):20274~20279[46]JacobF,MonodJ.Geneticregulatorymechanismsinthesynthesisofproteins.JournalofMolecularBiology,1961,3(3):318?356[47]GillR,DattaS,DattaS.Astatisticalframeworkfordiffer

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論