整合PPI與基因表達譜.ppt_第1頁
整合PPI與基因表達譜.ppt_第2頁
整合PPI與基因表達譜.ppt_第3頁
整合PPI與基因表達譜.ppt_第4頁
整合PPI與基因表達譜.ppt_第5頁
已閱讀5頁,還剩16頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、Towards the identification of protein complexes and functional modules by integrating PPI network and gene expression data,報 告 人:李光輝,Li min .BMC Bioinformatics,2012,背景,在蛋白質相互作用網絡中識別蛋白質復合物和功能模塊有助于理解細胞組織的原理及預測蛋白質的功能. 在過去幾十年,提出了許多計算方法用于聚類PPI網絡. 不足: 傳統的聚類方法將PPI網絡視為一個靜態(tài)圖,忽視了這類網絡的內在的動態(tài)性; 未區(qū)分蛋白質復合物與功能模塊.,2

2、020/8/27,2/15,蛋白質復合物與功能模塊,蛋白質復合物 在相同時間和空間上相互作用的一組蛋白質; 功能模塊 參與一個特定細胞過程的一組蛋白質,而這組蛋白質在不同的時間和空間上相互作用.,2020/8/27,3/15,動態(tài)PPI網絡的構建,數據集: DIP:yeast PPI 36個含時序的基因表達譜數據及周期性轉錄數據 時序子網絡(TSNs)的構建 過濾基因表達譜 映射過濾后的基因表達譜與靜態(tài)PPI相互作用數據,2020/8/27,4/15,蛋白質復合物與功能模塊識別的框架,2020/8/27,5/15,TSN-PCD:基于時序子網絡的蛋白質復合物發(fā)現算法,在每一個時序子網絡中使用基

3、于邊聚集值的層次聚類算法發(fā)現復合物. 邊聚集值 模塊定義:H是帶權圖G的一個子圖,2020/8/27,6/15,TSN-PCD:基于時序子網絡的蛋白質復合物發(fā)現算法,2020/8/27,7/15,TSN-PCD:基于時序子網絡的蛋白質復合物發(fā)現算法,2020/8/27,8/15,DFM-CIN:在復合物相互作用網絡識別功能模塊,若兩個復合物至少出現在同一個時序子網絡中,則稱它們是同步的. 若兩個復合物出現在兩個連續(xù)的時序子網絡中,則稱它們是鄰接的. 兩個復合物的相似性 復合物相互作用網絡的構建 一個頂點代表一個復合物,邊表示兩復合物之間的聯系.若兩個復合物是同步和鄰接的,且相似性大于等于閾值t

4、h,則這兩個復合物有一條邊相連.,2020/8/27,9/15,DFM-CIN:在復合物相互作用網絡識別功能模塊,子圖K的模塊性 記 為簇K一個鄰居節(jié)點,該節(jié)點對簇K的模塊貢獻值定義為:,2020/8/27,10/15,DFM-CIN:在復合物相互作用網絡識別功能模塊,算法步驟:記G(V,E)是一個復合物相互作用網絡 圖G中的所有頂點按照其出現的頻率的非遞增順序插入到隊列Q中; 選擇隊列Q中第一個元素做為種子,并初始化為一個單獨的簇K; a. 計算簇K的所有鄰居節(jié)點對于模塊K的貢獻值 若存在正的貢獻值,則選擇擁有最大貢獻值的鄰居節(jié)點加入到簇K中,并跳到b; 若不存在則停止簇K的擴展,且將簇K的

5、所有頂點從隊列Q中刪除,并跳到3; b. 重復a過程 重復步驟2,直到隊列Q為空.,2020/8/27,11/15,DFM-CIN:在復合物相互作用網絡識別功能模塊,2020/8/27,12/15,DFM-CIN:在復合物相互作用網絡識別功能模塊,2020/8/27,13/15,復合物評價指標,識別復合物與已知復合物重疊得分 特異性(specificity,Sp)是指算法識別的蛋白質復合物中識別正確的部分所占比重 敏感度(sensitivity,Sn)是指已知蛋白質復合物中被算法標識出來的部分所占比重 其中TP表示算法識別的蛋白質復合物中與己知蛋白質復合物匹配的數量,FP等于識別的蛋白質復合物

6、總數減去TP,FN表示己知蛋白質復合物中沒有被標識的數量,2020/8/27,14/15,復合物評價指標,綜合評價指標F:特異性和敏感度的調和平均數,2020/8/27,15/15,實驗結果,2020/8/27,16/15,實驗結果,2020/8/27,17/15,功能模塊的富集分析,組成功能模塊的一組蛋白質傾向于參與同一生物過程中. 根據超幾何聚集分布的P-value來注釋識別的功能模塊的主要功能, P-value體現了識別的模塊對某個功能的富集程度,其計算公式為: 其中,N表示蛋白質網絡的規(guī)模,C表示功能模塊中的蛋白質數量,k表示功能模塊中含有某個功能的蛋白質數量,F表示蛋白質網絡中含有該功能的蛋白質數量.,2020/8/27,18/15,實驗結果,2020/8/27,19/

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論