版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
(19)國家知識產(chǎn)權(quán)局(12)發(fā)明專利308號公司37252GO6N3/042(2023.GO6N3/048(2023.01)G16B40/20(2019.01)權(quán)利要求書3頁說明書9頁附圖1頁一種基于對比融合圖特征的藥物靶點親和本發(fā)明提供了一種基于對比融合圖特征的取,得到靶點特征;設(shè)計對比融合圖模塊,基于對征、靶點特征和對比融合圖特征進行拼接并降21.一種基于對比融合圖特征的藥物靶點親和活性預(yù)測方法,其特征在于,具體包括如下步驟:S1,利用圖卷積網(wǎng)絡(luò)對藥物的SMILES字符串進行特征提取,得到藥物特征;S3,設(shè)計對比融合圖模塊,基于對比融合圖模塊,提取對比融合圖特征;S4,將藥物特征、靶點特征和對比融合圖特征進行拼接并降維,得到預(yù)測分數(shù);步驟S3具體包括如下步驟:S3.1,計算兩個氨基酸之間的歐幾里得距離,判斷兩個氨基酸是否存在接觸,生成靶點圖鄰接矩陣;S3.2,通過中心節(jié)點創(chuàng)建藥物與靶點的融合圖;S3.3,基于圖同構(gòu)網(wǎng)絡(luò)GIN對融合圖進行自監(jiān)督學(xué)習(xí),提取對比融合圖特征;步驟S3.2具體包括如下步驟:S3.2.1,通過線性層將藥物圖維度和靶點圖維度統(tǒng)一:藥物圖和靶點圖的權(quán)重矩陣,d和P分別為藥物和靶點的初始特征矩陣,ba和bp分別為藥物和靶點的偏置向量;S3.2.2,初始化中心節(jié)點,作為連接藥物圖和靶點圖的橋梁,中心節(jié)點表示為:S3.2.3,更新融合圖的鄰接矩陣P:其中,Aa和Ap分別為藥物圖和靶點圖的鄰接矩陣;中心節(jié)點分別隨機連接藥物和靶點圖中的若干節(jié)點,且連接邊的數(shù)量相同,融合圖的節(jié)點總數(shù)為na+np+1,其中,na和np分別表示藥物圖和靶點圖的節(jié)點數(shù)量;步驟S3.3具體包括如下步驟:S3.3.1,隨機遮蔽每個融合圖中的部分邊,得到掩蔽圖;S3.3.2,對于每個融合圖和掩蔽圖,利用圖同構(gòu)網(wǎng)絡(luò)GIN提取融合圖和掩蔽圖中的節(jié)點定義正樣本對的特征為融合圖特征和正樣本對的掩蔽圖特征,負樣本對的特征為融合圖特征和負樣本對的掩蔽圖特征,采用對比損失進行優(yōu)化。2.根據(jù)權(quán)利要求1所述的一種基于對比融合圖特征的藥物靶點親和活性預(yù)測方法,其S1.2,將藥物原子節(jié)點輸入圖卷積網(wǎng)絡(luò)分層聚合藥物原子節(jié)點特征,再通過全局加法操作將所有節(jié)點特征融合為藥物全局特征,最后通過線性層映射成為藥物特征。33.根據(jù)權(quán)利要求1所述的一種基于對比融合圖特征的藥物靶點親和活性預(yù)測方法,其4.根據(jù)權(quán)利要求1所述的一種基于對比融合圖特征的藥物靶點親和活性預(yù)測方法,其5.根據(jù)權(quán)利要求1所述的一種基于對比融合圖特征的藥物靶點親和活性預(yù)測方法,其S3.3.2.1,輸入的融合圖或S3.3.2.4,定義正樣本對的特征為融合圖特征hfusion和正樣本對的掩蔽圖特征hmask,負樣本對的特征為hfusion和負樣本對的掩蔽圖特征hneg,采用對比損失Lcontrastive進4圖或掩蔽圖的特征。6.根據(jù)權(quán)利要求1所述的一種基于對比融合圖特征的藥物靶點親和活性預(yù)測方法,其S4.1,將三種特征拼接后生成最終的特征表示合圖特征;S4.2,通過第一層線性變換對hfinal進行特征降維:5[0002]藥物靶點親和活性DTA預(yù)測通常依賴于藥物分子的化型進行更精準的預(yù)測。性。[0005]本發(fā)明的主要目的在于提供一種基于對比融合圖特征的藥物靶點親和活性預(yù)測的深層交互信息關(guān)系的問題。原子。[0013]S1.2,將藥物原子節(jié)點輸入圖卷積網(wǎng)絡(luò)分層聚合藥物原子節(jié)點特征,再通過全局[0015]S2.1,將靶點的氨基酸序列輸入前向LSTM捕捉當前氨基酸與前方序列的依賴關(guān)6靶點圖鄰接矩陣。之記為0。[0030]S3.2.2,初始化中心節(jié)點,作為連接藥物圖和靶點圖的橋梁,中心節(jié)點表示為:數(shù)量。7[0048]S3.3.2.4,定義正樣本對的特征為融合圖特征hfusion和正樣本對的掩蔽圖特征hmask,負樣本對的特征為hfusion和負樣本對的掩蔽圖特征hneg,采用對比損失8[0061]S4.4,采用均方誤差MSE損失函數(shù)Lmse對模型進行更新:[0063]其中,I為樣本總數(shù),父i和yi分別表[0064]本發(fā)明具有如下有益效果:[0065](1)本發(fā)明利用圖卷積網(wǎng)絡(luò)從藥物的SMILES表示中提取分子拓撲特征,以及通過雙向長短時記憶網(wǎng)絡(luò)提取靶點序列的上下文特征。[0066](2)本發(fā)明設(shè)計了一種對比融合圖模塊,通過構(gòu)建藥物分子圖和靶點2D接觸圖的統(tǒng)一圖,并隨機生成掩蔽圖,利用對比學(xué)習(xí)優(yōu)化統(tǒng)一圖的特征表示。[0067](3)本發(fā)明通過預(yù)訓(xùn)練階段拉近正樣本特征表示,結(jié)合三種特征的拼接及線性層映射,實現(xiàn)藥物-靶點活性分數(shù)的精準預(yù)測。附圖說明[0068]為了更清楚地說明本發(fā)明具體實施方式或現(xiàn)有技術(shù)中的技術(shù)方案,下面將對具體實施方式或現(xiàn)有技術(shù)描述中所需要使用的附圖作簡單地介紹,顯而易見地,下面描述中的附圖是本發(fā)明的一些實施方式,對于本領(lǐng)域普通技術(shù)人員來講,在不付出創(chuàng)造性勞動的前提下,還可以根據(jù)這些附圖獲得其他的附圖。在附圖中:[0069]圖1示出了本發(fā)明的一種基于對比融合圖特征的藥物靶點親和活性預(yù)測方法的流程圖。[0070]圖2示出了對比融合圖學(xué)習(xí)過程。具體實施方式[0071]下面將結(jié)合附圖對本發(fā)明的技術(shù)方案進行清楚、完整地描述,顯然,所描述的實施例是本發(fā)明一部分實施例,而不是全部的實施例?;诒景l(fā)明中的實施例,本領(lǐng)域普通技術(shù)人員在沒有做出創(chuàng)造性勞動前提下所獲得的所有其他實施例,都屬于本發(fā)明保護的范圍。[0072]如圖1所示的一種基于對比融合圖特征的藥物靶點親和活性預(yù)測方法,具體包括如下步驟:[0073]S1,利用圖卷積網(wǎng)絡(luò)對藥物的SMILES字符串進行特征提取,得到藥物特征。[0074]S2,利用雙向LSTM對靶點序列進行特征提取,得到靶點特征。[0076]S4,將藥物特征、靶點特征和對比融合圖特征進行拼接并降維,得到預(yù)測分數(shù)。[0077]本發(fā)明首先利用圖卷積網(wǎng)絡(luò)對藥物的SMILES字符串進行特征提取,分析藥物的拓于藥物和靶點的結(jié)構(gòu)信息構(gòu)建兩種基礎(chǔ)圖:藥物分子圖和靶點2D接觸圖。在此基礎(chǔ)上,設(shè)計了一個對比融合圖模塊,該模塊通過引入中心節(jié)點將兩種基礎(chǔ)圖連接成一個統(tǒng)一圖,并生成部分邊隨機遮掩的掩蔽圖,以增強特征的魯棒性。統(tǒng)一圖和掩蔽圖分別輸入圖同構(gòu)網(wǎng)絡(luò)進行信息傳遞,通過平均池化提取全局特征表示,并利用對比學(xué)習(xí)優(yōu)化藥物和靶點的正樣本特征。最后,將提取到的藥物拓撲特征、靶點序列特征和融合圖的全局特征進行拼接,輸9[0081]S1.2,將藥物原子節(jié)點輸入圖卷積網(wǎng)絡(luò)分層聚合藥物原子節(jié)點特征,再通過全局[0084]S2.1,將靶點的氨基酸序列輸入前向LSTM捕捉當前氨基酸與前方序列的依賴關(guān)[0095]本發(fā)明創(chuàng)建一個藥物與靶點的融合圖,以實現(xiàn)藥物和靶點之間信息的有效交互。以往的方法通常單獨考慮藥物與靶點的特征,忽視了兩者之間的相互作[0100]S3.2.2,為了連接兩種節(jié)點特征。特征hfusion和正樣本對的掩蔽圖特征hmask,負樣本對的特征為hfusion和負樣本對的掩示hfinal:[0127]hfinal=Concat(dfinal,Pfinal,ha,p);[0129]S4.2,模型通過兩個線性層對拼接后的特征進行進一步處理以完成預(yù)測。通過第一致性系數(shù),用于衡量隨機選擇的兩個藥物-靶標對的預(yù)測親和力值是否與它們實際值的模型MSECI[0142]在KIBA數(shù)據(jù)集上的結(jié)果同樣表明提出的方法表現(xiàn)優(yōu)秀,如表2所示。與基線模型相比,本發(fā)明提出模型的MSE降低了0.005,具體驗證了其在精度上的優(yōu)勢。盡管在CI指標上與顯示出其在優(yōu)化DTA預(yù)測精度方面的潛力。模型[0145]本發(fā)明中對比融合圖模塊能夠有效增強藥物與靶點之間的信息交互,捕捉更為豐富的特征,從而提高了本發(fā)明的模型對藥物-靶點相互作用的理解;其次,通過自監(jiān)督預(yù)訓(xùn)練,模型能夠在沒有人工標簽的情況下,學(xué)習(xí)到藥物和靶點的潛在關(guān)系,這進一步提升了DTA預(yù)測的準確性。自監(jiān)督學(xué)習(xí)不僅可以增強特征的表達能力,還能在數(shù)據(jù)稀缺時提供有效的訓(xùn)練信號,從而實現(xiàn)更高效的特征提取和信息整合。[0146]當然,上述說明并非是對本發(fā)明的限制,本發(fā)明也并不僅限于上述舉例,本技術(shù)領(lǐng)域的技術(shù)人員在本發(fā)明的實質(zhì)范圍內(nèi)所做出的變化、改型、添加或
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 玫瑰痤瘡的中醫(yī)內(nèi)服方劑與光電聯(lián)合方案
- 廢水廢氣處理項目可行性分析報告范文
- 三峽集團辦公室副主任晉升考試題含答案
- 酒店總經(jīng)理職位面試技巧及問題解析
- 刮板流量計建設(shè)項目可行性分析報告(總投資16000萬元)
- 旅游行業(yè)崗位面試題庫及答案參考
- 資源循環(huán)各子公司總經(jīng)理管理能力考試題含答案
- 工會工作考核與評價標準
- 促銷專員崗位面試全攻略百威中國面試題集
- 特殊毒物(如甲醇)中毒的凈化方案優(yōu)化
- 判決分析報告
- 潔凈工作臺性能參數(shù)校準規(guī)范
- 如果歷史是一群喵16
- 華為HCIA存儲H13-611認證培訓(xùn)考試題庫(匯總)
- 社會主義發(fā)展史知到章節(jié)答案智慧樹2023年齊魯師范學(xué)院
- 美國史智慧樹知到答案章節(jié)測試2023年東北師范大學(xué)
- GB/T 15924-2010錫礦石化學(xué)分析方法錫量測定
- GB/T 14525-2010波紋金屬軟管通用技術(shù)條件
- GB/T 11343-2008無損檢測接觸式超聲斜射檢測方法
- GB/T 1040.3-2006塑料拉伸性能的測定第3部分:薄膜和薄片的試驗條件
- 教師晉級專業(yè)知識和能力證明材料
評論
0/150
提交評論