蛋白質(zhì)折疊模型和算法_第1頁
蛋白質(zhì)折疊模型和算法_第2頁
蛋白質(zhì)折疊模型和算法_第3頁
蛋白質(zhì)折疊模型和算法_第4頁
蛋白質(zhì)折疊模型和算法_第5頁
已閱讀5頁,還剩17頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

蛋白質(zhì)折疊模型和算法2023/2/20第一頁,共二十二頁,2022年,8月28日目錄01理論進(jìn)展03折疊模擬02折疊模型04折疊算法05數(shù)據(jù)庫第二頁,共二十二頁,2022年,8月28日一、理論進(jìn)展[1]20世紀(jì)30年代,吳憲提出了蛋白質(zhì)的變性。英國劍橋大學(xué)的Bemal發(fā)現(xiàn)蛋白質(zhì)折疊是一個(gè)物理過程,而且能在試管中進(jìn)行。

1973年,Anfisen觀察到完全還原的核糖核酸酶A可以在體外自發(fā)折疊成具有完全活性的天然構(gòu)象,蛋白質(zhì)的一級結(jié)構(gòu)包含有指導(dǎo)其形成天然構(gòu)象的全部信息。天然結(jié)構(gòu)可能處于總體自由能的最低點(diǎn)。

Levinthal的悖論(paradox)。Levinthal和wetlaufer提出蛋白質(zhì)的折疊過程是有動力學(xué)控制的。首先,經(jīng)典的“折疊途徑”模型為主,,變性蛋白質(zhì)經(jīng)過確定途徑按折疊中間體的順序到達(dá)天然態(tài)。隨后,“能量地形面”的概念來研究蛋白質(zhì)折疊,“折疊漏斗(foldingfmmel)”模型。

折疊過程的模型包括:框架模型、成核增長機(jī)制、擴(kuò)散-碰撞模型、疏水核折疊模型、等級制度模型。常用的技術(shù)包括:可以追蹤三級結(jié)構(gòu)形成和解體的吸光度(Abs)和熒光度(FL)分析。最新,蛋白質(zhì)天然結(jié)構(gòu)的拓?fù)浣Y(jié)構(gòu)決定了蛋白質(zhì)折疊機(jī)制,蛋白質(zhì)的折疊速率和機(jī)制主要決定于蛋白質(zhì)的拓?fù)浣Y(jié)構(gòu),而不是原子間的相互作用。

第三頁,共二十二頁,2022年,8月28日一、理論進(jìn)展[1]直接從氨基酸序列出發(fā)預(yù)測蛋白質(zhì)分子的折疊構(gòu)象在理論和操作上都存在很大的困難.其主要困難來自兩個(gè)方面:(1)對構(gòu)象穩(wěn)定的自由能情況了解得很少,難以給出明確判定蛋白質(zhì)活性的構(gòu)象能指標(biāo);

(2)可能的構(gòu)象空間非常大且很復(fù)雜,如二維模型,長度為L的氨基酸序列可有Aμ^LL^γ種可能的構(gòu)象,其中μ≈2.63,

γ≈0.333,A為一常數(shù).因此,這是典型的NP難題.

第一個(gè)問題需要參照理化實(shí)驗(yàn)所獲得的信息,歸結(jié)出模擬蛋白質(zhì)折疊的可行的數(shù)理模型。

第二個(gè)問題則要釆用新的優(yōu)化算法,使之在有限的時(shí)間內(nèi)找到最優(yōu)的穩(wěn)定構(gòu)象。[2]第四頁,共二十二頁,2022年,8月28日一、理論進(jìn)展[1]蛋白質(zhì)折疊機(jī)理研究熱點(diǎn)[1]:

一是蛋白質(zhì)理論模型的。主要是簡單的格點(diǎn)模型,主要內(nèi)容有3個(gè)方面:(1)水分子影響;⑵側(cè)鏈的影響;(3)拓?fù)浣Y(jié)構(gòu)的研究。

二是蛋白質(zhì)折疊機(jī)理的研究。(1)熱力學(xué)性質(zhì)分析;(2)動力學(xué)過程的研究;(3)折疊初期研究。研究的進(jìn)展趨勢一方面是蛋白質(zhì)折疊研究下一步會更需要實(shí)驗(yàn)研究的深人,特別是蛋白質(zhì)折疊初期快速過程的研究;另一方面是蛋白質(zhì)折疊過程的長時(shí)間計(jì)算機(jī)動態(tài)模擬,這包括全原子模型和簡化的非格點(diǎn)模型。另外,水分子如何與大分子相互作用,

疏水相互作用的本質(zhì)等也是研究內(nèi)容。第五頁,共二十二頁,2022年,8月28日二、折疊模型1、格點(diǎn)HP模型將20類氨基酸分為疏水性的氨基酸和極性的氨基酸,分別用兩個(gè)有效氨基酸H和P來表示,一般稱為HP模型。產(chǎn)生了有關(guān)二維和三維格點(diǎn)的模型研究等。[1]第六頁,共二十二頁,2022年,8月28日二、折疊模型2、HZ疏水拉鏈模型

蛋白質(zhì)鏈通過疏水性接觸作用,形成鏈的局部疏水接觸作用,再將其近鄰的氨基酸對拉近,從而帶動他們的近鄰兩殘基b-b‘靠近并形成接觸對,然后,c-c’殘基對等等,這樣完成一個(gè)p-片或a螺旋的折疊[1]。

基本假設(shè)是多肽鏈中必須有一定數(shù)量和規(guī)則(不規(guī)則)排列的H型殘基并且有較強(qiáng)的相互作用。這樣一對對地形成接觸,就象拉鏈一樣完成它們的折疊過程。這樣形成的H型接觸在鏈的組態(tài)空間中的搜索是十分有限的,因此能夠完成快速的折疊[1]。第七頁,共二十二頁,2022年,8月28日二、折疊模型3、Go模型在有關(guān)蛋白質(zhì)的早期格點(diǎn)模擬中首次引入了只考慮在其折疊自然態(tài)結(jié)構(gòu)中的相互作用,即自然相互作用(Nativeinteraction),而假設(shè)非自然的相互作用對球蛋白質(zhì)的折疊能量無貢獻(xiàn)。Go模型是有關(guān)能量地形理論的重要部分(即具有指向自然態(tài)的折疊漏斗形狀)的一個(gè)簡單刻畫:一個(gè)蛋白質(zhì)鏈具有自然相互作用的接觸越多,蛋白質(zhì)處在能量地形中的狀態(tài)就越接近自然折疊態(tài),也就是越接近漏斗的底部。Go模型沒有考慮能量面的粗糙特性,只能描述折疊漏斗的漏斗形態(tài)的大致特性,第八頁,共二十二頁,2022年,8月28日二、折疊模型4、β-發(fā)卡模型β-發(fā)卡模型把統(tǒng)計(jì)物理引用到蛋白質(zhì)折疊機(jī)制中。對G蛋白中只有16個(gè)氨基酸的一段小β-發(fā)卡的研究很成功。通過討論各個(gè)組態(tài)并求出系統(tǒng)的配分函數(shù),最后確定其系統(tǒng)的自由能,有人采用動力學(xué)網(wǎng)絡(luò)模型運(yùn)用REMD模擬研究了G蛋白的折疊路徑。[1]第九頁,共二十二頁,2022年,8月28日三、折疊模擬蛋白質(zhì)折疊的模擬分三個(gè)層次:全原子模型,簡略模型和簡單晶格模型。

全原子模型可分為兩種:包括水的和不包括水的。

在簡略模型中,用球或球棒簡化表示支鏈,對勢能也相應(yīng)簡化處理。簡單晶格模型常在熱力學(xué)、動力學(xué)、二級結(jié)構(gòu)的形式等地方有獨(dú)特之處。HMM(即profile-HMM)是一種概率模型,將多序列比對轉(zhuǎn)化為二十種氨基酸的位點(diǎn)特異分布概形,各種氨基酸在每個(gè)位點(diǎn)的概率取值不同,HMM根據(jù)此特異性在大型數(shù)據(jù)庫中搜尋與模型匹配的蛋白質(zhì)序列,是目前最成功的蛋白質(zhì)識別方法之一[7]。第十頁,共二十二頁,2022年,8月28日四、折疊算法(l)MetropolisMonteCario模擬(MC);MC模擬的主要目的在于在特定溫度下對構(gòu)象空間作統(tǒng)計(jì)分析??捎糜诮Y(jié)構(gòu)的優(yōu)化。涉及的構(gòu)象范圍較大。[1]基本步驟[2]:第一步從一個(gè)隨機(jī)的構(gòu)象S1出發(fā),并計(jì)算其E1能量值第二步對S1的某個(gè)殘基定向進(jìn)行隨機(jī)改變,形成新構(gòu)象S2,并計(jì)算其能量值E2;第三步如果E1<E2,接受構(gòu)象S2,使之成為當(dāng)前構(gòu)象;否則,如果滿足仍然接受S2,其中Ran為(0,1)之間的隨機(jī)數(shù),Ck為一遞減序列.如果不接受S2,則仍使S1為當(dāng)前構(gòu)象;第四步如果不滿足停止準(zhǔn)則,則重復(fù)第二步到第四步.理論上,該算法能保證收斂到全局最小.但是,實(shí)際上即使利用盡可能多的計(jì)算機(jī)資源,也很難得能量最小的構(gòu)象。第十一頁,共二十二頁,2022年,8月28日四、折疊算法(2)分子動力學(xué)(MolecularDynamics)模擬(MD);

MD通過牛頓第二方程模擬真實(shí)的動力學(xué)過程,能夠?qū)﹄逆溦郫B的動力學(xué)行為作較準(zhǔn)確的描述,如表示折疊過程自組織特征的f分子一噪聲。用于結(jié)構(gòu)的優(yōu)化。一般用于在總體構(gòu)象基本確定時(shí),消除不合理的局部結(jié)構(gòu)。[1]第十二頁,共二十二頁,2022年,8月28日四、折疊算法(3)ESMC(熵取樣MonteCario),也稱之為GeneralizedEnsemble

創(chuàng)造性的將“熵”即某能量或區(qū)間的構(gòu)象數(shù)目的對數(shù)作為描述對象,以負(fù)熵代替-E/T的取樣,此法能夠?qū)π§貐^(qū)域作比較多的取樣,由于低能區(qū)域都是小區(qū)域熵,故通過這個(gè)方法可以對低能構(gòu)象區(qū)域作較好的統(tǒng)計(jì)分析。熵取樣MC能一次性地給出構(gòu)象數(shù)目隨能量的分布,非常適合作蛋白質(zhì)折疊的熱力學(xué)的研究。[1]第十三頁,共二十二頁,2022年,8月28日四、折疊算法⑷遺傳算法(GeneticAlgorithm)(GA);GA模擬蛋白質(zhì)折疊的關(guān)鍵問題是解決雜交時(shí)肽鏈的自規(guī)避。[1]首先要選擇一種合適的編碼方法,要確定算法的參數(shù),要考慮具體的遺傳操作方法算法的基本步驟可描述如下[2]:第一步隨機(jī)產(chǎn)生N個(gè)構(gòu)象作為初始集團(tuán),并確定參數(shù);第二步計(jì)算每個(gè)構(gòu)象Si被選擇進(jìn)行遺傳操作的概率:其中Ei為Si的能量值,并約定依據(jù)概率p(Si)進(jìn)行隨機(jī)選擇;第三步利用交叉算子和變異算子對選定的構(gòu)象(即染色體)施行交叉和變異操作,并產(chǎn)生新的集團(tuán)。第四步若不滿足停止準(zhǔn)則,則重復(fù)第二步到第三步.否則,輸出集團(tuán)中能量值最小的構(gòu)象.在交叉操作中,隨機(jī)選擇一對構(gòu)象作為父代染色體,并將序列中隨機(jī)選定的一個(gè)點(diǎn)作為交叉點(diǎn).將每條序列的交叉點(diǎn)前的部分與另一序列交叉點(diǎn)后的部分連接起來.在二維晶格模型中有三種連接方式:0°連接,90°連接和270°連接.隨機(jī)選擇一種連接方式連接兩部分,并尋找一條有效的序列作為子代染色體.如果三種連接方式所得序列均無效,則重新選擇一對父變異操作類似于MC方法:隨機(jī)選擇序列中一點(diǎn)并改變原先的連接方式.第十四頁,共二十二頁,2022年,8月28日四、折疊算法⑷遺傳算法(GeneticAlgorithm)(GA);GA模擬得到的結(jié)構(gòu),能量值為-19。[2]在GA基礎(chǔ)上又演化出混合遺傳算法HGA[2].第十五頁,共二十二頁,2022年,8月28日四、折疊算法(5)增刪方法PERM基本思想也類似生存競爭的內(nèi)核,髙適應(yīng)度的個(gè)體大規(guī)模復(fù)制,而低適應(yīng)度的個(gè)體消亡,這種方案效率比常規(guī)MC髙,PERM是依格點(diǎn)模型求解蛋白質(zhì)折疊問題的最髙效算法。

基本算法流程[5]:第十六頁,共二十二頁,2022年,8月28日四、折疊算法(5)增刪方法PERM在求解PERM的過程中,因?yàn)闇囟萒和人口控制系數(shù)C0是對計(jì)算影響極大的一個(gè)因素MJ,計(jì)算中嘗試了許多不同T和C0組合,得到了較好的改進(jìn)效果第十七頁,共二十二頁,2022年,8月28日四、折疊算法(6)擴(kuò)散方程

將構(gòu)象能量比作粒子數(shù)密度,而低能量構(gòu)象對應(yīng)髙密度區(qū)域。利用擴(kuò)散可使粒子數(shù)分布均勻化,高密度區(qū)域粒子數(shù)減少,而低密度區(qū)域粒子數(shù)增加。對應(yīng)于能貌上的操作就是,能谷上升,能壘下降,由此可將局域勢阱的數(shù)目減少或深度變淺,將能貌變得平滑。這種能貌平滑化操作滿足不改變能貌大致形狀的前提。擴(kuò)散方程的主要步驟是先將能貌平滑化,再對折疊進(jìn)行模擬,是肽鏈構(gòu)象在最低能谷內(nèi)或附近,然后在復(fù)原能貌,再進(jìn)行真實(shí)模擬。第十八頁,共二十二頁,2022年,8月28日四、折疊算法(7)簇MC算法(ClusterMCAlgorithm)自旋體系最好的算法之一,它的移動集合很具特色,具體操作上的困難,少有引入。[1]第十九頁,共二十二頁,2022年,8月28日四、折疊算法(8)人口控制算法一種改進(jìn)的PERM算法,它給出了PERM算法的一種擬人解釋,對算法中的權(quán)重及預(yù)測值進(jìn)行了擬人化的改進(jìn),并對選擇動作時(shí)不同情況下的權(quán)重計(jì)算公式進(jìn)行了統(tǒng)一,算法在計(jì)算效率上有了明顯的提高。[1]擬物算法具體步驟如下[6]:a)在3n維歐氏空間中隨機(jī)生成一個(gè)點(diǎn),并計(jì)算當(dāng)前構(gòu)型下的U值;b)當(dāng)前構(gòu)型下的U值記為U0;C)按梯度下降法作一次優(yōu)化并計(jì)算當(dāng)前U值,記做Ul;d)計(jì)算U0-Ul的值,若該值小于0.00000l則結(jié)束;否則轉(zhuǎn)至b擬人策略[6]:當(dāng)擬物計(jì)算落入某一局部極小值“陷阱”時(shí),可獲得與該值相對應(yīng)的格局以及該格局的中心位置;將此格局中距離該中心最遠(yuǎn)的黑球(象征著上面例子中那個(gè)非常痛苦的人)取出來放到這個(gè)中心點(diǎn)上,并以此時(shí)的格局作為新的初始格局進(jìn)行新一輪的擬物計(jì)算。第二十頁,共二十二頁,2022年,8月28日四、折疊算法(9)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論