生物信息學 蛋白質(zhì)結(jié)構(gòu)預測學習資料_第1頁
生物信息學 蛋白質(zhì)結(jié)構(gòu)預測學習資料_第2頁
生物信息學 蛋白質(zhì)結(jié)構(gòu)預測學習資料_第3頁
生物信息學 蛋白質(zhì)結(jié)構(gòu)預測學習資料_第4頁
生物信息學 蛋白質(zhì)結(jié)構(gòu)預測學習資料_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

蛋白質(zhì)結(jié)構(gòu)預測生命科學與技術(shù)學院周鵬小班研討話題:

蛋白質(zhì)結(jié)構(gòu)預測內(nèi)容:請你對蛋白質(zhì)結(jié)構(gòu)預測這個重要的生物信息學方向加以討論,形式多樣、內(nèi)容不限,比如:可以對其發(fā)展過程進行介紹、可以對其成功案例加以討論、可以探討各類計算機和信息學方法、工具在其中的應用、也可以結(jié)合一個具體的案例進行分析。形式:

口頭報告+臺下研討時間:

第十三周周一下午7、8節(jié)蛋白質(zhì)的功能蛋白質(zhì)是調(diào)控和實現(xiàn)所有生物功能的分子機器。例如:結(jié)構(gòu)蛋白-膠原酶-維持和增強結(jié)締組織機械酶-肌漿球蛋白-實現(xiàn)宏觀和微觀上的運動各種酶-參與生理功能某些蛋白質(zhì)與DNA或RNA相互作用產(chǎn)生新的蛋白質(zhì)蛋白質(zhì)折疊蛋白質(zhì)是線性的氨基酸合成的結(jié)果,但在生物體內(nèi)會迅速折疊成一個緊密的球狀結(jié)構(gòu)。1.大多數(shù)蛋白質(zhì)只有在折疊成天然球狀結(jié)構(gòu)的時候才能具有完全的生物活性。2.去折疊(變性)蛋白質(zhì)在允許重新折疊的實驗條件下可以折疊到原來的結(jié)構(gòu)。

諾貝爾獎:20世紀60年代,Anfinsen基于還原變性的牛胰RNase在不需其他任何物質(zhì)幫助下,僅通過去除變性劑和還原劑就使其恢復天然結(jié)構(gòu)的實驗結(jié)果,提出了“多肽鏈的氨基酸序列包含了形成其熱力學上穩(wěn)定的天然構(gòu)象所必需的全部信息”的“自組裝學說”。簡單蛋白質(zhì)的折疊蛋白質(zhì)折疊示意

序列結(jié)構(gòu)功能….-Gly-Ala-Glu-Phe-….功能蛋白質(zhì)結(jié)構(gòu)預測問題….-Gly-Ala-Glu-Phe-….功能?….-Gly-Ala-Glu-Phe-….功能計算機輔助蛋白質(zhì)結(jié)構(gòu)預測重大挑戰(zhàn)性問題蛋白質(zhì)的結(jié)構(gòu)預測!?。壳埃€沒有一個算法能夠很好地預測出一個蛋白的三維結(jié)構(gòu)形狀)氨基酸蛋白質(zhì)由20種不同大小、形狀和化學特性的氨基酸組成。氨基酸結(jié)構(gòu):A.疏水氨基酸(hydrophobicaminoacid)B.極性氨基酸(polaraminoacid)C.帶電氨基酸(chargedaminoacid)氨基酸通常按性質(zhì)被分為3類疏水性氨基酸這類氨基酸的側(cè)鏈大多或者全部由碳原子和氫原子組成,因此這些氨基酸就不太可能與水分子形成氫鍵。如:亮氨酸、色氨酸、苯丙氨酸等。苯丙氨酸色氨酸亮氨酸極性氨基酸這類氨基酸的側(cè)鏈通常由氧原子和/或氮原子組成,它們比較容易與水分子形成氫鍵。如絲氨酸、天冬酰胺、酪氨酸等。絲氨酸天冬酰胺酪氨酸帶電氨基酸這類氨基酸的側(cè)鏈可以電離質(zhì)子或奪取質(zhì)子。如谷氨酸、賴氨酸等。谷氨酸賴氨酸多肽的組成(一級結(jié)構(gòu))幾個氨基酸組成的氨基酸鏈稱作肽,一條較長的氨基酸鏈通常稱為多肽或者蛋白質(zhì)。當兩個氨基酸實現(xiàn)共價結(jié)合的時候,一個氨基酸的氨基丟失一個氫,同時另一個氨基酸丟失一個氧和一個氫,脫水生成肽鍵。二級結(jié)構(gòu)(1)α螺旋:

肽鏈主鏈繞假想的中心軸盤繞成螺旋狀,一般都是右手螺旋結(jié)構(gòu),螺旋是靠鏈內(nèi)氫鍵維持的。每個氨基酸殘基(第n個)的羰基與多肽鏈C端方向的第4個殘基(第4+n個)的酰胺氮形成氫鍵。二級結(jié)構(gòu)的類型(2)β折疊:

肽鍵平面折疊成鋸齒狀,相鄰肽鏈主鏈的N-H和C=O之間形成有規(guī)則的氫鍵,在β-折疊中,所有的肽鍵都參與鏈間氫鍵的形成,氫鍵與β-折疊的長軸呈垂直關(guān)系.二級結(jié)構(gòu)的類型(3)t轉(zhuǎn)角:

蛋白質(zhì)二級結(jié)構(gòu)類型之一,由4個氨基酸殘基組成,其中第一個殘基的CO基團和第四個殘基的NH基團之間形成氫鍵,使多肽鏈的方向發(fā)生“U”形改變。骨架柔性多肽鏈中氨基酸的非側(cè)鏈原子構(gòu)成了蛋白骨架。骨架中共價鍵的鍵長和平面鍵角或多或少都是固定的。只有兩個鍵可以旋轉(zhuǎn):(1)氨基氮原子和α碳原子之間形成的鍵的旋轉(zhuǎn)角(Φ);

(2)α碳原子和羧基碳原子之間形成的鍵的旋轉(zhuǎn)角(Ψ);CompanyLogo

一個蛋白質(zhì)的構(gòu)象可以通過每個氨基酸的Φ和Ψ角來表示,但是物理上并不能確實觀察到所有的Φ和Ψ角,因為一些Φ和Ψ角的組合可能導致骨架上相鄰殘基側(cè)鏈原子的空間碰撞。Ramachandran圖顯示了除甘氨酸殘基外的其他氨基酸殘基中允許出現(xiàn)的Φ和Ψ值。Ramachandran圖甘氨酸沒有側(cè)鏈,因此甘氨酸殘基允許出現(xiàn)的Φ和Ψ值的范圍比其他氨基酸殘基都要大。二級結(jié)構(gòu)預測

作用估計蛋白的結(jié)構(gòu)類型提高同源模建的準確性三級結(jié)構(gòu)預測的起點方法Chou-Fasman(經(jīng)驗參數(shù)法)

Garnier(GOR法)每種氨基酸出現(xiàn)在各種二級結(jié)構(gòu)中傾向或者頻率是不同的例如:Glu

主要出現(xiàn)在α螺旋中

Asp和Gly

主要分布在轉(zhuǎn)角中

Pro也常出現(xiàn)在轉(zhuǎn)角中,但是絕不會出現(xiàn)在α螺旋中所以可以根據(jù)每種氨基酸殘基形成二級結(jié)構(gòu)的傾向性(Chou-Fasman)或者統(tǒng)計規(guī)律(GOR)進行二級結(jié)構(gòu)預測蛋白質(zhì)二級結(jié)構(gòu)預測方法該方法由Chou和Fasman

在70年代提出來,是一種基于單個氨基酸殘基統(tǒng)計的經(jīng)驗預測方法。通過統(tǒng)計分析,獲得的每個殘基出現(xiàn)于特定二級結(jié)構(gòu)構(gòu)象的傾向性因子,進而利用這些傾向性因子預測蛋白質(zhì)的二級結(jié)構(gòu).每個氨基酸都有幾個構(gòu)成參數(shù),P(a),P(b)和P(turn),分別表示相應的氨基酸形成α螺旋、β折疊和t轉(zhuǎn)角的偏向性。另外,每個氨基酸同時也有4個轉(zhuǎn)角參數(shù)f(i),f(i+1),f(i+2),f(i+3),分別對應于這種氨基酸出現(xiàn)在發(fā)夾轉(zhuǎn)角第一、第二、第三和第四位的頻率。Chou-Fasman法(1)三級結(jié)構(gòu)一個折疊的多肽鏈的整體三維形狀稱為蛋白質(zhì)的三級結(jié)構(gòu)。三級結(jié)構(gòu)和四級結(jié)構(gòu)(2)四級結(jié)構(gòu)幾個多肽相互作用形成一個功能蛋白質(zhì),多酶復合物中也會出現(xiàn)蛋白質(zhì)與蛋白質(zhì)的相互作用,這種分子間相互作用稱為蛋白質(zhì)的四級結(jié)構(gòu)。三級結(jié)構(gòu)和四級結(jié)構(gòu)(1)理論分析方法通過理論計算(如分子力學、分子動力學計算)進行結(jié)構(gòu)預測。(2)統(tǒng)計的方法

對已知結(jié)構(gòu)的蛋白質(zhì)進行統(tǒng)計分析,建立序列到結(jié)構(gòu)的映射模型,進而對未知結(jié)構(gòu)的蛋白質(zhì)根據(jù)映射模型直接從氨基酸序列預測結(jié)構(gòu)。包括:經(jīng)驗性方法結(jié)構(gòu)規(guī)律提取方法同源模型化方法三級結(jié)構(gòu)和四級結(jié)構(gòu)預測方法理論方法效果不理想

通過計算(如分子力學、分子動力學等)來進行結(jié)構(gòu)預測(1)對于天然蛋白結(jié)構(gòu)和未折疊結(jié)構(gòu),兩者之間的能量差非常?。?kcal/mol數(shù)量級)(2)研究蛋白質(zhì)結(jié)構(gòu)的計算量非常大影響三、四級結(jié)構(gòu)的幾類作用力:(1)疏水性疏水作用力通常被認為是蛋白質(zhì)折疊成一個緊密球狀結(jié)構(gòu)的幾種基礎(chǔ)力之一。大多數(shù)蛋白質(zhì)的天然結(jié)構(gòu)都有一個疏水核心和一個與溶液相接觸的表面,疏水核心中掩藏了疏水殘基,使得它們與溶液相隔離,而與溶液相接觸的表面大多或者全部由極性殘基和帶電殘基組成。

鐮刀形細胞貧血癥正是由于血紅打敗表面的單個殘基由帶電的谷氨酸突變到疏水的纈氨酸,就導致了細胞形態(tài)的徹底變化,最終使人產(chǎn)生貧血、勞累甚至是壞疽的嚴重病癥。(2)二硫鍵當兩個半胱氨酸殘基中的巰基相互靠近時,它們可以被氧化而產(chǎn)生共價的二硫鍵,從而將在蛋白質(zhì)一級結(jié)構(gòu)中可能相距很遠的殘基交叉連接起來。

二硫鍵是蛋白質(zhì)中唯一非骨架原子的共價交聯(lián)結(jié)合,它們對穩(wěn)定蛋白質(zhì)的折疊起著非常明顯的作用。

影響三、四級結(jié)構(gòu)的幾類作用力:(3)活性結(jié)構(gòu)與最穩(wěn)定結(jié)構(gòu)

由于蛋白質(zhì)折疊過程中的自由度非常大,因此一般不可能評價蛋白質(zhì)的天然狀態(tài)是不是實際中最穩(wěn)定(能量最優(yōu))的構(gòu)象。但是,自然選擇很明顯會選擇既有活性又有穩(wěn)定性的蛋白質(zhì)。

如果蛋白質(zhì)一級結(jié)構(gòu)中的突變降低了蛋白質(zhì)的穩(wěn)定性,在進化中就會產(chǎn)生不利因素,那么在選擇的時候這些突變體就會被剔除。影響三、四級結(jié)構(gòu)的幾類作用力:Levinthal悖論1968年,C.Levinthal

在他的一篇論文中指出,即使一個多肽鏈的長度不長,它可能采取的折疊方式也非常多。如果要對一個多肽的所有可能出現(xiàn)的構(gòu)象進行隨機搜索,那么可能要花費很多年的時間。這個發(fā)現(xiàn)被稱為Levinthal悖論。100殘基蛋白質(zhì)198個可旋轉(zhuǎn)的Φ和Ψ角3的198次方種構(gòu)象Levinthal悖論Levinthal

悖論認為蛋白折疊的過程是從未折疊的狀態(tài)開始,然后逐漸經(jīng)過一系列越來越穩(wěn)定的中間態(tài),最終折疊成蛋白質(zhì)的天然狀態(tài)。至于這樣的折疊途徑是否最終在構(gòu)象的能量處于全局最小點時結(jié)束,目前還有很多爭論。蛋白質(zhì)折疊模型1.啟發(fā)式模型

2.疏水塌縮模型3.成核-凝聚-生長模型

HydrophobiccollapseheuristicmodelrearrangementDiffusion/collisionpropagationNucleationmodel蛋白質(zhì)折疊建模算法(1)

網(wǎng)格模型(2)

去網(wǎng)格模型(3)

能量函數(shù)和優(yōu)化網(wǎng)格模型H-P(疏水-極性)模型:該模型有三種簡化:(1)蛋白質(zhì)中各個氨基酸殘基的α碳原子都位于二維網(wǎng)格

或三維網(wǎng)格的格點上;(2)疏水作用是蛋白折疊中唯一的重要因素;(3)通過計算疏水殘基接觸的數(shù)目代替構(gòu)象的能量計算。雖然這樣的處理非常簡單,但是通過H-P模型的計算分析,能夠發(fā)現(xiàn)蛋白質(zhì)折疊的一些機制。網(wǎng)格模型H-P模型是基于疏水殘基接觸來進行打分的。除了多肽鏈中相鄰的疏水殘基之外,每一個相互靠近的疏水接觸對能量的貢獻都設(shè)為-1,最優(yōu)的構(gòu)象就是所有可能的構(gòu)象中具有最多疏水接觸的那個構(gòu)象。上圖中二維和三維構(gòu)象的得分都是-4。黑色為疏水殘基,白色為極性殘基。N端為1號殘基,位于(0,0)處,下一個位于(1,0)處。去網(wǎng)格模型如果在蛋白質(zhì)模型中取消氨基酸定位于網(wǎng)格點的限制,那么蛋白模型就可以更真實地模擬出蛋白的實際構(gòu)象。如果采取完整骨架模型,并將模型中的phi角和psi

角的取值范圍定義為Ramachandran

圖中所用允許出現(xiàn)的phi角和psi

角的值,那么這種去網(wǎng)格折疊模型模擬出的小多肽的構(gòu)象與實驗測出的真實構(gòu)象會非常接近。

去網(wǎng)格模型的誤差通常用預測構(gòu)象和實際構(gòu)象中α碳原子的均方根偏差(RMSD)

來計算。α碳原子的RMSD是指當預測構(gòu)象和實際構(gòu)象重疊在一起時,兩種構(gòu)象中每個α碳原子位置的Euclidean平方距離的總和。去網(wǎng)格模型隨著蛋白模型與實際情況越來越相符,模型的復雜性也越來越大??梢灾豢紤]α碳原子,也可以考慮所有的骨架原子,甚至所有的骨架原子和側(cè)鏈原子。側(cè)鏈也可以考慮剛性、半柔性和完全柔性。去網(wǎng)格模型側(cè)鏈

剛性側(cè)鏈:X-射線晶體結(jié)構(gòu)中每種氨基酸出現(xiàn)最多的構(gòu)象;

半柔性側(cè)鏈:可以采用類似的經(jīng)驗性方法得到;從一系列的X-射線晶體結(jié)構(gòu)得到側(cè)鏈的多種構(gòu)象,形狀類似的為一組。每一組的平均構(gòu)象稱為一個旋轉(zhuǎn)異構(gòu)體。在半柔性模型中,每個側(cè)鏈的構(gòu)象可以采用任意一種最常出現(xiàn)的旋轉(zhuǎn)異構(gòu)體(rotamer)。

除了要考慮疏水作用,蛋白折疊的能量函數(shù)中還要考慮到氫鍵、二硫橋的形成、靜電作用、范德華力以及溶劑作用。由于這些力中每一個力的相對作用還很難通過實驗來計算,因此尋找一個合適的蛋白折疊復合能量函數(shù)仍然是一個研究熱點。我們可以通過理論方法,針對范德華力、氫鍵、溶劑、靜電和其它力對一個已折疊蛋白總體穩(wěn)定性的相對作用來建立能量函數(shù)。它的目標是得到一個近似的能量函數(shù)或者力場,那些已知結(jié)構(gòu)的蛋白質(zhì)結(jié)晶構(gòu)象在這個能量函數(shù)中處于一個最小能量的狀態(tài)。例如:

ΔG=ΔGvanderwaals+ΔGH-bonds+ΔGsolvent+ΔGcoulomb能量函數(shù)和優(yōu)化結(jié)構(gòu)預測雖然很多蛋白折疊模型使得我們能夠越來越多地了解蛋白質(zhì)的折疊過程以及蛋白質(zhì)折疊過程中涉及的各種分子力,但是目前還沒有一種從頭開始進行蛋白質(zhì)折疊的算法能夠很準確地模擬出一些大蛋白質(zhì)的空間結(jié)構(gòu)。蛋白質(zhì)預測方法:(1)比較建模(同源模建)(2)從頭預測同源建模同源建模是通過與相近蛋白的結(jié)構(gòu)進行比較來預測目標蛋白的結(jié)構(gòu)的方法。這種方法依賴于目標序列和已知結(jié)構(gòu)蛋白的序列相似度的強弱,依賴于折疊編碼。也就是說,蛋白質(zhì)氨基酸序列間的變化如果很小的話,那么蛋白質(zhì)的三級結(jié)構(gòu)的變化也很小。同源模建同源建模的過程

(1)尋找一系列與目標蛋白相近的蛋白質(zhì)的結(jié)構(gòu)集。

通常利用像BLAST和FASTA這樣的序列數(shù)據(jù)庫搜索工具看來得到與目標蛋白相近的序列集,進而得到這些序列的結(jié)構(gòu)集。由于這些結(jié)構(gòu)在建模中是用作模板結(jié)構(gòu)的,因此這些結(jié)構(gòu)也稱為模板結(jié)構(gòu)。同源建模的過程(2)將目標序列與模板蛋白的序列進行比對。

用像CLUSTALW這樣的多重比對工具產(chǎn)生比對,發(fā)現(xiàn)目標序列中與所有模板結(jié)構(gòu)高度保守的區(qū)域以及保守性不高的區(qū)域。當目標序列和模板序列相似度小于30%時,自動多重比對方法就不能得到高質(zhì)量的比對。此時,必須對序列不必對進行人工調(diào)節(jié)。同源

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論