版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
#基于分形維數(shù)的蛋白質(zhì)結(jié)構(gòu)分析第一章引(前)言1.1分形研究蛋白質(zhì)的意研義:蛋白質(zhì)是生命科學(xué)的重要研究對(duì)象?;蚴巧锛?xì)胞中的遺傳物質(zhì),基因必須以蛋白質(zhì)形式表達(dá)出來(lái),才能顯示出生物的各種遺傳性狀。因此,蛋白質(zhì)的研究是生物信息科學(xué)中至關(guān)重要。生物信息學(xué)的主要目的之一在于了解蛋白質(zhì)序列和三級(jí)結(jié)構(gòu)之間的關(guān)系。從分形的角度來(lái)研究蛋白質(zhì)是近來(lái)比較新穎的研究方法。從分形的角度來(lái)研究蛋白質(zhì)是近來(lái)比較新穎的研究方法。由于蛋白質(zhì)結(jié)構(gòu)的復(fù)雜性和不規(guī)則性,用傳統(tǒng)的方法無(wú)法對(duì)其進(jìn)行很好的描述。分形作為研究和探索自然界復(fù)雜的不規(guī)則形體的數(shù)學(xué)理論,已經(jīng)在很多領(lǐng)域得到廣泛應(yīng)用。由于分形反映的是蛋白質(zhì)結(jié)構(gòu)不同尺度間的相似性,因此將分形應(yīng)用于蛋白質(zhì)結(jié)構(gòu)研究具有很大的優(yōu)勢(shì)。2蛋白質(zhì)結(jié)構(gòu)研究現(xiàn)狀[2]:自從20世紀(jì)50年代以來(lái),關(guān)于蛋白質(zhì)結(jié)構(gòu)的研究受到物理學(xué)家,生物化學(xué)家,分子生物學(xué)家,生物信息學(xué)家的高度重視,取得了豐碩的收獲。MareWilkins和KeithWilliams在1994年首次提出蛋白質(zhì)組(Preteome)分析。蛋白質(zhì)組包括一組染色體所有蛋白質(zhì)的表達(dá)。在多細(xì)胞生物中,所表達(dá)的蛋白質(zhì)根據(jù)細(xì)胞類型而有所差異。由于基因調(diào)控會(huì)從胚胎階段開(kāi)始隨著發(fā)育階段的不同而改變,所以,蛋白質(zhì)表達(dá)也會(huì)隨著時(shí)間變化。蛋白質(zhì)組分析的內(nèi)容不僅包括編碼蛋白質(zhì)的基因的序列,位置結(jié)構(gòu)和功能,更注重于轉(zhuǎn)錄后修飾形式存在的每一個(gè)蛋白質(zhì)的準(zhǔn)確生化狀態(tài)。面對(duì)龐大的生物信息數(shù)據(jù)庫(kù),傳統(tǒng)的計(jì)算機(jī)科學(xué)算法和模型越來(lái)越顯示出不足,世界上許多研究人員提出新的思想和方法。例如:人工神經(jīng)網(wǎng)絡(luò),隱含馬爾科夫模型,支持向量機(jī)模型,遺傳模型算法等。第一章基本理論知識(shí)的的介紹1分形及其分形理論的簡(jiǎn)介[1]嚴(yán)格而且正式地定義分形是一件非常復(fù)雜而且困難地事情。Mandelbrot,Taylor,Falconer等都曾對(duì)分形作過(guò)嘗試性定義,企圖從數(shù)學(xué)的角度進(jìn)行更詳細(xì)的描述,但這些定義很難驗(yàn)證是適用于一般的情形。這些定義中,最為流行的幾個(gè)定義是:“分形是一種具有自相似特性的現(xiàn)象,圖象或者物理過(guò)程”;“其組成部分以某種方式與整體相似的形體叫分形”;“分形是Hausdorff維數(shù)大于拓?fù)渚S數(shù)的幾何”“分形是具有伸縮對(duì)稱性或膨脹對(duì)稱性的幾何對(duì)象”。[4]吳標(biāo)度性和自相似性是各種定義中都提到的分形特點(diǎn)。在不同尺度上表現(xiàn)出
相同程度的粗糙性和破碎性意味著標(biāo)度變換下的不變性,這種不變性就是無(wú)標(biāo)度性。在無(wú)標(biāo)度性意義下,這些不規(guī)則的實(shí)體意味著規(guī)則,復(fù)雜性意味著簡(jiǎn)單。而無(wú)標(biāo)度性的表現(xiàn)就是自相似性??梢允蔷哂袊?yán)格的自相似特性,如,Kohn雪花和Sierpinski三角形,但更多的是并不嚴(yán)格的自相似特性,從心臟的跳動(dòng),變幻莫測(cè)的天氣到股票的起落,從無(wú)邊的海岸線,神奇的蛋白質(zhì)結(jié)構(gòu)到城市規(guī)模分布等許多現(xiàn)象都是如此。分形幾何的主要工具就是它的許多形式的維數(shù)。我們已經(jīng)習(xí)慣一條(光滑的)曲線是一維的,而一個(gè)曲面是二維的。事實(shí)上,對(duì)于分形集來(lái)說(shuō),它們的維數(shù)卻是分?jǐn)?shù)。分形可以分為規(guī)則分形和不規(guī)則分形。它們的維數(shù)計(jì)算方法也有很多,這里我們主要介紹不規(guī)則分形的盒維數(shù)計(jì)算方法。假設(shè)有一個(gè)平面分形體為A,盒子邊長(zhǎng)為e,N(£)為至少包含一個(gè)A中點(diǎn)A的盒子數(shù)。不斷減小e,就可以得到一系列N(e)。如果A公式1lnN(e)公式1limae—o-lne存在,則稱這個(gè)極限值為集A的盒維數(shù),記為dim(A)。B盒維數(shù)法也適用于一維和三維的不規(guī)則分形。對(duì)于一維空間中的,用等分的直線段來(lái)測(cè)量;對(duì)三維空間中的分形,可以用等分成小立方體的網(wǎng)格進(jìn)行測(cè)量。多重分形是分形理論主要的研究方向之一。它描述的是一個(gè)具有標(biāo)度特性的分形幾何體在生長(zhǎng)過(guò)程中不同層次的特征。將所研究的對(duì)象分成不同線度的小區(qū)域并將具有生長(zhǎng)幾率的那些區(qū)域用特征標(biāo)度指數(shù)a來(lái)表征,這樣就得到了一個(gè)由不同的a組成的集合。它的性質(zhì)反映了所研究的問(wèn)題的某種可以區(qū)別的特性。多重分形也可以分為規(guī)則多重分形和不規(guī)則多重分形。規(guī)則多重分形可以用解析方法或統(tǒng)計(jì)物理的方法得到它們的多重分形譜,不規(guī)則多重分形譜只能用統(tǒng)計(jì)物理的方法得出。這里我們主要用到的是不規(guī)則多重分形,統(tǒng)計(jì)物理給出了它的計(jì)算方法。對(duì)照經(jīng)典的盒維數(shù)法,它沒(méi)有區(qū)分包含點(diǎn)的盒子中點(diǎn)的個(gè)數(shù)。而多重分形方法則需考慮點(diǎn)集的空間分布,設(shè)N是點(diǎn)的總數(shù),N是包含在第i個(gè)盒子內(nèi)的點(diǎn)數(shù),i公式2定義概率公式2p二N/Nii那么集合M={p,i=0,1,,N}就包含了點(diǎn)集分布的所有信息。定義配分?jǐn)?shù):i公式3咒(e)=毀)pq=(q)公式3qii=1由式(3)可見(jiàn),當(dāng)q二0時(shí),咒(£)就等于N(e),此時(shí)的分形維數(shù)就退化為0分形的盒維數(shù)。因此,q次信息維也被定義為InX(e)limq——D(q)屮-1一。*8q豐1公式4工pInpq-1
lim—£匕I—0In8多重分形一般用廣義維數(shù)譜曲線D-q來(lái)描述,不難理解,廣義維數(shù)譜比簡(jiǎn)q單的分形維數(shù)包含有更多的特征信息。描述多重分形的另外一組參量是f(a)-a。這兩套參量間的關(guān)系為L(zhǎng)egendre變換D=[qa-f(a)]或f(a)=aq-t(q)公式5qq-1其中T(q)為質(zhì)量指數(shù)。其為t(q)=(q-1)D。q通過(guò)q-Dq對(duì)曲線圖或a-f(a)對(duì)曲線圖可以描述多重分形的奇異性特征。q如在a-f(a)對(duì)曲線圖中,多重分形譜的參數(shù)a、f(a)反映的是概率最小子maxmax集的性質(zhì),a、f(a)反映的是概率最大子集的性質(zhì),f(a)和相應(yīng)的a反minminmax0映的是最或然子集的性質(zhì)。多重分形譜的寬度a反映了概率分布范圍的大小等等。2.2聚類理論知識(shí)的簡(jiǎn)介對(duì)樣本或指標(biāo)進(jìn)行聚類,我們都可以將變量看乘N維空間點(diǎn)的集合,而樣本看作是M維空間的點(diǎn)的集合,如對(duì)樣本聚類時(shí)每一個(gè)樣本點(diǎn)是M維空間的點(diǎn),聚類分析就是用某種準(zhǔn)則將靠近的點(diǎn)集歸為一類。用數(shù)學(xué)方法來(lái)處理時(shí)必須把這些樣本點(diǎn)之間的距離計(jì)算出來(lái),并且把暫聚成的類與類之間的距離也計(jì)算出來(lái),然后用統(tǒng)計(jì)準(zhǔn)則進(jìn)行檢驗(yàn)并繼續(xù)進(jìn)行聚類。第三章蛋白質(zhì)結(jié)構(gòu)的生物背景蛋白質(zhì)(protein)是生命的物質(zhì)基礎(chǔ),沒(méi)有蛋白質(zhì)就沒(méi)有生命。因此,它是與生命及與各種形式的生命活動(dòng)緊密聯(lián)系在一起的物質(zhì)。機(jī)體中的每一個(gè)細(xì)胞和所有重要組成部分都有蛋白質(zhì)參與。蛋白質(zhì)占人體重量的16.3%,即一個(gè)60kg重的成年人其體內(nèi)約有蛋白質(zhì)9.8kg。人體內(nèi)蛋白質(zhì)的種類很多,性質(zhì)、功能各異,但都是由20多種氨基酸按不同比例組合而成的,并在體內(nèi)不斷進(jìn)行代謝與更新。蛋白質(zhì)的生物活性不僅決定于蛋白質(zhì)分子的一級(jí)結(jié)構(gòu),而且與其特定的空間結(jié)構(gòu)密切相關(guān)。肽單位(peptideunit):又稱為肽基(peptidegroup),是肽鍵主鏈上的重復(fù)結(jié)構(gòu)。是由參于肽鏈形成的氮原子,碳原子和它們的4個(gè)取代成分:羰基氧原子,酰氨氫原子和兩個(gè)相鄰a碳原子組成的一個(gè)平面單位。蛋白質(zhì)一級(jí)結(jié)構(gòu)(primarystructure):指蛋白質(zhì)中共價(jià)連接的氨基酸殘基的排列順序。蛋白質(zhì)二級(jí)結(jié)構(gòu)(protein在蛋白質(zhì)分子中的局布區(qū)域內(nèi)氨基酸殘基的有規(guī)則的排列。常見(jiàn)的有二級(jí)結(jié)構(gòu)有a-螺旋和0-折疊。二級(jí)結(jié)構(gòu)是通過(guò)骨架上的羰基和酰胺基團(tuán)之間形成的氫鍵維持的。蛋白質(zhì)三級(jí)結(jié)構(gòu)(proteintertiarystructure):蛋白質(zhì)分子處于它的天然折疊狀態(tài)的三維構(gòu)象。三級(jí)結(jié)構(gòu)是在二級(jí)結(jié)構(gòu)的基礎(chǔ)上進(jìn)一步盤(pán)繞,折疊形成的。三級(jí)結(jié)構(gòu)主要是靠氨基酸側(cè)鏈之間的疏水相互作用,氫鍵,范德華力和鹽鍵維持的。蛋白質(zhì)四級(jí)結(jié)構(gòu)(proteinquaternarystructure):多亞基蛋白質(zhì)的三維結(jié)構(gòu)。實(shí)際上是具有三級(jí)結(jié)構(gòu)多肽(亞基)以適當(dāng)方式聚合所呈現(xiàn)的三維結(jié)構(gòu)。超二級(jí)結(jié)構(gòu)(super-secondarystructure):也稱為基元(motif).在蛋白質(zhì)中,特別是球蛋白中,經(jīng)??梢钥吹接扇舾上噜彽亩?jí)結(jié)構(gòu)單元組合在一起,彼此相互作用,形成有規(guī)則的,在空間上能辨認(rèn)的二級(jí)結(jié)構(gòu)組合體。結(jié)構(gòu)域(domain):在蛋白質(zhì)的三級(jí)結(jié)構(gòu)內(nèi)的獨(dú)立折疊單元。結(jié)構(gòu)域通常都是幾個(gè)超二級(jí)結(jié)構(gòu)單元的組合。二硫鍵(disulfidebond):通過(guò)兩個(gè)(半胱氨酸)巰基的氧化形成的共價(jià)鍵。二硫鍵在穩(wěn)定某些蛋白的三維結(jié)構(gòu)上起著重要的作用。范德華力(vanderWaalsforce):中性原子之間通過(guò)瞬間靜電相互作用產(chǎn)生的一弱的分子之間的力。當(dāng)兩個(gè)原子之間的距離為它們范德華力半徑之和時(shí),范德華力最強(qiáng)。強(qiáng)的范德華力的排斥作用可防止原子相互靠近。a-螺旋(a-heliv):蛋白質(zhì)中常見(jiàn)的二級(jí)結(jié)構(gòu),肽鏈主鏈繞假想的中心軸盤(pán)繞成螺旋狀,一般都是右手螺旋結(jié)構(gòu),螺旋是靠鏈內(nèi)氫鍵維持的。每個(gè)氨基酸殘基(第n個(gè))的羰基與多肽鏈C端方向的第4個(gè)殘基(第4+n個(gè))的酰胺氮形成氫鍵。在古典的右手a-螺旋結(jié)構(gòu)中,螺距為0.54nm,每一圈含有3.6個(gè)氨基酸殘基,每個(gè)殘基沿著螺旋的長(zhǎng)軸上升0.15nm.0-折疊(0-sheet):蛋白質(zhì)中常見(jiàn)的二級(jí)結(jié)構(gòu),是由伸展的多肽鏈組成的。折疊片的構(gòu)象是通過(guò)一個(gè)肽鍵的羰基氧和位于同一個(gè)肽鏈的另一個(gè)酰氨氫之間形成的氫鍵維持的。氫鍵幾乎都垂直伸展的肽鏈,這些肽鏈可以是平行排列(由N到C方向)或者是反平行排列(肽鏈反向排列)。0-轉(zhuǎn)角(0-turn):也是多肽鏈中常見(jiàn)的二級(jí)結(jié)構(gòu),是連接蛋白質(zhì)分子中的二級(jí)結(jié)構(gòu)(a-螺旋和0-折疊),使肽鏈走向改變的一種非重復(fù)多肽區(qū),一般含有2?16個(gè)氨基酸殘基。含有5個(gè)以上的氨基酸殘基的轉(zhuǎn)角又常稱為環(huán)(loop)。常見(jiàn)的轉(zhuǎn)角含有4個(gè)氨基酸殘基有兩種類型:轉(zhuǎn)角I的特點(diǎn)是:第一個(gè)氨基酸殘基羰基氧與第四個(gè)殘基的酰氨氮之間形成氫鍵;轉(zhuǎn)角II的第三個(gè)殘基往往是甘氨酸。這兩種轉(zhuǎn)角中的第二個(gè)大都是脯氨酸。蛋白質(zhì)結(jié)構(gòu)分類的概念是1976年由英國(guó)學(xué)者Levitt和Chothia提出來(lái)的。根據(jù)當(dāng)時(shí)已知的31種球蛋白晶體X射線衍射所測(cè)定的三級(jí)結(jié)構(gòu),他們將蛋白質(zhì)分成四類。之后,在SCOP數(shù)據(jù)庫(kù)中還提到其他一些類別,以下例舉這些類別。a類由在蛋白質(zhì)表面上的由環(huán)連接的一束a螺旋構(gòu)成。卩類由反平行式卩折疊構(gòu)成,通常是兩個(gè)折疊緊密接觸形成一個(gè)三明治。通過(guò)第一條和最后一條鏈接觸,一個(gè)折疊可選擇地纏繞成一個(gè)圓柱(如酶、轉(zhuǎn)運(yùn)蛋白、抗體和病毒衣殼蛋白、唾液酸酶)。卩類主要由分離的a螺旋和反平行式0折疊構(gòu)成)a/卩類主要由平行式卩折疊和a螺旋構(gòu)成,但也有混合的卩折疊。除了在這一類的蛋白質(zhì)中形成折疊以外,在另一些蛋白質(zhì)中平行式0鏈可能形成由a螺旋環(huán)繞的圓柱狀結(jié)構(gòu)。這類蛋白質(zhì)包括許多代謝酶。第四章具體實(shí)例分析4.1分形維數(shù)的計(jì)算Huang在文獻(xiàn)中基于“蛋白質(zhì)空間結(jié)構(gòu)分形的立體分子片模型”,對(duì)Havlin的分形維數(shù)計(jì)算算法進(jìn)行改進(jìn),給出如下的計(jì)算公式[2:]D(N)=ln(R)/ln(r)公式6TOC\o"1-5"\h\zMNMNM(R)二1/(M-N)另藝(R)公式7NMi,i+NN=2i=1M(r)=1/(M-N)藝藝(r)公式8NMi,i+NN=2i=1M(R)=N^i-1[(X—X)2+(Y—Y)2+(Z—Z)2]1/2公式9i,i+NMj+1jj+1jj+1jj=1(r)=[(X—X)2+(Y—Y)2+(Z—Z)2]1/2公式10i,i+NMi+Nii+Nii+NiD=1/NK藝D(N)公式11fMN=2NK=M/2當(dāng)M為偶數(shù)時(shí)NK=(M+1)/2當(dāng)M為奇數(shù)時(shí)這里(R)是在殘基數(shù)為M的某一肽鏈中殘基數(shù)為N的片段的平均長(zhǎng)度;NM(r)是平均長(zhǎng)度為(R)的片段的平均端距端距;R)是殘基數(shù)為M的肽鏈NMNMi,i+NM中第i和第i+N個(gè)a-碳原子間鏈的長(zhǎng)度;(r)是肽鏈長(zhǎng)度為(R)的第ii,i+NMi,i+NM和第i+N個(gè)a-碳原子間的距離;XYZ貝U分別為第j個(gè)a-碳原子在三維空間中的原子坐標(biāo)。本文認(rèn)為上述公式有錯(cuò)誤。我們來(lái)分析公式(2),對(duì)于給定的長(zhǎng)度M的肽鏈,藝藝(R),與N無(wú)關(guān),相對(duì)于N是常數(shù)C。因此,(R)=C/(M-N),與i,i+NNM空間位置分布無(wú)關(guān),這與肽鏈中殘基數(shù)為N的片段的平均長(zhǎng)度的含義顯然不符,自然不能反映蛋白質(zhì)的二三級(jí)結(jié)構(gòu)。事實(shí)上,肽鏈中殘基數(shù)為N的片段的平均長(zhǎng)度應(yīng)為肽鏈中所有殘基數(shù)為N的片段的長(zhǎng)度之和與片段數(shù)的比值,因此,我們公式6修改為:(R)=1/(M-N)藝(R)公式6'NMi,i+NMi=1類似地,公式(3)修改為:(r)=1/(M-N)呢(r)公式8'NMi,i+NM故我們啟用的是公式(5),(6'),(i=71),(8')(9),(10),(11)我們從PDB數(shù)據(jù)庫(kù)中取出264條蛋白質(zhì)鏈數(shù)據(jù),按照我們的模型和公式,計(jì)算分形維數(shù)。結(jié)果見(jiàn)附錄:4.2聚類分析下面對(duì)上述蛋白質(zhì)的分形維數(shù)進(jìn)行聚類分析,其結(jié)果如下:圖1group1=Columns1through15
1202134222389101113141619Columns16through30252627282930333437383957585964Columns31through45656676777879808586878990919293Columns46through60949596979899101102103104107118123130131Columns61through75132133135136137138139140141142143144153156157Columns76through90158164166167169170173174175181182183186187188Columns91through105189195197198200204205206207208209210217220222Columns106through120229232233234236238239245247248249251252253254Columns121through124255261262264group2=
Columns1through152121718313248676882838488117159Columns16through29172176177178179201202203223224241242243244group3=24134230group4=Columns1through15567153536404142434445464749Columns16through30505152535455566061626369707172Columns31through4573747581100105106108109110111112113114115Columns46through60116119120121122124125126127128129145146147148Columns61through75149150151152154155160161162163165168171180184
Columns76through90185190191192193194196199211212213214215216218Columns91through105219221225226227228231235237240246250256257258Columns106through108259260263從聚類結(jié)果看出,結(jié)果并不理想,如GROUP2中既有Q類,0類,a+0類。這說(shuō)明蛋白質(zhì)鏈的分形維數(shù)作為單一的聚類特征指標(biāo)不合適,對(duì)于具有相同分形維數(shù)的蛋白質(zhì),有的結(jié)構(gòu)并不相似,甚至不同。這就需要進(jìn)一步討論分析。4.2進(jìn)一步討論分析本文采用MATLAB編程(程序見(jiàn)附錄),對(duì)于分維數(shù)接近的四條蛋白質(zhì)BflFigure1FileEditViewInsertToolsDesWopWindowHelp1-□X□HS紳倒近□[Es□la0,lal8,lalna,lf4a,進(jìn)行多重分形分析。試驗(yàn)結(jié)果如下:圖2FJFigure1FileEdit辿已艸InsertToolsDesklop巴門(mén)如艸Help圖3圖4圖5分析如下:EJFigure1FileEditViewInsertTuulsDeshlop'■AHndovvHelp-□X□QS運(yùn)□0■口q=-WOWO簡(jiǎn)單分形維數(shù)是對(duì)蛋白質(zhì)表面形貌,折疊的整體表征,而多重分形譜全面反映了表面上幾何高度的概率分布,其寬度人。可以度量表征表面的起伏程度。以下為結(jié)構(gòu)比較相近的蛋白質(zhì)的山結(jié)果如下:1a18蛋白質(zhì):q=[-10,10]Aa=max(a)-min(a)=6.624032875135588e-001q=[-10,10]Aa-maxa(-)man()6.794271276860535e-001q=[-30,30]Aa=max(a)-min(a)=6.794823302025714e-001q=[-50,50]Aa=max(a)-min(a)=6.794825058819123e-001q=[-100,100]1a1na蛋白質(zhì):Aa=max(a)-min(a)=1.060405141924315e+000q=[-10,10]Aa=max(a)-min(a)=1.075316210260531e+000q=[-30,30]Aa=max(a)-min(a)=1.076794858650659e+000q=[-50,50]Aa二max(a)-min(a)二1.076953848977773e+000q=[-100,100]
Aa=max(a)-min(a)=1.212935227899142e+000q=[-30,30]Aa=maxa(-)man()1.217206168240774e+0q0=0[-50,50]Aa=max(a)-min(a)=1.217950188275634e+000q=[-100,100]1f4a蛋白質(zhì):Aa=max(a)-min(a)=1.484177485013398e+000q=[-10,10]Aa=max(a)-min(a)=1.532066946890844e+000q=[-30,30]Aa=max(a)-min(a)=1.536247940609423e+000q=[-50,50]q=[-10,10]1a00蛋白質(zhì):Aa=max(a)-min(a)=1.154138473004997e+000A1a00蛋白質(zhì):Aa=max(a)-min(a)=1.154138473004997e+000盡管分形維數(shù)接近,但是,隨著的變化,f()變化形式是不一樣的,這說(shuō)明蛋白質(zhì)的多重分形譜是對(duì)其分形維數(shù)較細(xì)致的刻畫(huà)。在相同的分形維數(shù)類中,只具有相同的多重分形譜分布的蛋白質(zhì)鏈的結(jié)構(gòu)會(huì)較為接近。從圖中可看出,q的變化及其范圍,會(huì)影響f(),,和山,但總的來(lái)說(shuō)在q增大到一定程度時(shí),f(a),a基本上都不再隨著q的的增加而變化,q的范圍可以截至。第五章總結(jié)本文討論的是基于分形維數(shù)的蛋白質(zhì)結(jié)構(gòu)分析,首先運(yùn)用改進(jìn)的計(jì)算方法算出264個(gè)蛋白質(zhì)的分形維數(shù),并對(duì)其進(jìn)行聚類分析.但光從分析維數(shù)單一特性不能很好的區(qū)分各個(gè)蛋白質(zhì).于是又進(jìn)一步分析,將四個(gè)分形維數(shù)比較接近的但不同種類的蛋白質(zhì)的多重分形譜給做了出來(lái),可以看到分形維數(shù)接近的蛋白質(zhì)多重分形譜差異很大,因此多重分形譜可以比較細(xì)致的描述蛋白質(zhì)的結(jié)構(gòu)特征.主要參考文獻(xiàn)孫霞,吳自勤.分形原理及其應(yīng)用[M].中國(guó)科學(xué)技術(shù)出版社,2003,10毛軍軍.基于商空間粒度理論的商分形模型及其應(yīng)用[J].曾建軍,李世航.面向科學(xué)與工程問(wèn)題的語(yǔ)言matlab[M].安徽大學(xué)出版社,2002,6高海霞.多重分形的算法研究及應(yīng)用[J].成都理工大學(xué)學(xué)報(bào),2004,5姜靈敏,周峰.上證指數(shù)合維數(shù)的計(jì)量與特性研究[J].系統(tǒng)工程學(xué)報(bào),2006,8曹漢強(qiáng),朱光喜,李旭濤,夏文芳.多重分形及其在地形特征分析中的應(yīng)用[J].北京航空航天大學(xué)學(xué)報(bào),2004,11王堅(jiān),田社平,顏國(guó)正.結(jié)腸道壓力數(shù)據(jù)的多重分形分析[J].中國(guó)計(jì)量學(xué)院學(xué)報(bào),2005,11王福林,周陰請(qǐng).多重分形譜及其計(jì)算[J].北京航空航天大學(xué)學(xué)報(bào),2000⑼張濟(jì)忠?分形[M].清華大學(xué)出版社,1998[10]沈晨,樂(lè)友喜.求多重分形譜的一種實(shí)用算法[J].石油大學(xué)學(xué)報(bào),1996
附錄附錄A蛋白質(zhì)分形維數(shù)計(jì)算結(jié)果PDB名稱分形維數(shù)PDB名稱分形維數(shù)PDB名稱分形維數(shù)PDB名稱分形維數(shù)legn1.52571a1h1.40131ean1.54381a0rb1.6800lg6m1.38451a1k1.39871a0rg1.24491a0rp1.516815c811.54251a4la1.72711a1ma1.58211a1mb1.473215c8h1.53941a4lb1.72711a1na1.58261a1nb1.47381a4ld1.72711a4lc1.72641a1oa1.57941a1ob1.47271a4ma1.72661a4mb1.72641a3na1.58241a3nb1.57921a4mc1.72651a4md1.72641a3nc1.58331a3nd1.57691a6wl1.52481aoqa1.76891e50a1.56031e50b1.54141a6wh1.53441aoqb1.77011e50c1.56261e50d1.53791dzaa1.54671dyt1.55031e50e1.56301e50f1.53861dzab1.54621dyt1.54891e50g1.56321e50h1.54171k761.458712e8l1.54251e50q1.54051e50r1.540012e8h1.539812e8m1.54441e5j1.70451e5la1.674612e8p1.54311a0k1.56651e5lb1.67971e5qa1.69191aoqa1.76891aoqb1.77011e5qb1.69201e5qc1.69201a181.54671a1f1.40311e5qd1.69181e5qe1.69231a1g1.40031a1i1.39971e5qf1.69181e5qg1.69191a1j1.39771a1l1.39811e5qh1.69221e6va1.71271a2da1.54551a2db1.54741e6vb1.69181e6vc1.60481a2ya1.51481a2yb1.53051e6vd1.71281e6ve1.69171a2yc1.53491a3ll1.54251e6vf1.60441e6ya1.71871a3lh1.55621a3p1.38291e6yb1.69091e6yc1.61701a3rl1.53671a3rh1.56121e6yd1.71841e6ye1.69211a3rp1.09181a4jl1.54641e6yf1.61681f9ea1.54161a4jb1.54031a4kl1.54281f9ec1.54191f9ed1.43491a5fh1.54181a6ta1.53461f9eg1.54131f9eh1.43391a7nl1.52011a7nh1.53481f9el1.43391e6za1.72701a7ol1.51891a7oh1.53471e6zb1.72431e79a1.73441a7pl1.52071a7ph1.53431e79b1.73811e79c1.73901a7rl1.51991a7rh1.53521e79d1.72991e79e1.72961aay1.40051ab01.54511e79f1.73011e79g1.53461abq1.42551aifl1.54171e79h1.52311e79i1.25951aifh1.55201aifa1.54151e81e1.69581e7pa1.79021aifb1.55231aqua1.68921e7pb1.61161e7pc1.59451aqub1.68691acd1.53671e7pe1.61101e7pf1.5947
laddl.7247lahwal.54l4le7pgl.7899le7ph1.6113lahwbl.5694lahwcl.5432le7pil.5950le7pj1.7902lahwdl.54l4lahwel.5700le7pkl.6ll2le7p1.5948lahwfl.5445l3pkl.7l53le7pdl.79021e82e1.691113pkl.7l36l3pkl.7l37le9jal.32301a3oa1.584413pkl.7l00l9l4l.6028la3obl.58l01a3oc1.58351e04il.69l8le04ll.7007la3odl.5790lfOq1.7036lelcal.79O6lelcbl.7359lf2hl.555l1f3ua1.3923lelccl.7908lelcdl.7359lf3ubl.348l1f3uc1.3889lelqal.7367lelqbl.7420lf3udl.389l1f3ue1.3885lelqcl.7390lelqdl.7307lf3ufl.38l61f3ug1.3921lelqel.7300lelqfl.7304lf3uhl.3474107l1.5769lelqgl.3755lelral.7388ll7eal.6793117eb1.6781lelrbl.7444lelrcl.74l2lf99al.52341f99b1.5352lelrdl.7332lelrel.7327lf99kl.52321f99l1.5350lelrfl.7330lelrgl.3755lf99ml.524l1f99n1.5363le24al.6758le3aal.5526la8il.79l21a5sa1.6740le3abl.7007le3sal.6466la5sbl.75281a6aa1.5461le3sdl.6463le3wal.66l9la6dal.60751a6db1.6096le3wbl.6595le3wcl.6579la6eal.6l061a6eb1.6124le3wdl.6643le3zl.7299l22ll.57781f421.5922le42al.5975le42bl.5976lf45al.58721f45b1.5134le9yal.5293le9ybl.7365lf49al.80241f49b1.8022le9zal.5292le9zbl.7396lf49cl.80221f49d1.8021leaOal.86l3leaObl.86l0lf49el.80231f49f1.8022lf49gl.8022lf49hl.8022lf4aal.804l1f4ab1.8039lf4acl.804llf4adl.8040lf4hal.80501f4hb1.8049lf4hcl.8052lf4hdl.8049la95al.546l1a95b1.5345la95cl.5369la95dl.54l3lbapl.6502lbbba1.5807lbbbbl.5760lbbbcl.5804lbbbdl.5772lbbs1.6950lbd2el.5743lbdfal.5260lbdfbl.525llbdfc1.5191附錄B分形維數(shù)聚類程序clc,clear;X=load('D:\data.txt');Y=pdist(X');Z=linkage(Y,'complete');T=cluster(Z,'maxclust',4);dendrogram(Z);group1=find(T==1)'group2=find(T==2
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年特色住宿服務(wù)合同
- 食品流通合同(標(biāo)準(zhǔn)版)
- 2025年中國(guó)科學(xué)院東北地理與農(nóng)業(yè)生態(tài)研究所學(xué)術(shù)期刊中心工作人員招聘?jìng)淇碱}庫(kù)有答案詳解
- 長(zhǎng)沙市食品藥品檢驗(yàn)所2025年公開(kāi)招聘編外合同制人員備考題庫(kù)參考答案詳解
- 【2025年】藥品網(wǎng)絡(luò)銷售監(jiān)督管理辦法考核試題(附答案)
- 2025年張家港市大新鎮(zhèn)人民醫(yī)院自主招聘編外合同制衛(wèi)技人員備考題庫(kù)及參考答案詳解
- 2025年衢州市公安局第四期面向社會(huì)公開(kāi)招聘警務(wù)輔助人員備考題庫(kù)完整答案詳解
- 楚雄州教育體育局直屬學(xué)校2025年公開(kāi)選調(diào)工作人員備考題庫(kù)及1套參考答案詳解
- 2025年昌圖輔警招聘真題及答案
- 2025年北京協(xié)和醫(yī)院腫瘤內(nèi)科合同制科研助理招聘?jìng)淇碱}庫(kù)及答案詳解1套
- 2025年事業(yè)單位工勤人員高級(jí)工圖書(shū)倉(cāng)儲(chǔ)員考試試題附答案
- 冬季電纜敷設(shè)施工專項(xiàng)方案
- 紅色展覽館介紹
- GB/T 46237-2025信息技術(shù)數(shù)字孿生能力成熟度模型
- 印刷外包協(xié)議合同范本
- GB 6537-20253號(hào)噴氣燃料
- 新能源項(xiàng)目-電氣試驗(yàn)作業(yè)指導(dǎo)書(shū)
- 人血白蛋白臨床應(yīng)用管理中國(guó)專家共識(shí)解讀
- 中煤集團(tuán)技術(shù)筆試題目及答案
- 光伏電站班組安全培訓(xùn)課件
- 科研財(cái)務(wù)助理工作總結(jié)
評(píng)論
0/150
提交評(píng)論