分子進(jìn)化分析_第1頁
分子進(jìn)化分析_第2頁
分子進(jìn)化分析_第3頁
分子進(jìn)化分析_第4頁
分子進(jìn)化分析_第5頁
已閱讀5頁,還剩53頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第六章 分子進(jìn)化分析,主講:涂昀,生物信息學(xué),重慶大學(xué)生物工程學(xué)院,18世紀(jì)之前,神創(chuàng)論和物種不變論。 18世紀(jì),相信物種是變化的。拉馬克用環(huán)境作用的影響、器官的用進(jìn)廢退和獲得性的遺傳等原理解釋生物進(jìn)化過程,創(chuàng)立了第一個(gè)比較嚴(yán)整的進(jìn)化理論。 1859年達(dá)爾文發(fā)表物種起源,論證了地球上現(xiàn)存的生物都由共同祖先發(fā)展而來,并提出自然選擇學(xué)說以說明進(jìn)化的原因,從而創(chuàng)立了科學(xué)的進(jìn)化理論。 20世紀(jì)30年代,綜合進(jìn)化論,綜合了細(xì)胞遺傳學(xué)、群體遺傳學(xué)以及古生物學(xué)等學(xué)科的成就,進(jìn)一步發(fā)展了進(jìn)化理論。 20世紀(jì)60年代末,分子進(jìn)化中性學(xué)說,認(rèn)為種內(nèi)和種間大多數(shù)可見差異是適合度很小的隨機(jī)突變的固定所決定的。,Dar

2、win, Charles (1809-1882),The Origin of Species (1859),生物進(jìn)化,1. 化石證據(jù):理想但是零散、不完整,生物進(jìn)化研究方法,2. 比較形態(tài)學(xué)和比較生理學(xué):確定大致的進(jìn)化框架 但是細(xì)節(jié)存很多的爭議,生物進(jìn)化研究方法,3. 分子進(jìn)化( molecular evolution ) 研究生物大分子(如核酸和蛋白質(zhì)分子)的進(jìn)化速率、模式及機(jī)制的理論,生物進(jìn)化研究方法,分子進(jìn)化,1964年,Pauling等提出分子進(jìn)化理論: (1) 生命起源:有機(jī)分子由簡單向復(fù)雜演變 (2) 生物進(jìn)化:構(gòu)成生物體的生物大分子如蛋白質(zhì)、核酸的演變。 基本假設(shè):核苷酸和氨基酸

3、序列中含有生物進(jìn)化歷史的全部信息 意義:分子進(jìn)化的研究可以為生物進(jìn)化過程提供佐證,為深入研究進(jìn)化機(jī)制提供重要依據(jù)。,普適性 由4種核酸組成 分子水平的進(jìn)化表現(xiàn)為:DNA序列的演化、氨基酸序列演化、蛋白質(zhì)結(jié)構(gòu)及功能的演化 可比較性 比較不同物種的有關(guān)DNA序列 建立DNA序列的演化模型、氨基酸序列的演化模型(數(shù)學(xué)模型) 蛋白質(zhì)結(jié)構(gòu)的演化模型 基因組編碼信息的豐富 與形態(tài)、性狀包含的信息相比,基因組序列、蛋白質(zhì)序列包含更多、更復(fù)雜的信息結(jié)構(gòu),分子進(jìn)化,序列比較:源于同一祖先DNA/氨基酸序列的兩條DNA/氨基酸序列,考察二者的差異。 序列差異:進(jìn)化過程中分子突變的痕跡 分子進(jìn)化:以累計(jì)在DNA/氨

4、基酸分子上的歷史信息為基礎(chǔ),研究分子水平的生物進(jìn)化過程和機(jī)制。,分子進(jìn)化的研究方法,分子進(jìn)化的模式,DNA突變的模式:替代,插入,缺失,倒位 (2) 核苷酸替代:轉(zhuǎn)換 (Transition) & 顛換 (Transversion) (3) 基因復(fù)制:多基因家族的產(chǎn)生以及偽基因的產(chǎn)生 A. 單個(gè)基因復(fù)制 重組或者逆轉(zhuǎn)錄 B. 染色體片斷復(fù)制 C. 基因組復(fù)制,分子進(jìn)化鐘:某一蛋白在不同物種間的取代數(shù)與所研究物種間的分歧時(shí)間接近正線性關(guān)系,進(jìn)而將分子水平的這種恒速變異稱為“分子鐘”。 中性學(xué)說:突變大多數(shù)是中性的, 中性突變通過隨機(jī)的遺傳漂變在群體里固定下來, 分子進(jìn)化是遺傳漂變的結(jié)果, 在分子

5、進(jìn)化上自然選擇不起作用。,分子進(jìn)化的理論基礎(chǔ),(1) 從物種的一些分子特性出發(fā),構(gòu)建系統(tǒng)發(fā)育樹,進(jìn)而了解物種之間的生物系統(tǒng)發(fā)生的關(guān)系 生命樹,物種分類 (2) 大分子功能與結(jié)構(gòu)的分析:同一家族的大分子,具有相似的三級結(jié)構(gòu)及生化功能,通過序列同源性分析,進(jìn)行大分子功能預(yù)測 (3) 進(jìn)化速率分析:例如,HIV的高突變性,哪些位點(diǎn)易發(fā)生突變?,分子進(jìn)化的研究目的,作為進(jìn)化標(biāo)尺的 生物大分子的選擇原則,1)在所需研究的種群范圍內(nèi),它必須是普遍存的。,2)在所有物種中該分子的功能是相同的。,3)為了鑒定大分子序列的同源位置或同源區(qū),要求所 選擇的分子序列必須能嚴(yán)格線性排列,以便進(jìn)行進(jìn) 一步的分析比較。,

6、4)分子上序列的改變(突變)頻率應(yīng)與進(jìn)化的測量尺 度相適應(yīng)。,大量的資料表明:功能重要的大分子、或者大分子中功能重要 的區(qū)域,比功能不重要的分子或分子區(qū)域進(jìn)化變化速度低。,16S rRNA被普遍公認(rèn)為 是一把好的譜系分析的 “分子尺”,16S rRNA,1)rRNA具有重要且恒定的生理功能;,2)在16SrRNA分子中,既含有高度保守的序列區(qū)域,又有中度 保守和高度變化的序列區(qū)域,因而它適用于進(jìn)化距離不同的 各類生物親緣關(guān)系的研究;,3)16SrRNA分子量大小適中,便于序列分析;,4)rRNA在細(xì)胞中含量大(約占細(xì)胞中RNA的90%),也易于提??;,5)16SrRNA普遍存在于真核生物和原核

7、生物中(真核生物中其同 源分子是18SrRNA)。因此它可以作為測量各類生物進(jìn)化的工具。,(1) Tree of Life: 16S rRNA,真菌,真核生物,古生菌,Out of Africa,53個(gè)人的線粒體基因組(16,587bp),人類遷移的路線,非洲人相對其他大陸上的人類在基因上極為多樣化,隨著距非洲距離越來越長,遺傳多樣性的衰退程度,正好沿著人類早期遷徙的路線慢慢增大。,系統(tǒng)發(fā)育樹 (Phylogenetic tree),對一組實(shí)際對象的世系關(guān)系的描述(如基因,物種等)。,一個(gè)系統(tǒng)發(fā)育樹,用一種類似樹狀分支的圖形來概括各種(類)生物之間的親緣關(guān)系 通過比較生物大分子序列差異的數(shù)值構(gòu)

8、建的系統(tǒng)樹稱為分子系統(tǒng)樹,系統(tǒng)發(fā)育樹,系統(tǒng)發(fā)育樹的術(shù)語,代表最終分類,可以是物種,群體或者蛋白質(zhì)、DNA、RNA分子等,系統(tǒng)發(fā)育樹是一種二叉樹。由一系列節(jié)點(diǎn)(nodes)和分支(branches )組成,其中每個(gè)節(jié)點(diǎn)代表一個(gè)分類單元(物種或序列),而節(jié)點(diǎn)之間的連線代表物種之間的進(jìn)化關(guān)系。 樹的節(jié)點(diǎn)又分為外部節(jié)點(diǎn)(terminal node)和內(nèi)部節(jié)點(diǎn)(internal node)。外部節(jié)點(diǎn)代表實(shí)際觀察到的分類單元。內(nèi)部節(jié)點(diǎn)又稱為分支點(diǎn),代表分類單元進(jìn)化歷程中的祖先。,系統(tǒng)發(fā)育樹的術(shù)語,拓?fù)浣Y(jié)構(gòu): 有根樹:反映時(shí)間順序 無根樹:反映距離,理論上,一個(gè)DNA序列在物種形成或基因復(fù)制時(shí),分裂成兩個(gè)子

9、序列,因此系統(tǒng)發(fā)育樹一般是二叉的。 一般考慮二叉的樹結(jié)構(gòu):二叉樹,系統(tǒng)發(fā)育樹的種類: 有根樹、無根樹,考慮4個(gè)分類群時(shí),共有15種可能的有根樹,a,b,c,d,a,c,b,d,a,d,b,c,考慮4個(gè)分類群時(shí),共有3種可能的無根樹,考察類群數(shù)為 m ( m 3 )的系統(tǒng)樹,其可能的拓?fù)浣Y(jié)構(gòu)數(shù)目為:,有根樹,無根樹,m=10: 34,459,425種,m=10: 2,027,025種,當(dāng) m較大時(shí),選出真實(shí)樹的拓?fù)浣Y(jié)構(gòu)十分困難。,分支數(shù)目:,有根樹,無根樹,內(nèi)部分支數(shù)目:,有根樹,無根樹,內(nèi)部節(jié)點(diǎn)數(shù)目:,有根樹,無根樹,系統(tǒng)發(fā)育樹的種類: 有根樹、無根樹,選擇一個(gè)或多個(gè)已知與分析序列關(guān)系較遠(yuǎn)的序

10、列作為外圍支 2. 外圍支可以輔助定位樹根 3. 外圍支條件:序列必須與剩余序列關(guān)系較近,但外圍支序列與其他序列間的差異必須比其他序列之間的差異更顯著,選擇外圍支 (Outgroup),基因樹: 由來自各個(gè)物種的一個(gè)基因構(gòu)建的系統(tǒng)發(fā)育樹(不完全等同于物種樹),表示基因分離的時(shí)間。 物種樹: 代表一個(gè)物種或群體進(jìn)化歷史的系統(tǒng)發(fā)育樹,表示兩個(gè)物種分歧的時(shí)間。,系統(tǒng)發(fā)育樹的種類:基因樹、物種樹,a,b,c,A,B,D,Gene tree,Species tree,進(jìn)化分支圖,進(jìn)化樹,系統(tǒng)發(fā)生樹性質(zhì),如果是一棵有根樹,則樹根代表在進(jìn)化歷史上是最早的、并且與其它所有分類單元都有聯(lián)系的分類單元。 如果找不

11、到可以作為樹根的單元,則系統(tǒng)發(fā)生樹是無根樹。 從根節(jié)點(diǎn)出發(fā)到任何一個(gè)節(jié)點(diǎn)的路徑指明進(jìn)化時(shí)間或者進(jìn)化距離。,對于給定的分類單元數(shù),有很多棵可能的系統(tǒng)發(fā)生樹,但是只有一棵樹是正確的。 系統(tǒng)發(fā)生分析的目標(biāo) 尋找這棵正確的樹,系統(tǒng)發(fā)生樹性質(zhì),系統(tǒng)發(fā)育樹構(gòu)建分析步驟,多序列比對(自動(dòng)比對,手工比對),建立取代模型(建樹方法),建立進(jìn)化樹,進(jìn)化樹評估,系統(tǒng)發(fā)育樹的構(gòu)建,1. 系統(tǒng)發(fā)育樹:分子進(jìn)化樹/分子進(jìn)化分析 2. 通過進(jìn)化樹的構(gòu)建,分析分子之間的起源關(guān)系,預(yù)測分子的功能 3. 建樹方法: A. 最大簡約法 (Maximum Parsimony) B. 距離法 (distance-based metho

12、ds) C. 最大似然性法 (Maximum Likelihood),A. 最大簡約法(MP),最大簡約法(maximum parsimony,MP)最早源于形態(tài)性狀研究,現(xiàn)在已經(jīng)推廣到分子序列的進(jìn)化分析中。 最大簡約法的理論基礎(chǔ)是奧卡姆(Ockham)原則,這個(gè)原則認(rèn)為:解釋一個(gè)過程的最好理論是所需假設(shè)數(shù)目最少的那一個(gè)。對所有可能的拓?fù)浣Y(jié)構(gòu)進(jìn)行計(jì)算,計(jì)算出所需替代數(shù)最小的那個(gè)拓?fù)浣Y(jié)構(gòu),作為最優(yōu)樹。,B. 距離法,又稱距離矩陣法,首先通過各個(gè)物種之間的比較,根據(jù)一定的假設(shè)(進(jìn)化距離模型)推導(dǎo)得出分類群之間的進(jìn)化距離,構(gòu)建一個(gè)進(jìn)化距離矩陣。進(jìn)化樹的構(gòu)建則是基于這個(gè)矩陣中的進(jìn)化距離關(guān)系,計(jì)算序列的

13、距離,建立距離矩陣,通過距離矩陣建進(jìn)化樹,由進(jìn)化距離構(gòu)建進(jìn)化樹的方法有很多,常見有: 1.Fitch-Margoliash Method(FM法) 2. Neighbor-Joining Method (NJ法/鄰接法): 求最短支長,最通用的距離方法 3. Neighbors Relaton Method(鄰居關(guān)系法) 4.Unweighted Pair Group Method (UPGMA法),通過矩陣建樹的方法,選取一個(gè)特定的替代模型來分析給定的一組序列數(shù)據(jù),使得獲得的每一個(gè)拓?fù)浣Y(jié)構(gòu)的似然率都為最大值,然后再挑出其中似然率最大的拓?fù)浣Y(jié)構(gòu)作為最優(yōu)樹。,C. 最大似然法(ML),1. 可靠

14、的待分析數(shù)據(jù) 2. 準(zhǔn)確的多序列比對 3. 選擇合適的建樹方法: A. 序列相似程度高,MP(最大簡約法) B. 序列相似程度較低,ML(最大似然法) C. 序列相似程度太低,無意義 4. 一般采用兩種及以上方法構(gòu)建進(jìn)化樹,無顯著區(qū)別可接受,構(gòu)建進(jìn)化樹的一般原則,進(jìn)化樹的可靠性分析: 自展法 (Bootstrap Method) (統(tǒng)計(jì)方法) 。 從排列的多序列中隨機(jī)有放回的抽取某一列,構(gòu)成相同長度的新的排列序列 重復(fù)上面的過程,得到多組新的序列 對這些新的序列進(jìn)行建樹,再觀察這些樹與原始樹是否有差異,以此評價(jià)建樹的可靠性,進(jìn)化樹的可靠分析,常用分子進(jìn)化與系統(tǒng)進(jìn)化分析的軟件,謝 謝,(1) D

15、NA突變的模式,替代,插入,缺失,倒位,酪氨酸,亮氨酸,半胱氨酸,酪氨酸,苯丙氨酸,甲硫氨酸,(2) 核苷酸替代:轉(zhuǎn)換 & 顛換,轉(zhuǎn)換:嘌呤被嘌呤替代,或者嘧啶被嘧啶替代 顛換:嘌呤被嘧啶替代,或者嘧啶被嘌呤替代,A: 腺嘌呤,C: 胞嘧啶,G: 鳥嘌呤,T: 胸腺嘧啶,(3) 基因復(fù)制:A. 單個(gè)基因復(fù)制,重組,逆轉(zhuǎn)錄,(3) 基因復(fù)制: B. 染色體片段復(fù)制,缺失染色體失去了片段 重復(fù)染色體增加了片段 易位非同源染色體間相互交換染色體片段,造成染色體間的重新排列 倒立染色體片段作180的顛倒,造成染色體內(nèi)的重新排列。,(3) 基因復(fù)制: C. 基因組復(fù)制,S. Cerevisiae (釀酒

16、酵母),K. Waltii (克魯雄酵母),克魯雄酵母中的同源基因數(shù)量與釀酒酵母相比為1:2,分子進(jìn)化的兩個(gè)特點(diǎn),生物大分子進(jìn)化速率的相對恒定 分子進(jìn)化速率 生物大分子隨時(shí)間的改變主要表現(xiàn)為核苷酸、蛋白質(zhì)的一級結(jié)構(gòu)的改變,即分子序列中核苷酸、氨基酸的替換 不同物種同源大分子的分子進(jìn)化速率大體相同 分子進(jìn)化速率遠(yuǎn)遠(yuǎn)比表型進(jìn)化速率穩(wěn)定,生物大分子進(jìn)化的保守性 保守性:功能上重要的大分子或大分子的局部在進(jìn)化速率上明顯低于那些在功能上不重要的大分子或者大分子局部。(引起表型發(fā)生顯著改變的突變發(fā)生的頻率要低于無明顯表型發(fā)生顯著改變得突變發(fā)生的頻率。) 氨基酸 例:血紅蛋白分子的外區(qū)的功能要次于內(nèi)區(qū)的功能

17、,外區(qū)的進(jìn)化速率是內(nèi)區(qū)進(jìn)化速率的10倍。 核苷酸 例:DNA密碼子的同義替代頻率高于非同義替代頻率;內(nèi)含子上的核苷酸替代頻率較高。 生物大分子進(jìn)化并非完全隨機(jī) 存在某種制約因素,存在某種機(jī)制?,分子鐘(Molecular Clock),根據(jù)分子系統(tǒng)學(xué)研究與古生物學(xué)資料相結(jié)合,建立推論生物進(jìn)化事件發(fā)生的時(shí)間表。,假定分子進(jìn)化速率r恒定,則分子進(jìn)化改變量(替代數(shù)目或替代率)與進(jìn)化時(shí)間成正比。以兩條序列為例: d = 2 r t 其中,t是進(jìn)化時(shí)間,d是這兩條序列每個(gè)位點(diǎn)的替代數(shù)目。,分子鐘成立的先決條件:分子進(jìn)化速率恒定,分子鐘成立的證據(jù): 1、至少某些生物大分子(如珠蛋白)的進(jìn)化速率在相當(dāng)長的地

18、質(zhì)時(shí)間內(nèi)的相對穩(wěn)定、均勻; 2、許多不同物種的多種同源大分子在相當(dāng)長時(shí)間內(nèi)的平均進(jìn)化速率近似恒定。,建立分子鐘的大致步驟 1、選擇所要比較的生物大分子種類 根據(jù)具體研究目標(biāo)和已掌握的資料,選擇進(jìn)化速率相對恒定、速率大小合適、分布范圍能涵蓋各待比較物種的生物大分子。 2、選擇所要比較的物種,確定各比較組合及其所代表的進(jìn)化事件 3、獲得生物大分子一級結(jié)構(gòu)的資料,建立分子鐘的大致步驟 4、獲得有關(guān)的代表性進(jìn)化事件發(fā)生的地質(zhì)時(shí)間數(shù)據(jù) 5、通過比較大分子一級結(jié)構(gòu),選擇合適的數(shù)學(xué)模型,計(jì)算得到進(jìn)化產(chǎn)生的分子差異d,通過回歸分析等統(tǒng)計(jì)方法得到大分子的進(jìn)化速率r(t) 6、由此可以推斷未知進(jìn)化事件的發(fā)生時(shí)間,關(guān)于分子鐘的討論和爭議 1、對長期進(jìn)化而言,不存在以恒定速率替換的生物大分子一級結(jié)構(gòu);(基因功能的改變、基因數(shù)目的增加) 2、不存在通用的分子鐘; 3、爭議: 分子鐘的準(zhǔn)確性 中性理論(分子鐘成立的基礎(chǔ)),進(jìn)化理論概述,“一個(gè)半世紀(jì)以前,Charles Darwin可能沒有意識(shí)到他所給予

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論