基于測序的微生物多樣性分析總結(jié)_第1頁
基于測序的微生物多樣性分析總結(jié)_第2頁
基于測序的微生物多樣性分析總結(jié)_第3頁
基于測序的微生物多樣性分析總結(jié)_第4頁
基于測序的微生物多樣性分析總結(jié)_第5頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、基于二代高通量測序的環(huán)境微生物多樣性分析一般認(rèn)為土壤、海洋、腸道等生態(tài)系統(tǒng)中的微生物數(shù)量繁多、種類多樣。傳統(tǒng)的培養(yǎng)方法只限于對環(huán)境樣品中極少部分(0.1%-1%)可培養(yǎng)的微生物類群的研究,而變性梯度凝膠電泳(DGGE)、克隆文庫等常規(guī)的分子生物學(xué)方法也因操作復(fù)雜、成本高、痕量菌發(fā)現(xiàn)困難等因素?zé)o法達(dá)到深入分析環(huán)境微生物多樣性的目的。高通量測序技術(shù)的出現(xiàn),極大的促進(jìn)了對環(huán)境中不可培養(yǎng)微生物以及痕量菌的研究,為環(huán)境微生物多樣性的研究開啟了新的研究熱潮。 微生物群落中物種的多樣性依然是目前研究的重點(diǎn)。對群落結(jié)構(gòu)的研究,將有助于了解種群結(jié)構(gòu)的穩(wěn)定性,進(jìn)而了解種群內(nèi)物種間的相互依賴、相互制約的內(nèi)在聯(lián)系,為

2、將來構(gòu)建功能性種群服務(wù)。鑒于微生物群落是一個多物種的集合體,其中高達(dá) 95%以上的微生物物種無法分離也不能獨(dú)立培養(yǎng),拼裝出每個獨(dú)立個體的基因組現(xiàn)在也無法實現(xiàn),細(xì)菌16S 或真菌ITS測序分析依然是現(xiàn)階段微生物群落多樣性和多態(tài)性分析的基石。一、高通量測序背景介紹高通量測序技術(shù),可以一次對幾十萬到幾百萬條DNA分子進(jìn)行序列測定,使得對PCR擴(kuò)增產(chǎn)物直接進(jìn)行序列測定成為可能。極大的促進(jìn)了對環(huán)境中不可培養(yǎng)微生物以及痕量菌的研究,為環(huán)境微生物多樣性的研究開啟了新的研究熱潮。目前高通量測序的主要平臺代表有Illumina公司的Solexa基因組分析儀(Illumina Genome Analyzer)、羅

3、氏公司(Roche)的454測序儀(Roch GS FLX sequencer)和ABI的SOLiD測序儀(ABI SOLiD sequencer)。微生物多樣性分析中,以Illumina及454測序平臺應(yīng)用最為廣泛。二、工作流程1 PCR引物的設(shè)計2 PCR擴(kuò)增條件摸索3瓊脂糖凝膠電泳檢測結(jié)果4 全部樣品進(jìn)行PCR5 PCR產(chǎn)物的凝膠回收及檢測6 PCR產(chǎn)物精確定量(Qubit 2.0 )將純化后的PCR產(chǎn)物采用微量熒光核酸定量儀進(jìn)行精確定量(精確到0.1ng/ul)7. 將定量后混勻的DNA樣本再次進(jìn)行磁珠法純化后,進(jìn)行高通量測序三、可分析項目1) 有效序列數(shù)據(jù)統(tǒng)計在測序?qū)嶒炛?,通常采用?/p>

4、個樣品平行測序的方法,即多個樣品混合測序。為了能區(qū)分樣品,各樣品中的序列均引入了一段標(biāo)示其樣本來源信息的barcode標(biāo)簽序列。若所測序列中不含有barcode 標(biāo)簽序列,則無法確定其樣本來源,進(jìn)而導(dǎo)致后續(xù)生物信息錯誤或意義不明。因此,僅當(dāng)原始序列中含有完整的barcode 標(biāo)簽序列時,該條序列才被認(rèn)可為有效序列。2)優(yōu)化序列數(shù)據(jù)統(tǒng)計通常情況下,有效序列可以直接用于后續(xù)生物信息學(xué)分析。在實驗過程中,測序產(chǎn)物可能含有非特異性擴(kuò)增片段,利用特異性引物信息可以將其去除;序列中可能含有模糊堿基(ambiguous)、單堿基高重復(fù)區(qū) (homologous )以,長度過短的序列(序列長度小于200bp)

5、,及PCR過程中產(chǎn)生的一些嵌合體,將這些序列納入分析范圍會降低分析質(zhì)量,因此修剪、去除(trim)此部分序列,可得到供精準(zhǔn)分析的優(yōu)化序列。在數(shù)據(jù)去除(trim)時,把maxambig=0,axhomop=8,maxlength=200,及其嵌合體序列去掉,并對數(shù)據(jù)進(jìn)行統(tǒng)計,得到優(yōu)化序列的百分率。3) OTU生成根據(jù)序列的相似性,將序列歸為多個OTU(操作分類單元),以便后續(xù)分析。OTU (Operational Taxonomic Units)是在系統(tǒng)發(fā)生學(xué)研究或群體遺傳學(xué)研究中,為了便于進(jìn)行分析,人為給某一個分類單元(品系,種,屬,分組等)設(shè)置的同一標(biāo)志。在生物信息分析中,一般來說,測序得到

6、的每一條序列來自一個菌。要了解一個樣品測序結(jié)果中的菌種、菌屬等數(shù)目信息,就需要對序列進(jìn)行歸類操作(cluster)。通過歸類操作,將序列按照彼此的相似性分歸為許多小組,一個小組就是一個OTU。根據(jù)客戶指定的相似度(96%、97%或者98%),對所有序列進(jìn)行OTU 劃分并進(jìn)行生物信息統(tǒng)計分析。OTU 分析主要步驟(1) 提取非重復(fù)序列,堿基完全一致序列為重復(fù)序列;(2) 與silva 庫中的aligned(16S/18S, SSU)核糖體序列比對;(3) Chimeric 序列檢測與去除(4) 距離計算與OTU 聚類。4) 多樣性分析 (Alpha-diversity)計算菌群豐度(Commun

7、ity richness)的指數(shù)有:(1)Chao:是用chao1 算法估計群落中含OTU 數(shù)目的指數(shù),chao1 在生態(tài)學(xué)中常用來估計物種總數(shù),由Chao (1984) 最早提出。(2)Ace:用來估計群落中含有OTU 數(shù)目的指數(shù),由Chao 提出,是生態(tài)學(xué)中估計物種總數(shù)的常用指數(shù)之一,與Chao I 的算法不同。計算菌群多樣性(Community diversity)的指數(shù)有:(1)Simpson:用來估算樣品中微生物的多樣性指數(shù)之一,由Edward Hugh Simpson (1949) 提出,在生態(tài)學(xué)中常用來定量的描述一個區(qū)域的生物多樣性。Simpson 指數(shù)值越大,說明群落多樣性越低

8、。(2)Shannon:用來估算樣品中微生物的多樣性指數(shù)之一。它與 Simpson多樣性指數(shù)均為常用的反映 alpha多樣性的指數(shù)。Shannon值越大,說明群落多樣性越高。測序深度指數(shù)有:Coverage:是指各樣品文庫的覆蓋率,其數(shù)值越高,則樣本中序列沒有被測出的概率越低。該指數(shù)實際反映了本次測序結(jié)果是否代表樣本的真實情況。使用軟件:mothur及BioLinker自編程序。5) 稀釋性曲線(Rarefaction curve)稀釋性曲線:一般是從樣本中隨機(jī)抽取一定數(shù)量的個體,統(tǒng)計出這些個體所代表物種數(shù)目,并以個體數(shù)與物種數(shù)來構(gòu)建曲線。它可以用來比較測序數(shù)量不同的樣本物種的豐富度,也可以用

9、來說明樣本的取樣大小是否合理。分析采用對優(yōu)化序列進(jìn)行隨機(jī)抽樣的方法,以抽到的序列數(shù)與它們所能代表OTU的數(shù)目構(gòu)建稀釋性曲線。稀釋性曲線圖中,當(dāng)曲線趨向平坦時,說明取樣的數(shù)量合理,更多的取樣只會產(chǎn)生少量新的OTU,反之則表明繼續(xù)取樣還可能產(chǎn)生較多新的OTU。因此,通過作稀釋性曲線,可以得出樣品的取樣深度情況。稀釋性曲線分析結(jié)果默認(rèn)是在 97%相似性水平下劃分OUT并制作各樣品的稀疏曲線。6) 分類學(xué)分析(Taxonomy)在之前的分析步驟中,已經(jīng)將序列按照其自身的堿基組成的相似性,分歸到各 OTU 中。在進(jìn)行分類學(xué)分析時,首先,將每一條優(yōu)質(zhì)序列都與SILVA(最新版)數(shù)據(jù)庫進(jìn)行比對,找出其最相近

10、且可信度達(dá)80%以上的種屬信息。之后,將每一個 OTU 中的所有序列進(jìn)行類比,找出同一 OTU 中的不同序列的最近祖先的種屬信息。最后,將得到的結(jié)果記錄在表格文件中。這樣做,可以在保留最可能多的信息量的情況下,確保得出信息的準(zhǔn)確性。7) 樣本間比較各樣品群落結(jié)構(gòu)分析柱狀圖或者餅狀圖在某一分類地位上根據(jù)各樣品中的微生物組成繪制餅圖或者柱狀圖。8) 全樣品相似度分析樹狀圖比較多個樣品中OTU組成的差異及各OTU中含有序列的豐度,計算這些樣品的相似性,并繪制相似性圖譜。9) 樣品 OTU分布比較-VENN圖統(tǒng)計多個樣品中所共有的 OTU 數(shù)目可以反映環(huán)境樣品的相似性及重疊情況。10) Heatmap

11、熱圖分析Heatmap 可以用顏色變化來反映二維矩陣或表格中的數(shù)據(jù)信息,它可以直觀地將數(shù)據(jù)值的大小以定義的顏色深淺表示出來。常根據(jù)需要將數(shù)據(jù)進(jìn)行聚類,將聚類后的數(shù)據(jù)表示在heatmap的相似性和差異性。如在屬水平上對樣品和 OTU 類型(樣品所含菌屬)進(jìn)行聚類(依據(jù)是不同樣品中各 OTU 所含序列數(shù)越相近,即所含菌屬數(shù)量越相近,樣品間相似性越高),對聚類后各樣品中不同 OTU(不同菌屬)所含序列的豐度作 heatmap 圖,能夠反映出在菌屬水平上各樣品菌落結(jié)構(gòu)的相似性和差異性。將指定種屬水平上的分類信息分別按照樣品和分類進(jìn)行聚類后作出 Heatmap 圖,能夠反映出所有樣品在各分類水平上表現(xiàn)的

12、相似性或者差異性。11) 組間顯著性差異分析(metastats分析)分析多個樣品時,如果這些樣品分屬于兩個組,則可以進(jìn)行Metastats分析。該分析通過對比兩組條件下的多個樣品,找出兩組中具有顯著差異的微生物類型。結(jié)果如下表所示:12) PCA分析(Principal Component Analysis)PCA 分析,即主成分分析,是一種對數(shù)據(jù)進(jìn)行簡化分析的技術(shù),這種方法可以有效的找出數(shù)據(jù)中最“主要”的元素和結(jié)構(gòu),去除噪音和冗余,將原有的復(fù)雜數(shù)據(jù)降維,揭示隱藏在復(fù)雜數(shù)據(jù)背后的簡單結(jié)構(gòu)。它的優(yōu)點(diǎn)是簡單,而且無參數(shù)限制,可以方便的應(yīng)用于各個場合。我們可以用PCA 來分析不同樣品OTU組成的差

13、異,通過方差分解,將多組數(shù)據(jù)的差異反映在二維坐標(biāo)圖上,坐標(biāo)軸取能夠最大反映方差值的兩個特征值。如樣品組成越相似,反映在PCA圖中的距離越近。不同環(huán)境間的樣品可能表現(xiàn)出分散分布。PCA 分析可以用來反映不同樣品中微生物群落組成的相似性以及影響微生物多樣性的主要因素,一般情況下是用來對假設(shè)進(jìn)行驗證。如PCA 可以用來做以下分析:確定環(huán)境中的樣品是否具有顯著不同的微生物群落。將環(huán)境間的差異以圖的形式表現(xiàn)出來等。13) RDA分析利用冗余分析(RDA)可以反映在OTU的水平或者某生物學(xué)分類水平上各樣品中菌群與環(huán)境因子之間關(guān)系。14) UniFrac分析選取一個組的多個樣品或者不同組的樣品,進(jìn)行 Weighted unifrac PCoA分析或者unweighted unifrac PCoA分析,可以在OTU的水平上反映各樣

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論