不止于長(zhǎng)讀長(zhǎng)!Nanopore直測(cè)5mC零亞硫酸處理、零PCR偏差92.4% CpG覆蓋碾壓傳統(tǒng)WGBS!20250715_第1頁(yè)
不止于長(zhǎng)讀長(zhǎng)!Nanopore直測(cè)5mC零亞硫酸處理、零PCR偏差92.4% CpG覆蓋碾壓傳統(tǒng)WGBS!20250715_第2頁(yè)
不止于長(zhǎng)讀長(zhǎng)!Nanopore直測(cè)5mC零亞硫酸處理、零PCR偏差92.4% CpG覆蓋碾壓傳統(tǒng)WGBS!20250715_第3頁(yè)
不止于長(zhǎng)讀長(zhǎng)!Nanopore直測(cè)5mC零亞硫酸處理、零PCR偏差92.4% CpG覆蓋碾壓傳統(tǒng)WGBS!20250715_第4頁(yè)
不止于長(zhǎng)讀長(zhǎng)!Nanopore直測(cè)5mC零亞硫酸處理、零PCR偏差92.4% CpG覆蓋碾壓傳統(tǒng)WGBS!20250715_第5頁(yè)
已閱讀5頁(yè),還剩2頁(yè)未讀 繼續(xù)免費(fèi)閱讀

不止于長(zhǎng)讀長(zhǎng)!Nanopore直測(cè)5mC零亞硫酸處理、零PCR偏差92.4% CpG覆蓋碾壓傳統(tǒng)WGBS!20250715.docx 免費(fèi)下載

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

不止于長(zhǎng)讀長(zhǎng)!Nanopore直測(cè)5mC,零亞硫酸處理、零PCR偏差,92.4%CpG覆蓋碾壓傳統(tǒng)WGBS!一、引言在生命科學(xué)研究中,斑馬魚(Daniorerio)憑借其遺傳和生理特征與人類高度相似,已成為研究人類疾?。ㄈ绨┌Y、心血管疾病和血液疾病)的重要模式生物。其造血系統(tǒng),尤其是腎臟骨髓(kidneymarrow,KM),作為主要的造血器官,與哺乳動(dòng)物的骨髓功能類似,是研究造血過(guò)程及相關(guān)疾病的理想模型。然而,目前尚缺乏對(duì)斑馬魚KM這一關(guān)鍵組織的全面DNA甲基化基線數(shù)據(jù),限制了對(duì)其表觀遺傳調(diào)控機(jī)制的深入理解。DNA甲基化作為重要的表觀遺傳修飾,在調(diào)控基因表達(dá)和影響造血疾病的發(fā)生發(fā)展中扮演著關(guān)鍵角色。異常的甲基化模式可能導(dǎo)致腫瘤抑制基因的沉默,從而促進(jìn)疾病的發(fā)生。因此,繪制斑馬魚KM的DNA甲基化圖譜,對(duì)于揭示造血疾病的分子機(jī)制、開發(fā)新的診斷和治療策略具有重要意義。傳統(tǒng)的全基因組甲基化測(cè)序方法,如全基因組亞硫酸氫鹽測(cè)序(WGBS),雖然廣泛應(yīng)用,但存在諸多局限性,包括化學(xué)處理導(dǎo)致的DNA損傷、PCR擴(kuò)增引入的偏差,以及對(duì)特定基因組區(qū)域覆蓋不足等問(wèn)題。這些問(wèn)題可能影響數(shù)據(jù)的準(zhǔn)確性和完整性,限制了對(duì)甲基化模式的全面解析。牛津納米孔測(cè)序技術(shù)(OxfordNanoporeTechnologies,ONT)的出現(xiàn)為DNA甲基化研究帶來(lái)了革命性的突破。作為一種長(zhǎng)讀長(zhǎng)測(cè)序技術(shù),ONT能夠直接檢測(cè)DNA分子上的5-甲基胞嘧啶(5mC)修飾,無(wú)需亞硫酸氫鹽處理,從而避免了化學(xué)處理帶來(lái)的偏差和DNA損傷。同時(shí),其長(zhǎng)讀長(zhǎng)特性能夠提供更完整的基因組覆蓋,減少GC偏好,提高數(shù)據(jù)的準(zhǔn)確性。此外,ONT測(cè)序具有單分子分辨率,能夠識(shí)別稀有和異質(zhì)性的甲基化事件,為深入理解DNA甲基化在不同生物學(xué)背景下的功能提供了可能。本研究利用ONT測(cè)序技術(shù),對(duì)斑馬魚KM進(jìn)行了全基因組DNA甲基化分析,比較了有無(wú)紅細(xì)胞污染的樣本,建立了全面的甲基化圖譜。研究結(jié)果表明,ONT測(cè)序在CpG位點(diǎn)覆蓋率和數(shù)據(jù)質(zhì)量方面均優(yōu)于傳統(tǒng)WGBS方法,為斑馬魚造血系統(tǒng)的表觀遺傳研究提供了可靠的數(shù)據(jù)支持。二、研究發(fā)現(xiàn)2.1數(shù)據(jù)統(tǒng)計(jì)本研究作者共收集了4份斑馬魚腎臟骨髓(KM)樣本,并根據(jù)是否預(yù)先裂解紅細(xì)胞分為兩組:KM組(已去除紅細(xì)胞,包括KM1和KM2)和KMB組(保留紅細(xì)胞,包括KMB1和KMB2)。所有樣本均采用OxfordNanoporeTechnologies(ONT)平臺(tái)進(jìn)行測(cè)序,使用R9.4.1芯片完成。測(cè)序結(jié)果顯示,KM組的原始數(shù)據(jù)產(chǎn)量顯著高于KMB組。具體來(lái)說(shuō),KM1和KM2的原始數(shù)據(jù)量分別為20.6Gb和20.5Gb,而KMB1和KMB2的原始數(shù)據(jù)量分別為7.2Gb和9.8Gb。經(jīng)過(guò)過(guò)濾(包括去除接頭、短讀和低質(zhì)量讀段)后,過(guò)濾后的數(shù)據(jù)占比均在85%以上。2.2測(cè)序精度與基因組恢復(fù)率(recoveryrate)為了評(píng)估四組斑馬魚腎臟骨髓樣本的測(cè)序質(zhì)量,作者同時(shí)計(jì)算了每條nanoporeread的“估算精度”(依據(jù)basecall質(zhì)量值)和“實(shí)測(cè)精度”(比對(duì)到GRCz11后的錯(cuò)配、插入和缺失率)。結(jié)果顯示,KM組(已去除紅細(xì)胞)兩例樣本的平均估算精度約為95%,實(shí)測(cè)精度約為92.5%;而保留紅細(xì)胞的KMB組兩條樣本分別降至約92.5%與90%(圖1A)。精度密度分布進(jìn)一步表明,KM1與KM2的眾數(shù)精度均高于95%,KMB1與KMB2則低于95%(圖1B、C)。值得注意的是,讀長(zhǎng)與實(shí)測(cè)精度之間的皮爾遜相關(guān)系數(shù)絕對(duì)值均低于0.2(圖1D),提示質(zhì)量差異并非由讀長(zhǎng)本身造成,而更可能與紅細(xì)胞帶來(lái)的DNA降解或雜質(zhì)干擾有關(guān)。為了排除產(chǎn)量差異對(duì)比較的影響,作者將KM1、KM2和KMB2的原始數(shù)據(jù)量均下采樣至與KMB1相同的7.2Gb,再次計(jì)算精度。結(jié)果與使用全部讀段時(shí)一致(圖1E、F),進(jìn)一步確認(rèn)紅細(xì)胞污染是降低讀段精度的主要因素。接下來(lái),作者合并同一組的全部讀段并評(píng)估基因組覆蓋度。結(jié)果顯示,KM組讀段可覆蓋99.1%的GRCz11基因組,而KMB組僅覆蓋96.7%(圖1G)。這一差異與產(chǎn)量降低直接相關(guān):紅細(xì)胞殘留導(dǎo)致有效讀段減少,從而丟失了約2.4%的基因組區(qū)域。結(jié)合前述精度結(jié)果,可以得出結(jié)論:紅細(xì)胞污染不僅拉低了ONT讀段本身的堿基準(zhǔn)確率,也顯著削弱了整體基因組覆蓋范圍。圖12.3甲基化模式為了檢驗(yàn)紅細(xì)胞污染是否影響腎臟骨髓的甲基化信息,作者首先對(duì)四個(gè)數(shù)據(jù)集進(jìn)行了下采樣穩(wěn)健性測(cè)試。將每個(gè)數(shù)據(jù)集隨機(jī)抽取10個(gè)梯度(0–100%),重復(fù)10次后計(jì)算全基因組5mC比例。結(jié)果顯示,所有子集均呈現(xiàn)穩(wěn)定的甲基化水平(圖2A),說(shuō)明現(xiàn)有測(cè)序深度足以支持可靠的5mC檢測(cè)。值得注意的是,KM組(去除紅細(xì)胞)兩條樣本的平均5mC比例為78.2%,而保留紅細(xì)胞的KMB1和KMB2分別僅為74.7%與76.8%(圖2A),提示血液污染顯著拉低了整體甲基化水平。隨后,作者分別在100kb窗口和啟動(dòng)子區(qū)域(TSS上游5kb)計(jì)算四組間的皮爾遜相關(guān)系數(shù)。所有組合均表現(xiàn)出較高相關(guān)性(R≥0.68),但KM組內(nèi)部相關(guān)性最高:KM1與KM2在100kb水平R=0.83,啟動(dòng)子水平R=0.93;而KMB1與KMB2在對(duì)應(yīng)尺度僅0.68與0.81(圖2B、C)。這說(shuō)明紅細(xì)胞的存在不僅降低了甲基化水平,也削弱了區(qū)域甲基化狀態(tài)的一致性。區(qū)域分布進(jìn)一步印證了這一結(jié)論。在100kb分辨率下,KMB1與KMB2的平均5mC比例為74.2%和76.3%,均低于KM組的78.2%(圖2D);啟動(dòng)子區(qū)域差異更明顯,KMB1約61.7%,KM組約65%(圖2E)。為排除讀長(zhǎng)或覆蓋度差異的干擾,作者計(jì)算了每條讀段的5mC比例與讀長(zhǎng)的相關(guān)性,所有樣本|R|<0.2(圖2F),表明讀長(zhǎng)本身不影響甲基化估計(jì)。進(jìn)一步將KM1、KM2、KMB2下采樣至與KMB1相同的7.2Gb后,區(qū)域分布趨勢(shì)保持不變(圖2G、2H),再次確認(rèn)血液污染是甲基化水平下降及區(qū)域波動(dòng)增大的根本原因。圖22.4跨組織WGBS甲基化景觀為了理解“腎臟骨髓+血液”(KMB)樣本中觀察到的5mC水平下降是否源于血液本身的低甲基化特征,作者調(diào)用了已公開發(fā)表的11種成年斑馬魚組織的WGBS數(shù)據(jù)集(GSE134055),并使用liftOver將其從GRCz10轉(zhuǎn)換到GRCz11。整體結(jié)果顯示,不同組織在全基因組100kb分辨率下的5mC比例介于77.4%–86.5%,其中肝臟與睪丸最高(>80%);血液為77.4%,而腎臟為79.6%(圖3A)。在啟動(dòng)子區(qū)域,血液5mC比例為64.7%,腎臟為65%(圖3C)。這一差距雖然不大,但在KM(≈78%)與KMB(≈75%)之間已足夠解釋觀察到的3%整體偏移。區(qū)域分布圖進(jìn)一步顯示,血液在100kb窗口內(nèi)呈現(xiàn)略低的甲基化分布峰(圖3B),而啟動(dòng)子區(qū)域則與腎臟幾乎重疊(圖3C)。因此,當(dāng)腎臟骨髓樣本中混入大量紅細(xì)胞時(shí),其整體甲基化水平會(huì)向血液特征靠攏,導(dǎo)致KMB組5mC比例系統(tǒng)性下降。該結(jié)果不僅驗(yàn)證了實(shí)驗(yàn)設(shè)計(jì)的合理性,也為后續(xù)在混合組織樣本中解析真實(shí)腎臟骨髓甲基化信號(hào)提供了校正依據(jù)。圖32.5ONT與WGBS的甲基化檢測(cè)能力比較:覆蓋度、相關(guān)性及GC偏倚作者系統(tǒng)比較了ONT與常規(guī)WGBS在斑馬魚全基因組5mC檢測(cè)中的性能差異,從CpG位點(diǎn)回收率、區(qū)域一致性、GC偏倚三個(gè)維度給出量化證據(jù)。1.CpG位點(diǎn)回收率以GRCz11全部23,591,891個(gè)CpG為基準(zhǔn),ONT數(shù)據(jù)集(KM1+KM2)可覆蓋92.4%的位點(diǎn)(至少一條正向與一條反向讀段),而4個(gè)已發(fā)表的WGBS腎臟樣本僅覆蓋70%–80%,最高83.4%(圖4A)。這意味著在同等測(cè)序深度預(yù)算下,ONT能多檢出10%–20%的CpG,顯著降低信息遺漏。2.區(qū)域甲基化一致性將全部CpG按100kb或啟動(dòng)子區(qū)域聚類后,ONT-KM與WGBS-腎臟的皮爾遜相關(guān)系數(shù)分別為0.75(100kb)與0.81(啟動(dòng)子)(圖4B、4C)。若僅保留兩平臺(tái)共同檢出的位點(diǎn),相關(guān)性迅速提升至0.86(100kb)與0.94(啟動(dòng)子)(圖4D、4E),表明差異主要源于位點(diǎn)覆蓋差異而非系統(tǒng)偏差。進(jìn)一步將血液、腎臟WGBS與KMB1、KMB2ONT數(shù)據(jù)進(jìn)行交叉比較,發(fā)現(xiàn)WGBS血液-腎臟間相關(guān)性最高,KMB1-KMB2最低,再次提示紅細(xì)胞污染會(huì)拉低平臺(tái)間一致性(圖4F)。3.GC偏倚盡管WGBS原始數(shù)據(jù)量(47–71Gb)遠(yuǎn)高于ONT(20Gb),其基因組覆蓋率卻僅約85%,而ONT達(dá)到98%(圖4G)。1kb窗口分析顯示,斑馬魚基因組GC含量集中在10%–60%(圖4H)。在該區(qū)間內(nèi),ONT讀段深度幾乎恒定(歸一化值≈1),而WGBS在低GC區(qū)顯著過(guò)覆蓋、高GC區(qū)明顯缺失(圖4I)。這種GC偏倚導(dǎo)致WGBS在高GC的啟動(dòng)子或CpG島區(qū)域覆蓋不足,而ONT則保持均勻。圖4三、總結(jié)本研究利用ONT長(zhǎng)讀長(zhǎng)、單分子、無(wú)亞硫酸處理的特性,系統(tǒng)描繪了斑馬魚腎臟骨髓(KM)的全基因組5mC圖譜,并建立了“去紅細(xì)胞(KM)”與“含紅細(xì)胞(KMB)”兩套基線。主要結(jié)論可歸納為三點(diǎn):1.樣本制備決定數(shù)據(jù)質(zhì)量紅細(xì)胞污染不僅使ONT讀段產(chǎn)量下降約60%,還將堿基準(zhǔn)確率從95%拉低到92.5%,基因組恢復(fù)率由99.1%降至96.7%(圖1)。提示在微量或復(fù)雜組織中提取高分子量DNA時(shí),必須優(yōu)先考慮紅細(xì)胞裂解或細(xì)胞分選步驟。2.紅細(xì)胞混入導(dǎo)致甲基化水平系統(tǒng)性偏移KMB組整體5mC比例(≈75%)顯著低于KM組(≈78%),且區(qū)域一致性下降(圖2)。通過(guò)與11種組織的WGBS數(shù)據(jù)比對(duì),證實(shí)該偏移與血液本身低甲基化特征直接相關(guān)(圖3),為后續(xù)混合樣本的校正提供了量化依據(jù)。3.ONT全面優(yōu)于傳統(tǒng)WGBS在相同實(shí)驗(yàn)周期內(nèi),ONT覆蓋92.4%CpG位點(diǎn),而WGBS僅70%–80%;基因組覆蓋率98%vs85%;GC偏倚近乎為零(圖4)。當(dāng)兩平臺(tái)共享位點(diǎn)足夠時(shí),甲基化定量高度一致(R≥0.86),證明ONT可作為WGBS的高覆蓋、低偏差優(yōu)化方案。綜上,本研究不僅為斑馬魚造血研究提供了迄今最完整的甲基化基線

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論