基于計算生物學(xué)的環(huán)形RNA二級結(jié)構(gòu)與功能解析_第1頁
基于計算生物學(xué)的環(huán)形RNA二級結(jié)構(gòu)與功能解析_第2頁
基于計算生物學(xué)的環(huán)形RNA二級結(jié)構(gòu)與功能解析_第3頁
基于計算生物學(xué)的環(huán)形RNA二級結(jié)構(gòu)與功能解析_第4頁
基于計算生物學(xué)的環(huán)形RNA二級結(jié)構(gòu)與功能解析_第5頁
已閱讀5頁,還剩27頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

基于計算生物學(xué)的環(huán)形RNA二級結(jié)構(gòu)與功能解析一、引言1.1研究背景RNA作為生物體內(nèi)重要的核酸分子,長期以來備受關(guān)注。傳統(tǒng)認知中,RNA主要以線性形式存在,承擔(dān)著遺傳信息傳遞和蛋白質(zhì)合成的關(guān)鍵任務(wù)。隨著科學(xué)研究的持續(xù)深入,尤其是測序技術(shù)與生物信息學(xué)的飛速發(fā)展,一類特殊的RNA分子——環(huán)形RNA(circRNA)逐漸進入人們的視野,引發(fā)了科學(xué)界的廣泛關(guān)注。環(huán)形RNA的發(fā)現(xiàn)可以追溯到20世紀70年代。1976年,Sanger等人在研究馬鈴薯紡錘體塊莖病類病毒時,首次發(fā)現(xiàn)了環(huán)狀RNA分子,當(dāng)時將其描述為“單鏈和共價的閉合的RNA分子”。然而,由于技術(shù)手段的限制,對circRNA的研究進展緩慢。直到1979年,Hsu和Coca-Prados使用電子顯微鏡在HeLa細胞中觀察到無自由側(cè)翼末端的circRNA分子,才首次證實真核細胞中存在circRNA。但在之后很長一段時間里,circRNA被認為是轉(zhuǎn)錄過程中的錯誤產(chǎn)物,未受到足夠重視。21世紀初,隨著高通量測序技術(shù)和生物信息學(xué)的興起,circRNA的研究迎來了重大突破。2012年,斯坦福大學(xué)和霍華德休斯醫(yī)學(xué)研究所的科學(xué)家們發(fā)表在《PlosOne》的研究首次證實在人體細胞的基因表達程序中,環(huán)形RNA分子是一個普遍特征。2013年,Nature雜志同期發(fā)表兩篇circRNA研究文章,揭示了circRNA的廣泛存在和潛在功能,自此circRNA相關(guān)研究呈爆發(fā)式增長,逐漸成為非編碼RNA領(lǐng)域的研究熱點。環(huán)形RNA具有獨特的結(jié)構(gòu)特點,其呈閉合環(huán)狀結(jié)構(gòu),沒有5'末端帽子和3'末端poly(A)尾巴,這種結(jié)構(gòu)使其不易被核酸外切酶降解,比線性RNA更加穩(wěn)定。circRNA由特殊可變剪切產(chǎn)生,大量存在于真核細胞的細胞質(zhì)中,主要來源于外顯子,少部分內(nèi)含子來源的circRNA存在于細胞核中。circRNA的表達水平具有種屬、組織、時間特異性,且具有一定序列保守性。根據(jù)其來源和形成機制,circRNA可分為多種類型,主要包括外顯子circRNA(ecircRNA)、內(nèi)含子circRNA(ciRNA)以及外顯子-內(nèi)含子circRNA(EIciRNA)。外顯子circRNA僅含外顯子,占總circRNA的80%以上,通過套索驅(qū)動的環(huán)化或直接反向剪接環(huán)化產(chǎn)生;內(nèi)含子circRNA由從套索衍生機制的分枝中逃脫的內(nèi)含子產(chǎn)生;外顯子-內(nèi)含子circRNA由外顯子跳躍環(huán)化產(chǎn)生,其功能相對復(fù)雜,可能同時涉及轉(zhuǎn)錄和轉(zhuǎn)錄后兩個層面的調(diào)控。大量研究表明,circRNA在生物體內(nèi)發(fā)揮著廣泛而重要的生物學(xué)功能。在基因表達調(diào)控方面,circRNA可與宿主DNA結(jié)合形成R-loop,影響DNA復(fù)制、轉(zhuǎn)錄和損傷后修復(fù);還能作為“海綿”吸附microRNA(miRNA)或蛋白,間接調(diào)控基因表達。例如,circHIPK3可與miR-124結(jié)合并抑制其活性,從而調(diào)控相關(guān)基因的表達。在細胞生理活動中,circRNA也扮演著重要角色,如EBV感染宿主后產(chǎn)生的circBART2.2,可被細胞RIG-I受體識別,激活下游干擾素信號通路,實現(xiàn)抗病毒作用。此外,部分circRNA還具有編碼蛋白質(zhì)的功能,拓展了其生物學(xué)功能的多樣性。circRNA的異常表達與多種疾病的發(fā)生發(fā)展密切相關(guān)。在癌癥領(lǐng)域,circRNA在腫瘤的發(fā)生、發(fā)展、轉(zhuǎn)移和耐藥等過程中發(fā)揮著關(guān)鍵作用,可作為潛在的癌癥診斷標志物和治療靶點。如在白血病中,circRNA在混合譜系白血病(MLL)重組基因組中富集,通過形成circR-loop促進致癌染色體易位,最終導(dǎo)致白血病的發(fā)生。在神經(jīng)系統(tǒng)疾病中,circRNA的表達變化也與神經(jīng)退行性疾病、精神疾病等的發(fā)病機制相關(guān)。對circRNA與疾病關(guān)系的深入研究,為疾病的診斷、治療和預(yù)后評估提供了新的思路和方法。盡管目前對circRNA的研究取得了一定進展,但仍有許多問題亟待解決。例如,circRNA的二級結(jié)構(gòu)特征及其與功能的關(guān)系尚不明確,circRNA在生物體內(nèi)的作用機制和調(diào)控網(wǎng)絡(luò)還需進一步深入探究。因此,本研究旨在運用計算生物學(xué)方法,深入剖析環(huán)形RNA的二級結(jié)構(gòu)特征及生物學(xué)功能,為揭示circRNA的奧秘提供新的見解和理論依據(jù)。1.2研究目的與意義本研究旨在通過計算生物學(xué)方法,深入剖析環(huán)形RNA的二級結(jié)構(gòu)特征,探索其與生物學(xué)功能之間的關(guān)聯(lián),為揭示circRNA的作用機制提供理論依據(jù),具體研究目的如下:解析環(huán)形RNA二級結(jié)構(gòu)特征:運用生物信息學(xué)工具和算法,對已有的circRNA序列數(shù)據(jù)進行分析,預(yù)測其二級結(jié)構(gòu),包括莖環(huán)結(jié)構(gòu)、發(fā)夾結(jié)構(gòu)等,明確不同類型circRNA二級結(jié)構(gòu)的特點和分布規(guī)律。探究二級結(jié)構(gòu)與生物學(xué)功能的關(guān)系:結(jié)合circRNA的功能注釋信息,分析其二級結(jié)構(gòu)與生物學(xué)功能(如基因表達調(diào)控、miRNA海綿作用、蛋白質(zhì)結(jié)合等)之間的內(nèi)在聯(lián)系,揭示二級結(jié)構(gòu)在circRNA功能發(fā)揮中的作用機制。構(gòu)建環(huán)形RNA二級結(jié)構(gòu)與功能數(shù)據(jù)庫:整合circRNA的序列、二級結(jié)構(gòu)、功能等信息,構(gòu)建綜合性數(shù)據(jù)庫,為后續(xù)研究提供數(shù)據(jù)支持和資源共享平臺,方便科研人員查詢和分析。circRNA作為一類具有獨特結(jié)構(gòu)和重要功能的非編碼RNA,對其二級結(jié)構(gòu)特征及生物學(xué)功能的研究具有重要的科學(xué)意義和潛在的應(yīng)用價值,具體體現(xiàn)在以下幾個方面:理論意義:深化對RNA結(jié)構(gòu)與功能多樣性的認識:傳統(tǒng)上,對RNA的研究主要集中在線性RNA上,對circRNA的研究相對較少。深入研究circRNA的二級結(jié)構(gòu)特征及生物學(xué)功能,有助于揭示RNA分子的結(jié)構(gòu)與功能多樣性,豐富我們對RNA世界的認識,完善RNA生物學(xué)理論體系。拓展對基因表達調(diào)控網(wǎng)絡(luò)的理解:circRNA在基因表達調(diào)控中發(fā)揮著重要作用,通過與miRNA、蛋白質(zhì)等相互作用,參與轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)控過程。研究circRNA的二級結(jié)構(gòu)與功能關(guān)系,能夠進一步闡明其在基因表達調(diào)控網(wǎng)絡(luò)中的作用機制,揭示基因表達調(diào)控的復(fù)雜性和精細性,為理解生命過程的調(diào)控機制提供新的視角。實際應(yīng)用價值:疾病診斷與治療:circRNA的異常表達與多種疾病的發(fā)生發(fā)展密切相關(guān),可作為潛在的疾病診斷標志物和治療靶點。了解circRNA的二級結(jié)構(gòu)特征及生物學(xué)功能,有助于篩選和鑒定與疾病相關(guān)的circRNA,開發(fā)基于circRNA的診斷方法和治療策略,為疾病的早期診斷、精準治療和預(yù)后評估提供新的手段和方法,具有重要的臨床應(yīng)用價值。藥物研發(fā):circRNA的獨特結(jié)構(gòu)和功能使其成為藥物研發(fā)的新靶點和新工具。基于circRNA的二級結(jié)構(gòu)特征,可以設(shè)計和開發(fā)新型的RNA藥物,如RNA干擾藥物、RNA適配體等,用于治療各種疾病。此外,circRNA還可以作為藥物載體,提高藥物的穩(wěn)定性和靶向性,為藥物研發(fā)提供新的思路和方法。生物技術(shù)應(yīng)用:在生物技術(shù)領(lǐng)域,circRNA的研究成果也具有廣泛的應(yīng)用前景。例如,利用circRNA的穩(wěn)定性和特殊結(jié)構(gòu),可以開發(fā)新型的生物傳感器、生物芯片等,用于生物分子的檢測和分析;在基因工程中,circRNA可以作為基因表達調(diào)控元件,實現(xiàn)對基因表達的精準調(diào)控,提高基因工程的效率和安全性。1.3國內(nèi)外研究現(xiàn)狀近年來,環(huán)形RNA憑借其獨特的結(jié)構(gòu)和重要的生物學(xué)功能,在國內(nèi)外掀起了研究熱潮,相關(guān)研究成果不斷涌現(xiàn)。在國外,科研人員對circRNA的研究起步較早,在基礎(chǔ)研究和應(yīng)用探索方面都取得了豐碩的成果。在結(jié)構(gòu)解析方面,運用先進的實驗技術(shù)和計算方法,深入剖析circRNA的二級結(jié)構(gòu)特征。如通過化學(xué)修飾和高通量測序相結(jié)合的方法,繪制circRNA的二級結(jié)構(gòu)圖譜,揭示其莖環(huán)、假結(jié)等結(jié)構(gòu)元件的分布規(guī)律。在功能機制研究上,大量研究表明circRNA在基因表達調(diào)控中發(fā)揮關(guān)鍵作用。例如,德國的研究團隊發(fā)現(xiàn)circRNA可通過與轉(zhuǎn)錄因子相互作用,影響基因的轉(zhuǎn)錄起始和延伸過程;美國的科學(xué)家則證實circRNA能夠作為miRNA海綿,吸附miRNA,解除其對靶基因的抑制作用,從而調(diào)控基因表達。在疾病關(guān)聯(lián)研究方面,國外研究人員發(fā)現(xiàn)circRNA的異常表達與多種疾病密切相關(guān)。如在癌癥研究中,發(fā)現(xiàn)某些circRNA在腫瘤組織中高表達,可促進腫瘤細胞的增殖、遷移和侵襲;在神經(jīng)系統(tǒng)疾病研究中,揭示了circRNA在神經(jīng)退行性疾病發(fā)病機制中的作用,為疾病的診斷和治療提供了新的靶點。國內(nèi)的科研團隊也在circRNA研究領(lǐng)域積極探索,取得了一系列具有國際影響力的成果。在分子特征研究方面,通過大規(guī)模測序和生物信息學(xué)分析,系統(tǒng)鑒定了多種物種和組織中的circRNA,深入分析其序列特征、表達模式和進化保守性。例如,浙江大學(xué)樊龍江教授團隊通過分析已發(fā)表的植物circRNA數(shù)據(jù),揭示了circRNA的來源、可變剪接現(xiàn)象、剪接信號特征以及潛在的miRNA-circRNA網(wǎng)絡(luò)等。在功能驗證方面,國內(nèi)學(xué)者運用基因編輯等技術(shù),對circRNA的生物學(xué)功能進行了深入驗證。中山大學(xué)孫逸仙紀念醫(yī)院蘇士成團隊確定了一種線粒體特異性circRNA——SCAR,在非酒精性脂肪性肝炎(NASH)中表達下調(diào),向線粒體特異性遞送SCAR,可降低線粒體活性氧(mROS)輸出,減輕炎癥,為NASH的治療提供了新的靶點。在應(yīng)用研究方面,國內(nèi)科研人員積極探索circRNA在疾病診斷、治療和藥物研發(fā)等方面的應(yīng)用潛力。如開發(fā)基于circRNA的生物標志物,用于疾病的早期診斷和預(yù)后評估;開展circRNA藥物的研發(fā),探索其在癌癥、神經(jīng)系統(tǒng)疾病等治療中的應(yīng)用前景。盡管目前對circRNA的研究取得了顯著進展,但仍存在一些不足之處。在二級結(jié)構(gòu)預(yù)測方面,現(xiàn)有的計算方法準確性和可靠性有待提高,不同算法預(yù)測結(jié)果存在差異,缺乏統(tǒng)一的標準和驗證方法。在功能機制研究方面,雖然已知circRNA參與多種生物學(xué)過程,但對于其具體的作用機制和調(diào)控網(wǎng)絡(luò)仍不完全清楚,尤其是circRNA與蛋白質(zhì)、DNA等生物大分子之間的相互作用機制,還需要進一步深入研究。在疾病應(yīng)用研究方面,雖然發(fā)現(xiàn)了許多與疾病相關(guān)的circRNA,但將其轉(zhuǎn)化為臨床應(yīng)用的生物標志物或治療靶點還面臨諸多挑戰(zhàn),如circRNA的穩(wěn)定性、遞送效率以及安全性等問題,需要進一步探索有效的解決方案。針對現(xiàn)有研究的不足,本研究擬運用計算生物學(xué)方法,整合多組學(xué)數(shù)據(jù),建立更準確的circRNA二級結(jié)構(gòu)預(yù)測模型,深入探究其二級結(jié)構(gòu)與生物學(xué)功能的關(guān)系;結(jié)合實驗驗證,揭示circRNA在基因表達調(diào)控和疾病發(fā)生發(fā)展中的作用機制,為circRNA的研究和應(yīng)用提供新的理論依據(jù)和技術(shù)支持。二、環(huán)形RNA概述2.1環(huán)形RNA的發(fā)現(xiàn)與發(fā)展環(huán)形RNA的研究歷程充滿了曲折與突破,其從最初被偶然發(fā)現(xiàn),到逐漸被科學(xué)界所認知,每一個階段都伴隨著技術(shù)的進步與科研人員的不懈探索。1976年,Sanger等人在研究馬鈴薯紡錘體塊莖病類病毒時,首次發(fā)現(xiàn)了環(huán)狀RNA分子,當(dāng)時將其描述為“單鏈和共價的閉合的RNA分子”。這一發(fā)現(xiàn)為RNA領(lǐng)域開啟了新的大門,然而,由于當(dāng)時技術(shù)手段的限制,對circRNA的研究難以深入開展,其在很長一段時間內(nèi)處于研究的邊緣地帶。1979年,Hsu和Coca-Prados使用電子顯微鏡在HeLa細胞中觀察到無自由側(cè)翼末端的circRNA分子,首次證實真核細胞中存在circRNA。但在后續(xù)的研究中,circRNA一直被視為轉(zhuǎn)錄過程中的錯誤產(chǎn)物,未受到足夠的重視。21世紀初,隨著高通量測序技術(shù)和生物信息學(xué)的興起,circRNA的研究迎來了重大轉(zhuǎn)機。2012年,斯坦福大學(xué)和霍華德休斯醫(yī)學(xué)研究所的科學(xué)家們發(fā)表在《PlosOne》的研究首次證實在人體細胞的基因表達程序中,環(huán)形RNA分子是一個普遍特征。這一研究成果打破了人們對RNA的傳統(tǒng)認知,使得circRNA開始進入科學(xué)家們的視野中心。2013年,Nature雜志同期發(fā)表兩篇circRNA研究文章,進一步揭示了circRNA的廣泛存在和潛在功能,自此circRNA相關(guān)研究呈爆發(fā)式增長,逐漸成為非編碼RNA領(lǐng)域的研究熱點。隨著研究的深入,科研人員對circRNA的結(jié)構(gòu)、功能和作用機制有了更深入的認識。在結(jié)構(gòu)方面,通過化學(xué)修飾和高通量測序相結(jié)合的方法,繪制circRNA的二級結(jié)構(gòu)圖譜,揭示其莖環(huán)、假結(jié)等結(jié)構(gòu)元件的分布規(guī)律。在功能機制研究上,大量研究表明circRNA在基因表達調(diào)控中發(fā)揮關(guān)鍵作用。例如,circRNA可通過與轉(zhuǎn)錄因子相互作用,影響基因的轉(zhuǎn)錄起始和延伸過程;還能夠作為miRNA海綿,吸附miRNA,解除其對靶基因的抑制作用,從而調(diào)控基因表達。在疾病關(guān)聯(lián)研究方面,發(fā)現(xiàn)circRNA的異常表達與多種疾病密切相關(guān),為疾病的診斷和治療提供了新的靶點?;仡櫗h(huán)形RNA的發(fā)現(xiàn)與發(fā)展歷程,從最初的偶然發(fā)現(xiàn)到如今成為科研熱點,每一個階段都離不開技術(shù)的創(chuàng)新和科研人員的努力。未來,隨著研究的不斷深入,相信circRNA將在生命科學(xué)和醫(yī)學(xué)領(lǐng)域展現(xiàn)出更加廣闊的應(yīng)用前景。2.2環(huán)形RNA的結(jié)構(gòu)特點2.2.1一級結(jié)構(gòu)環(huán)形RNA的一級結(jié)構(gòu)即為其核苷酸序列,由腺嘌呤(A)、鳥嘌呤(G)、胞嘧啶(C)和尿嘧啶(U)四種核苷酸通過3',5'-磷酸二酯鍵連接而成。circRNA的序列長度差異較大,短則幾十到幾百個核苷酸,長則可達數(shù)千個核苷酸。其序列來源廣泛,主要來源于基因的外顯子區(qū)域,也有部分來源于內(nèi)含子、基因間區(qū)或非轉(zhuǎn)錄區(qū)。外顯子來源的circRNA保留了原始基因的編碼信息,部分circRNA甚至可通過非帽依賴的翻譯機制編碼蛋白質(zhì)。例如,2017年王澤峰團隊首次發(fā)現(xiàn)大量的circRNA富含m6A修飾,可以像IRES一樣驅(qū)動circRNA翻譯,拓展了circRNA在蛋白質(zhì)編碼領(lǐng)域的研究。circRNA的序列特征還表現(xiàn)出一定的保守性,不同物種間部分circRNA的序列具有相似性。有研究發(fā)現(xiàn)小鼠和人類中的直系同源基因,依然有5-30%相似的保守環(huán)狀RNA。這種保守性暗示了circRNA在進化過程中可能具有重要的生物學(xué)功能,對維持生物的基本生命活動或適應(yīng)環(huán)境變化起到關(guān)鍵作用。此外,circRNA的表達具有組織特異性和發(fā)育階段特異性。在不同的組織和細胞類型中,circRNA的表達譜存在顯著差異。例如,在心臟、肝臟、大腦等組織中,circRNA的表達水平和種類各不相同。在個體發(fā)育過程中,circRNA的表達也會發(fā)生動態(tài)變化,從胚胎發(fā)育到成年階段,circRNA的表達譜會隨著細胞的分化和功能特化而改變。這種特異性表達表明circRNA在不同組織和發(fā)育階段可能參與了特定的生物學(xué)過程,對細胞的功能維持和分化調(diào)控發(fā)揮著重要作用。2.2.2獨特的二級結(jié)構(gòu)環(huán)形RNA獨特的二級結(jié)構(gòu)使其區(qū)別于其他RNA,在生命活動中發(fā)揮著特殊作用。circRNA主要通過反向剪接形成閉合環(huán)狀結(jié)構(gòu),這種結(jié)構(gòu)賦予其較高的穩(wěn)定性,使其不易被核酸外切酶降解。circRNA的二級結(jié)構(gòu)中,莖環(huán)結(jié)構(gòu)是常見的特征之一。莖環(huán)結(jié)構(gòu)由一段雙鏈RNA區(qū)域(莖)和一段單鏈RNA環(huán)組成,通過堿基互補配對形成。研究表明,circRNA中的莖環(huán)結(jié)構(gòu)在其功能發(fā)揮中起著重要作用,例如作為miRNA或蛋白質(zhì)的結(jié)合位點,參與基因表達調(diào)控。如circHIPK3含有多個miRNA結(jié)合位點,通過莖環(huán)結(jié)構(gòu)與miR-124等miRNA結(jié)合,充當(dāng)miRNA海綿,解除miRNA對靶基因的抑制作用,從而調(diào)控基因表達。除了莖環(huán)結(jié)構(gòu),circRNA還可能形成假結(jié)結(jié)構(gòu)。假結(jié)結(jié)構(gòu)是一種更為復(fù)雜的二級結(jié)構(gòu),由RNA鏈自身折疊形成多個莖環(huán)結(jié)構(gòu)相互嵌套而成。假結(jié)結(jié)構(gòu)的形成增加了circRNA二級結(jié)構(gòu)的復(fù)雜性和穩(wěn)定性,同時也為其與其他生物分子的相互作用提供了更多的可能性。假結(jié)結(jié)構(gòu)可能影響circRNA的翻譯起始、與蛋白質(zhì)的結(jié)合能力等,進而調(diào)控其生物學(xué)功能。雖然目前對circRNA假結(jié)結(jié)構(gòu)的研究相對較少,但隨著研究的深入,假結(jié)結(jié)構(gòu)在circRNA功能中的重要性將逐漸被揭示。此外,circRNA的二級結(jié)構(gòu)還受到多種因素的影響,如核苷酸序列、離子濃度、溫度等。不同的circRNA由于其核苷酸序列的差異,會形成不同的二級結(jié)構(gòu);離子濃度和溫度的變化也會影響RNA分子內(nèi)堿基之間的相互作用,從而改變circRNA的二級結(jié)構(gòu)。深入研究這些影響因素,有助于更好地理解circRNA二級結(jié)構(gòu)的形成機制及其與功能的關(guān)系。2.3環(huán)形RNA的分類與生成機制2.3.1分類根據(jù)其來源和形成機制,環(huán)形RNA可分為多種類型,主要包括外顯子環(huán)形RNA(ecircRNA)、內(nèi)含子環(huán)形RNA(ciRNA)以及外顯子-內(nèi)含子環(huán)形RNA(EIciRNA)。外顯子環(huán)形RNA僅由外顯子序列環(huán)化形成,是最為常見的一類circRNA,占總circRNA的80%以上。其形成過程主要通過套索驅(qū)動的環(huán)化或直接反向剪接環(huán)化。在套索驅(qū)動的環(huán)化過程中,外顯子跳過一個功能性的轉(zhuǎn)錄本,并形成一個由跳過外顯子和內(nèi)含子組成的套索中間物,這個套索可以進行二次裂解以釋放外顯子,進而形成ecircRNA。直接反向剪接環(huán)化則是下游的3'剪接位點與上游的5'剪接位點直接相連,形成共價連接的閉環(huán)。外顯子環(huán)形RNA保留了原始基因的編碼信息,部分ecircRNA甚至可通過非帽依賴的翻譯機制編碼蛋白質(zhì)。內(nèi)含子環(huán)形RNA由內(nèi)含子序列環(huán)化產(chǎn)生,其形成機制與外顯子環(huán)形RNA有所不同。內(nèi)含子環(huán)形RNA主要由從套索衍生機制的分枝中逃脫的內(nèi)含子產(chǎn)生,這些內(nèi)含子在環(huán)化過程中通常需要特定的順式作用元件和反式作用因子的參與。ciRNA主要存在于細胞核中,在轉(zhuǎn)錄后調(diào)控過程中發(fā)揮重要作用,如通過與RNA聚合酶II相互作用,影響基因的轉(zhuǎn)錄效率。外顯子-內(nèi)含子環(huán)形RNA由外顯子和內(nèi)含子序列共同環(huán)化形成,其功能相對復(fù)雜,可能同時涉及轉(zhuǎn)錄和轉(zhuǎn)錄后兩個層面的調(diào)控。EIciRNA的形成通常需要外顯子跳躍環(huán)化,即部分外顯子跳過正常的剪接位點,與上下游的內(nèi)含子或外顯子進行反向剪接,形成包含外顯子和內(nèi)含子的環(huán)形結(jié)構(gòu)。在轉(zhuǎn)錄調(diào)控方面,EIciRNA可與U1snRNP結(jié)合形成復(fù)合物,通過與啟動子區(qū)域的相互作用,促進基因的轉(zhuǎn)錄;在轉(zhuǎn)錄后調(diào)控中,EIciRNA可能通過與miRNA或蛋白質(zhì)相互作用,影響mRNA的穩(wěn)定性和翻譯效率。此外,還有一些特殊類型的環(huán)形RNA,如基因間環(huán)形RNA,由基因間區(qū)域的序列環(huán)化形成,其功能和形成機制尚不完全清楚,有待進一步深入研究。不同類型的環(huán)形RNA在細胞中發(fā)揮著各自獨特的作用,共同構(gòu)成了circRNA復(fù)雜而多樣的生物學(xué)功能網(wǎng)絡(luò)。2.3.2生成機制環(huán)形RNA的生成主要通過反向剪接機制,這一過程涉及多個順式作用元件和反式作用因子的參與,與傳統(tǒng)的線性RNA剪接過程既相互關(guān)聯(lián)又有所區(qū)別。反向剪接是環(huán)形RNA形成的核心步驟,其過程中,下游的3'剪接位點與上游的5'剪接位點發(fā)生異常連接,從而使外顯子或內(nèi)含子形成閉合的環(huán)狀結(jié)構(gòu)。與傳統(tǒng)的線性RNA剪接中上下游相鄰?fù)怙@子依次連接不同,反向剪接打破了常規(guī)的剪接順序,使得RNA鏈發(fā)生反向連接。Jeck在2013年提出了兩種RNA的回接形成模型:套索驅(qū)動的環(huán)化模型和內(nèi)含子配對驅(qū)動模型。在套索驅(qū)動的環(huán)化模型中,當(dāng)5‘剪接點和分支點附近富集GU的7nt堿基序列和富含C的11nt堿基的序列時,可以誘導(dǎo)內(nèi)含子形成長鏈結(jié)構(gòu)避免被分支酶降解,外顯子跳過一個功能性的轉(zhuǎn)錄本,并形成一個由跳過外顯子和內(nèi)含子組成的套索中間物,這個套索可以進行二次裂解以釋放外顯子,進而形成環(huán)形RNA。在內(nèi)含子配對驅(qū)動的環(huán)化模型中,長側(cè)內(nèi)含子中的直接堿基配對,如ALU重復(fù)元素,可以在前mRNA中形成二級結(jié)構(gòu),這對下游剪接供體的后續(xù)連接至關(guān)重要。順式作用元件在環(huán)形RNA的生成中起著重要的調(diào)控作用。內(nèi)含子中的反向互補序列是常見的順式作用元件之一,如人類和小鼠基因組中廣泛存在的ALU重復(fù)序列。這些反向互補序列可以通過堿基配對形成雙鏈結(jié)構(gòu),拉近上下游剪接位點的空間距離,促進反向剪接的發(fā)生。外顯子兩側(cè)的特定序列也可能影響環(huán)形RNA的生成,某些外顯子具有較高的環(huán)化傾向,其兩側(cè)的序列特征可能為反向剪接提供了有利條件。反式作用因子同樣參與了環(huán)形RNA生成的調(diào)控過程。RNA結(jié)合蛋白(RBPs)是一類重要的反式作用因子,它們可以識別并結(jié)合在前mRNA上,對下游剪接供體和上游剪接接受體之間的連接發(fā)揮關(guān)鍵作用。例如,Quaking(QKI)蛋白可以結(jié)合在特定的RNA序列上,促進環(huán)形RNA的形成;肌肉失明蛋白(MBNL)則通過與側(cè)翼內(nèi)含子結(jié)合,影響環(huán)形RNA的反向剪接。一些轉(zhuǎn)錄因子也可能通過調(diào)節(jié)基因轉(zhuǎn)錄的速率和剪接體的組裝,間接影響環(huán)形RNA的生成。環(huán)形RNA的生成與線性RNA剪接之間存在著復(fù)雜的競爭關(guān)系。在同一基因座上,既可以產(chǎn)生線性RNA,也可以產(chǎn)生環(huán)形RNA,二者的比例受到多種因素的調(diào)控。順式作用元件和反式作用因子的相對豐度和活性變化,會影響剪接方式的選擇,從而決定線性RNA和環(huán)形RNA的生成比例。細胞的生理狀態(tài)、發(fā)育階段以及外界環(huán)境刺激等因素,也可能通過調(diào)節(jié)相關(guān)基因的表達和剪接因子的活性,影響環(huán)形RNA和線性RNA的生成平衡。三、計算生物學(xué)在環(huán)形RNA研究中的應(yīng)用3.1計算生物學(xué)方法簡介計算生物學(xué)作為一門交叉學(xué)科,融合了數(shù)學(xué)、統(tǒng)計學(xué)、計算機科學(xué)等多學(xué)科的理論與方法,旨在解決生物學(xué)領(lǐng)域的各種復(fù)雜問題。在環(huán)形RNA研究中,計算生物學(xué)方法發(fā)揮著至關(guān)重要的作用,為深入探索circRNA的結(jié)構(gòu)與功能提供了有力的工具和手段。生物信息學(xué)分析是計算生物學(xué)的核心組成部分之一,在circRNA研究中應(yīng)用廣泛。通過對高通量測序數(shù)據(jù)的分析,可以大規(guī)模地識別和鑒定circRNA。利用序列比對算法,將測序得到的短讀段(reads)與參考基因組進行比對,尋找反向剪接位點,從而確定circRNA的存在及其邊界。常用的比對工具如STAR、HISAT2等,能夠高效地處理大規(guī)模的測序數(shù)據(jù),準確識別circRNA。通過生物信息學(xué)分析,還可以對circRNA的序列特征進行深入挖掘,包括核苷酸組成、保守性分析、開放閱讀框(ORF)預(yù)測等。核苷酸組成分析可以揭示circRNA序列中不同堿基的分布規(guī)律,為后續(xù)的結(jié)構(gòu)和功能研究提供基礎(chǔ);保守性分析則有助于發(fā)現(xiàn)具有重要生物學(xué)功能的circRNA,因為保守性較高的circRNA往往在進化過程中承擔(dān)著關(guān)鍵作用。對circRNA中ORF的預(yù)測,可以初步判斷其是否具有編碼蛋白質(zhì)的潛力,拓展了對circRNA功能的認識。機器學(xué)習(xí)作為人工智能領(lǐng)域的重要分支,在計算生物學(xué)中也展現(xiàn)出強大的優(yōu)勢,為circRNA研究帶來了新的思路和方法。機器學(xué)習(xí)算法可以從大量的生物數(shù)據(jù)中自動學(xué)習(xí)模式和規(guī)律,用于預(yù)測circRNA的結(jié)構(gòu)和功能。在circRNA二級結(jié)構(gòu)預(yù)測方面,深度學(xué)習(xí)算法取得了顯著進展。例如,基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的模型,能夠有效地學(xué)習(xí)RNA序列中的特征,準確預(yù)測circRNA的二級結(jié)構(gòu)。這些模型通過對大量已知結(jié)構(gòu)的RNA序列進行訓(xùn)練,學(xué)習(xí)到序列與結(jié)構(gòu)之間的復(fù)雜關(guān)系,從而對未知結(jié)構(gòu)的circRNA進行準確預(yù)測。機器學(xué)習(xí)還可以用于circRNA的功能預(yù)測。通過構(gòu)建機器學(xué)習(xí)模型,整合circRNA的序列特征、表達模式、與其他生物分子的相互作用信息等多維度數(shù)據(jù),預(yù)測circRNA在基因表達調(diào)控、細胞生理過程等方面的功能。支持向量機(SVM)、隨機森林等算法在circRNA功能預(yù)測中得到了廣泛應(yīng)用,為揭示circRNA的生物學(xué)功能提供了有力的支持。除了生物信息學(xué)分析和機器學(xué)習(xí),其他計算生物學(xué)方法也在circRNA研究中發(fā)揮著重要作用。分子動力學(xué)模擬可以從原子層面研究circRNA的結(jié)構(gòu)動態(tài)變化,揭示其與其他生物分子相互作用的機制。通過模擬circRNA在不同環(huán)境條件下的結(jié)構(gòu)變化,以及與蛋白質(zhì)、DNA等分子的結(jié)合過程,可以深入了解circRNA的功能實現(xiàn)方式。網(wǎng)絡(luò)分析方法則可以用于構(gòu)建circRNA與其他生物分子之間的相互作用網(wǎng)絡(luò),如circRNA-miRNA-mRNA調(diào)控網(wǎng)絡(luò)、circRNA-蛋白質(zhì)相互作用網(wǎng)絡(luò)等。通過對這些網(wǎng)絡(luò)的拓撲結(jié)構(gòu)分析、功能模塊挖掘等,可以揭示circRNA在復(fù)雜生物調(diào)控網(wǎng)絡(luò)中的作用和地位。三、計算生物學(xué)在環(huán)形RNA研究中的應(yīng)用3.2環(huán)形RNA數(shù)據(jù)獲取與處理3.2.1數(shù)據(jù)來源本研究主要通過高通量測序技術(shù)獲取環(huán)形RNA數(shù)據(jù)。高通量測序技術(shù),也被稱為下一代測序技術(shù)(NGS),能夠在短時間內(nèi)對大量的核酸分子進行測序,具有高通量、低成本、高準確性等優(yōu)勢,為大規(guī)模研究環(huán)形RNA提供了可能。在實驗過程中,選取多種組織樣本,包括人體的心臟、肝臟、大腦等重要器官組織,以及不同發(fā)育階段的胚胎組織等,以確保獲取的環(huán)形RNA數(shù)據(jù)具有廣泛的代表性。對這些組織樣本進行RNA提取,采用高質(zhì)量的RNA提取試劑盒,嚴格按照操作步驟進行,以保證提取的RNA純度和完整性。提取得到的總RNA需要進行質(zhì)量檢測,使用NanoDrop分光光度計測定RNA的濃度和純度,確保A260/A280比值在1.8-2.0之間;通過瓊脂糖凝膠電泳檢測RNA的完整性,觀察28S和18SrRNA條帶的亮度和清晰度,以判斷RNA是否降解。為了富集環(huán)形RNA,采用去除核糖體RNA(rRNA)和Poly-A尾RNA的方法。利用RiboMinus?Human/MouseTranscriptomeIsolationKit等試劑盒去除rRNA,再通過磁珠法結(jié)合Poly(A)的RNA后,剩余的RNA即為Poly(A)-RNA樣品,其中環(huán)形RNA得到了有效富集。對富集后的RNA樣品進行RNaseR消化處理,RNaseR是一種能夠降解線性RNA的核酸外切酶,但對環(huán)形RNA具有抗性。將RNA樣品一分為二,一份進行RNaseR消化,另一份作為對照,消化條件為加入3μL10×RNaseRReactionBuffer和1μLRNaseR(20U/μl),在37°C孵育1-2h。消化結(jié)束后,加入酚-氯仿-異戊醇終止反應(yīng),通過離心分層,棄去上清,沉淀用4M氯化鋰、糖原和預(yù)冷無水乙醇進行重懸,在?80°C沉淀1h,然后離心,用75%預(yù)冷乙醇洗滌兩次,風(fēng)干后用DEPC水溶解,得到的RNA樣品中環(huán)形RNA的比例進一步提高。將處理后的RNA樣品用于RNA-seq文庫構(gòu)建,使用Illumina等公司的文庫構(gòu)建試劑盒,按照標準流程進行操作,包括RNA片段化、反轉(zhuǎn)錄、接頭連接、PCR擴增等步驟。構(gòu)建好的文庫經(jīng)過質(zhì)量檢測,使用Agilent2100Bioanalyzer測定文庫的片段大小分布,利用qPCR測定文庫的濃度,確保文庫質(zhì)量符合測序要求。將合格的文庫在IlluminaHiSeq、NovaSeq等高通量測序平臺上進行測序,獲得大量的測序讀段(reads),這些reads是后續(xù)分析環(huán)形RNA的基礎(chǔ)數(shù)據(jù)。除了自行測序獲得的數(shù)據(jù)外,還從公共數(shù)據(jù)庫中獲取相關(guān)的環(huán)形RNA數(shù)據(jù),以擴充數(shù)據(jù)集。常用的公共數(shù)據(jù)庫如circBase,收錄了包括人類、小鼠、黑腹果蠅、秀麗隱桿線蟲等多個物種的環(huán)狀RNA數(shù)據(jù),為研究提供了豐富的資源。從circBase數(shù)據(jù)庫中,可以獲取環(huán)形RNA的序列信息、基因組坐標、表達譜等數(shù)據(jù),通過與自行測序數(shù)據(jù)進行整合分析,能夠更全面地研究環(huán)形RNA的特征和功能。3.2.2數(shù)據(jù)預(yù)處理對高通量測序得到的原始數(shù)據(jù)進行預(yù)處理是數(shù)據(jù)分析的關(guān)鍵步驟,旨在去除低質(zhì)量數(shù)據(jù)和噪聲,提高數(shù)據(jù)的質(zhì)量和可用性,為后續(xù)的分析提供可靠的基礎(chǔ)。首先進行測序讀段的質(zhì)量控制。使用FastQC等工具對原始測序數(shù)據(jù)進行質(zhì)量評估,F(xiàn)astQC能夠生成詳細的質(zhì)量報告,展示每個讀段的堿基質(zhì)量分布、GC含量、序列重復(fù)率等信息。通過分析質(zhì)量報告,確定低質(zhì)量區(qū)域和可能存在的污染序列。對于堿基質(zhì)量較低的區(qū)域,采用Trimmomatic等軟件進行修剪,設(shè)定質(zhì)量閾值,如Q值低于20的堿基將被切除;對于接頭序列污染,使用軟件自動識別并去除接頭序列。通過質(zhì)量控制,去除低質(zhì)量的讀段和堿基,提高數(shù)據(jù)的整體質(zhì)量。在數(shù)據(jù)過濾階段,去除可能的污染數(shù)據(jù)。由于實驗過程中可能引入外源DNA或RNA污染,需要對數(shù)據(jù)進行嚴格過濾。將測序讀段與常見的污染序列數(shù)據(jù)庫進行比對,如PhiX噬菌體基因組序列、人類線粒體基因組序列等,去除與污染序列匹配的讀段。通過比對統(tǒng)計,評估污染程度,確保數(shù)據(jù)的純凈性。數(shù)據(jù)去重也是預(yù)處理的重要環(huán)節(jié)。測序過程中可能會產(chǎn)生大量重復(fù)的讀段,這些重復(fù)讀段可能是由于PCR擴增偏好性或測序誤差導(dǎo)致的,會影響后續(xù)分析結(jié)果的準確性。使用Picard工具中的MarkDuplicates模塊進行數(shù)據(jù)去重,該模塊通過識別具有相同起始位置和序列的讀段,將其標記為重復(fù)讀段并去除,保留唯一的讀段,從而減少數(shù)據(jù)量,提高分析效率。經(jīng)過質(zhì)量控制、過濾和去重等預(yù)處理步驟后,得到的高質(zhì)量測序數(shù)據(jù)為環(huán)形RNA的鑒定和分析奠定了堅實的基礎(chǔ)。這些經(jīng)過預(yù)處理的數(shù)據(jù)將用于后續(xù)的生物信息學(xué)分析,如環(huán)形RNA的識別、結(jié)構(gòu)預(yù)測和功能注釋等,確保分析結(jié)果的可靠性和準確性。3.3計算方法在環(huán)形RNA二級結(jié)構(gòu)預(yù)測中的應(yīng)用3.3.1常用預(yù)測算法動態(tài)規(guī)劃算法是預(yù)測環(huán)形RNA二級結(jié)構(gòu)的經(jīng)典方法之一,其中最具代表性的是Zuker算法。該算法基于最小自由能原理,假設(shè)RNA分子會折疊成自由能最低的二級結(jié)構(gòu)。在計算過程中,將RNA序列劃分為多個子序列,通過遞歸計算每個子序列的最小自由能,逐步構(gòu)建出整個RNA分子的二級結(jié)構(gòu)。對于一個長度為n的RNA序列,Zuker算法通過定義一個二維數(shù)組M[i][j]來表示從第i個核苷酸到第j個核苷酸的子序列的最小自由能。在計算M[i][j]時,考慮所有可能的堿基配對情況,包括莖環(huán)結(jié)構(gòu)、內(nèi)部環(huán)、多分支環(huán)等,并根據(jù)已知的熱力學(xué)參數(shù)計算每種配對方式的自由能變化。通過比較不同配對方式的自由能,選擇自由能最小的配對方式,從而確定M[i][j]的值。最終,通過回溯算法,從M[1][n]的值反向推導(dǎo)出整個RNA分子的二級結(jié)構(gòu)。Zuker算法在預(yù)測不包含假結(jié)的RNA二級結(jié)構(gòu)時具有較高的準確性和效率,被廣泛應(yīng)用于各種RNA二級結(jié)構(gòu)預(yù)測軟件中,如Mfold、RNAfold等。隨著機器學(xué)習(xí)技術(shù)的發(fā)展,基于機器學(xué)習(xí)的算法在環(huán)形RNA二級結(jié)構(gòu)預(yù)測中展現(xiàn)出獨特的優(yōu)勢。這些算法通過對大量已知二級結(jié)構(gòu)的RNA序列進行學(xué)習(xí),建立起序列特征與二級結(jié)構(gòu)之間的關(guān)系模型,從而對未知結(jié)構(gòu)的環(huán)形RNA進行預(yù)測。支持向量機(SVM)是一種常用的機器學(xué)習(xí)算法,在RNA二級結(jié)構(gòu)預(yù)測中,SVM通過將RNA序列轉(zhuǎn)化為特征向量,利用核函數(shù)將低維特征空間映射到高維空間,尋找一個最優(yōu)的分類超平面,將形成堿基對的核苷酸對與未形成堿基對的核苷酸對區(qū)分開來。為了將RNA序列轉(zhuǎn)化為適合SVM輸入的特征向量,需要提取多種序列特征,如核苷酸組成、堿基對概率、二級結(jié)構(gòu)元件的分布等。通過對這些特征的組合和優(yōu)化,提高SVM模型的預(yù)測性能。深度學(xué)習(xí)算法在RNA二級結(jié)構(gòu)預(yù)測中也取得了顯著進展?;诰矸e神經(jīng)網(wǎng)絡(luò)(CNN)和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的模型能夠自動學(xué)習(xí)RNA序列中的復(fù)雜特征,捕捉核苷酸之間的長程相互作用,從而更準確地預(yù)測環(huán)形RNA的二級結(jié)構(gòu)。以基于CNN的模型為例,其通過卷積層對RNA序列進行特征提取,卷積核在序列上滑動,提取不同位置的局部特征;池化層則用于對特征進行降維,減少計算量并保留關(guān)鍵特征;全連接層將提取到的特征進行整合,輸出預(yù)測的二級結(jié)構(gòu)。在訓(xùn)練過程中,通過大量的已知結(jié)構(gòu)的RNA序列數(shù)據(jù)對模型進行訓(xùn)練,不斷調(diào)整模型的參數(shù),使其能夠準確地學(xué)習(xí)到序列與結(jié)構(gòu)之間的關(guān)系。除了上述算法外,還有一些其他方法也被應(yīng)用于環(huán)形RNA二級結(jié)構(gòu)預(yù)測。隨機上下文無關(guān)語法(SCFG)算法將RNA二級結(jié)構(gòu)的形成過程看作是一個概率生成過程,通過構(gòu)建語法規(guī)則和概率模型,對RNA二級結(jié)構(gòu)進行預(yù)測。SCFG算法考慮了RNA二級結(jié)構(gòu)中不同結(jié)構(gòu)元件的出現(xiàn)概率和相互關(guān)系,能夠?qū)Π俳Y(jié)等復(fù)雜結(jié)構(gòu)的RNA進行預(yù)測。但該算法計算復(fù)雜度較高,在處理長序列時存在一定的局限性。一些混合算法將不同的預(yù)測方法相結(jié)合,取長補短,以提高預(yù)測的準確性和可靠性。例如,將熱力學(xué)模型與機器學(xué)習(xí)算法相結(jié)合,利用熱力學(xué)模型提供的先驗知識,輔助機器學(xué)習(xí)模型進行預(yù)測,從而減少模型的過擬合風(fēng)險,提高預(yù)測性能。3.3.2預(yù)測準確性評估預(yù)測環(huán)形RNA二級結(jié)構(gòu)的準確性評估是衡量預(yù)測算法性能的關(guān)鍵環(huán)節(jié),對于判斷預(yù)測結(jié)果的可靠性、比較不同算法的優(yōu)劣以及改進預(yù)測方法具有重要意義。目前,常用的評估指標和方法主要包括以下幾個方面。敏感度(Sensitivity,Sn)和特異性(Specificity,Sp)是評估預(yù)測準確性的重要指標。敏感度表示預(yù)測正確的堿基對在真實堿基對中所占的比例,反映了預(yù)測算法對真實結(jié)構(gòu)中堿基對的識別能力。其計算公式為:Sn=TP/(TP+FN),其中TP(TruePositive)表示預(yù)測正確的堿基對數(shù)量,F(xiàn)N(FalseNegative)表示實際存在但未被預(yù)測到的堿基對數(shù)量。特異性則表示預(yù)測正確的非堿基對在真實非堿基對中所占的比例,衡量了預(yù)測算法對非堿基對的正確判斷能力。其計算公式為:Sp=TN/(TN+FP),其中TN(TrueNegative)表示預(yù)測正確的非堿基對數(shù)量,F(xiàn)P(FalsePositive)表示實際不存在但被錯誤預(yù)測為堿基對的數(shù)量。一般來說,敏感度和特異性越高,說明預(yù)測算法的性能越好。理想情況下,Sn和Sp都應(yīng)接近1,但在實際預(yù)測中,這兩個指標往往需要在一定程度上進行平衡。馬修斯相關(guān)系數(shù)(MatthewsCorrelationCoefficient,MCC)綜合考慮了預(yù)測結(jié)果中的真陽性、真陰性、假陽性和假陰性,能夠更全面地評估預(yù)測算法的性能。MCC的取值范圍為[-1,1],值越接近1,表示預(yù)測結(jié)果與真實結(jié)果的一致性越好;值為0時,表示預(yù)測結(jié)果與隨機猜測相當(dāng);值為-1時,表示預(yù)測結(jié)果與真實結(jié)果完全相反。其計算公式為:MCC=(TP×TN-FP×FN)/√[(TP+FP)(TP+FN)(TN+FP)(TN+FN)]。MCC在評估預(yù)測準確性方面具有較高的可靠性,尤其適用于樣本不均衡的情況。在環(huán)形RNA二級結(jié)構(gòu)預(yù)測中,由于堿基對和非堿基對的數(shù)量可能存在較大差異,MCC能夠更準確地反映預(yù)測算法的性能。除了上述指標外,還可以通過與已知的實驗結(jié)構(gòu)進行比較來評估預(yù)測準確性。將預(yù)測得到的環(huán)形RNA二級結(jié)構(gòu)與通過實驗手段(如X射線晶體學(xué)、核磁共振等)測定的真實結(jié)構(gòu)進行比對,計算兩者之間的相似度。常用的相似度指標包括均方根偏差(RootMeanSquareDeviation,RMSD)、結(jié)構(gòu)相似性指數(shù)(StructuralSimilarityIndex,SSI)等。RMSD用于衡量預(yù)測結(jié)構(gòu)與真實結(jié)構(gòu)中對應(yīng)原子位置的偏差程度,RMSD值越小,表示預(yù)測結(jié)構(gòu)與真實結(jié)構(gòu)越接近。SSI則從整體結(jié)構(gòu)的角度評估兩個結(jié)構(gòu)的相似性,考慮了結(jié)構(gòu)的拓撲特征和堿基對的分布情況。通過與實驗結(jié)構(gòu)的比較,可以直觀地了解預(yù)測算法的準確性,發(fā)現(xiàn)預(yù)測結(jié)果中存在的問題,為改進算法提供依據(jù)。但需要注意的是,實驗測定的RNA結(jié)構(gòu)也可能存在一定的誤差和不確定性,在評估時需要綜合考慮這些因素。四、環(huán)形RNA的二級結(jié)構(gòu)特征分析4.1莖環(huán)結(jié)構(gòu)分析4.1.1莖環(huán)結(jié)構(gòu)的形成與特點莖環(huán)結(jié)構(gòu)是環(huán)形RNA二級結(jié)構(gòu)的重要組成部分,對其功能的發(fā)揮起著關(guān)鍵作用。莖環(huán)結(jié)構(gòu)的形成是RNA分子折疊過程中的一個重要事件,涉及到核苷酸序列的相互作用和熱力學(xué)因素。在環(huán)形RNA中,莖環(huán)結(jié)構(gòu)的形成主要依賴于堿基互補配對原則。當(dāng)RNA序列中存在反向互補的區(qū)域時,這些區(qū)域會通過堿基配對形成雙鏈結(jié)構(gòu),即莖部;而在雙鏈結(jié)構(gòu)的兩端,未配對的核苷酸則形成單鏈的環(huán)狀結(jié)構(gòu),即環(huán)部。這種莖環(huán)結(jié)構(gòu)的形成使得RNA分子能夠折疊成特定的三維構(gòu)象,增加了分子的穩(wěn)定性。莖環(huán)結(jié)構(gòu)的特點使其在環(huán)形RNA中具有獨特的生物學(xué)功能。莖部的雙鏈結(jié)構(gòu)具有較高的穩(wěn)定性,能夠抵抗核酸酶的降解作用,從而保護RNA分子的完整性。環(huán)部的單鏈結(jié)構(gòu)則具有較高的靈活性,能夠與其他生物分子發(fā)生相互作用,如與蛋白質(zhì)、miRNA等結(jié)合,參與基因表達調(diào)控等生物學(xué)過程。莖環(huán)結(jié)構(gòu)的大小和序列組成也會影響其功能。較小的莖環(huán)結(jié)構(gòu)可能更容易與其他分子結(jié)合,而較大的莖環(huán)結(jié)構(gòu)則可能具有更強的穩(wěn)定性。不同的核苷酸序列組成會導(dǎo)致莖環(huán)結(jié)構(gòu)的熱力學(xué)穩(wěn)定性和結(jié)構(gòu)柔性不同,進而影響其與其他分子的相互作用能力。莖環(huán)結(jié)構(gòu)在環(huán)形RNA中的分布具有一定的規(guī)律性。研究發(fā)現(xiàn),莖環(huán)結(jié)構(gòu)在不同類型的環(huán)形RNA中分布存在差異,且在同一環(huán)形RNA分子中,莖環(huán)結(jié)構(gòu)的位置和數(shù)量也會影響其功能。在一些外顯子來源的環(huán)形RNA中,莖環(huán)結(jié)構(gòu)可能主要分布在編碼區(qū)域附近,對基因的翻譯過程產(chǎn)生影響;而在內(nèi)含子來源的環(huán)形RNA中,莖環(huán)結(jié)構(gòu)則可能與轉(zhuǎn)錄調(diào)控元件相互作用,參與基因的轉(zhuǎn)錄調(diào)控。4.1.2莖環(huán)結(jié)構(gòu)對環(huán)形RNA穩(wěn)定性的影響莖環(huán)結(jié)構(gòu)對環(huán)形RNA的穩(wěn)定性具有重要影響,是維持環(huán)形RNA結(jié)構(gòu)完整性和功能正常發(fā)揮的關(guān)鍵因素之一。莖環(huán)結(jié)構(gòu)通過增加分子內(nèi)的相互作用,增強了環(huán)形RNA的穩(wěn)定性。莖部的雙鏈結(jié)構(gòu)通過堿基互補配對形成氫鍵,使得RNA分子內(nèi)部的相互作用增強,從而增加了分子的穩(wěn)定性。這種雙鏈結(jié)構(gòu)能夠抵抗核酸酶的降解作用,因為核酸酶通常需要識別和結(jié)合單鏈RNA區(qū)域才能發(fā)揮作用,而莖環(huán)結(jié)構(gòu)中的雙鏈莖部對核酸酶具有一定的抗性。環(huán)部的單鏈結(jié)構(gòu)雖然相對不穩(wěn)定,但它可以通過與莖部的相互作用,進一步穩(wěn)定整個莖環(huán)結(jié)構(gòu)。環(huán)部的核苷酸可以與莖部的核苷酸形成非經(jīng)典的堿基配對或其他相互作用,如堿基堆積作用等,從而增強莖環(huán)結(jié)構(gòu)的穩(wěn)定性。莖環(huán)結(jié)構(gòu)的穩(wěn)定性還與RNA分子的折疊方式有關(guān)。RNA分子在折疊過程中,會形成一系列的莖環(huán)結(jié)構(gòu),這些莖環(huán)結(jié)構(gòu)之間的相互作用會影響整個分子的穩(wěn)定性。當(dāng)多個莖環(huán)結(jié)構(gòu)相互靠近并形成穩(wěn)定的相互作用時,RNA分子的穩(wěn)定性會顯著提高。一些環(huán)形RNA分子中存在多個莖環(huán)結(jié)構(gòu),這些莖環(huán)結(jié)構(gòu)通過相互纏繞或堆積,形成了復(fù)雜的三維結(jié)構(gòu),進一步增強了分子的穩(wěn)定性。莖環(huán)結(jié)構(gòu)對環(huán)形RNA穩(wěn)定性的影響還體現(xiàn)在其與其他生物分子的相互作用上。莖環(huán)結(jié)構(gòu)可以作為蛋白質(zhì)或miRNA的結(jié)合位點,當(dāng)這些生物分子與莖環(huán)結(jié)構(gòu)結(jié)合時,會改變RNA分子的結(jié)構(gòu)和穩(wěn)定性。一些RNA結(jié)合蛋白可以與莖環(huán)結(jié)構(gòu)特異性結(jié)合,保護RNA分子免受核酸酶的降解,同時還可能影響RNA分子的功能。miRNA也可以通過與莖環(huán)結(jié)構(gòu)互補配對,結(jié)合到環(huán)形RNA分子上,從而調(diào)控環(huán)形RNA的穩(wěn)定性和功能。莖環(huán)結(jié)構(gòu)在環(huán)形RNA的代謝過程中也發(fā)揮著重要作用。在環(huán)形RNA的合成和降解過程中,莖環(huán)結(jié)構(gòu)的穩(wěn)定性會影響這些過程的速率和效率。如果莖環(huán)結(jié)構(gòu)不穩(wěn)定,環(huán)形RNA可能更容易被降解;反之,如果莖環(huán)結(jié)構(gòu)穩(wěn)定,環(huán)形RNA則可以在細胞中持續(xù)存在并發(fā)揮作用。4.2堿基配對模式4.2.1常見堿基配對方式在環(huán)形RNA中,常見的堿基配對方式遵循經(jīng)典的Watson-Crick堿基配對原則,即腺嘌呤(A)與尿嘧啶(U)通過兩個氫鍵配對,鳥嘌呤(G)與胞嘧啶(C)通過三個氫鍵配對。這種堿基配對方式是維持RNA二級結(jié)構(gòu)穩(wěn)定性的基礎(chǔ),通過堿基之間的互補配對,RNA分子能夠折疊形成各種復(fù)雜的二級結(jié)構(gòu),如莖環(huán)結(jié)構(gòu)、發(fā)夾結(jié)構(gòu)等。在莖環(huán)結(jié)構(gòu)中,莖部的雙鏈區(qū)域就是由互補的堿基對通過氫鍵相互作用形成的。當(dāng)RNA序列中存在反向互補的區(qū)域時,這些區(qū)域會按照A-U、G-C的配對方式形成雙鏈結(jié)構(gòu),從而構(gòu)成莖環(huán)結(jié)構(gòu)的莖部。這種堿基配對方式不僅賦予了莖部結(jié)構(gòu)穩(wěn)定性,還使得莖環(huán)結(jié)構(gòu)能夠與其他生物分子發(fā)生特異性相互作用。在circRNA與miRNA的相互作用中,miRNA通過與circRNA上互補的堿基序列配對,結(jié)合到circRNA的莖環(huán)結(jié)構(gòu)上,從而影響circRNA的功能。除了A-U和G-C配對,在某些情況下,還會出現(xiàn)非標準的堿基配對方式,如G-U配對。G-U配對雖然不如G-C和A-U配對穩(wěn)定,但在RNA分子中也較為常見。G-U配對的存在增加了RNA二級結(jié)構(gòu)的多樣性和復(fù)雜性,使得RNA分子能夠形成更靈活的結(jié)構(gòu),以適應(yīng)不同的生物學(xué)功能需求。在一些RNA分子中,G-U配對可以參與形成特殊的結(jié)構(gòu)元件,如假結(jié)結(jié)構(gòu)中的部分堿基配對。在某些circRNA的二級結(jié)構(gòu)預(yù)測中,也發(fā)現(xiàn)了G-U配對的存在,其可能對circRNA的結(jié)構(gòu)和功能產(chǎn)生一定的影響。堿基配對方式還受到環(huán)境因素的影響,如離子濃度、溫度等。在高離子濃度條件下,離子可以屏蔽RNA分子中磷酸基團的負電荷,減少靜電排斥力,從而有利于堿基配對的發(fā)生,增強RNA二級結(jié)構(gòu)的穩(wěn)定性。溫度的變化也會影響堿基配對的穩(wěn)定性,高溫會破壞堿基之間的氫鍵,導(dǎo)致RNA二級結(jié)構(gòu)的解折疊;而低溫則有利于維持堿基配對,穩(wěn)定RNA的二級結(jié)構(gòu)。4.2.2特殊堿基配對及其功能除了常見的堿基配對方式,環(huán)形RNA中還存在一些特殊的堿基配對,這些特殊堿基配對在circRNA的結(jié)構(gòu)形成和功能發(fā)揮中起著獨特而重要的作用。Hoogsteen堿基配對是一種特殊的堿基配對方式,與傳統(tǒng)的Watson-Crick堿基配對不同。在Hoogsteen堿基配對中,腺嘌呤(A)與胸腺嘧啶(T)或尿嘧啶(U)形成的氫鍵模式發(fā)生了改變,A的N7原子與T或U的O4原子形成氫鍵,同時A的N6氨基與T或U的N3原子形成氫鍵。在鳥嘌呤(G)與胞嘧啶(C)的Hoogsteen配對中,G的N7原子與C的O2原子形成氫鍵,G的N1原子與C的N3原子形成氫鍵。這種特殊的堿基配對方式通常出現(xiàn)在RNA的三鏈或四鏈結(jié)構(gòu)中,通過形成額外的氫鍵,增加了RNA結(jié)構(gòu)的穩(wěn)定性和復(fù)雜性。在一些circRNA中,Hoogsteen堿基配對可能參與形成高級結(jié)構(gòu),如四鏈體結(jié)構(gòu)。circRNA中的四鏈體結(jié)構(gòu)可以與蛋白質(zhì)或其他RNA分子相互作用,調(diào)控基因表達、信號傳導(dǎo)等生物學(xué)過程。研究表明,某些circRNA中的四鏈體結(jié)構(gòu)可以作為蛋白質(zhì)的結(jié)合位點,招募特定的蛋白質(zhì),影響其功能。擺動堿基配對也是一種特殊的堿基配對現(xiàn)象,主要發(fā)生在密碼子與反密碼子的相互作用中。在擺動配對中,tRNA反密碼子的第一位堿基(5'端)與mRNA密碼子的第三位堿基(3'端)之間的配對具有一定的靈活性,不嚴格遵循Watson-Crick堿基配對原則。例如,反密碼子的第一位堿基為次黃嘌呤(I)時,它可以與密碼子的第三位堿基A、U或C配對;反密碼子的第一位堿基為U時,它可以與密碼子的第三位堿基A或G配對;反密碼子的第一位堿基為G時,它可以與密碼子的第三位堿基U或C配對。擺動堿基配對在circRNA中可能影響其與蛋白質(zhì)的相互作用以及翻譯過程。如果circRNA具有編碼蛋白質(zhì)的能力,擺動堿基配對可能導(dǎo)致翻譯過程中氨基酸的錯配或正確識別,從而影響蛋白質(zhì)的序列和功能。擺動堿基配對還可能影響circRNA與RNA結(jié)合蛋白的相互作用,因為RNA結(jié)合蛋白通常通過識別特定的堿基序列或結(jié)構(gòu)來結(jié)合RNA,擺動堿基配對可能改變circRNA的局部結(jié)構(gòu),進而影響其與蛋白質(zhì)的結(jié)合親和力和特異性。4.3與蛋白質(zhì)相互作用相關(guān)的結(jié)構(gòu)特征4.3.1結(jié)合位點預(yù)測準確預(yù)測環(huán)形RNA與蛋白質(zhì)的結(jié)合位點對于深入理解它們之間的相互作用機制至關(guān)重要。目前,計算生物學(xué)方法在結(jié)合位點預(yù)測中發(fā)揮著關(guān)鍵作用,主要包括基于序列特征和基于結(jié)構(gòu)特征的預(yù)測方法?;谛蛄刑卣鞯念A(yù)測方法通過分析環(huán)形RNA和蛋白質(zhì)的序列信息,提取相關(guān)特征并構(gòu)建預(yù)測模型。核苷酸組成是一個重要的序列特征,不同的核苷酸在結(jié)合位點附近的分布可能存在特異性。鳥嘌呤(G)和胞嘧啶(C)含量較高的區(qū)域可能更容易與某些蛋白質(zhì)結(jié)合,因為它們可以形成更穩(wěn)定的堿基對,為蛋白質(zhì)的結(jié)合提供更好的結(jié)構(gòu)基礎(chǔ)。k-mer頻率也是常用的特征之一,k-mer是指長度為k的核苷酸序列片段,通過統(tǒng)計不同k-mer在結(jié)合位點區(qū)域和非結(jié)合位點區(qū)域的出現(xiàn)頻率,可以挖掘出與結(jié)合相關(guān)的序列模式。利用機器學(xué)習(xí)算法,如支持向量機(SVM)、隨機森林等,將這些序列特征作為輸入,對環(huán)形RNA與蛋白質(zhì)的結(jié)合位點進行預(yù)測。以SVM為例,首先將環(huán)形RNA序列轉(zhuǎn)化為特征向量,每個特征對應(yīng)一個序列特征,如核苷酸組成、k-mer頻率等。然后使用已知結(jié)合位點的環(huán)形RNA和蛋白質(zhì)數(shù)據(jù)作為訓(xùn)練集,對SVM模型進行訓(xùn)練,調(diào)整模型參數(shù),使其能夠準確地區(qū)分結(jié)合位點和非結(jié)合位點。最后,將待預(yù)測的環(huán)形RNA序列的特征向量輸入訓(xùn)練好的模型,得到結(jié)合位點的預(yù)測結(jié)果。隨著對RNA結(jié)構(gòu)研究的深入,基于結(jié)構(gòu)特征的預(yù)測方法逐漸受到關(guān)注。RNA的二級結(jié)構(gòu),如莖環(huán)結(jié)構(gòu)、發(fā)夾結(jié)構(gòu)等,對其與蛋白質(zhì)的相互作用具有重要影響。莖環(huán)結(jié)構(gòu)中的環(huán)區(qū)通常具有較高的柔性,更容易與蛋白質(zhì)發(fā)生相互作用,因此可以將莖環(huán)結(jié)構(gòu)的位置和特征作為預(yù)測結(jié)合位點的重要依據(jù)。通過預(yù)測環(huán)形RNA的二級結(jié)構(gòu),結(jié)合蛋白質(zhì)的三維結(jié)構(gòu)信息,可以更準確地預(yù)測結(jié)合位點。利用分子對接技術(shù),將環(huán)形RNA的二級結(jié)構(gòu)模型與蛋白質(zhì)的三維結(jié)構(gòu)模型進行對接,通過計算兩者之間的相互作用能量,尋找能量最低的結(jié)合模式,從而確定可能的結(jié)合位點。在分子對接過程中,考慮到RNA和蛋白質(zhì)分子的柔性,可以采用柔性對接方法,允許分子在對接過程中發(fā)生一定程度的構(gòu)象變化,以更真實地模擬它們的結(jié)合過程。一些基于深度學(xué)習(xí)的方法也被應(yīng)用于結(jié)合位點預(yù)測,通過對大量的RNA-蛋白質(zhì)復(fù)合物結(jié)構(gòu)數(shù)據(jù)進行學(xué)習(xí),模型可以自動提取結(jié)構(gòu)特征,實現(xiàn)對結(jié)合位點的準確預(yù)測。4.3.2結(jié)構(gòu)特征對相互作用的影響環(huán)形RNA的結(jié)構(gòu)特征在其與蛋白質(zhì)的相互作用中起著關(guān)鍵作用,不同的結(jié)構(gòu)特征會對相互作用的親和力、特異性和功能產(chǎn)生不同的影響。莖環(huán)結(jié)構(gòu)作為環(huán)形RNA二級結(jié)構(gòu)的重要組成部分,對與蛋白質(zhì)的相互作用具有重要影響。莖環(huán)結(jié)構(gòu)中的莖部雙鏈區(qū)域為蛋白質(zhì)提供了穩(wěn)定的結(jié)合平臺,蛋白質(zhì)可以通過與莖部的堿基對相互作用,實現(xiàn)與環(huán)形RNA的結(jié)合。某些蛋白質(zhì)可以識別莖部特定的堿基序列,通過氫鍵、范德華力等相互作用與莖部結(jié)合,從而影響環(huán)形RNA的功能。環(huán)部的單鏈區(qū)域則具有較高的柔性,能夠與蛋白質(zhì)形成更靈活的相互作用。環(huán)部的核苷酸序列可以與蛋白質(zhì)的氨基酸殘基形成特異性的相互作用,如堿基與氨基酸的側(cè)鏈基團之間的相互作用,從而決定了蛋白質(zhì)與環(huán)形RNA結(jié)合的特異性。一些蛋白質(zhì)可以通過與環(huán)部的特定序列結(jié)合,調(diào)控環(huán)形RNA的穩(wěn)定性、翻譯過程或與其他分子的相互作用。研究發(fā)現(xiàn),某些RNA結(jié)合蛋白可以與環(huán)形RNA的莖環(huán)結(jié)構(gòu)結(jié)合,保護環(huán)形RNA免受核酸酶的降解,同時影響其在細胞內(nèi)的定位和功能。假結(jié)結(jié)構(gòu)是環(huán)形RNA中較為復(fù)雜的二級結(jié)構(gòu),它的存在增加了環(huán)形RNA結(jié)構(gòu)的復(fù)雜性和穩(wěn)定性,同時也為其與蛋白質(zhì)的相互作用提供了更多的可能性。假結(jié)結(jié)構(gòu)中的多個莖環(huán)相互嵌套,形成了獨特的三維結(jié)構(gòu),這種結(jié)構(gòu)可以提供更多的蛋白質(zhì)結(jié)合位點,增強環(huán)形RNA與蛋白質(zhì)的相互作用。假結(jié)結(jié)構(gòu)的穩(wěn)定性較高,使得蛋白質(zhì)與環(huán)形RNA的結(jié)合更加牢固,不易解離。一些蛋白質(zhì)可以特異性地識別假結(jié)結(jié)構(gòu),與假結(jié)中的特定區(qū)域結(jié)合,從而調(diào)控環(huán)形RNA的功能。在某些病毒的環(huán)形RNA中,假結(jié)結(jié)構(gòu)與病毒蛋白的結(jié)合對于病毒的復(fù)制和感染過程至關(guān)重要。假結(jié)結(jié)構(gòu)還可能影響環(huán)形RNA與其他蛋白質(zhì)的競爭結(jié)合,因為其獨特的結(jié)構(gòu)可能會改變蛋白質(zhì)結(jié)合位點的空間構(gòu)象,影響其他蛋白質(zhì)的結(jié)合能力。除了二級結(jié)構(gòu)特征,環(huán)形RNA的三級結(jié)構(gòu)對與蛋白質(zhì)的相互作用也具有重要影響。三級結(jié)構(gòu)是RNA分子在二級結(jié)構(gòu)基礎(chǔ)上進一步折疊形成的三維空間結(jié)構(gòu),它決定了RNA分子的整體形狀和表面性質(zhì)。環(huán)形RNA的三級結(jié)構(gòu)可以通過堿基堆積、離子相互作用等方式形成,使得RNA分子具有特定的空間構(gòu)象。蛋白質(zhì)與環(huán)形RNA的相互作用不僅依賴于局部的二級結(jié)構(gòu),還受到整體三級結(jié)構(gòu)的影響。蛋白質(zhì)需要與環(huán)形RNA的特定表面區(qū)域相互匹配,才能實現(xiàn)有效的結(jié)合。如果環(huán)形RNA的三級結(jié)構(gòu)發(fā)生改變,可能會影響蛋白質(zhì)的結(jié)合位點和結(jié)合方式,從而改變相互作用的親和力和特異性。一些分子伴侶蛋白可以幫助環(huán)形RNA正確折疊形成特定的三級結(jié)構(gòu),促進其與其他蛋白質(zhì)的相互作用。五、環(huán)形RNA的生物學(xué)功能研究5.1作為miRNA海綿的功能5.1.1miRNA海綿作用機制環(huán)形RNA作為miRNA海綿發(fā)揮作用,主要基于其獨特的結(jié)構(gòu)和序列特征,通過競爭性結(jié)合miRNA,影響miRNA對靶基因的調(diào)控,從而參與基因表達調(diào)控網(wǎng)絡(luò),在細胞的生理和病理過程中發(fā)揮重要作用。miRNA是一類長度約為22個核苷酸的小分子非編碼RNA,在基因表達調(diào)控中扮演著關(guān)鍵角色。成熟的miRNA與AGO2等蛋白結(jié)合形成RNA誘導(dǎo)沉默復(fù)合體(RISC),通過堿基互補配對的方式識別并結(jié)合靶mRNA分子的3’-UTR區(qū)域,抑制靶mRNA的翻譯過程,或促使其降解,進而下調(diào)靶基因的表達水平。由于miRNA與mRNA的序列互補性決定了其對靶mRNA的特異性識別與作用,且每個miRNA可能與多個mRNA互補結(jié)合,因此miRNA可以調(diào)控多個基因的表達,廣泛參與細胞增殖、分化、凋亡等生命活動。環(huán)形RNA之所以能夠充當(dāng)miRNA海綿,是因為其序列中含有多個miRNA結(jié)合位點。這些結(jié)合位點的核苷酸序列與miRNA的種子序列互補,能夠通過堿基互補配對與miRNA特異性結(jié)合。當(dāng)circRNA表達水平升高時,它會與miRNA結(jié)合,將miRNA“隔離”,使其無法與靶mRNA結(jié)合,從而解除miRNA對靶mRNA的抑制作用,維持靶mRNA的結(jié)構(gòu)和翻譯穩(wěn)定性,導(dǎo)致靶蛋白表達水平上調(diào)。相反,當(dāng)circRNA表達水平降低時,結(jié)合的miRNA數(shù)量減少,更多的miRNA得以與靶mRNA結(jié)合,破壞靶mRNA的結(jié)構(gòu)和翻譯穩(wěn)定性,使得靶蛋白表達水平下調(diào)。這種調(diào)控方式類似于競爭性內(nèi)源性RNA(ceRNA)機制,circRNA通過競爭性結(jié)合miRNA,調(diào)節(jié)miRNA對靶基因的調(diào)控作用,進而影響基因表達。以CDR1as(小腦變性相關(guān)蛋白1的反義轉(zhuǎn)錄本)為例,它在哺乳動物大腦中廣泛存在,且含有70多個miR-7保守結(jié)合位點。CDR1as作為miR-7分子海綿,能夠阻斷miR-7對下游基因的表達抑制。當(dāng)CDR1as過表達時,它會結(jié)合大量的miR-7,抑制miR-7的活性,從而促進miR-7靶蛋白(如UBE2A、EGFP、PTEN、CCNE1和PIK3CD等)的表達,這些靶蛋白參與中樞神經(jīng)系統(tǒng)疾病、糖尿病、胃癌、肝細胞癌等疾病的發(fā)生發(fā)展。5.1.2相關(guān)案例分析在癌癥研究領(lǐng)域,circPVT1在肝癌的發(fā)生發(fā)展中展現(xiàn)出重要的調(diào)控作用,其機制與作為miRNA海綿密切相關(guān)。研究發(fā)現(xiàn),circPVT1在肝癌組織中顯著高表達,通過生物信息學(xué)分析和實驗驗證,確定其含有多個miR-125b的結(jié)合位點。在正常生理狀態(tài)下,miR-125b可以與靶基因mRNA的3’-UTR區(qū)域結(jié)合,抑制其翻譯過程,從而調(diào)控細胞的增殖、凋亡等生物學(xué)過程。當(dāng)circPVT1在肝癌細胞中高表達時,它大量吸附miR-125b,使miR-125b無法與靶基因mRNA有效結(jié)合,解除了miR-125b對靶基因的抑制作用。進一步研究發(fā)現(xiàn),circPVT1通過吸附miR-125b,上調(diào)了靶基因SOX4和MCL1的表達。SOX4是一種轉(zhuǎn)錄因子,在肝癌細胞中,它可以促進細胞的增殖、遷移和侵襲能力;MCL1是一種抗凋亡蛋白,能夠抑制細胞凋亡,增強肝癌細胞的存活能力。因此,circPVT1通過作為miR-125b的海綿,調(diào)控相關(guān)靶基因的表達,促進了肝癌細胞的增殖、遷移和侵襲,在肝癌的發(fā)生發(fā)展過程中發(fā)揮了重要的促進作用。在心血管疾病研究中,circRNA也發(fā)揮著關(guān)鍵作用,以circRNA-100338在心肌梗死中的作用為例。心肌梗死是一種嚴重的心血管疾病,其發(fā)病機制涉及多種生物學(xué)過程的異常。研究表明,circRNA-100338在心肌梗死患者的血清和心肌組織中表達顯著下調(diào)。通過一系列實驗,發(fā)現(xiàn)circRNA-100338含有miR-122-5p的結(jié)合位點,能夠作為miR-122-5p的海綿。miR-122-5p在心肌梗死的發(fā)生發(fā)展中具有重要作用,它可以通過抑制靶基因的表達,影響心肌細胞的增殖、凋亡和能量代謝等過程。在正常情況下,circRNA-100338可以結(jié)合一定量的miR-122-5p,維持miR-122-5p對靶基因的適度調(diào)控。當(dāng)circRNA-100338表達下調(diào)時,其對miR-122-5p的吸附能力減弱,導(dǎo)致miR-122-5p大量游離,進而過度抑制靶基因的表達。研究發(fā)現(xiàn),miR-122-5p的靶基因包括一些參與心肌細胞能量代謝的關(guān)鍵酶和信號通路分子,如HK2、PFKFB3等。miR-122-5p對這些靶基因的過度抑制,會導(dǎo)致心肌細胞能量代謝紊亂,細胞凋亡增加,最終加重心肌梗死的病情。因此,circRNA-100338通過作為miR-122-5p的海綿,調(diào)控相關(guān)靶基因的表達,在心肌梗死的發(fā)生發(fā)展中發(fā)揮著重要的調(diào)節(jié)作用。5.2調(diào)控基因轉(zhuǎn)錄與表達5.2.1對轉(zhuǎn)錄過程的影響環(huán)形RNA在基因轉(zhuǎn)錄過程中扮演著重要角色,通過多種機制對轉(zhuǎn)錄過程進行調(diào)控,影響基因表達水平,進而參與細胞的生理和病理過程。環(huán)形RNA可以通過與轉(zhuǎn)錄因子相互作用,直接影響基因的轉(zhuǎn)錄起始和延伸過程。一些環(huán)形RNA能夠特異性地結(jié)合轉(zhuǎn)錄因子,改變其活性或定位,從而調(diào)控基因轉(zhuǎn)錄。circRNA-Foxo3可以與轉(zhuǎn)錄因子E2F1和DP1相互作用,形成circRNA-Foxo3-E2F1-DP1復(fù)合物,抑制E2F1和DP1的轉(zhuǎn)錄激活活性,進而抑制細胞周期相關(guān)基因的轉(zhuǎn)錄,阻滯細胞周期進程。這種調(diào)控作用在細胞增殖、分化和衰老等過程中具有重要意義。在細胞增殖過程中,circRNA-Foxo3對細胞周期相關(guān)基因轉(zhuǎn)錄的抑制,能夠控制細胞的增殖速度,防止細胞過度增殖;在細胞分化過程中,其對轉(zhuǎn)錄因子的調(diào)控作用有助于細胞向特定方向分化,實現(xiàn)細胞功能的特化。環(huán)形RNA還可以通過與RNA聚合酶II(PolII)相互作用,影響基因轉(zhuǎn)錄。部分環(huán)形RNA能夠與PolII結(jié)合,促進或抑制其在DNA模板上的結(jié)合和移動,從而調(diào)控轉(zhuǎn)錄的起始和延伸。ci-ankrd52是一種內(nèi)含子來源的環(huán)形RNA,它主要在細胞核中積累,能夠通過與RNAPolII的順式調(diào)節(jié)作用,促進ANKRD52基因的轉(zhuǎn)錄。具體機制可能是ci-ankrd52與PolII結(jié)合后,改變了PolII的構(gòu)象或與DNA模板的結(jié)合親和力,使得PolII更容易起始轉(zhuǎn)錄或在轉(zhuǎn)錄過程中更穩(wěn)定地沿著DNA模板移動,從而增加ANKRD52基因的轉(zhuǎn)錄產(chǎn)物。這種調(diào)控方式在維持細胞的正常生理功能中發(fā)揮著關(guān)鍵作用,ANKRD52基因的正常表達對于細胞的結(jié)構(gòu)和功能穩(wěn)定至關(guān)重要,ci-ankrd52通過對其轉(zhuǎn)錄的調(diào)控,間接參與了細胞的多種生理過程。環(huán)形RNA與DNA形成的R-loop結(jié)構(gòu)也對轉(zhuǎn)錄過程產(chǎn)生重要影響。R-loop是由RNA與DNA模板鏈雜交形成的三鏈核酸結(jié)構(gòu),在基因組中廣泛存在。環(huán)形RNA可以與DNA結(jié)合形成R-loop,這種結(jié)構(gòu)的形成會影響DNA的結(jié)構(gòu)和功能,進而影響轉(zhuǎn)錄過程。在白血病中,circMLL、circMLLT1和circMLLT2等環(huán)形RNA在細胞核中大量表達,并與MLL基因及其伴侶基因的基因組位點形成R-loop。這些R-loop的形成促進了RNAPII轉(zhuǎn)錄時的暫停現(xiàn)象,同時也促進了DNA雙鏈斷裂(DSBs)的產(chǎn)生。DSBs的產(chǎn)生會激活細胞的DNA損傷修復(fù)機制,在修復(fù)過程中可能會發(fā)生錯誤,導(dǎo)致致癌性染色體易位的發(fā)生,從而促進白血病的發(fā)展。R-loop還可能影響轉(zhuǎn)錄因子與DNA的結(jié)合,改變基因的轉(zhuǎn)錄活性。當(dāng)R-loop形成在基因的啟動子區(qū)域時,可能會阻礙轉(zhuǎn)錄因子的結(jié)合,抑制基因轉(zhuǎn)錄;而在基因的編碼區(qū)域,R-loop可能會影響RNA聚合酶的移動,導(dǎo)致轉(zhuǎn)錄異常。5.2.2在不同生物過程中的調(diào)控作用環(huán)形RNA在生物的發(fā)育過程中發(fā)揮著關(guān)鍵的調(diào)控作用,對細胞的分化、組織器官的形成和發(fā)育進程的調(diào)控具有重要影響。在胚胎發(fā)育階段,環(huán)形RNA的表達譜呈現(xiàn)動態(tài)變化,不同階段特異性表達的環(huán)形RNA參與了相應(yīng)的發(fā)育調(diào)控過程。在小鼠胚胎發(fā)育過程中,研究發(fā)現(xiàn)一些環(huán)形RNA在特定的發(fā)育時期高表達,通過調(diào)控相關(guān)基因的轉(zhuǎn)錄和表達,影響細胞的分化和組織器官的形成。circ-Sry在雄性小鼠胚胎發(fā)育過程中特異性表達,它可以通過與miR-138相互作用,調(diào)控下游基因的表達,參與性別決定相關(guān)的發(fā)育過程。miR-138通常會抑制某些與雄性性別決定相關(guān)基因的表達,而circ-Sry作為miR-138的海綿,吸附miR-138,解除其對靶基因的抑制,使得這些基因能夠正常表達,從而促進雄性胚胎的發(fā)育。在神經(jīng)系統(tǒng)發(fā)育中,環(huán)形RNA也扮演著不可或缺的角色。在神經(jīng)干細胞向神經(jīng)元分化的過程中,環(huán)形RNA的表達和功能變化對神經(jīng)分化的調(diào)控至關(guān)重要。研究表明,一些環(huán)形RNA在神經(jīng)干細胞中低表達,隨著神經(jīng)分化的進行,其表達逐漸升高。circRNA-100284在神經(jīng)干細胞分化為神經(jīng)元的過程中表達上調(diào),通過調(diào)控相關(guān)基因的轉(zhuǎn)錄,促進神經(jīng)分化相關(guān)基因的表達,抑制神經(jīng)干細胞相關(guān)基因的表達,從而推動神經(jīng)干細胞向神經(jīng)元的分化進程。circRNA-100284可能通過與轉(zhuǎn)錄因子結(jié)合,改變其對神經(jīng)分化相關(guān)基因啟動子的結(jié)合能力,促進這些基因的轉(zhuǎn)錄;同時,它也可能通過與miRNA相互作用,間接調(diào)控神經(jīng)干細胞相關(guān)基因的表達。環(huán)形RNA的異常表達與多種疾病的發(fā)生發(fā)展密切相關(guān),在癌癥、神經(jīng)系統(tǒng)疾病等疾病中,環(huán)形RNA通過調(diào)控基因轉(zhuǎn)錄和表達,參與疾病的病理過程。在癌癥中,環(huán)形RNA可以作為致癌基因或抑癌基因,影響腫瘤細胞的增殖、遷移、侵襲和凋亡等生物學(xué)行為。circPVT1在肝癌組織中高表達,通過與miR-125b結(jié)合,解除miR-125b對靶基因SOX4和MCL1的抑制,促進這些基因的轉(zhuǎn)錄和表達,從而促進肝癌細胞的增殖、遷移和侵襲。SOX4作為轉(zhuǎn)錄因子,能夠促進肝癌細胞的增殖和轉(zhuǎn)移相關(guān)基因的表達;MCL1作為抗凋亡蛋白,能夠抑制肝癌細胞的凋亡,增強其存活能力。在神經(jīng)系統(tǒng)疾病中,如阿爾茨海默病,環(huán)形RNA的異常表達也參與了疾病的發(fā)病機制。研究發(fā)現(xiàn),一些環(huán)形RNA在阿爾茨海默病患者的大腦組織中表達異常,通過調(diào)控相關(guān)基因的轉(zhuǎn)錄和表達,影響神經(jīng)細胞的功能和存活。circRNA-CDR1as在阿爾茨海默病患者大腦中表達失調(diào),它可以作為miR-7的海綿,調(diào)節(jié)miR-7對靶基因的調(diào)控作用,影響神經(jīng)細胞的信號傳導(dǎo)和代謝過程,從而參與阿爾茨海默病的發(fā)病過程。5.3參與蛋白質(zhì)翻譯5.3.1翻譯機制研究環(huán)形RNA參與蛋白質(zhì)翻譯的機制與傳統(tǒng)線性mRNA的翻譯過程存在顯著差異,它主要通過非帽依賴的翻譯機制來實現(xiàn)蛋白質(zhì)的合成。傳統(tǒng)的線性mRNA翻譯起始依賴于5'端帽子結(jié)構(gòu),需要多種起始因子的參與,如eIF4E、eIF4G等,這些起始因子與5'端帽子結(jié)合,招募核糖體小亞基,進而啟動翻譯過程。而環(huán)形RNA由于缺乏5'端帽子結(jié)構(gòu),無法通過經(jīng)典的帽依賴翻譯途徑進行翻譯。內(nèi)部核糖體進入位點(IRES)介導(dǎo)的翻譯是環(huán)形RNA翻譯的重要機制之一。IRES是一段特殊的RNA序列,能夠直接招募核糖體小亞基,啟動蛋白質(zhì)翻譯過程。在環(huán)形RNA中,IRES序列通常位于編碼區(qū)的上游,當(dāng)核糖體小亞基結(jié)合到IRES上后,能夠繞過對5'端帽子的依賴,直接開始掃描起始密碼子,從而啟動翻譯。研究表明,一些病毒來源的環(huán)形RNA含有天然的IRES序列,能夠在宿主細胞中高效地進行翻譯。在脊髓灰質(zhì)炎病毒中,其基因組RNA為環(huán)形結(jié)構(gòu),含有IRES序列,在感染細胞后,能夠利用宿主細胞的翻譯機器,通過IRES介導(dǎo)的翻譯機制合成病毒蛋白。在真核生物中,也有部分環(huán)形RNA被發(fā)現(xiàn)含有IRES序列,如circ-ZNF609,它可以通過IRES介導(dǎo)的翻譯機制編碼蛋白質(zhì),且該蛋白質(zhì)在細胞增殖和遷移過程中發(fā)揮作用。除了IRES介導(dǎo)的翻譯,N6-甲基腺苷(m6A)修飾也在環(huán)形RNA翻譯中發(fā)揮重要作用。m6A是真核生物RNA中最常見的一種修飾方式,它能夠影響RNA的穩(wěn)定性、剪接、轉(zhuǎn)運和翻譯等過程。在環(huán)形RNA中,m6A修飾可以促進核糖體與環(huán)形RNA的結(jié)合,增強翻譯效率。m6A修飾可以作為一種識別信號,被YTHDF3等m6A結(jié)合蛋白識別,這些結(jié)合蛋白可以與翻譯起始因子相互作用,促進核糖體在環(huán)形RNA上的組裝,從而啟動翻譯過程。研究發(fā)現(xiàn),在一些腫瘤細胞中,circRNA的m6A修飾水平升高,其翻譯效率也隨之提高,翻譯產(chǎn)生的蛋白質(zhì)可能參與腫瘤細胞的增殖、遷移和侵襲等過程。還有研究表明,環(huán)形RNA可能通過滾環(huán)擴增(RCA)的方式進行翻譯。在滾環(huán)擴增過程中,環(huán)形RNA作為模板,在DNA聚合酶或RNA聚合酶的作用下,不斷地進行復(fù)制和轉(zhuǎn)錄,產(chǎn)生多個線性的RNA分子,這些線性RNA分子可以進一步進行翻譯,從而提高蛋白質(zhì)的合成效率。這種翻譯機制在一些病毒感染的細胞中較為常見,如乙肝病毒感染的細胞中,病毒來源的環(huán)形

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論