版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
基于計算生物學(xué)的環(huán)形RNA篩選系統(tǒng)與堿基編輯器開發(fā)的深度探究一、引言1.1研究背景與意義1.1.1環(huán)形RNA研究背景環(huán)形RNA(circRNA)是一類具有閉合環(huán)狀結(jié)構(gòu)的RNA分子,其不具備5'末端帽子和3'末端poly(A)尾巴,通過共價鍵形成環(huán)形結(jié)構(gòu)。circRNA的發(fā)現(xiàn)可追溯到1976年,當(dāng)時在電子顯微鏡下觀測到真核細胞的細胞質(zhì)中存在此類分子,然而,在后續(xù)長達30多年的時間里,circRNA一直被視作mRNA剪接過程中產(chǎn)生的無功能副產(chǎn)物而未受到重視。直到2013年,《Nature》期刊同期發(fā)表的兩篇研究論文指出,circRNA是一類具有調(diào)控作用的非編碼RNA,可作為miRNA的海綿來調(diào)控其他基因表達,這一發(fā)現(xiàn)使得circRNA迅速成為生物學(xué)研究的焦點,相關(guān)研究也開始呈爆發(fā)式增長。circRNA在基因表達調(diào)控中發(fā)揮著關(guān)鍵作用。從轉(zhuǎn)錄水平來看,部分circRNA的生成與線性RNA剪切密切相關(guān),其表達量的變化會對轉(zhuǎn)錄過程產(chǎn)生影響。在轉(zhuǎn)錄后水平,circRNA主要通過作為miRNA海綿來發(fā)揮調(diào)控作用。例如,第一個被揭示具有調(diào)控功能的circRNA——ciRS7,它含有miR7的470個保守結(jié)合位點,能夠通過抑制miR7活性來增加miR7靶基因的表達水平,而miR7直接靶向多種致癌基因,在多種人類癌癥的發(fā)生發(fā)展過程中發(fā)揮重要作用。此外,circRNA還具有一些獨特的性質(zhì),使其在生物學(xué)研究中備受關(guān)注。circRNA呈閉合環(huán)狀結(jié)構(gòu),不易被核酸外切酶降解,比線性RNA更加穩(wěn)定;其表達水平具有種屬、組織、時間特異性,且具有一定序列保守性;絕大多數(shù)circRNA是非編碼的,但也有少數(shù)可以翻譯為多肽。隨著高通量測序技術(shù)的不斷發(fā)展以及生物信息學(xué)分析方法的廣泛應(yīng)用,越來越多的circRNA被發(fā)現(xiàn)并鑒定,然而,目前對于circRNA的功能研究仍處于起步階段,僅有少數(shù)circRNA的功能被深入解析,大部分circRNA的功能尚不清楚。因此,建立高效的環(huán)形RNA篩選系統(tǒng),深入研究circRNA的功能及作用機制,對于揭示生命過程的奧秘、探索疾病的發(fā)病機制以及開發(fā)新型治療方法具有重要意義。1.1.2堿基編輯器開發(fā)背景基因編輯技術(shù)的發(fā)展為生命科學(xué)研究和疾病治療帶來了革命性的變化?;谝?guī)律成簇間隔短回文重復(fù)序列(clusteredregularlyinterspacedshortpalindromicrepeat,CRISPR)及其相關(guān)蛋白(CRISPR-associated,Cas)開發(fā)出的單堿基編輯器(baseeditor,BE),是一類不依賴于DNA雙鏈斷裂便可以實現(xiàn)高效單堿基替換的新一代基因編輯工具,在基因編輯領(lǐng)域具有重要地位。堿基編輯器的發(fā)展經(jīng)歷了多個階段。2016年,DavidLiu實驗室開發(fā)出第一個胞嘧啶堿基編輯器(CBE),它通過將胞嘧啶脫氨酶與失活的dCas9偶聯(lián),在不切斷DNA的情況下將胞嘧啶轉(zhuǎn)化為尿嘧啶,尿嘧啶隨后通過DNA復(fù)制或修復(fù)轉(zhuǎn)化為胸腺嘧啶,這一技術(shù)的出現(xiàn)為單堿基編輯提供了新的手段。之后,該實驗室又開發(fā)出腺嘌呤堿基編輯器(ABE),能夠使A變成G(互補鏈上的T變成C),進一步豐富了堿基編輯的類型。隨著研究的不斷深入,科研人員對堿基編輯器進行了一系列優(yōu)化和改進,旨在擴大靶向范圍、提高編輯效率、降低脫靶效應(yīng)。通過嘗試不同的脫氨酶、開發(fā)Cas9的變體以及優(yōu)化融合蛋白的結(jié)構(gòu)等方式,使得堿基編輯器的性能得到了顯著提升。盡管堿基編輯器在基因編輯領(lǐng)域取得了巨大的進展,但目前仍然面臨一些挑戰(zhàn)。例如,編輯窗口的限制,大多數(shù)堿基編輯器只能編輯特定范圍內(nèi)的堿基,這限制了其應(yīng)用范圍;脫靶效應(yīng)也是一個亟待解決的問題,即使經(jīng)過優(yōu)化,堿基編輯器仍然可能在非目標(biāo)位點產(chǎn)生編輯,從而帶來潛在的風(fēng)險;此外,堿基編輯器在不同細胞類型和生物體中的編輯效率和特異性也存在差異,需要進一步研究和優(yōu)化。因此,持續(xù)開發(fā)性能更優(yōu)的堿基編輯器,解決當(dāng)前面臨的技術(shù)難題,對于推動基因編輯技術(shù)的發(fā)展和應(yīng)用具有重要的現(xiàn)實意義。1.1.3計算生物學(xué)在其中的關(guān)鍵作用計算生物學(xué)作為一門交叉學(xué)科,融合了數(shù)學(xué)、統(tǒng)計學(xué)、計算機科學(xué)和生物學(xué)等多學(xué)科知識,在環(huán)形RNA篩選和堿基編輯器開發(fā)中發(fā)揮著不可或缺的關(guān)鍵作用。在環(huán)形RNA篩選方面,計算生物學(xué)提供了強大的數(shù)據(jù)分析和處理能力。高通量測序技術(shù)的發(fā)展使得大量的RNA測序數(shù)據(jù)得以產(chǎn)生,通過生物信息學(xué)算法和工具,可以從這些海量數(shù)據(jù)中準(zhǔn)確地識別和預(yù)測circRNA。利用轉(zhuǎn)錄組數(shù)據(jù)挖掘和差異表達分析方法,能夠探究circRNA的表達模式和調(diào)控機制,挖掘出與特定生物學(xué)過程或疾病相關(guān)的circRNA。通過計算分析可以預(yù)測circRNA與miRNA之間的相互作用關(guān)系,為研究circRNA的功能提供重要線索。在堿基編輯器開發(fā)中,計算生物學(xué)同樣發(fā)揮著重要作用?;诘鞍踪|(zhì)結(jié)構(gòu)和功能的計算分析,可以對堿基編輯器的融合蛋白結(jié)構(gòu)進行優(yōu)化設(shè)計,提高其編輯效率和特異性。通過分子動力學(xué)模擬等方法,可以深入研究堿基編輯器與DNA或RNA底物之間的相互作用機制,為改進堿基編輯器提供理論依據(jù)。計算生物學(xué)還可以用于評估堿基編輯器的脫靶效應(yīng),通過建立預(yù)測模型,預(yù)測潛在的脫靶位點,從而指導(dǎo)實驗設(shè)計,降低脫靶風(fēng)險。計算生物學(xué)在環(huán)形RNA篩選和堿基編輯器開發(fā)中提供了從數(shù)據(jù)處理、功能預(yù)測到結(jié)構(gòu)優(yōu)化和風(fēng)險評估等全方位的技術(shù)支持和理論依據(jù),極大地推動了這兩個領(lǐng)域的研究進展。1.2研究目標(biāo)與創(chuàng)新點1.2.1研究目標(biāo)本研究旨在利用計算生物學(xué)方法,開發(fā)高效的環(huán)形RNA篩選系統(tǒng),優(yōu)化堿基編輯器的性能,為環(huán)形RNA功能研究和基因編輯技術(shù)的發(fā)展提供新的工具和方法。具體研究目標(biāo)如下:構(gòu)建精準(zhǔn)的環(huán)形RNA篩選系統(tǒng):通過整合多種生物信息學(xué)算法和機器學(xué)習(xí)模型,構(gòu)建一套能夠從高通量測序數(shù)據(jù)中精準(zhǔn)識別和篩選具有潛在功能的環(huán)形RNA的系統(tǒng)。利用該系統(tǒng)對不同組織和疾病狀態(tài)下的轉(zhuǎn)錄組數(shù)據(jù)進行分析,挖掘與特定生物學(xué)過程或疾病相關(guān)的環(huán)形RNA,并對其進行功能預(yù)測和驗證。優(yōu)化堿基編輯器的性能:基于蛋白質(zhì)結(jié)構(gòu)和功能的計算分析,對堿基編輯器的融合蛋白結(jié)構(gòu)進行優(yōu)化設(shè)計,提高其編輯效率和特異性。通過分子動力學(xué)模擬等方法,深入研究堿基編輯器與DNA或RNA底物之間的相互作用機制,為改進堿基編輯器提供理論依據(jù)。利用計算生物學(xué)方法評估堿基編輯器的脫靶效應(yīng),建立預(yù)測模型,預(yù)測潛在的脫靶位點,指導(dǎo)實驗設(shè)計,降低脫靶風(fēng)險。探索環(huán)形RNA與堿基編輯器的聯(lián)合應(yīng)用:研究環(huán)形RNA作為堿基編輯器載體或調(diào)控元件的可行性,探索環(huán)形RNA與堿基編輯器的聯(lián)合應(yīng)用策略。通過實驗驗證,評估聯(lián)合應(yīng)用在基因治療、疾病模型構(gòu)建等領(lǐng)域的應(yīng)用效果,為相關(guān)研究提供新的思路和方法。1.2.2創(chuàng)新點與前人研究相比,本研究在環(huán)形RNA篩選系統(tǒng)優(yōu)化和堿基編輯器開發(fā)方面具有以下創(chuàng)新之處:采用新算法和模型進行環(huán)形RNA篩選:在環(huán)形RNA篩選過程中,本研究創(chuàng)新性地將深度學(xué)習(xí)算法與傳統(tǒng)生物信息學(xué)方法相結(jié)合,構(gòu)建了一種新型的環(huán)形RNA識別模型。該模型能夠充分挖掘高通量測序數(shù)據(jù)中的特征信息,提高環(huán)形RNA的識別準(zhǔn)確率和篩選效率。引入了基于圖神經(jīng)網(wǎng)絡(luò)的方法來分析環(huán)形RNA與其他分子(如miRNA、蛋白質(zhì)等)之間的相互作用關(guān)系,為深入研究環(huán)形RNA的功能提供了新的視角和方法?;诮Y(jié)構(gòu)導(dǎo)向的堿基編輯器優(yōu)化策略:在堿基編輯器優(yōu)化方面,本研究首次采用基于蛋白質(zhì)結(jié)構(gòu)導(dǎo)向的策略,通過對堿基編輯器融合蛋白的三維結(jié)構(gòu)進行分析和模擬,有針對性地對關(guān)鍵氨基酸殘基進行突變和優(yōu)化,從而提高堿基編輯器的編輯效率和特異性。利用分子動力學(xué)模擬和自由能計算等方法,深入研究堿基編輯器與DNA或RNA底物結(jié)合過程中的動態(tài)變化和能量變化,為優(yōu)化堿基編輯器的性能提供了更為精確的理論指導(dǎo)。提出環(huán)形RNA與堿基編輯器聯(lián)合應(yīng)用的新策略:本研究首次提出將環(huán)形RNA作為堿基編輯器的載體或調(diào)控元件,實現(xiàn)對特定基因的精準(zhǔn)編輯和調(diào)控。通過設(shè)計和構(gòu)建具有特定功能的環(huán)形RNA,將其與堿基編輯器相結(jié)合,形成一種新型的基因編輯工具,有望克服傳統(tǒng)堿基編輯器在應(yīng)用過程中存在的一些局限性,為基因治療和疾病研究提供新的技術(shù)手段。二、環(huán)形RNA篩選系統(tǒng)的計算生物學(xué)基礎(chǔ)2.1環(huán)形RNA的生物信息學(xué)特征2.1.1結(jié)構(gòu)特點與形成機制環(huán)形RNA最為顯著的結(jié)構(gòu)特點是其呈閉環(huán)狀,不具備線性RNA所擁有的5'末端帽子結(jié)構(gòu)和3'末端poly(A)尾巴。這種獨特的閉環(huán)結(jié)構(gòu)賦予了環(huán)形RNA諸多特殊性質(zhì),例如,其對核酸外切酶具有較強的抗性,穩(wěn)定性遠高于線性RNA,這使得環(huán)形RNA能夠在細胞內(nèi)長時間穩(wěn)定存在。環(huán)形RNA主要通過反向剪接機制形成。在反向剪接過程中,下游外顯子的5'剪接供體位點與上游外顯子的3'剪接受體位點以反向的方式連接,從而形成共價閉合的環(huán)狀結(jié)構(gòu)。這一過程與傳統(tǒng)的線性RNA剪接方式截然不同,傳統(tǒng)線性RNA剪接是將相鄰?fù)怙@子按照順序依次連接,而反向剪接則打破了這種常規(guī)的連接順序。反向剪接的發(fā)生并非隨機,受到多種因素的調(diào)控。順式作用元件,如內(nèi)含子互補序列(ICS)在反向剪接中起著關(guān)鍵作用。ICS能夠通過堿基互補配對形成雙鏈結(jié)構(gòu),使上下游外顯子在空間上相互靠近,進而促進反向剪接的發(fā)生。當(dāng)基因轉(zhuǎn)錄過程中,內(nèi)含子區(qū)域轉(zhuǎn)錄出的ICS序列相互配對,就會引導(dǎo)下游外顯子的5'端與上游外顯子的3'端靠近并發(fā)生反向剪接。反式作用因子,如RNA結(jié)合蛋白(RBPs)也參與調(diào)控反向剪接。某些RBPs能夠與特定的RNA序列結(jié)合,改變RNA的二級結(jié)構(gòu)或與剪接體的相互作用,從而影響反向剪接的效率。例如,Quaking蛋白能夠結(jié)合到特定的RNA序列上,促進環(huán)形RNA的形成。環(huán)形RNA的結(jié)構(gòu)特點對其功能和篩選均具有重要影響。其穩(wěn)定性高的特點使得環(huán)形RNA在細胞內(nèi)能夠持續(xù)發(fā)揮作用,參與多種生物學(xué)過程的調(diào)控。一些環(huán)形RNA作為miRNA海綿,通過吸附miRNA來調(diào)控基因表達,由于其穩(wěn)定性好,能夠長時間穩(wěn)定地吸附miRNA,從而對基因表達產(chǎn)生持續(xù)的調(diào)控作用。在篩選方面,環(huán)形RNA的閉環(huán)結(jié)構(gòu)以及獨特的反向剪接位點使其在測序數(shù)據(jù)中具有獨特的特征,這些特征成為了篩選環(huán)形RNA的重要依據(jù)。通過識別測序數(shù)據(jù)中反向剪接位點的特征序列,可以從海量的測序數(shù)據(jù)中準(zhǔn)確地篩選出環(huán)形RNA。。2.1.2與線性RNA的區(qū)別和聯(lián)系環(huán)形RNA與線性RNA在序列、結(jié)構(gòu)和功能上存在明顯差異。在序列方面,雖然環(huán)形RNA與部分線性RNA可能源自相同的基因轉(zhuǎn)錄本,但環(huán)形RNA通過反向剪接形成了獨特的序列結(jié)構(gòu),其序列排列順序與線性RNA不同。從結(jié)構(gòu)上看,線性RNA具有典型的線性結(jié)構(gòu),擁有5'末端帽子和3'末端poly(A)尾巴,而環(huán)形RNA則是閉環(huán)結(jié)構(gòu),沒有明顯的末端。這種結(jié)構(gòu)上的差異導(dǎo)致兩者在穩(wěn)定性上表現(xiàn)出顯著不同,環(huán)形RNA的閉環(huán)結(jié)構(gòu)使其不易被核酸外切酶降解,穩(wěn)定性更高;而線性RNA相對更容易受到核酸外切酶的作用而降解。在功能方面,線性RNA主要作為信使RNA(mRNA)參與蛋白質(zhì)的翻譯過程,將遺傳信息從DNA傳遞到蛋白質(zhì);轉(zhuǎn)運RNA(tRNA)參與氨基酸的轉(zhuǎn)運,在蛋白質(zhì)合成中發(fā)揮關(guān)鍵作用。環(huán)形RNA的功能則更為多樣化,大部分環(huán)形RNA作為非編碼RNA,不直接參與蛋白質(zhì)的翻譯,但在基因表達調(diào)控中發(fā)揮重要作用。它們可以作為miRNA海綿,吸附miRNA,解除miRNA對靶基因的抑制作用,從而調(diào)控基因表達;一些環(huán)形RNA還能夠與蛋白質(zhì)相互作用,調(diào)節(jié)蛋白質(zhì)的功能,或者參與轉(zhuǎn)錄調(diào)控等過程。盡管環(huán)形RNA與線性RNA存在諸多差異,但它們在基因表達調(diào)控中也存在緊密的相互關(guān)系。部分環(huán)形RNA的生成與線性RNA的剪接過程相互競爭。在基因轉(zhuǎn)錄過程中,外顯子既可以按照線性方式進行剪接形成線性RNA,也可以通過反向剪接形成環(huán)形RNA。當(dāng)反向剪接效率較高時,會導(dǎo)致線性RNA的生成減少;反之,線性剪接效率高則會抑制環(huán)形RNA的產(chǎn)生。一些環(huán)形RNA可以通過與線性RNA相互作用來調(diào)控基因表達。某些環(huán)形RNA能夠與線性RNA結(jié)合形成RNA-RNA復(fù)合物,影響線性RNA的穩(wěn)定性、翻譯效率或與其他分子的相互作用,進而對基因表達產(chǎn)生調(diào)控作用。線性RNA和環(huán)形RNA在基因表達調(diào)控網(wǎng)絡(luò)中相互協(xié)作、相互影響,共同維持細胞的正常生理功能。2.1.3在不同物種中的分布與保守性隨著高通量測序技術(shù)的廣泛應(yīng)用,大量研究對環(huán)形RNA在不同物種中的分布情況進行了深入探究。在哺乳動物中,環(huán)形RNA廣泛存在于各種組織和細胞中。例如,在人類細胞中,通過對多種組織的轉(zhuǎn)錄組測序分析發(fā)現(xiàn),環(huán)形RNA的表達具有組織特異性,不同組織中環(huán)形RNA的表達譜存在明顯差異。在腦組織中,環(huán)形RNA的表達豐富,且一些環(huán)形RNA在神經(jīng)發(fā)育和神經(jīng)功能中發(fā)揮重要作用;在腫瘤組織中,也檢測到大量特異性表達的環(huán)形RNA,這些環(huán)形RNA與腫瘤的發(fā)生、發(fā)展密切相關(guān)。在植物中,環(huán)形RNA同樣廣泛分布。對擬南芥、水稻等植物的研究表明,環(huán)形RNA參與了植物的生長發(fā)育、逆境響應(yīng)等生物學(xué)過程。在擬南芥中,一些環(huán)形RNA在干旱、高溫等逆境條件下表達量發(fā)生顯著變化,可能參與了植物對逆境的適應(yīng)機制。在果蠅等昆蟲中,環(huán)形RNA也被發(fā)現(xiàn)參與了發(fā)育調(diào)控等重要生物學(xué)過程。環(huán)形RNA在不同物種中具有一定的保守性。通過對多個物種的環(huán)形RNA序列進行比對分析發(fā)現(xiàn),部分環(huán)形RNA在進化過程中具有保守的序列和結(jié)構(gòu)特征。例如,一些在哺乳動物中保守的環(huán)形RNA,其反向剪接位點和序列在不同物種間具有較高的相似性。這種保守性暗示了環(huán)形RNA在進化過程中可能承擔(dān)著重要的生物學(xué)功能,并且這些功能在不同物種中得到了保留和傳承。保守的環(huán)形RNA可能參與了一些基本的生物學(xué)過程,如細胞增殖、分化等,這些過程對于維持生物體的正常生理功能至關(guān)重要。環(huán)形RNA的保守性也為研究其功能提供了重要線索。通過對保守環(huán)形RNA的研究,可以揭示其在不同物種中的共性功能,為深入理解環(huán)形RNA的生物學(xué)作用機制提供有力支持。同時,對于保守性較低的環(huán)形RNA,其可能在特定物種或特定生物學(xué)過程中發(fā)揮獨特的功能,進一步研究這些環(huán)形RNA有助于拓展對物種特異性生物學(xué)現(xiàn)象的認識。2.2現(xiàn)有環(huán)形RNA篩選技術(shù)概述2.2.1基于高通量測序的篩選方法高通量測序技術(shù),也被稱為下一代測序(NextGenerationSequencing,NGS)技術(shù),憑借其能同時對數(shù)百萬個DNA或RNA分子進行測序的強大能力,為環(huán)形RNA的篩選和研究開辟了全新的道路。在環(huán)形RNA篩選中,高通量測序技術(shù)主要應(yīng)用于轉(zhuǎn)錄組測序(RNA-seq)。通過對細胞或組織中的全部RNA進行測序,可以獲得大量的RNA序列信息,其中包含了環(huán)形RNA的序列。在基于高通量測序的環(huán)形RNA篩選過程中,數(shù)據(jù)處理流程至關(guān)重要。測序得到的原始數(shù)據(jù)通常是大量的短序列reads,首先需要進行質(zhì)量控制,去除低質(zhì)量的reads以及接頭序列等雜質(zhì),以保證數(shù)據(jù)的可靠性。隨后,將經(jīng)過質(zhì)量控制的數(shù)據(jù)與參考基因組進行比對。由于環(huán)形RNA具有特殊的反向剪接位點,常規(guī)的線性比對算法無法準(zhǔn)確識別,因此需要使用專門的生物信息學(xué)工具和算法來識別反向剪接位點,從而鑒定出環(huán)形RNA。例如,CIRI(CircularRNAIdentifier)是一種常用的環(huán)形RNA識別工具,它通過對測序reads進行獨特的拆分和比對策略,能夠有效地識別出環(huán)形RNA的反向剪接位點。此外,還有一些其他工具如find_circ、CIRCexplorer等也在環(huán)形RNA識別中發(fā)揮著重要作用。在識別出環(huán)形RNA后,還需要對其進行定量分析,以確定不同樣本中環(huán)形RNA的表達水平。常用的定量方法包括計算比對到環(huán)形RNA反向剪接位點的reads數(shù),并進行歸一化處理,如使用每百萬映射reads中來自某環(huán)形RNA的反向剪接reads數(shù)(readspermillionmappedreads,RPM)等指標(biāo)來衡量環(huán)形RNA的表達豐度。盡管高通量測序技術(shù)在環(huán)形RNA篩選中取得了顯著成果,但也存在一些問題。測序成本仍然較高,這在一定程度上限制了大規(guī)模樣本的研究。對于低表達水平的環(huán)形RNA,由于測序深度的限制,可能無法被準(zhǔn)確檢測到,容易造成漏檢。此外,從海量的測序數(shù)據(jù)中準(zhǔn)確識別和分析環(huán)形RNA,對生物信息學(xué)算法和計算資源提出了較高要求。目前的算法在識別環(huán)形RNA時,仍然存在一定的假陽性和假陰性率,如何進一步優(yōu)化算法,提高環(huán)形RNA識別的準(zhǔn)確性和可靠性,是亟待解決的問題。2.2.2CRISPR-Cas13技術(shù)在篩選中的應(yīng)用CRISPR-Cas13系統(tǒng)是一種新型的基因編輯技術(shù),其作用原理基于CRISPR(規(guī)律成簇間隔短回文重復(fù)序列)和Cas13蛋白。Cas13蛋白是一類RNA靶向的核酸酶,能夠在向?qū)NA(gRNA)的引導(dǎo)下,特異性地識別并切割靶標(biāo)RNA。在環(huán)形RNA篩選中,CRISPR-Cas13技術(shù)展現(xiàn)出獨特的優(yōu)勢。以陳玲玲研究組等建立的CRISPR-RfxCas13d/BSJ-gRNA系統(tǒng)為例,該系統(tǒng)利用RfxCas13d蛋白和靶向環(huán)形RNA反向剪接位點(BSJ)的gRNA,實現(xiàn)對環(huán)形RNA的特異性敲低。其原理是,gRNA與環(huán)形RNA的反向剪接位點互補配對,引導(dǎo)RfxCas13d蛋白結(jié)合到環(huán)形RNA上,然后RfxCas13d蛋白發(fā)揮核酸酶活性,對環(huán)形RNA進行切割,從而降低環(huán)形RNA的表達水平。通過這種方式,可以有效地將環(huán)形RNA與同源線性RNA區(qū)分開來,研究環(huán)形RNA的功能。CRISPR-Cas13技術(shù)在環(huán)形RNA篩選中具有諸多優(yōu)勢。該技術(shù)具有高度的特異性,能夠精確地靶向環(huán)形RNA的反向剪接位點,而不影響其同源線性RNA的表達,這為研究環(huán)形RNA的獨立功能提供了有力的工具。相較于傳統(tǒng)的RNA干擾等技術(shù),CRISPR-Cas13技術(shù)的敲低效率更高,能夠更有效地降低環(huán)形RNA的表達水平,從而更準(zhǔn)確地研究其功能。CRISPR-Cas13技術(shù)還可以用于構(gòu)建gRNA文庫,實現(xiàn)對環(huán)形RNA的大規(guī)模功能篩選,有助于快速發(fā)現(xiàn)具有重要功能的環(huán)形RNA。然而,CRISPR-Cas13技術(shù)在應(yīng)用中也存在一定的局限性。gRNA的設(shè)計和篩選較為復(fù)雜,需要考慮gRNA與靶標(biāo)序列的互補性、特異性以及脫靶效應(yīng)等因素,設(shè)計不當(dāng)可能導(dǎo)致敲低效率低下或產(chǎn)生脫靶效應(yīng)。Cas13蛋白在細胞內(nèi)的表達和活性可能受到多種因素的影響,如細胞類型、轉(zhuǎn)染效率等,這可能會影響技術(shù)的應(yīng)用效果。CRISPR-Cas13技術(shù)目前主要應(yīng)用于細胞水平的研究,在體內(nèi)動物模型中的應(yīng)用還存在一定的挑戰(zhàn),如何將該技術(shù)有效地應(yīng)用于體內(nèi)研究,是未來需要解決的問題。2.2.3其他篩選技術(shù)的簡要介紹除了基于高通量測序和CRISPR-Cas13技術(shù)的篩選方法外,還有一些其他技術(shù)在環(huán)形RNA研究中也有應(yīng)用,其中RNA干擾(RNAinterference,RNAi)技術(shù)是較為常用的一種。RNAi技術(shù)的原理是利用雙鏈RNA(dsRNA)介導(dǎo)的同源mRNA降解,從而實現(xiàn)對特定基因表達的抑制。在環(huán)形RNA篩選中,通過設(shè)計針對環(huán)形RNA特異性序列(如反向剪接位點附近序列)的小干擾RNA(siRNA)或短發(fā)夾RNA(shRNA),可以實現(xiàn)對環(huán)形RNA表達的敲低。RNAi技術(shù)的優(yōu)點是操作相對簡單,成本較低,在一些實驗室中易于實施。由于環(huán)形RNA與同源線性RNA序列高度相似,很難設(shè)計出只針對環(huán)形RNA而不影響線性RNA的RNAi分子,這限制了其在環(huán)形RNA功能研究中的應(yīng)用。免疫沉淀技術(shù)也可用于環(huán)形RNA的篩選。該技術(shù)利用特異性抗體與目標(biāo)RNA結(jié)合,然后通過免疫沉淀的方法將與抗體結(jié)合的RNA復(fù)合物沉淀下來,從而富集目標(biāo)RNA。對于環(huán)形RNA,可以使用針對環(huán)形RNA結(jié)合蛋白的抗體,通過免疫沉淀來富集與這些蛋白結(jié)合的環(huán)形RNA。免疫沉淀技術(shù)能夠獲得與特定蛋白相互作用的環(huán)形RNA,有助于研究環(huán)形RNA在蛋白質(zhì)-RNA相互作用網(wǎng)絡(luò)中的功能。該技術(shù)依賴于高質(zhì)量的抗體,抗體的特異性和親和力會影響實驗結(jié)果,且實驗過程較為繁瑣,需要優(yōu)化多個實驗條件。不同篩選技術(shù)在環(huán)形RNA研究中各有優(yōu)劣。高通量測序技術(shù)能夠全面地檢測環(huán)形RNA,但存在成本高、數(shù)據(jù)分析復(fù)雜等問題;CRISPR-Cas13技術(shù)特異性強、敲低效率高,但gRNA設(shè)計和體內(nèi)應(yīng)用存在挑戰(zhàn);RNAi技術(shù)操作簡單、成本低,但難以區(qū)分環(huán)形RNA和線性RNA;免疫沉淀技術(shù)有助于研究環(huán)形RNA的相互作用,但依賴抗體且實驗繁瑣。在實際研究中,需要根據(jù)研究目的和實驗條件,選擇合適的篩選技術(shù),或者結(jié)合多種技術(shù),以更有效地篩選和研究環(huán)形RNA。2.3計算生物學(xué)方法在篩選系統(tǒng)中的應(yīng)用2.3.1篩選算法的設(shè)計與優(yōu)化針對環(huán)形RNA篩選,設(shè)計高效準(zhǔn)確的算法是關(guān)鍵環(huán)節(jié)。在識別反向剪接位點的算法設(shè)計中,通常會利用環(huán)形RNA獨特的反向剪接特征。例如,基于剪接位點的序列保守性和側(cè)翼序列特征來構(gòu)建算法模型。通過對大量已知環(huán)形RNA的反向剪接位點進行分析,提取其共有序列模式,如經(jīng)典的GU-AG剪接信號在反向剪接中的特定排列方式。結(jié)合機器學(xué)習(xí)算法,如支持向量機(SVM),將剪接位點的序列特征、側(cè)翼序列的長度、堿基組成等作為特征向量輸入模型進行訓(xùn)練,構(gòu)建出能夠準(zhǔn)確識別反向剪接位點的分類器。為了進一步提高算法的準(zhǔn)確性,還可以引入位置權(quán)重矩陣(PWM)來描述剪接位點的序列保守性。PWM通過統(tǒng)計每個位置上不同堿基出現(xiàn)的頻率,為每個堿基分配一個權(quán)重,從而更精確地衡量序列與已知剪接位點模式的匹配程度。在優(yōu)化算法時,考慮多方面因素以提高篩選準(zhǔn)確性。在數(shù)據(jù)預(yù)處理階段,采用更嚴(yán)格的質(zhì)量控制策略,去除低質(zhì)量的測序數(shù)據(jù)和可能的測序錯誤,減少噪聲對算法的干擾。對于算法中的參數(shù)進行優(yōu)化調(diào)整,通過交叉驗證等方法確定最優(yōu)參數(shù)組合,以提高算法的性能。利用深度學(xué)習(xí)算法對環(huán)形RNA篩選算法進行優(yōu)化也是當(dāng)前的研究熱點。例如,采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)模型,其能夠自動學(xué)習(xí)數(shù)據(jù)中的復(fù)雜特征,對環(huán)形RNA的測序數(shù)據(jù)進行特征提取和分類。CNN通過卷積層、池化層和全連接層的組合,能夠有效地捕捉到反向剪接位點周圍的局部特征和全局特征,從而提高識別的準(zhǔn)確性。與傳統(tǒng)算法相比,深度學(xué)習(xí)算法在處理大規(guī)模數(shù)據(jù)時具有更強的適應(yīng)性和泛化能力,能夠更好地應(yīng)對環(huán)形RNA篩選中數(shù)據(jù)多樣性和復(fù)雜性的挑戰(zhàn)。2.3.2數(shù)據(jù)分析與挖掘策略在環(huán)形RNA篩選過程中,會產(chǎn)生大量的測序數(shù)據(jù),對這些數(shù)據(jù)進行有效的分析和挖掘至關(guān)重要。差異表達分析是常用的數(shù)據(jù)分析方法之一,通過比較不同樣本(如正常組織與疾病組織、不同發(fā)育階段的組織等)中環(huán)形RNA的表達水平,篩選出表達差異顯著的環(huán)形RNA。在差異表達分析中,通常會使用統(tǒng)計檢驗方法,如DESeq2軟件包,該軟件基于負二項分布模型,能夠?qū)y序數(shù)據(jù)中的計數(shù)進行標(biāo)準(zhǔn)化處理,并準(zhǔn)確計算出不同樣本間環(huán)形RNA表達的差異倍數(shù)和顯著性水平。通過設(shè)定適當(dāng)?shù)拈撝?,如差異倍?shù)大于2且調(diào)整后的P值小于0.05,篩選出在不同樣本中具有顯著表達差異的環(huán)形RNA,這些環(huán)形RNA可能與特定的生物學(xué)過程或疾病狀態(tài)相關(guān)。功能富集分析也是挖掘環(huán)形RNA潛在功能的重要策略。由于大部分環(huán)形RNA通過與miRNA相互作用來調(diào)控基因表達,因此可以利用生物信息學(xué)工具預(yù)測環(huán)形RNA可能結(jié)合的miRNA,并進一步預(yù)測這些miRNA的靶基因。通過對靶基因進行功能富集分析,如基因本體(GO)富集分析和京都基因與基因組百科全書(KEGG)通路富集分析,可以了解環(huán)形RNA可能參與的生物學(xué)過程和信號通路。在GO富集分析中,將靶基因映射到GO數(shù)據(jù)庫中的生物學(xué)過程、分子功能和細胞組成等類別,計算每個類別中基因的富集程度,從而確定環(huán)形RNA可能參與的生物學(xué)過程。在KEGG通路富集分析中,將靶基因映射到KEGG數(shù)據(jù)庫中的各種信號通路,分析哪些通路在靶基因中顯著富集,揭示環(huán)形RNA可能參與的信號傳導(dǎo)和代謝途徑。還可以結(jié)合蛋白質(zhì)-蛋白質(zhì)相互作用網(wǎng)絡(luò)分析,研究環(huán)形RNA通過調(diào)控miRNA和靶基因,在蛋白質(zhì)相互作用網(wǎng)絡(luò)中發(fā)揮的作用,進一步深入挖掘環(huán)形RNA的生物學(xué)功能。2.3.3預(yù)測模型的構(gòu)建與驗證構(gòu)建預(yù)測環(huán)形RNA功能和表達的模型,有助于深入理解環(huán)形RNA的生物學(xué)特性和作用機制。在構(gòu)建預(yù)測模型時,可以整合多種數(shù)據(jù)信息,如環(huán)形RNA的序列特征、表達譜數(shù)據(jù)、與miRNA的相互作用信息以及蛋白質(zhì)-RNA相互作用數(shù)據(jù)等。利用機器學(xué)習(xí)算法,如隨機森林(RandomForest)算法,將這些數(shù)據(jù)作為特征輸入模型進行訓(xùn)練。隨機森林通過構(gòu)建多個決策樹,并對決策樹的預(yù)測結(jié)果進行綜合投票,能夠有效地處理高維度數(shù)據(jù)和減少過擬合問題。在訓(xùn)練過程中,模型會學(xué)習(xí)到不同特征與環(huán)形RNA功能和表達之間的關(guān)系,從而建立起預(yù)測模型。為了驗證預(yù)測模型的準(zhǔn)確性和可靠性,需要使用實驗數(shù)據(jù)進行驗證。收集已有的實驗數(shù)據(jù),包括環(huán)形RNA的功能驗證實驗數(shù)據(jù)和表達定量實驗數(shù)據(jù),將模型的預(yù)測結(jié)果與實驗數(shù)據(jù)進行對比分析。可以采用多種評估指標(biāo),如準(zhǔn)確率(Accuracy)、召回率(Recall)、F1值等,來評估模型的性能。如果模型的預(yù)測結(jié)果與實驗數(shù)據(jù)具有較高的一致性,即準(zhǔn)確率、召回率和F1值等指標(biāo)較高,說明模型具有較好的準(zhǔn)確性和可靠性;反之,則需要對模型進行進一步的優(yōu)化和改進。還可以通過獨立的實驗驗證,如對新的樣本進行環(huán)形RNA功能和表達的檢測,并用模型進行預(yù)測,將預(yù)測結(jié)果與實際實驗結(jié)果進行對比,進一步驗證模型的泛化能力和可靠性。通過不斷地優(yōu)化模型和驗證實驗,提高預(yù)測模型的性能,為環(huán)形RNA的功能研究和應(yīng)用提供有力的支持。三、環(huán)形RNA篩選系統(tǒng)案例分析3.1案例一:基于CRISPR-Cas13技術(shù)的環(huán)形RNA功能篩選3.1.1實驗設(shè)計與實施陳玲玲、楊力、李勁松團隊合作開展了一項具有開創(chuàng)性的研究,旨在開發(fā)一種基于CRISPR-Cas13技術(shù)的篩選工具,以快速篩選和發(fā)現(xiàn)功能性環(huán)形RNA。該研究的實驗設(shè)計緊密圍繞CRISPR-Cas13系統(tǒng)的作用機制,通過巧妙的gRNA文庫設(shè)計和細胞系構(gòu)建,實現(xiàn)了對環(huán)形RNA的特異性敲除和功能篩選。在gRNA文庫設(shè)計方面,研究團隊聚焦于環(huán)形RNA的反向剪接位點(BSJ)。他們精心挑選并合成了靶向人類高表達circRNA反向剪接位點序列的寡核苷酸片段,這些片段經(jīng)過一系列的酶切、連接等操作,被構(gòu)建到慢病毒載體中,從而形成了靶向環(huán)形RNA反向剪接位點的gRNA文庫。該文庫涵蓋了眾多環(huán)形RNA的反向剪接位點,為后續(xù)的功能篩選提供了豐富的靶點資源。為了實現(xiàn)對環(huán)形RNA的有效敲除,研究團隊構(gòu)建了RfxCas13d穩(wěn)定表達細胞系。他們將編碼RfxCas13d蛋白的基因?qū)爰毎?,并通過篩選和鑒定,獲得了能夠穩(wěn)定表達RfxCas13d蛋白的細胞系。在構(gòu)建過程中,研究人員充分考慮了細胞系的穩(wěn)定性、表達效率以及對后續(xù)實驗的影響等因素,通過優(yōu)化轉(zhuǎn)染條件、篩選合適的細胞株等措施,確保了RfxCas13d穩(wěn)定表達細胞系的高質(zhì)量。在篩選實驗中,研究團隊將構(gòu)建好的gRNA文庫通過慢病毒感染的方式導(dǎo)入RfxCas13d穩(wěn)定表達細胞系中。gRNA文庫中的每個gRNA都能夠特異性地引導(dǎo)RfxCas13d蛋白結(jié)合到相應(yīng)環(huán)形RNA的反向剪接位點上,隨后RfxCas13d蛋白發(fā)揮核酸酶活性,對環(huán)形RNA進行切割,從而實現(xiàn)對環(huán)形RNA的特異性敲除。通過這種方式,研究團隊在細胞水平上對環(huán)形RNA進行了大規(guī)模的功能篩選,觀察敲除環(huán)形RNA后細胞的表型變化,從而篩選出對細胞生長、發(fā)育等過程具有重要作用的功能性環(huán)形RNA。3.1.2篩選結(jié)果與數(shù)據(jù)分析通過基于CRISPR-Cas13技術(shù)的篩選實驗,研究團隊成功獲得了大量與細胞增殖相關(guān)的環(huán)形RNA分子數(shù)據(jù)。在數(shù)據(jù)分析階段,研究人員首先對篩選得到的環(huán)形RNA進行了表達水平的定量分析。他們通過計算比對到環(huán)形RNA反向剪接位點的reads數(shù),并進行歸一化處理,精確地確定了每個環(huán)形RNA在不同樣本中的表達水平。通過比較實驗組(敲除環(huán)形RNA的細胞)和對照組(未敲除環(huán)形RNA的細胞)中環(huán)形RNA的表達水平,篩選出了表達差異顯著的環(huán)形RNA。進一步對這些表達差異顯著的環(huán)形RNA進行功能注釋和富集分析。利用生物信息學(xué)工具,研究人員預(yù)測了環(huán)形RNA可能結(jié)合的miRNA,并進一步預(yù)測了這些miRNA的靶基因。通過對靶基因進行基因本體(GO)富集分析和京都基因與基因組百科全書(KEGG)通路富集分析,發(fā)現(xiàn)一些環(huán)形RNA通過調(diào)控miRNA和靶基因,參與了細胞周期調(diào)控、DNA復(fù)制、細胞增殖相關(guān)信號通路等重要生物學(xué)過程。某些環(huán)形RNA通過吸附特定的miRNA,解除了miRNA對靶基因的抑制作用,從而促進了細胞周期相關(guān)基因的表達,進而影響細胞增殖。研究人員還對環(huán)形RNA與細胞增殖之間的關(guān)系進行了深入分析。通過構(gòu)建細胞增殖模型,將篩選得到的環(huán)形RNA分別過表達或敲低,觀察細胞增殖能力的變化。實驗結(jié)果表明,部分環(huán)形RNA的過表達能夠顯著促進細胞增殖,而敲低這些環(huán)形RNA則會抑制細胞增殖;相反,另一些環(huán)形RNA的過表達會抑制細胞增殖,敲低后細胞增殖能力增強。這些結(jié)果表明,環(huán)形RNA在細胞增殖過程中發(fā)揮著重要的調(diào)控作用,且不同的環(huán)形RNA對細胞增殖的調(diào)控作用具有差異性。3.1.3對環(huán)形RNA功能研究的貢獻該案例在環(huán)形RNA功能研究領(lǐng)域具有重要的貢獻,從多個方面推動了該領(lǐng)域的發(fā)展。在發(fā)現(xiàn)環(huán)形RNA新功能方面,研究團隊通過大規(guī)模的功能篩選,鑒定出了一組對細胞生長、胚胎發(fā)育等有重要作用的功能性circRNA。這些新發(fā)現(xiàn)的環(huán)形RNA功能,為深入理解細胞生理過程和疾病發(fā)生機制提供了新的視角。例如,發(fā)現(xiàn)某些環(huán)形RNA在胚胎發(fā)育過程中特異性表達,并且對胚胎的正常發(fā)育至關(guān)重要,這揭示了環(huán)形RNA在發(fā)育生物學(xué)中的潛在作用。在建立研究范式方面,該研究為環(huán)形RNA功能研究提供了一種高效、可靠的方法?;贑RISPR-Cas13技術(shù)的篩選系統(tǒng),能夠特異性地敲除環(huán)形RNA,而不影響其同源線性RNA的表達,有效地解決了環(huán)形RNA功能研究中難以將其與同源線性RNA功能區(qū)分開來的難題。這種方法為后續(xù)的環(huán)形RNA功能研究提供了重要的技術(shù)參考,使得研究人員能夠更加準(zhǔn)確地研究環(huán)形RNA的功能和作用機制。該案例的研究成果還為環(huán)形RNA在疾病診斷和治療中的應(yīng)用提供了理論基礎(chǔ)。通過揭示環(huán)形RNA與細胞增殖、疾病發(fā)生等過程的關(guān)系,為開發(fā)基于環(huán)形RNA的疾病診斷標(biāo)志物和治療靶點提供了可能。某些與腫瘤細胞增殖密切相關(guān)的環(huán)形RNA,有可能成為腫瘤診斷的新型標(biāo)志物,或者作為腫瘤治療的潛在靶點,為腫瘤的精準(zhǔn)診斷和治療開辟新的途徑。3.2案例二:基于計算分析的環(huán)形RNA新分子鑒定3.2.1計算分析流程的應(yīng)用楊力團隊在環(huán)形RNA研究中開展了一項極具創(chuàng)新性的工作,通過精妙的計算分析流程,成功鑒定出一類包含特異外顯子的環(huán)形RNA新分子。該團隊首先從RNA測序數(shù)據(jù)入手,運用先進的生物信息學(xué)工具和算法對數(shù)據(jù)進行深度挖掘。他們利用CIRI、CIRCexplorer等環(huán)形RNA識別工具,從海量的測序數(shù)據(jù)中精準(zhǔn)地識別出環(huán)形RNA的反向剪接位點。通過嚴(yán)格的篩選標(biāo)準(zhǔn),去除可能的假陽性結(jié)果,確保鑒定出的環(huán)形RNA具有較高的可信度。在鑒定過程中,團隊著重關(guān)注環(huán)形RNA的序列特征,尤其是外顯子組成。他們發(fā)現(xiàn),一些環(huán)形RNA包含了在對應(yīng)線性RNA中并不存在的特異外顯子。為了深入分析這些特異外顯子的功能和作用,團隊利用多種生物信息學(xué)數(shù)據(jù)庫和分析工具,對特異外顯子的序列進行了全面的分析。通過與已知的基因序列進行比對,預(yù)測特異外顯子可能編碼的蛋白質(zhì)結(jié)構(gòu)域或功能模塊;運用功能富集分析工具,探究特異外顯子可能參與的生物學(xué)過程和信號通路。為了驗證計算分析結(jié)果的準(zhǔn)確性,團隊還進行了多方面的驗證工作。他們將鑒定出的環(huán)形RNA與已有的數(shù)據(jù)庫進行比對,確保新發(fā)現(xiàn)的環(huán)形RNA確實是未曾報道過的新分子。通過實驗驗證,如RT-qPCR實驗,對計算分析預(yù)測的環(huán)形RNA表達水平進行檢測,進一步證實了計算分析結(jié)果的可靠性。3.2.2新分子的驗證與功能研究為了驗證新分子的存在,研究團隊進行了嚴(yán)謹?shù)膶嶒烌炞C。首先,采用逆轉(zhuǎn)錄-定量聚合酶鏈反應(yīng)(RT-qPCR)技術(shù),針對預(yù)測得到的環(huán)形RNA新分子設(shè)計特異性引物,以細胞或組織的RNA為模板進行逆轉(zhuǎn)錄和擴增。通過與內(nèi)參基因的比較,準(zhǔn)確地檢測出環(huán)形RNA新分子的表達水平,從分子層面證實了其存在。為了進一步確認環(huán)形RNA的結(jié)構(gòu)特征,團隊采用了核酸酶消化實驗。用RNaseR處理RNA樣本,RNaseR是一種能夠特異性降解線性RNA的核酸酶,而環(huán)形RNA由于其閉環(huán)結(jié)構(gòu)對RNaseR具有抗性。經(jīng)過RNaseR處理后,通過凝膠電泳或測序分析,發(fā)現(xiàn)預(yù)測的環(huán)形RNA新分子依然存在,而線性RNA被降解,這進一步證明了其環(huán)形結(jié)構(gòu)。在功能研究方面,研究團隊運用細胞生物學(xué)實驗方法,探究新分子對細胞生長等功能的影響。通過構(gòu)建過表達和敲低細胞模型,將環(huán)形RNA新分子的表達水平進行上調(diào)或下調(diào)。在過表達實驗中,將編碼環(huán)形RNA新分子的基因構(gòu)建到表達載體中,通過轉(zhuǎn)染等方法導(dǎo)入細胞,使細胞中環(huán)形RNA新分子的表達水平顯著升高。在敲低實驗中,利用RNA干擾技術(shù),設(shè)計針對環(huán)形RNA新分子的小干擾RNA(siRNA)或短發(fā)夾RNA(shRNA),轉(zhuǎn)染細胞后降低環(huán)形RNA新分子的表達。通過檢測細胞增殖、凋亡、遷移等指標(biāo),分析環(huán)形RNA新分子表達水平變化對細胞功能的影響。實驗結(jié)果表明,過表達環(huán)形RNA新分子能夠顯著促進細胞增殖,而敲低該分子則會抑制細胞增殖,說明該環(huán)形RNA新分子在細胞生長過程中發(fā)揮著重要的調(diào)控作用。3.2.3研究成果的創(chuàng)新性與意義該案例在環(huán)形RNA研究領(lǐng)域具有顯著的創(chuàng)新性和重要意義。在發(fā)現(xiàn)新型環(huán)形RNA分子方面,團隊通過獨特的計算分析流程,成功鑒定出包含特異外顯子的環(huán)形RNA新分子,這是對環(huán)形RNA家族的重要補充。以往的研究雖然發(fā)現(xiàn)了大量的環(huán)形RNA,但對于包含特異外顯子的環(huán)形RNA關(guān)注較少,該研究拓展了人們對環(huán)形RNA多樣性的認識。在拓展對環(huán)形RNA認識方面,研究成果為深入理解環(huán)形RNA的功能和作用機制提供了新的視角。特異外顯子的發(fā)現(xiàn),使得人們對環(huán)形RNA的功能有了新的思考方向。這些特異外顯子可能賦予環(huán)形RNA獨特的功能,如參與特定的信號傳導(dǎo)通路、調(diào)控基因表達等。通過對新分子功能的研究,揭示了環(huán)形RNA在細胞生長調(diào)控中的重要作用,進一步豐富了人們對環(huán)形RNA生物學(xué)功能的認識。該研究成果還為后續(xù)的環(huán)形RNA研究提供了重要的方法和思路。其采用的計算分析與實驗驗證相結(jié)合的研究策略,為環(huán)形RNA的鑒定和功能研究提供了可借鑒的模式,有助于推動環(huán)形RNA研究領(lǐng)域的進一步發(fā)展。四、堿基編輯器開發(fā)的計算生物學(xué)策略4.1堿基編輯器的作用機制與分類4.1.1作用機制解析堿基編輯器作為一類新型基因編輯工具,其核心優(yōu)勢在于能夠在不引發(fā)DNA雙鏈斷裂的前提下實現(xiàn)單堿基替換,這一特性與傳統(tǒng)基因編輯技術(shù)有著顯著區(qū)別。傳統(tǒng)的基因編輯技術(shù),如基于CRISPR-Cas9系統(tǒng)的基因編輯,通常依賴于Cas9核酸酶對DNA雙鏈進行切割,產(chǎn)生雙鏈斷裂(DSB),然后細胞通過非同源末端連接(NHEJ)或同源重組(HR)等修復(fù)機制對斷裂的DNA進行修復(fù)。在這個過程中,NHEJ修復(fù)往往會引入隨機的插入或缺失突變,HR修復(fù)雖然能夠?qū)崿F(xiàn)精確的基因編輯,但需要提供外源的同源模板,且效率較低。而堿基編輯器則另辟蹊徑,巧妙地利用了脫氨酶的作用,直接對DNA或RNA上的堿基進行化學(xué)修飾,從而實現(xiàn)單堿基的精準(zhǔn)替換。以胞嘧啶堿基編輯器(CBE)為例,其作用機制主要涉及胞嘧啶脫氨酶、失活的Cas9(dCas9)或Cas9切口酶(nCas9)以及尿嘧啶糖基化酶抑制劑(UGI)等關(guān)鍵組件。當(dāng)CBE被導(dǎo)入細胞后,dCas9或nCas9在向?qū)NA(gRNA)的引導(dǎo)下,精準(zhǔn)地識別并結(jié)合到目標(biāo)DNA序列上。gRNA與目標(biāo)DNA序列通過堿基互補配對的方式相互作用,確保了CBE能夠特異性地靶向目標(biāo)位點。此時,胞嘧啶脫氨酶發(fā)揮關(guān)鍵作用,它能夠催化目標(biāo)DNA鏈上的胞嘧啶(C)發(fā)生脫氨反應(yīng),將其轉(zhuǎn)化為尿嘧啶(U)。在DNA復(fù)制過程中,DNA聚合酶會將U識別為胸腺嘧啶(T),從而實現(xiàn)C到T的堿基替換。為了防止細胞內(nèi)的尿嘧啶DNA糖基化酶(UNG)將U切除,導(dǎo)致堿基編輯失敗,CBE中通常會融合UGI,UGI能夠抑制UNG的活性,穩(wěn)定U的存在,保證堿基編輯的順利進行。腺嘌呤堿基編輯器(ABE)的作用機制與之類似,但涉及的關(guān)鍵酶和堿基轉(zhuǎn)換類型有所不同。ABE主要由腺嘌呤脫氨酶、dCas9或nCas9以及其他輔助組件構(gòu)成。在gRNA的引導(dǎo)下,dCas9或nCas9結(jié)合到目標(biāo)DNA位點后,腺嘌呤脫氨酶將目標(biāo)DNA鏈上的腺嘌呤(A)脫氨轉(zhuǎn)化為肌苷(I)。由于I在DNA復(fù)制過程中會被DNA聚合酶識別為鳥嘌呤(G),從而實現(xiàn)A到G的堿基替換。ABE在作用過程中不需要像CBE那樣依賴UGI來穩(wěn)定中間產(chǎn)物,這是因為細胞內(nèi)沒有能夠高效切除I中次黃嘌呤堿基的酶,使得A脫氨形成的I能夠直接被當(dāng)作G讀取,進而獲得較高純度的A到G編輯。堿基編輯器的作用機制是一個高度精準(zhǔn)且復(fù)雜的過程,涉及多種分子組件的協(xié)同作用。這種不依賴DNA雙鏈斷裂的單堿基替換方式,不僅提高了基因編輯的精準(zhǔn)性,還降低了因雙鏈斷裂引發(fā)的染色體異常等風(fēng)險,為基因治療和基礎(chǔ)生物學(xué)研究提供了一種強大而安全的工具。4.1.2主要類型介紹堿基編輯器主要包括胞嘧啶堿基編輯器(CBE)和腺嘌呤堿基編輯器(ABE),它們在基因編輯領(lǐng)域發(fā)揮著重要作用,且各自具有獨特的編輯功能和特點。胞嘧啶堿基編輯器(CBE)最早由DavidLiu實驗室于2016年開發(fā)成功。CBE能夠在不切斷DNA雙鏈的情況下,將靶位點的胞嘧啶(C)轉(zhuǎn)化為尿嘧啶(U),經(jīng)過DNA復(fù)制或修復(fù)過程,最終實現(xiàn)C到T的堿基替換。CBE主要由胞嘧啶脫氨酶、失活的Cas9(dCas9)或Cas9切口酶(nCas9)以及尿嘧啶糖基化酶抑制劑(UGI)組成。常用的胞嘧啶脫氨酶包括大鼠載脂蛋白BmRNA編輯酶催化多肽1(rAPOBEC1)、人激活誘導(dǎo)的胞嘧啶脫氨酶(hAID)等。這些脫氨酶能夠特異性地對單鏈DNA上的胞嘧啶進行脫氨作用。dCas9或nCas9在gRNA的引導(dǎo)下,將脫氨酶帶到目標(biāo)DNA位點,實現(xiàn)精準(zhǔn)的堿基編輯。UGI則能夠抑制細胞內(nèi)尿嘧啶DNA糖基化酶(UNG)的活性,防止U被切除,從而提高堿基編輯的效率和純度。CBE的優(yōu)勢在于能夠高效地實現(xiàn)C到T的轉(zhuǎn)換,在糾正由C到T突變引起的遺傳疾病方面具有巨大潛力。在一些單基因遺傳病中,如鐮狀細胞貧血,其致病原因是β-珠蛋白基因中的一個C到T突變,CBE有望通過將突變的T轉(zhuǎn)換回C,實現(xiàn)對疾病基因的修復(fù)。CBE的編輯窗口相對較窄,通常在gRNA靶向序列的特定位置范圍內(nèi)起作用,這在一定程度上限制了其應(yīng)用范圍。腺嘌呤堿基編輯器(ABE)是在CBE之后開發(fā)的另一類重要堿基編輯器。2017年,DavidLiu實驗室成功開發(fā)出ABE,它能夠?qū)⑾汆堰剩ˋ)轉(zhuǎn)化為肌苷(I),在DNA復(fù)制過程中,I被識別為鳥嘌呤(G),從而實現(xiàn)A到G的堿基替換。ABE主要由腺嘌呤脫氨酶TadA、dCas9或nCas9組成。TadA最初是在大腸桿菌中發(fā)現(xiàn)的一種天然腺嘌呤脫氨酶,經(jīng)過改造和進化,被應(yīng)用于ABE中。與CBE不同,ABE在作用過程中不需要UGI,因為細胞內(nèi)沒有能夠高效切除I中次黃嘌呤堿基的酶,使得A脫氨形成的I能夠穩(wěn)定存在并被正確識別。ABE的出現(xiàn)極大地拓展了堿基編輯的范圍,對于那些由A到G突變引起的遺傳疾病,ABE提供了潛在的治療手段。在某些遺傳性耳聾疾病中,由于相關(guān)基因的A到G突變導(dǎo)致疾病發(fā)生,ABE可以通過將突變的G轉(zhuǎn)換回A,為疾病治療帶來希望。ABE在靠近原間隔序列鄰近基序(PAM)區(qū)的編輯活性相對較低,且編輯窗口也存在一定的局限性。除了CBE和ABE這兩種主要類型外,科研人員還在不斷開發(fā)新的堿基編輯器,如糖基化酶堿基編輯器(GBE),它能夠?qū)崿F(xiàn)C到G和C到A的堿基顛換,進一步豐富了堿基編輯的類型和功能。不同類型的堿基編輯器在編輯功能和特點上各有優(yōu)劣,為基因編輯研究和應(yīng)用提供了多樣化的選擇。4.1.3現(xiàn)有堿基編輯器的局限性盡管堿基編輯器在基因編輯領(lǐng)域取得了顯著進展,為基因治療和基礎(chǔ)研究提供了強大的工具,但目前的堿基編輯器仍然存在一些局限性,這些問題限制了其更廣泛的應(yīng)用和進一步的發(fā)展。在靶向范圍方面,現(xiàn)有堿基編輯器受到PAM序列的限制。PAM序列是Cas9蛋白識別并結(jié)合DNA的關(guān)鍵元件,不同的Cas9蛋白變體具有不同的PAM序列要求。常用的SpCas9蛋白的PAM序列為NGG,這意味著堿基編輯器只能對緊鄰NGG序列的堿基進行編輯。這極大地限制了堿基編輯器的靶向范圍,許多潛在的編輯位點由于不滿足PAM序列要求而無法被編輯。對于一些重要的基因位點,如果其周圍不存在合適的PAM序列,就無法利用現(xiàn)有的堿基編輯器進行精準(zhǔn)編輯。雖然科研人員開發(fā)了一些具有不同PAM特異性的Cas9變體,如SpCas9-NGA、xCas9等,能夠識別不同的PAM序列,但這些變體在編輯效率和特異性等方面往往存在一定的權(quán)衡,且仍然無法完全覆蓋所有可能的編輯位點。編輯效率也是現(xiàn)有堿基編輯器面臨的一個重要問題。在實際應(yīng)用中,堿基編輯器的編輯效率在不同細胞類型和基因組位點之間存在較大差異。在某些細胞類型中,堿基編輯器的編輯效率可能較低,無法滿足實驗或治療的需求。對于一些難以轉(zhuǎn)染的細胞,如原代細胞,堿基編輯器的導(dǎo)入效率較低,從而導(dǎo)致編輯效率低下。不同基因組位點的染色質(zhì)結(jié)構(gòu)、DNA甲基化狀態(tài)等因素也會影響堿基編輯器的編輯效率。在染色質(zhì)緊密纏繞、甲基化程度高的區(qū)域,堿基編輯器難以接近目標(biāo)DNA序列,編輯效率會顯著降低。脫靶效應(yīng)是堿基編輯器應(yīng)用中最受關(guān)注的問題之一。盡管堿基編輯器相比于傳統(tǒng)的CRISPR-Cas9系統(tǒng)在一定程度上降低了脫靶風(fēng)險,但仍然存在脫靶編輯的可能性。脫靶效應(yīng)可能導(dǎo)致在非目標(biāo)位點發(fā)生不必要的堿基替換,從而引發(fā)潛在的安全風(fēng)險。堿基編輯器可能會在與目標(biāo)序列相似的非目標(biāo)位點進行編輯,這種脫靶編輯可能會影響正?;虻墓δ?,導(dǎo)致細胞生理功能異常,甚至引發(fā)疾病。目前,雖然已經(jīng)開發(fā)了一些預(yù)測脫靶位點的方法和工具,如通過生物信息學(xué)算法預(yù)測潛在的脫靶序列,并利用高通量測序技術(shù)檢測脫靶編輯情況,但這些方法仍然存在一定的局限性,無法完全準(zhǔn)確地預(yù)測和避免脫靶效應(yīng)。4.2計算生物學(xué)在堿基編輯器設(shè)計中的應(yīng)用4.2.1蛋白質(zhì)結(jié)構(gòu)預(yù)測與分析中國科學(xué)院遺傳與發(fā)育生物學(xué)研究所科研團隊在堿基編輯工具開發(fā)領(lǐng)域取得了創(chuàng)新性突破,他們開創(chuàng)性地運用AI輔助的大規(guī)模蛋白結(jié)構(gòu)預(yù)測技術(shù),建立起基于三級結(jié)構(gòu)的蛋白聚類方法,為新型堿基編輯工具的開發(fā)奠定了堅實基礎(chǔ)。在蛋白質(zhì)結(jié)構(gòu)預(yù)測方面,團隊借助先進的蛋白質(zhì)結(jié)構(gòu)預(yù)測模型AlphaFold2,對具有代表性的脫氨功能序列進行了批量三維結(jié)構(gòu)預(yù)測。AlphaFold2是一款基于深度學(xué)習(xí)的蛋白質(zhì)結(jié)構(gòu)預(yù)測工具,它能夠根據(jù)蛋白質(zhì)的氨基酸序列準(zhǔn)確預(yù)測其三維結(jié)構(gòu),為蛋白質(zhì)結(jié)構(gòu)研究提供了強大的技術(shù)支持。通過AlphaFold2,團隊獲得了大量脫氨酶的三維結(jié)構(gòu)信息,這些信息為后續(xù)的結(jié)構(gòu)分析和功能研究提供了關(guān)鍵數(shù)據(jù)。在結(jié)構(gòu)分析過程中,團隊創(chuàng)新性地開展了基于三維結(jié)構(gòu)的蛋白質(zhì)多重比對與聚類。傳統(tǒng)的蛋白質(zhì)聚類方法主要基于氨基酸一級序列的相似性,然而這種方法在面對序列同源性較低且功能多樣的蛋白集合時,往往難以準(zhǔn)確揭示蛋白質(zhì)之間的功能關(guān)系。而團隊采用的基于三維結(jié)構(gòu)的聚類方法,能夠直接從蛋白質(zhì)的三維空間結(jié)構(gòu)出發(fā),更準(zhǔn)確地反映蛋白質(zhì)的功能特征。通過這種方法,團隊成功將潛在的脫氨酶劃分為20個不同的分支。除了已報道的APOBEC/AID胞嘧啶脫氨酶外,還檢測到5個結(jié)構(gòu)、序列全新的具有活性的胞嘧啶脫氨酶分支。對具有類DddA(Double-strandedDNAdeaminasetoxinA-like)脫氨結(jié)構(gòu)域的蛋白進行進一步結(jié)構(gòu)聚類和功能驗證時,發(fā)現(xiàn)該分支不僅包含以前推測的具有雙鏈DNA脫氨活性的蛋白,還包含了大量只具有單鏈DNA脫氨活性的蛋白,這一發(fā)現(xiàn)顛覆了之前對該類蛋白功能的認知?;谏鲜鼍垲惡头治鼋Y(jié)果,團隊全新鑒定到45個單鏈胞嘧啶脫氨酶(Sdd)和13個雙鏈胞嘧啶脫氨酶(Ddd)。這些脫氨酶全部來自原核生物(細菌),與現(xiàn)有APOBEC/AID脫氨酶家族成員(主要來自真核生物,如人、哺乳動物或魚類)截然不同。團隊基于這些新鑒定的脫氨酶開發(fā)了一系列新型堿基編輯系統(tǒng),并在動、植物細胞中進行了測試。結(jié)果表明,新開發(fā)的基于Ddd1和Ddd9脫氨酶的雙鏈堿基編輯系統(tǒng)克服了常規(guī)編輯器對GC序列編輯效率明顯降低的缺陷;基于Sdd7和Sdd3的單鏈堿基編輯系統(tǒng)展現(xiàn)出了非常高的編輯活性,在GC序列同樣具有可觀的堿基編輯能力;基于Sdd6的單鏈堿基編輯系統(tǒng)則展現(xiàn)出了極高的特異性,幾乎檢測不到脫靶事件。通過蛋白理性設(shè)計和功能驗證,團隊開發(fā)了新型的可被單個腺相關(guān)病毒(AAV)包被的Sdd6-CBE堿基編輯器,在小鼠細胞系中獲得高達43.1%的編輯效率,解決了常規(guī)堿基編輯器過大而無法被腺病毒顆包被遞送的難題。針對大豆中長期存在堿基編輯效率低下的問題,該團隊新開發(fā)了Sdd7-CBE系統(tǒng),在154株大豆陽性苗中獲得了34株穩(wěn)定編輯的植株,編輯效率高達22.1%。該研究通過AI輔助的蛋白質(zhì)結(jié)構(gòu)預(yù)測與分析,成功開發(fā)出一系列具有我國自主知識產(chǎn)權(quán)的新型堿基編輯工具,為堿基編輯技術(shù)的發(fā)展提供了新的策略和工具,展現(xiàn)出新型堿基編輯系統(tǒng)在醫(yī)學(xué)和農(nóng)業(yè)方面廣泛的應(yīng)用前景。4.2.2脫氨酶的篩選與改造脫氨酶作為堿基編輯器的核心元件,其性能直接影響著堿基編輯器的編輯效率和特異性。通過計算分析來篩選和改造脫氨酶,是優(yōu)化堿基編輯器性能的關(guān)鍵策略之一。在篩選脫氨酶時,計算分析能夠從大量的潛在脫氨酶中快速、準(zhǔn)確地識別出具有優(yōu)良特性的脫氨酶??蒲腥藛T會利用生物信息學(xué)工具,對不同來源的脫氨酶進行序列分析和結(jié)構(gòu)預(yù)測。通過分析脫氨酶的氨基酸序列,研究人員可以了解其進化關(guān)系、保守結(jié)構(gòu)域等信息。通過蛋白質(zhì)結(jié)構(gòu)預(yù)測工具,如AlphaFold2等,預(yù)測脫氨酶的三維結(jié)構(gòu),進而分析其活性位點、底物結(jié)合口袋等結(jié)構(gòu)特征。這些信息有助于評估脫氨酶的潛在功能和性能。研究人員可以通過計算分析預(yù)測脫氨酶對不同底物的親和力,篩選出對目標(biāo)堿基具有高親和力的脫氨酶。對脫氨酶與DNA或RNA底物結(jié)合時的自由能變化進行計算,自由能變化越小,表明脫氨酶與底物的結(jié)合越穩(wěn)定,越有利于堿基編輯反應(yīng)的進行。通過這種方式,可以篩選出能夠高效催化目標(biāo)堿基編輯的脫氨酶。對篩選出的脫氨酶進行改造,能夠進一步優(yōu)化堿基編輯器的性能?;诮Y(jié)構(gòu)導(dǎo)向的設(shè)計策略是常用的改造方法之一。研究人員會根據(jù)脫氨酶的三維結(jié)構(gòu),分析其活性位點和關(guān)鍵氨基酸殘基。通過定點突變等技術(shù),對關(guān)鍵氨基酸殘基進行替換或修飾,改變脫氨酶的活性和特異性。如果發(fā)現(xiàn)某個氨基酸殘基在底物結(jié)合過程中起到關(guān)鍵作用,通過突變該氨基酸殘基,可能會增強脫氨酶與底物的結(jié)合能力,從而提高編輯效率??梢酝ㄟ^改變脫氨酶的底物特異性來拓展堿基編輯器的編輯范圍。例如,通過對腺嘌呤脫氨酶的改造,使其能夠識別并編輯除腺嘌呤以外的其他堿基,從而實現(xiàn)更多類型的堿基編輯。機器學(xué)習(xí)算法在脫氨酶改造中也發(fā)揮著重要作用。通過構(gòu)建機器學(xué)習(xí)模型,輸入脫氨酶的序列、結(jié)構(gòu)和功能數(shù)據(jù),模型可以學(xué)習(xí)到這些數(shù)據(jù)之間的關(guān)系,并預(yù)測不同突變對脫氨酶性能的影響。研究人員可以利用這些預(yù)測結(jié)果,有針對性地設(shè)計突變方案,減少實驗的盲目性,提高脫氨酶改造的效率。通過機器學(xué)習(xí)算法預(yù)測某個突變可能會提高脫氨酶的熱穩(wěn)定性,研究人員可以在實驗中驗證這一預(yù)測,并進一步優(yōu)化突變方案。脫氨酶的篩選與改造是一個復(fù)雜而精細的過程,計算分析為這一過程提供了強大的技術(shù)支持。通過合理運用計算分析方法,可以篩選出性能優(yōu)良的脫氨酶,并對其進行有效的改造,從而開發(fā)出更高效、更特異的堿基編輯器。4.2.3堿基編輯活性預(yù)測模型構(gòu)建預(yù)測堿基編輯活性的模型對于堿基編輯器的設(shè)計和優(yōu)化具有重要指導(dǎo)意義,能夠幫助研究人員更好地理解堿基編輯過程,提高堿基編輯器的性能。預(yù)測模型的構(gòu)建通常需要整合多種數(shù)據(jù)信息。序列特征是重要的輸入數(shù)據(jù)之一,包括向?qū)NA(gRNA)的序列、目標(biāo)DNA或RNA的序列以及脫氨酶的氨基酸序列等。gRNA的序列決定了堿基編輯器的靶向特異性,其與目標(biāo)DNA或RNA的互補配對情況會影響堿基編輯的效率。目標(biāo)DNA或RNA的序列特征,如堿基組成、二級結(jié)構(gòu)等,也會對堿基編輯活性產(chǎn)生影響。脫氨酶的氨基酸序列則決定了其催化活性和特異性。研究表明,某些特定的堿基序列模體與堿基編輯活性密切相關(guān),通過分析這些序列模體,可以為模型提供重要的特征信息。除了序列特征,表觀遺傳因素也在堿基編輯過程中發(fā)揮著重要作用。DNA甲基化、組蛋白修飾等表觀遺傳修飾會影響染色質(zhì)的結(jié)構(gòu)和可及性,進而影響堿基編輯器與目標(biāo)DNA的結(jié)合以及編輯活性。在構(gòu)建模型時,需要考慮這些表觀遺傳因素的影響。通過實驗測量或生物信息學(xué)預(yù)測獲取目標(biāo)位點的DNA甲基化水平、組蛋白修飾狀態(tài)等信息,并將其作為模型的輸入特征。研究發(fā)現(xiàn),在DNA甲基化程度較高的區(qū)域,堿基編輯器的編輯效率往往較低,這是因為甲基化會阻礙堿基編輯器與DNA的結(jié)合。機器學(xué)習(xí)算法在堿基編輯活性預(yù)測模型中得到了廣泛應(yīng)用。常用的機器學(xué)習(xí)算法包括支持向量機(SVM)、隨機森林(RandomForest)、神經(jīng)網(wǎng)絡(luò)(NeuralNetwork)等。這些算法能夠?qū)φ系男蛄刑卣骱捅碛^遺傳因素等數(shù)據(jù)進行學(xué)習(xí)和分析,建立起輸入數(shù)據(jù)與堿基編輯活性之間的關(guān)系模型。以神經(jīng)網(wǎng)絡(luò)為例,它可以通過構(gòu)建多層神經(jīng)元結(jié)構(gòu),自動學(xué)習(xí)數(shù)據(jù)中的復(fù)雜特征和模式。在訓(xùn)練過程中,神經(jīng)網(wǎng)絡(luò)會不斷調(diào)整神經(jīng)元之間的連接權(quán)重,使得模型能夠準(zhǔn)確地預(yù)測堿基編輯活性。通過大量的訓(xùn)練數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)到不同序列特征和表觀遺傳因素對堿基編輯活性的影響規(guī)律,從而實現(xiàn)對堿基編輯活性的準(zhǔn)確預(yù)測。預(yù)測模型在堿基編輯器設(shè)計和優(yōu)化中具有重要的指導(dǎo)作用。在設(shè)計新的堿基編輯器時,研究人員可以利用預(yù)測模型對不同的gRNA序列、脫氨酶變體等進行篩選和評估。通過模型預(yù)測不同設(shè)計方案下的堿基編輯活性,選擇具有高編輯活性的方案進行實驗驗證,從而提高設(shè)計效率,減少實驗成本。在優(yōu)化堿基編輯器性能時,模型可以幫助研究人員分析影響編輯活性的關(guān)鍵因素,有針對性地進行改進。如果模型預(yù)測某個特定的序列模體或表觀遺傳因素對編輯活性有顯著影響,研究人員可以通過調(diào)整堿基編輯器的結(jié)構(gòu)或改變目標(biāo)位點的表觀遺傳狀態(tài)來優(yōu)化編輯活性。預(yù)測模型還可以用于評估堿基編輯器在不同細胞類型或組織中的編輯活性,為其在實際應(yīng)用中的效果預(yù)測提供參考。4.3堿基編輯器優(yōu)化策略4.3.1提高編輯效率的策略提高堿基編輯器的編輯效率是優(yōu)化堿基編輯器性能的關(guān)鍵目標(biāo)之一,通過改變蛋白質(zhì)結(jié)構(gòu)和優(yōu)化反應(yīng)條件等策略,可以有效提升堿基編輯器的編輯效率。從蛋白質(zhì)結(jié)構(gòu)改造角度來看,對堿基編輯器中融合蛋白的結(jié)構(gòu)進行優(yōu)化是提高編輯效率的重要途徑。以腺嘌呤堿基編輯器(ABE)為例,其核心組件腺嘌呤脫氨酶TadA的結(jié)構(gòu)改造備受關(guān)注。研究表明,通過對TadA的氨基酸殘基進行突變,可以改變其與底物的結(jié)合親和力以及催化活性。在TadA的活性口袋附近引入特定突變,如L145T和N108Q突變,能夠顯著影響其對腺嘌呤的脫氨催化效率。這些突變可能通過改變活性口袋的空間構(gòu)象,使腺嘌呤更容易進入活性中心,從而提高脫氨反應(yīng)的速率,進而提高ABE的編輯效率。在融合蛋白中合理調(diào)整各組件之間的連接方式和空間排列也對編輯效率有重要影響。堿基編輯器通常由脫氨酶、Cas9或其變體以及其他輔助組件構(gòu)成,這些組件之間的連接長度、連接肽的氨基酸組成等因素都會影響融合蛋白的整體結(jié)構(gòu)和功能。通過優(yōu)化連接肽的長度和序列,可以減少組件之間的空間位阻,使各組件能夠更好地協(xié)同工作。在胞嘧啶堿基編輯器(CBE)中,優(yōu)化尿嘧啶糖基化酶抑制劑(UGI)與其他組件的連接方式,能夠增強UGI對尿嘧啶DNA糖基化酶(UNG)的抑制效果,穩(wěn)定堿基編輯過程中的中間產(chǎn)物尿嘧啶,從而提高CBE的編輯效率。優(yōu)化反應(yīng)條件也是提高編輯效率的有效策略。反應(yīng)體系中的溫度、pH值等因素對堿基編輯器的活性有顯著影響。不同的堿基編輯器在不同的溫度和pH條件下可能具有不同的活性表現(xiàn)。某些堿基編輯器在37℃左右能夠發(fā)揮最佳活性,而在溫度過高或過低時,酶的活性可能會受到抑制。pH值的變化也會影響脫氨酶和Cas9等蛋白的結(jié)構(gòu)和功能,進而影響堿基編輯效率。在實驗中,通過精確控制反應(yīng)體系的溫度和pH值,使其處于堿基編輯器的最適反應(yīng)條件下,可以有效提高編輯效率。細胞內(nèi)環(huán)境對堿基編輯器的編輯效率也有重要影響。細胞內(nèi)的代謝產(chǎn)物、離子濃度等因素可能會干擾堿基編輯器的正常功能。一些細胞內(nèi)的代謝產(chǎn)物可能會與堿基編輯器結(jié)合,影響其與底物的相互作用;離子濃度的變化可能會影響蛋白質(zhì)的電荷分布和結(jié)構(gòu)穩(wěn)定性。通過調(diào)節(jié)細胞內(nèi)環(huán)境,如調(diào)整培養(yǎng)基的成分、添加特定的小分子化合物等,為堿基編輯器創(chuàng)造更有利的反應(yīng)環(huán)境,有助于提高編輯效率。4.3.2降低脫靶效應(yīng)的方法脫靶效應(yīng)是堿基編輯器應(yīng)用中面臨的重要問題,降低脫靶效應(yīng)對于提高堿基編輯器的安全性和可靠性至關(guān)重要,可通過合理設(shè)計gRNA和改進蛋白質(zhì)結(jié)構(gòu)等方式來實現(xiàn)。在gRNA設(shè)計方面,精確設(shè)計gRNA的序列和結(jié)構(gòu)是降低脫靶效應(yīng)的關(guān)鍵。gRNA與目標(biāo)DNA序列的互補配對程度直接影響堿基編輯器的靶向特異性。為了提高靶向特異性,需要避免gRNA與非目標(biāo)DNA序列之間的非特異性互補配對。通過生物信息學(xué)工具對全基因組進行掃描,分析gRNA與潛在脫靶位點的互補情況,選擇與脫靶位點互補性低的gRNA序列。設(shè)計gRNA時,應(yīng)考慮其長度、GC含量等因素。合適的gRNA長度能夠保證其與目標(biāo)DNA序列穩(wěn)定結(jié)合,同時減少與非目標(biāo)序列的錯配。一般來說,gRNA的長度在18-22個核苷酸較為合適。GC含量過高或過低都可能影響gRNA的穩(wěn)定性和特異性,通常GC含量在40%-60%之間為宜。開發(fā)具有更高特異性的gRNA變體也是降低脫靶效應(yīng)的有效策略。一些研究通過對gRNA進行化學(xué)修飾或結(jié)構(gòu)改造,提高其與目標(biāo)DNA的結(jié)合特異性。在gRNA的末端添加特殊的化學(xué)修飾基團,能夠增強gRNA與目標(biāo)DNA的結(jié)合穩(wěn)定性,同時減少與脫靶位點的結(jié)合。對gRNA的二級結(jié)構(gòu)進行優(yōu)化,使其形成更穩(wěn)定的結(jié)構(gòu),也有助于提高靶向特異性。通過計算機模擬和實驗驗證,設(shè)計出具有特定二級結(jié)構(gòu)的gRNA,如莖環(huán)結(jié)構(gòu)等,能夠提高其與目標(biāo)DNA的識別能力,降低脫靶效應(yīng)。改進蛋白質(zhì)結(jié)構(gòu)同樣是降低脫靶效應(yīng)的重要途徑。對堿基編輯器中的Cas9蛋白進行改造,提高其對目標(biāo)DNA序列的識別特異性。通過對Cas9蛋白的氨基酸序列進行突變,改變其與DNA結(jié)合結(jié)構(gòu)域的構(gòu)象,使其能夠更準(zhǔn)確地識別目標(biāo)DNA序列,減少與脫靶位點的結(jié)合。研究人員發(fā)現(xiàn),對Cas9蛋白的PAM識別結(jié)構(gòu)域進行改造,能夠使其對PAM序列的識別更加嚴(yán)格,從而提高堿基編輯器的靶向特異性,降低脫靶效應(yīng)。優(yōu)化脫氨酶與Cas9蛋白之間的相互作用也有助于降低脫靶效應(yīng)。脫氨酶與Cas9蛋白的相互作用方式會影響堿基編輯器在DNA上的結(jié)合和催化活性。通過調(diào)整脫氨酶與Cas9蛋白之間的連接方式和相互作用界面,使脫氨酶在目標(biāo)位點上能夠更有效地發(fā)揮作用,同時減少在非目標(biāo)位點的非特異性催化。在某些堿基編輯器中,通過引入柔性連接肽,優(yōu)化脫氨酶與Cas9蛋白的空間位置關(guān)系,能夠提高堿基編輯器在目標(biāo)位點的編輯效率,同時降低在脫靶位點的編輯活性。4.3.3拓展靶向范圍的研究拓展堿基編輯器的靶向范圍是擴大其應(yīng)用領(lǐng)域的關(guān)鍵,通過改造蛋白質(zhì)或開發(fā)新系統(tǒng)等策略,可以有效實現(xiàn)靶向范圍的拓展。在蛋白質(zhì)改造方面,對Cas9蛋白進行改造以識別不同的PAM序列是拓展靶向范圍的重要方法。PAM序列是Cas9蛋白識別并結(jié)合DNA的關(guān)鍵元件,不同的Cas9蛋白變體具有不同的PAM序列要求。常用的SpCas9蛋白的PAM序列為NGG,這限制了堿基編輯器的靶向范圍??蒲腥藛T通過對SpCas9蛋白進行改造,開發(fā)出了具有不同PAM特異性的變體,如SpCas9-NGA、xCas9等。SpCas9-NGA能夠識別NGA的PAM序列,xCas9則可以識別NG、GAA、GAT等多種PAM序列。這些變體的出現(xiàn),極大地拓展了堿基編輯器的靶向范圍,使得更多的基因位點能夠被編輯。除了改造Cas9蛋白,對脫氨酶進行改造也可以拓展堿基編輯器的靶向范圍。通過改變脫氨酶的底物特異性,使其能夠作用于更多類型的堿基,從而實現(xiàn)更多種類的堿基編輯。一些研究嘗試對腺嘌呤脫氨酶進行改造,使其能夠識別并編輯除腺嘌呤以外的其他堿基,如胞嘧啶等。通過蛋白質(zhì)工程技術(shù),對腺嘌呤脫氨酶的活性位點進行修飾,改變其底物結(jié)合口袋的結(jié)構(gòu),使其能夠容納不同的堿基底物,從而實現(xiàn)對多種堿基的編輯,拓展了堿基編輯器的靶向范圍。開發(fā)新的堿基編輯系統(tǒng)也是拓展靶向范圍的重要策略。近年來,科研人員不斷探索開發(fā)新型的堿基編輯系統(tǒng),以克服現(xiàn)有系統(tǒng)的局限性。開發(fā)出了基于CRISPR-Cas12a的堿基編輯器,Cas12a蛋白與Cas9蛋白具有不同的結(jié)構(gòu)和功能特點,其PAM序列也與Cas9不同?;贑as12a的堿基編輯器能夠靶向Cas9難以編輯的位點,拓展了堿基編輯的靶向范圍。一些研究嘗試將堿基編輯器與其他技術(shù)相結(jié)合,開發(fā)出新型的基因編輯工具。將堿基編輯器與鋅指核酸酶(ZFN)或轉(zhuǎn)錄激活樣效應(yīng)因子核酸酶(TALEN)相結(jié)合,利用ZFN和TALEN能夠識別特定DNA序列的特點,與堿基編輯器協(xié)同作用,實現(xiàn)對更多位點的精準(zhǔn)編輯,進一步拓展了靶向范圍。五、堿基編輯器開發(fā)案例分析5.1案例一:新型線粒體堿基編輯器mitoBEs的開發(fā)5.1.1開發(fā)背景與目標(biāo)線粒體作為細胞的“能量工廠”,在細胞生命活動中扮演著至關(guān)重要的角色。它擁有獨立于細胞核的遺傳物質(zhì)——線粒體DNA(mtDNA),人體內(nèi)的線粒體包含37個基因,可編碼13種參與細胞能量代謝的蛋白。然而,線粒體DNA突變會導(dǎo)致多種嚴(yán)重的遺傳性疾病,如線粒體肌病、母系遺傳Leigh綜合征、Leber遺傳性視神經(jīng)病等。據(jù)MITOMAP數(shù)據(jù)庫統(tǒng)計,在已確認的97種線粒體遺傳疾病中,高達93種是由點突變引起的。因此,開發(fā)能夠精準(zhǔn)修正這些突變的堿基編輯工具,對于治療線粒體遺傳疾病具有重大意義。此前,修改線粒體DNA常用的方法主要是利用無RNA系統(tǒng)的核酸酶,如轉(zhuǎn)錄激活樣效應(yīng)因子核酸酶(TALEN)和鋅指核酸酶(ZFN)技術(shù)。但這些技術(shù)存在明顯的局限性,它們通常通過直接降解突變的mtDNA來增加野生型mtDNA的比例,這會導(dǎo)致mtDNA拷貝數(shù)降低,在實際治療中可能帶來風(fēng)險,且不適用于同源突變的線粒體疾病,也無法引入新的序列。2020年,基于雙鏈DNA脫氨酶毒素A(DddA)開發(fā)的線粒體堿基編輯器DdCBE,首次實現(xiàn)了mtDNA堿基序列從C到T的編輯,編輯效率約為4.6%-49%。2022年,Jin-SooKim團隊提出的TALED,能夠靶向誘導(dǎo)線粒體中堿基序列的A到G,編輯效率約為49%。盡管這些工具在一定程度上為線粒體基因編輯帶來了希望,但后續(xù)研究發(fā)現(xiàn)DddA系統(tǒng)存在較為嚴(yán)重的脫靶效應(yīng),尤其是DddA與CTCF之間的相互作用,會引發(fā)細胞核基因組的非特異性編輯,這嚴(yán)重限制了其在臨床治療中的應(yīng)用。在此背景下,開發(fā)一種不依賴于DddA系統(tǒng)、高效且精確的線粒體堿基編輯器成為當(dāng)務(wù)之急。北大魏文勝課題組致力于解決這一難題,其開發(fā)mitoBEs的目標(biāo)明確,旨在創(chuàng)建一種新型線粒體堿基編輯工具,該工具不僅能夠高效地實現(xiàn)A到G或C到T的單堿基編輯,還需具備高度的特異性和安全性,以克服現(xiàn)有線粒體堿基編輯器的缺陷,為線粒體遺傳疾病的治療提供更可靠的手段。5.1.2設(shè)計思路與實驗過程mitoBEs的設(shè)計思路基于對現(xiàn)有技術(shù)局限性的深入分析和對線粒體DNA編輯需求的精準(zhǔn)把握。由于目前發(fā)現(xiàn)的除DddA之外的DNA脫氨酶都只能作用于單鏈DNA,研究團隊提出在靶向位點產(chǎn)生瞬時的單鏈DNA,為所有“普通”脫氨酶提供有效反應(yīng)底物的設(shè)想?;诖耍芯咳藛T在定位系統(tǒng)轉(zhuǎn)錄激活子樣效應(yīng)因子(TALE)的基礎(chǔ)上,創(chuàng)新性地整合了切口酶和脫氨酶,設(shè)計出了基于TALE的單堿基編輯器。具體而言,mitoBEs工具包含3個關(guān)鍵部分:具有定位功能的可編程TALE結(jié)合蛋白,用于精準(zhǔn)識別線粒體基因組上的目標(biāo)位點;切口酶MutH或Nt.BspD6I(C),其作用是切開目標(biāo)位點,產(chǎn)生瞬時單鏈DNA(ssDNA);脫氨酶,如TALE-TadA8e(V106W)或TALE-rAPOBEC1-2×UGI,用于實現(xiàn)堿基的編輯。在實現(xiàn)A到G編輯的實驗中,當(dāng)使用工程化的脫氧腺苷脫氨酶TadA8e-V106W與TALE結(jié)合時,由于TALE無法解開DNA雙螺旋結(jié)構(gòu),單獨使用TadA8e-V106W也無法誘導(dǎo)有效的脫氨反應(yīng),在所有三個靶向位點MT-ND1、MT-ND4和MT-RNR2僅檢測到非常低水平的編輯,編輯率為0.39%。隨后,研究團隊通過融合TALE與切口酶MutH特異性切開DNA鏈,成對引入TALE-MutH和TALE-TadA8e-V106W并靶向
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 給藥題目及答案
- “雙減”背景下基于核心素養(yǎng)的初中道德與法治作業(yè)設(shè)計研究
- 智慧城市的概述
- 沖突論課件教學(xué)課件
- 醫(yī)院培訓(xùn)課件:《精神科護理小講座》
- 地理高考人文大題題庫及答案
- 大專招生考試試卷及答案
- 電梯門框安裝合同范本
- 生食供貨合同范本
- ??茣嬈谀┰囶}及答案
- GB 38304-2025手部防護防寒手套
- 2025年廣西度三類人員(持b證人員)繼續(xù)教育網(wǎng)絡(luò)學(xué)習(xí)考試題目及答案
- 食品法律法規(guī)教學(xué)課件
- 規(guī)范使用執(zhí)法記錄儀課件
- 掘進機維護保養(yǎng)課件
- 可轉(zhuǎn)債券投資協(xié)議書范本
- GJB939A-2022外購器材的質(zhì)量管理
- 《通信工程監(jiān)理》課件第4章、通信線路工程監(jiān)理
- 2025年光伏電站運維服務(wù)合同正規(guī)范本
- 醫(yī)務(wù)人員職業(yè)道德準(zhǔn)則(2025年版)全文培訓(xùn)課件
- 2025年大學(xué)試題(法學(xué))-著作權(quán)法歷年參考題庫含答案解析(5套典型題)
評論
0/150
提交評論