核酸序列分析_第1頁
核酸序列分析_第2頁
核酸序列分析_第3頁
核酸序列分析_第4頁
核酸序列分析_第5頁
已閱讀5頁,還剩75頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、關(guān)于核酸序列分析第一張,PPT共八十頁,創(chuàng)作于2022年6月一、分子質(zhì)量、堿基組成、堿基分布二、序列變換三、限制性酶切分析第一節(jié) 核酸序列的基本分析(DNAMAN軟件的應(yīng)用)第二張,PPT共八十頁,創(chuàng)作于2022年6月一、核酸測序中載體序列的識別與去除1、利用NCBI的數(shù)據(jù)庫許多數(shù)據(jù)庫中收集了常用的測序載體序列。如果用戶面對的是大批量序列的分析任務(wù),則需要將這些載體數(shù)據(jù)庫下載后進行分析。使用Blast程序?qū)Υ祟悢?shù)據(jù)庫進行相似性分析即可得知目的序列中是否含有載體序列。(/VecScreen/VecScreen.html)。如果是,那么在對測序數(shù)據(jù)進行進一步分析之前必須將載體序列去除。(Examp

2、le)第二節(jié) 核酸序列高級分析(數(shù)據(jù)庫及軟件的使用) 第三張,PPT共八十頁,創(chuàng)作于2022年6月2、利用SequencherTM軟件美國基因編碼公司(Gene Codes Corp.)所開發(fā)的SequencherTM軟件在識別載體序列方面具有很強的功能。SequencherTM軟件被多個公司用于測序數(shù)據(jù)的分析和管理。該公司同時提供該軟件的演示版,可通過訪問其網(wǎng)址獲得(/home.html)。第四張,PPT共八十頁,創(chuàng)作于2022年6月第五張,PPT共八十頁,創(chuàng)作于2022年6月第六張,PPT共八十頁,創(chuàng)作于2022年6月第七張,PPT共八十頁,創(chuàng)作于2022年6月第八張,PPT共八十頁,創(chuàng)作

3、于2022年6月第九張,PPT共八十頁,創(chuàng)作于2022年6月3、其他人工序列的分析與去除測序克隆中往往也含有來自于宿主菌核酸序列的污染,或者目的克隆的確來自于該宿主菌。這兩種情況均可通過BlastN軟件直接對GenBank或EMBL數(shù)據(jù)庫進行相似性分析進行判斷。顯然任何與大腸桿菌和釀酒酵母的序列具有高度一致性的序列必須慎重對待。一些生物如大腸桿菌含有可移動的遺傳物質(zhì)如插入序列。在進行克隆構(gòu)建以便測序的過程中,這些序列有時會插入到所構(gòu)建的克隆,導(dǎo)致目的序列測序的干擾。BlastN程序可以很方便地鑒定此類結(jié)果。如果是這樣的話,此類序列則值得懷疑。第十張,PPT共八十頁,創(chuàng)作于2022年6月二、核酸

4、序列的電子延伸1、簡介隨著人類基因組計劃的深入進行,很多實驗室采用cDNA文庫大規(guī)模測序的策略獲得了大量表達序列標(biāo)簽(expressed sequence tag,EST)和較長的cDNA序列。然而在大多數(shù)情況下,人們只能獲得EST序列或較長的cDNA序列。全長cDNA序列的獲得一直是制約新基因發(fā)現(xiàn)的瓶頸。第十一張,PPT共八十頁,創(chuàng)作于2022年6月同時,很多實驗室采用差異顯示PCR(different display PCR,DD-PCR)、代表性差異分析(representational difference analysis,RDA)等技術(shù)發(fā)現(xiàn)了大量具有潛在應(yīng)用價值的新基因片段,也同時

5、面臨著全長cDNA序列難以獲得的問題。在實驗方面,或者通過篩選cDNA文庫,或者通過RACE實驗等去獲得新基因的全長cDNA序列,均需要投入較大的精力。第十二張,PPT共八十頁,創(chuàng)作于2022年6月而在另一方面,公共數(shù)據(jù)庫如GenBank/EMBL已經(jīng)擁有了大量的表達序列標(biāo)簽(/dbEST)。這些EST序列在很多時候和研究者所感興趣的基因序列相重疊,可能代表了同一條 cDNA序列。因而,從生物信息學(xué)的原理出發(fā),基于公共數(shù)據(jù)庫中的EST序列或者較長cDNA序列對新獲得的EST序列進行電子延伸,就成為很多研究者關(guān)注的焦點。第十三張,PPT共八十頁,創(chuàng)作于2022年6月這一方案實際上來自于最初的克隆

6、測序過程。例如,在對一個長為1.5kb的序列進行測序過程中,如果每次測序只能獲得500bp的有效序列,則至少需進行4次測序,而且所有測序結(jié)果的末端必須相互重疊,以便根據(jù)末端重疊序列將該4次測序所獲得的序列片段進行組裝,才能獲得全長序列。1500kb500kb500kb500kb500kb第十四張,PPT共八十頁,創(chuàng)作于2022年6月2、基本過程(1)將待分析的核酸序列(稱為種子序列)采用Blast軟件搜索GenBank的EST數(shù)據(jù)庫,選擇與種子序列具有較高同源性的EST序列(一般要求在重疊40個堿基范圍內(nèi)有95%以上有同源性)(稱為匹配序列)(2)將匹配序列和種子序列裝配產(chǎn)生新生序列,此過程稱

7、為片段重疊群分析(contig analysis)(3)然后再以此新生序列作為種子序列重復(fù)上述過程,直至沒有新的匹配序列入選,從而生成最后的新生序列,作為對種子序列的延伸產(chǎn)物。第十五張,PPT共八十頁,創(chuàng)作于2022年6月3、利用UniGene數(shù)據(jù)庫進行電子延伸利用blastn程序,選擇數(shù)據(jù)庫“EST”進行序列同源性檢索。選擇同源性比分最高的一條EST序列,點擊右邊的UniGene超鏈接,將參與形成UniGene Cluster的所有核酸序列下載到本地,利用SequencherTM軟件或者其他的序列裝配軟件進行組裝,形成較長的新生序列。第十六張,PPT共八十頁,創(chuàng)作于2022年6月第十七張,P

8、PT共八十頁,創(chuàng)作于2022年6月第十八張,PPT共八十頁,創(chuàng)作于2022年6月第十九張,PPT共八十頁,創(chuàng)作于2022年6月第二十張,PPT共八十頁,創(chuàng)作于2022年6月第二十一張,PPT共八十頁,創(chuàng)作于2022年6月4、存在的不足無法直接通過此種方法獲得多種剪切形式之間的差異,真正的cDNA序列還需通過對延伸后的序列設(shè)計全長引物,經(jīng)過反轉(zhuǎn)錄PCR(RT-PCR)即可證實是否對原序列的有效延伸。第二十二張,PPT共八十頁,創(chuàng)作于2022年6月三、基因的電子表達譜分析GenBank/EMBL等數(shù)據(jù)庫在其EST數(shù)據(jù)庫中積累了大量序列的基因表達信息。電子表達譜分析原理是: 將待分析序列與EST數(shù)據(jù)

9、庫進行序列對庫檢索,獲得與待分析核酸序列具有高同源性的EST序列的UniGene編號后,就可通過參與形成UniGene Cluster的序列的組織/細(xì)胞來源來間接地反映分析序列在何種組織中表達體現(xiàn)在字段cDNA Sources中。第二十三張,PPT共八十頁,創(chuàng)作于2022年6月四、核酸序列的電子基因定位分析對核酸序列進行電子基因定位(即基因的染色體定位),通過所定位區(qū)帶的相鄰基因簇,間接地提示該基因的功能,是核酸序列分析的一個重要方面。進行電子基因定位策略是:利用基因組序列定位A、將待分析序列進行對基因組數(shù)據(jù)庫的同源性檢索B、得到確定基因組序列后點擊“Genome View”觀察其基因組結(jié)構(gòu)C

10、、點擊用紅色標(biāo)記所指示的染色體列表中選擇所對應(yīng)的染色體及區(qū)域。第二十四張,PPT共八十頁,創(chuàng)作于2022年6月五、cDNA對應(yīng)的基因組序列分析EST和cDNA的基因組序列查詢對于了解該基因組結(jié)構(gòu)包括extron/intron結(jié)構(gòu)、轉(zhuǎn)錄調(diào)控區(qū)域以及何種轉(zhuǎn)錄因子對該基因的表達進行調(diào)控等均十分重要。同時,如果對所獲得cDNA不能完全確定的情況下,也可參考基因組的序列進行校正。在人類基因組計劃推動下,NCBI、EMBL、和Sanger Centre均提供了基因組序列的同源性分析途徑。第二十五張,PPT共八十頁,創(chuàng)作于2022年6月1、通過從NCBI查詢?nèi)炕蚪M數(shù)據(jù)庫進行序列的分析聯(lián)網(wǎng)至/genome

11、/seq/HsBlast.html可直接對已經(jīng)公布的基因組序列進行查詢。2、通過從Sanger中心查詢?nèi)炕蚪M數(shù)據(jù)庫進行序列的分析http:/www.sanger.ac.uk/cgi-bin/blast/submitblast/hgp第二十六張,PPT共八十頁,創(chuàng)作于2022年6月六、基于核酸序列對齊分析的功能預(yù)測對庫比較、多序列以及序列之間的兩兩比較、同源性比較及結(jié)果的顯著性評價、分子進化樹的繪制。第二十七張,PPT共八十頁,創(chuàng)作于2022年6月七、可讀框架分析原理Kozak序列:AUG上游的第三個核苷酸,常常是嘌呤,且多數(shù)是A;緊跟在AUG后面的核苷酸,常常也是嘌呤,但多數(shù)情況下是G。A

12、UG附近的核苷酸序列中以ANNAUGN和GNNAUGPu(T/G)的利用率最高,而沒有起始功能AUG附近的核苷酸序列則無此保守性。/gorf/gorf.html第二十八張,PPT共八十頁,創(chuàng)作于2022年6月第二十九張,PPT共八十頁,創(chuàng)作于2022年6月第三十張,PPT共八十頁,創(chuàng)作于2022年6月第三十一張,PPT共八十頁,創(chuàng)作于2022年6月第三十二張,PPT共八十頁,創(chuàng)作于2022年6月八、基因組序列中的編碼區(qū)/內(nèi)含子結(jié)構(gòu)分析真核基因外顯子-內(nèi)含子連接區(qū)外顯子-內(nèi)含子連接區(qū)就是指外顯子和內(nèi)含子的交界,又稱邊界序列。重要特征:(1)內(nèi)含子的兩端序列之間沒有廣泛的同源性,不能互補。不能通過

13、形成發(fā)卡式二級結(jié)構(gòu)。 (2)外顯子-內(nèi)含子連接區(qū)序列很短,但高度保守。第三十三張,PPT共八十頁,創(chuàng)作于2022年6月GT-AG法則:幾乎在所有高等真核生物基因中每個內(nèi)含子5端起始的兩個堿基都是GT,3端最后兩個堿基總是AG。目前最好并最流行的軟件是GRAIL (Gene Recognition Analysis Internet Link)套裝軟件/Grail-1.3/ 。第三十四張,PPT共八十頁,創(chuàng)作于2022年6月第三十五張,PPT共八十頁,創(chuàng)作于2022年6月第三十六張,PPT共八十頁,創(chuàng)作于2022年6月第三十七張,PPT共八十頁,創(chuàng)作于2022年6月也可以利用Gene Finde

14、r軟件(/urllists/genefind.htm)進行基因組序列的內(nèi)含子/外顯子分析。第三十八張,PPT共八十頁,創(chuàng)作于2022年6月第三十九張,PPT共八十頁,創(chuàng)作于2022年6月九、基因啟動子、增強子、轉(zhuǎn)錄因子結(jié)合位點分析1、通過EBI匿名FTP獲得數(shù)據(jù)庫2、聯(lián)網(wǎng)至/seq_tools/promoter.html可對基因組序列進行啟動子分析。第四十張,PPT共八十頁,創(chuàng)作于2022年6月十、重復(fù)序列分析1、RepBase真核生物DNA中重復(fù)序列數(shù)據(jù)庫,由Genetic Information Research Institute,GIRI維護,其網(wǎng)址為:/server/RepBase/

15、。2、著名的RepeatMasker程序即基于此進行工作(/RM/RepeatMasker.html )。 第四十一張,PPT共八十頁,創(chuàng)作于2022年6月第三節(jié) PCR引物設(shè)計第四十二張,PPT共八十頁,創(chuàng)作于2022年6月一、基本過程PCR是在試管內(nèi)有DNA模版、引物和四種脫氧核糖核苷酸存在條件下,由DNA聚合酶催化的DNA合成反應(yīng)。基本反應(yīng)過程分為三步:1、變性 變性是指通過加熱使DNA雙鏈間的氫鍵斷裂,形成兩條單鏈的過程。加熱到9295可使一切復(fù)雜的DNA都達到變性的目的。2、退火 退火是指在溫度降低的過程中,DNA的復(fù)性過程,即變性后的兩條單鏈在堿基互補基礎(chǔ)上形成氫鍵,結(jié)合成雙鏈。第

16、四十三張,PPT共八十頁,創(chuàng)作于2022年6月3、延伸 從引物的3一端開始,沿DNA模版,由DNA聚合酶催化的DNA新鏈的合成反應(yīng)。上述三步反應(yīng)構(gòu)成一個循環(huán)。在下一個循環(huán)中,前一循環(huán)的產(chǎn)物再變性為兩條單鏈作為模版,這樣往復(fù)循環(huán),即可使靶序列大大擴增。第四十四張,PPT共八十頁,創(chuàng)作于2022年6月二、PCR的引物1、引物長度 以1530個堿基為宜。過短會影響到擴增的特異性。若擴增產(chǎn)物500堿基,引物長度為1618堿基即可。若擴增45kb的大片段,引物最好不要少于24個堿基。2、引物二聚體及二級結(jié)構(gòu)盡量避免在引物分子之間或引物分子內(nèi)部有過多的互補堿基。如果很難完全避免引物分子內(nèi)二級結(jié)構(gòu),也要盡可

17、能地避免在引物3一端出現(xiàn)二級結(jié)構(gòu)。3一端有二級結(jié)構(gòu)的引物不能有效引發(fā)延伸。第四十五張,PPT共八十頁,創(chuàng)作于2022年6月3、堿基分布的均衡性 避免嘌呤或嘧啶的堆積,避免連續(xù)出現(xiàn)4個以上的同一堿基。各種堿基最好分布均勻。4、引物在模版上結(jié)合位點的唯一性保證擴增產(chǎn)物的特異性。第四十六張,PPT共八十頁,創(chuàng)作于2022年6月5、堿基配對的嚴(yán)格性一般要求引物與模版間的堿基能完全配對特殊實驗?zāi)康?,部分堿基不配對是許可的。但要求引物3一端必須與模版配對。如:在5一端引入酶切位點。 點突變。 設(shè)計簡并引物。第四十七張,PPT共八十頁,創(chuàng)作于2022年6月6、引物的Tm值(解鏈溫度)在允許范圍內(nèi),選擇較高的

18、溫度,可大大減少引物和模版之間非特異性結(jié)合,從而提高PCR的特異性。引物容易復(fù)性到模版上的溫度是Tm值減去1525,但為了提高PCR的特異性,在實際應(yīng)用中常常將退火溫度設(shè)定為Tm值減去515。在實驗之初,寧可選用較低的退火溫度,首先得到有PCR合成產(chǎn)物之后再逐步提高退火溫度,以提高反應(yīng)的特異性。兩條引物的Tm盡可能相等或接近,最好相差不超過3。第四十八張,PPT共八十頁,創(chuàng)作于2022年6月7、引物的內(nèi)部穩(wěn)定性引物的5端互補序列應(yīng)該是相對穩(wěn)定結(jié)構(gòu),而3端應(yīng)在堿基配對的情況下盡可能為低穩(wěn)定結(jié)構(gòu)。 3端應(yīng)該選用A、T少選用G、C,這種引物有更高的引發(fā)效率,且能有效地避免假引發(fā)。第四十九張,PPT共

19、八十頁,創(chuàng)作于2022年6月二、引物設(shè)計軟件的引物設(shè)計功能主要體現(xiàn)在:1、引物分析評價功能,以“Oligo 6”最優(yōu)秀。2、引物的自動搜索功能。以“Primer Premier”為最強且方便使用在自動搜索的基礎(chǔ)上還要輔以人工分析。引物設(shè)計軟件以“Premier”進行自動搜索,“Oligo”進行分析評價,如此可快速設(shè)計出成功率很高的引物。 第五十張,PPT共八十頁,創(chuàng)作于2022年6月引物設(shè)計限制性內(nèi)切酶位點分析DNA基元(motif)查找同源性分析第五十一張,PPT共八十頁,創(chuàng)作于2022年6月設(shè)計簡并引物簡并引物:根據(jù)一段氨基酸序列反推到DNA來設(shè)計引物,由于遺傳密碼的簡并性,會遇到部分堿基

20、的不確定性。設(shè)計的引物實際上是多個序列的混和物。第五十二張,PPT共八十頁,創(chuàng)作于2022年6月軟件共給出八種生物亞結(jié)構(gòu)的不同遺傳密碼規(guī)則:纖毛蟲大核(Ciliate Macronuclear)無脊椎動物線粒體(Invertebrate Mitochondrion)支原體(Mycoplasma)植物線粒體(Plant Mitochondrion)原生動物線粒體(Protozoan Mitochondrion)一般標(biāo)準(zhǔn)(Standard)脊椎動物線粒體(Vertebrate Mitochondrion)酵母線粒體(Yeast Mitochondrion) 第五十三張,PPT共八十頁,創(chuàng)作于202

21、2年6月第五十四張,PPT共八十頁,創(chuàng)作于2022年6月第五十五張,PPT共八十頁,創(chuàng)作于2022年6月第五十六張,PPT共八十頁,創(chuàng)作于2022年6月第五十七張,PPT共八十頁,創(chuàng)作于2022年6月第五十八張,PPT共八十頁,創(chuàng)作于2022年6月第五十九張,PPT共八十頁,創(chuàng)作于2022年6月PCR模板及產(chǎn)物位置所選的上下游引物的一些性質(zhì)四種重要指標(biāo)的分析引物的最佳退火溫度對引物進行修飾編輯第六十張,PPT共八十頁,創(chuàng)作于2022年6月 此外還要注意:不同的引物3端末位堿基在錯配位置導(dǎo)致不同的擴增效率,末位堿基為A的錯配效率明顯高于其他3個堿基,因此應(yīng)當(dāng)避免在引物的3端使用堿基A。第六十一張

22、,PPT共八十頁,創(chuàng)作于2022年6月 G值是指DNA雙鏈形成所需的自由能,反映了雙鏈結(jié)構(gòu)內(nèi)部堿基對的相對穩(wěn)定性。應(yīng)當(dāng)選用3端G值較低(絕對值不超過9),而5端和中間的 G值相對較高的引物。引物二聚體及發(fā)夾結(jié)構(gòu)的能值過高(超過4.5kcal/mol)易導(dǎo)致產(chǎn)生引物二聚體帶。鄰近6至7個堿基組成的亞單位在一個指定數(shù)據(jù)庫文件中的出現(xiàn)頻率。該頻率高則可增加錯誤引發(fā)的可能性。選取引物時,宜選用3端Frq值相對較低的片段。第六十二張,PPT共八十頁,創(chuàng)作于2022年6月選好上下游引物后檢查:1、引物二聚體尤其是3端二聚體形成的可能性。2、發(fā)夾結(jié)構(gòu)(hairpin);與二聚體相同,發(fā)夾結(jié)構(gòu)的能值越低越好。一般來說,這兩項結(jié)構(gòu)的能值以不超過4.5為好3、GC含量以45-55為宜。4、如果模板不是基因組DNA,而是特定模板序列,最好還進行False priming site的檢測。第六十三張,PPT共八十頁,創(chuàng)作于2

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論