版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、轉(zhuǎn)錄組分析,張彩華20151031,1 轉(zhuǎn)錄組的定義,轉(zhuǎn)錄組: 廣義轉(zhuǎn)錄組 是指某一生理?xiàng)l件下,細(xì)胞中所有轉(zhuǎn)錄和加工的RNA分子(包括 信使RNA, 核糖體RNA, 轉(zhuǎn)運(yùn)RNA和非編碼RNA)。 狹義轉(zhuǎn)錄組 是指可直接參與翻譯蛋白質(zhì)的mRNA總和。,2 轉(zhuǎn)錄組的研究?jī)?nèi)容和意義,轉(zhuǎn)錄組的研究主要包括三個(gè)內(nèi)容,發(fā)育調(diào)控,環(huán)境適應(yīng),免疫互作,發(fā)育調(diào)控,發(fā)育調(diào)控研究的核心內(nèi)容是形態(tài)建成;形態(tài)建成是高等動(dòng)植物外部形態(tài)和內(nèi)部結(jié)構(gòu)的起源、發(fā)育和建成的過(guò)程。例如:動(dòng)物胚胎發(fā)育過(guò)程,植物種子萌發(fā)及形態(tài)建成等一直是研究的熱點(diǎn)。,環(huán)境適應(yīng),含水量變化;新陳代謝變化(分解大于合成);激素變化(ABA/IAA/GA)光
2、合強(qiáng)度變化等;,光合作用下降;酶活性變化;破壞正常物質(zhì)代謝(蛋白質(zhì)分解,脯氨酸積累,破壞核酸代謝);激素變化。,SOD活性下降;光合作用變化;葉綠素含量降低;蛋白質(zhì)分解;脯氨酸、甜菜堿含量變化,激素變化。,酶的變化,增加或分解(如混合功能氧化酶等),超氧化物歧化酶、蛋白質(zhì)合成或DNA修復(fù)均會(huì)受到影響。,蛋白質(zhì)變性; 膜脂液化; 有毒物質(zhì)積累等;,低溫及凍害,高溫,干旱及洪澇,鹽堿,環(huán)境污染,哺乳動(dòng)物,植物,微生物,海洋生物,昆蟲(chóng),免疫互作,自然環(huán)境中,動(dòng)植物常會(huì)經(jīng)歷各種病原物(病毒、細(xì)菌、真菌、害蟲(chóng))侵害,嚴(yán)重危害動(dòng)植物生長(zhǎng)、發(fā)育及健康。在長(zhǎng)期演化過(guò)程中,為更好的適應(yīng)壞境,動(dòng)植物逐漸形成了多種
3、與病原物對(duì)抗的生理途徑。,轉(zhuǎn)錄組的研究意義,轉(zhuǎn)錄組的研究不僅可以解釋細(xì)胞或組織的基因組的功能元件,揭示分子成分,還可以用來(lái)認(rèn)識(shí)生物學(xué)進(jìn)程和疾病發(fā)生機(jī)制,同時(shí),對(duì)基因及其轉(zhuǎn)錄表達(dá)產(chǎn)物功能研究的功能基因組學(xué),將為疾病控制和新藥開(kāi)發(fā)、作物和畜禽品種的改良提供新思路,為人類解決健康問(wèn)題、食物問(wèn)題、能源問(wèn)題和環(huán)境問(wèn)題提供新方法。,3 轉(zhuǎn)錄組研究方法,三代轉(zhuǎn)錄組測(cè)序,基于雜交技術(shù)的cDNA芯片和寡聚核苷酸芯片,3 轉(zhuǎn)錄組研究方法,3 轉(zhuǎn)錄組研究方法,基于Sanger測(cè)序法的SAGE、 LongSAGE和MPSS,3 轉(zhuǎn)錄組研究方法,基于二代測(cè)序技術(shù)的轉(zhuǎn)錄組測(cè)序(RNA-Seq),3 轉(zhuǎn)錄組研究方法,RNA
4、-seq的優(yōu)勢(shì),4 轉(zhuǎn)錄組測(cè)序(RNA-seq)的原理和流程,樣品制備(植物RNA提取的方法),4 轉(zhuǎn)錄組測(cè)序(RNA-seq)的原理和流程,1. 利用RNeasy Plant Mini Kit提取總RNA 2. 利用TRIZOL試劑盒提取RNA 3. CTAB法提取植物總RNA,RNA質(zhì)檢參數(shù)OD260/OD280,OD260/OD230 A230: 測(cè)定其它碳源物質(zhì),如酚,糖類等。 A260:核酸的吸收峰測(cè),測(cè)RNA,DNA,引物等的濃度用的。 A280:蛋白質(zhì)的吸收峰。 RIN值:RIN=RNA integrity number,即 RNA 分子完整數(shù),從 0-10,直接反應(yīng)了 RNA
5、質(zhì)量的好壞,此數(shù)值越大表明 RNA 質(zhì)量越好越完整。,4 轉(zhuǎn)錄組測(cè)序(RNA-seq)的原理和流程,RNA樣品檢測(cè),RIN=6.0,RIN=10,合格標(biāo)準(zhǔn): 1. rRNA 比率28s/18s 1.1, RNA完整系數(shù)(RIN) 7 2. 28s和18s條帶明顯(變性瓊脂糖凝膠電泳) 3. 比率260nm/280nm 2.0 (分光光度計(jì)測(cè)量)。,4 轉(zhuǎn)錄組測(cè)序(RNA-seq)的原理和流程,RNA文庫(kù)構(gòu)建,文庫(kù)庫(kù)檢,4 轉(zhuǎn)錄組測(cè)序(RNA-seq)的原理和流程,文庫(kù)構(gòu)建完成后,分別使用Qubit2.0和Agilent 2100對(duì)文庫(kù)的濃度和插入片段大?。?Insert Size)進(jìn)行檢測(cè),使
6、用Q-PCR方法對(duì)文庫(kù)的有效濃度進(jìn)行準(zhǔn)確定量,以保證文庫(kù)質(zhì)量,上機(jī)測(cè)序,5 轉(zhuǎn)錄組分析方法,測(cè)序數(shù)據(jù)處理和過(guò)濾,測(cè)序數(shù)據(jù)以fq格式保存:,堿基質(zhì)量值 = (字符的)ASCII值 64/33 范圍:2-40 堿基質(zhì)量值與測(cè)序錯(cuò)誤率的對(duì)應(yīng)關(guān)系: Qphred = -10 log10(e),5 轉(zhuǎn)錄組分析方法,測(cè)序數(shù)據(jù)過(guò)濾: 1.去除含接頭的reads; 2.去除 unknown bases(堿基N) 比例高于5%的reads; 3.去除低質(zhì)量reads(一個(gè)read中質(zhì)量值 7 的堿基含量高于65%) 數(shù)據(jù)要求: 1.Q20%80%; 2.有效數(shù)據(jù)量達(dá)到要求; NewMaster:/home/sh
7、are/users/zhangcaihua2013/projects/Pop.Timeseries.Transcriptome/NaCl/02.filter_fastq_gz.pl,5 轉(zhuǎn)錄組分析方法,5 轉(zhuǎn)錄組分析方法,兩種組裝思路,Assembly-first (de novo) Trinity SOAPdenovo(-Trans) (Trans-)AByss Velvet Oases Mapping-first (reference-based): Tophat Cufflinks Scripture,5 轉(zhuǎn)錄組分析方法,5 轉(zhuǎn)錄組分析方法(de novo組裝), de novo組裝流程
8、,5 轉(zhuǎn)錄組分析方法(de novo組裝原理),對(duì)于一個(gè)給定的read: GTCGAGG read長(zhǎng)度:7bps 取kmer長(zhǎng)度為4bps 如下:,構(gòu)建De Brui jn 圖:,5 轉(zhuǎn)錄組分析方法(de novo組裝原理),5 轉(zhuǎn)錄組分析方法,簡(jiǎn)化,5 轉(zhuǎn)錄組分析方法(de novo組裝原理),糾錯(cuò):Tips removed,5 轉(zhuǎn)錄組分析方法(de novo組裝原理),糾錯(cuò):Bubbles removed,5 轉(zhuǎn)錄組分析方法(de novo組裝原理),解開(kāi)短的重復(fù)序列(If therere reads assigning one outgoing branch for each incom
9、ing branch),5 轉(zhuǎn)錄組分析方法(de novo組裝原理),構(gòu)建Scaffold: Map reads to contigs,5 轉(zhuǎn)錄組分析方法(de novo組裝原理),Contigs are connected by paired reads to form a scaffolding graph,將reads比到 scaffolds ,根據(jù) overlap 在gap處延伸,5 轉(zhuǎn)錄組分析方法(de novo組裝原理),Trinity,5 轉(zhuǎn)錄組分析方法(de novo組裝),5 轉(zhuǎn)錄組分析方法(de novo組裝),1. 構(gòu)建kmer庫(kù)(k = 25); 2. 去掉潛在的測(cè)序錯(cuò)
10、誤k-mer; 3. 選取最高頻的k-mer 作為種子進(jìn)行組裝; 4. 將種子序列向兩邊延伸, 使用過(guò)的k-mer 從庫(kù)中去除掉; 5.若序列不能繼續(xù)延長(zhǎng),則輸出該contig; 6. 重復(fù)第3-5步,直到kmer庫(kù)中的所有kmer被用完。,Inchworm,5 轉(zhuǎn)錄組分析方法(de novo組裝),1. 利用contig之間的overlap關(guān)系,將具有k-1個(gè) overlap關(guān)系的contig作為一個(gè)cluster; 2. 對(duì)每一個(gè)cluster,以k 1作為節(jié)點(diǎn),構(gòu)建一個(gè)De Bruijn graph; 3. 通過(guò)比對(duì),將reads分配給contig(該reads至少必 須有k-1個(gè)堿基與
11、contig有overlap)。,Chrysalis,5 轉(zhuǎn)錄組分析方法(de novo組裝),1. 對(duì)De Bruijn graph圖進(jìn)行簡(jiǎn)化,將連續(xù)的節(jié)點(diǎn)合并。 2. 利用reads的支持關(guān)系,去掉不可信的邊,最后輸出轉(zhuǎn)錄本序列。,Butterfly, 聚類去冗余步驟,5 轉(zhuǎn)錄組分析方法(de novo組裝),1.所有scaffolds用mgblast進(jìn)行相似性比對(duì) 2.以scaffold作為節(jié)點(diǎn),以scaffold之間的相似性作為邊連接形成 一個(gè)圖,每一個(gè)連通的子圖作為一個(gè)類(cluster)。 3.對(duì)每一個(gè)cluster,用CAP3組裝軟件分別進(jìn)行組裝,得到 consensus序列(構(gòu)
12、建UniGene)。, 聚類去冗余工具,5 轉(zhuǎn)錄組分析方法(de novo組裝),TGICL CAP3(或phrap) Cd-hit,NewMaster:/home/users/luowenchun2010/Project/LuSongShaxi/03.cap3/CAP3,1.Contig長(zhǎng)度分布、Scaffold長(zhǎng)度分布、Unigene長(zhǎng)度分布; 2.N50:將序列按照長(zhǎng)度遞減累加,當(dāng)累加之和剛好大于 總長(zhǎng)度的一半時(shí),最后被累加的那條序列長(zhǎng)度, 即為N50; 3.組裝準(zhǔn)確性(注釋,近緣物種之間相似性分析)。, 組裝評(píng)估,5 轉(zhuǎn)錄組分析方法(de novo組裝), 預(yù)測(cè)CDS,5 轉(zhuǎn)錄組分析方
13、法(de novo組裝),使用transdecoder從trinity的轉(zhuǎn)錄本中提取coding region,得到對(duì)應(yīng) 的protein序列 ,利于下一步的功能注釋。,OldMaster:/home/share/software/trinity/trinityrnaseq_r20131110/trinityplugins/TransDecoder_r20131110/TransDecoder,按優(yōu)先級(jí)數(shù)據(jù)庫(kù)順序?qū)nigene序列與以上 蛋白庫(kù)做blastx比對(duì),如果某個(gè)Unigene序列比對(duì)上高優(yōu)先級(jí)數(shù)據(jù)庫(kù)中的蛋白,則不進(jìn)入下一輪比對(duì),否則自動(dòng)跟下一個(gè)庫(kù)做比對(duì),如此循環(huán)直到跟所有蛋白庫(kù)比對(duì)
14、完。我們?nèi)last比對(duì)結(jié)果中rank最高的蛋白確定該Unigene的編碼區(qū)序列,然后根據(jù)標(biāo)準(zhǔn)密碼子表將編碼區(qū)序列翻譯成氨基酸序列,從而得到該Unigene編碼區(qū)的核酸序列和氨基酸序列。,比對(duì)不上的Unigene用軟件ESTScan預(yù)測(cè)其編碼區(qū)。,NR KEGG SWISS-PROT COG GO, 功能注釋,5 轉(zhuǎn)錄組分析方法(de novo組裝),GO(gene ontology) 基因本體,是對(duì)基因或者蛋白質(zhì)進(jìn)行注解和分類的系統(tǒng)。 三個(gè)本體(Ontology): 分子功能(Molecular function),元件的活性。例如:結(jié)合活性、 催化活性 生物過(guò)程(Biological pr
15、ocess ),某些代謝過(guò)程從開(kāi)始到終止的過(guò) 程。例如:嘧啶代謝、 配糖基的運(yùn)輸 細(xì)胞組分(Cellular component),基因產(chǎn)物的位置。例如: 細(xì)胞核、線粒體基質(zhì)。, GO數(shù)據(jù)庫(kù),5 轉(zhuǎn)錄組分析方法(de novo組裝),功能注釋,5 轉(zhuǎn)錄組分析方法(de novo組裝),1.去掉較短的組裝序列(如要求:L 200); 2.對(duì)數(shù)據(jù)庫(kù)進(jìn)行物種分類(近緣種); 3.blastx比對(duì),得到同源蛋白序列,對(duì)unigene進(jìn)行功能注釋。,表達(dá)量的計(jì)算,RPKM :Reads Per Kilobase per Million reads FPKM :Fragments/Reads Per Ki
16、lobase of exon per Million fragments mapped,Xt :map至該基因的外顯子上的片斷數(shù) M :所有map至基因組的測(cè)序reads的堿基數(shù)Lt:該基因外顯子堿基全長(zhǎng),Nat Biotechnol. 2010,28(5):511 Bioinformatics 2009, 25(8):1026 Geno Biol. 2010, 11:R106,5 轉(zhuǎn)錄組分析方法(de novo組裝),= 10 6 Xt / 10 3, 表達(dá)量的計(jì)算,5 轉(zhuǎn)錄組分析方法(de novo組裝),Final.assembly.fa.1.bt2 Final.assembly.fa.
17、2.bt2 Final.assembly.fa.3.bt2 Final.assembly.fa.4.bt2 Final.assembly.fa.rev.1.bt2 Final.assembly.fa.rev.2.bt2,NewMaster: /home/share/users/zhangcaihua2013/projects/Pop.Timeseries.Transcriptome/NaCl/01.Bowtie2/4.RPKM.pl, 表達(dá)量,5 轉(zhuǎn)錄組分析方法(de novo組裝), 差異表達(dá)基因(DEGs),5 轉(zhuǎn)錄組分析方法(de novo組裝),NewMaster: /home/sha
18、re/users/zhangcaihua2013/projects/Pop.Timeseries.Transcriptome/NaCl/03.edgeR/2.run_edgeR.pl.sh,FDR= 2,5 轉(zhuǎn)錄組分析方法(Reference-based 組裝),Tophat and Cufflinks,5 轉(zhuǎn)錄組分析方法(Reference-based 組裝),Tophat and Cufflinks pipeline,5 轉(zhuǎn)錄組分析方法(Reference-based 組裝),轉(zhuǎn)錄組重構(gòu),Bowtie 第一步建庫(kù):/opt/blc/genome/biosoft/bowtie-0.12.8/
19、bowtie-build *.fa *.ebwt 第二部比對(duì):/opt/blc/genome/biosoft/bowtie-0.12.8/bowtie,Tophat /programs/tophat -o TophatOutputPE/ -p 8 /programs/indexes/hg19 Experiment1.r1.fastq Experiment1.r2.fastq,5 轉(zhuǎn)錄組分析方法(Reference-based 組裝),表達(dá)量的計(jì)算,cufflinks cufflinks -p 8 -G transcript.gtf -library-type fr-unstranded -o
20、cufflinks_output tophat_out/accepted_hits.bam,5 轉(zhuǎn)錄組分析方法(Reference-based 組裝),差異表達(dá)基因的篩選,5 轉(zhuǎn)錄組分析方法,5 轉(zhuǎn)錄組分析方法,同源基因鑒定(Orthologs),5 轉(zhuǎn)錄組分析方法,幾種簡(jiǎn)單的聚類方法,簡(jiǎn)單聚類 層次式聚類 K-means聚類 SOM自組織映射神經(jīng)網(wǎng)絡(luò),熱圖,K-means聚類,SOM 自組織映射聚類,5 轉(zhuǎn)錄組分析方法,K-means聚類,1 導(dǎo)入已經(jīng)標(biāo)準(zhǔn)化的數(shù)據(jù),3 計(jì)算FOM值,5 轉(zhuǎn)錄組分析方法,K-means聚類,5 轉(zhuǎn)錄組分析方法,K-means聚類,6 聚類參數(shù)設(shè)置,7 聚類結(jié)果,5 轉(zhuǎn)錄組分析方法,K-means聚類,8 圖片結(jié)果保存, GO,5 轉(zhuǎn)錄組分析方法,Blas
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年大學(xué)第一學(xué)年(新聞學(xué))新聞學(xué)專業(yè)基礎(chǔ)綜合測(cè)試試題及答案
- 多源醫(yī)療數(shù)據(jù)整合支持的臨床決策系統(tǒng)
- 2025年高職(文秘)商務(wù)文秘實(shí)務(wù)階段測(cè)試題及答案
- 2025年高職旅游管理(導(dǎo)游業(yè)務(wù)實(shí)操)試題及答案
- 2026年金融風(fēng)控智能SaaS平臺(tái)項(xiàng)目公司成立分析報(bào)告
- 多級(jí)醫(yī)院數(shù)據(jù)協(xié)同的區(qū)塊鏈權(quán)限模型
- 2025年大學(xué)理學(xué)(有機(jī)化學(xué))試題及答案
- 2025年大學(xué)二年級(jí)(藥學(xué))藥物化學(xué)試題及答案
- 2025年高職(體育保健與康復(fù))運(yùn)動(dòng)康復(fù)評(píng)估階段測(cè)試題及答案
- 2025年大學(xué)建筑材料管理(管理技術(shù))試題及答案
- 《智慧水電廠建設(shè)技術(shù)規(guī)范》
- 2.3《河流與湖泊》學(xué)案(第2課時(shí))
- 工地臨建合同(標(biāo)準(zhǔn)版)
- GB/T 46275-2025中餐評(píng)價(jià)規(guī)范
- 2025至2030供水產(chǎn)業(yè)行業(yè)項(xiàng)目調(diào)研及市場(chǎng)前景預(yù)測(cè)評(píng)估報(bào)告
- 2025年6月大學(xué)英語(yǔ)四級(jí)閱讀試題及答案
- 神經(jīng)內(nèi)外科會(huì)診轉(zhuǎn)診協(xié)作規(guī)范
- 高中詩(shī)歌手法鑒賞考試題
- 2025年及未來(lái)5年中國(guó)幽門螺桿菌藥物行業(yè)市場(chǎng)調(diào)查研究及發(fā)展戰(zhàn)略規(guī)劃報(bào)告
- 設(shè)備安裝安全施工培訓(xùn)課件
- 2025至2030年中國(guó)水泥基滲透結(jié)晶型堵漏材料市場(chǎng)分析及競(jìng)爭(zhēng)策略研究報(bào)告
評(píng)論
0/150
提交評(píng)論