諾禾rna-seq結(jié)題報(bào)告8月small致源生物信息科技_第1頁(yè)
諾禾rna-seq結(jié)題報(bào)告8月small致源生物信息科技_第2頁(yè)
諾禾rna-seq結(jié)題報(bào)告8月small致源生物信息科技_第3頁(yè)
諾禾rna-seq結(jié)題報(bào)告8月small致源生物信息科技_第4頁(yè)
諾禾rna-seq結(jié)題報(bào)告8月small致源生物信息科技_第5頁(yè)
已閱讀5頁(yè),還剩25頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

NHXXX_植物無(wú)參SmallRNA生物信息分析報(bào)告一、建庫(kù)實(shí)驗(yàn)流1TotalRNA樣品檢3庫(kù)4上機(jī)二、生物信息分析流三、項(xiàng)目結(jié)果及其說(shuō)1原始序列數(shù)2數(shù)據(jù)質(zhì)量評(píng) 2.2原 2.3數(shù)據(jù)過(guò)3與轉(zhuǎn)錄本比4已知miRNA分5ncRNA分6重復(fù)序列比7新miRNA預(yù)8植物ta-siRNA檢9sRNA分類注釋統(tǒng)10miRNA堿基編輯分11miRNA分12miRNA表達(dá)及差異分12.1miRNA12.313miRNA靶預(yù)14差異miRNA靶GO和KEGG分14.1候選靶GO分14.2候選靶KEGG分四、參考文一、建庫(kù)實(shí)驗(yàn)流致源對(duì)樣品檢測(cè)、建庫(kù)、每一個(gè)生產(chǎn)步驟都嚴(yán)格把控,從根本上確保了高質(zhì)量數(shù)據(jù)的產(chǎn)出。實(shí)驗(yàn)流程圖如下:1TotalRNA樣品檢瓊脂糖凝膠電泳分析RNANanodrop檢測(cè)RNA的純度(OD260/280比值QubitRNA濃度進(jìn)行精確定量2文庫(kù)構(gòu)SmallRNAcDNAPCR擴(kuò)增,PAGE膠電泳分離DNA片段,切膠回收得到的即為cDNA文庫(kù)。構(gòu)建原理圖如下:3庫(kù)文庫(kù)構(gòu)建完成后,先使用Qubit2.0進(jìn)行初步定量,稀釋文庫(kù)至1ng/ul,隨后使用Agilent2100對(duì)文庫(kù)的insertsize進(jìn)行檢測(cè),insertsize符合預(yù)期后,使用Q-PCR方法對(duì)文庫(kù)的有效濃度進(jìn)行準(zhǔn)確定量(文庫(kù)有效濃度>2nM),以保證文庫(kù)質(zhì)量。4上機(jī)HiSeq/MiSeq二、生物信息分析流程鑒于該物種是植物,且無(wú)參考組,采用植物smallRNA無(wú)參分析流程,示意圖如下三、結(jié)果展示及說(shuō)明1原始序列數(shù)經(jīng)堿基識(shí)別(BaseCalling)分析轉(zhuǎn)化為原始序列(SequencedReads),我們稱之為RawData或RawReads,結(jié)果以FASTQ(簡(jiǎn)稱為fq)文件格式,其中包含序列(reads)的FASTQ格式文件中每個(gè)read由四行描述其中第一行以―開(kāi)頭,隨后為Illumina標(biāo)識(shí)符(SequenceIdentifiers)和描述文(選擇性部分);第二行是堿基序列;第三行以―+‖開(kāi)頭,隨后為Illumina標(biāo)識(shí)符(選擇性部分);第四行是對(duì)應(yīng)序列的質(zhì)量(Cocketal.,2010)。illumina標(biāo)識(shí)符詳細(xì)信息如下Instrument–uniqueidentifieroftherunnumber–RunnumberonFlowCellID–IDof8LaneNumber–positiveTileNumber–positiveX–xcoordinateofthespot.IntegerwhichcanbeY–ycoordinateofthespot.Integerwhichcanbe1ReadNumber-1forsinglereads;1or2forpairedNwhetheritisfiltered-NB:Yifthereadisfilteredout,notinthedeliveredfastqfile,N0controlnumber-0whennoneofthecontrolbitsareon,otherwiseitisanevenindex第四行中每個(gè)字符對(duì)應(yīng)的ASCII值減去33,即為對(duì)應(yīng)第二行堿基的質(zhì)量值。如果測(cè)序錯(cuò)誤率用e表示,illuminaHiSeqTM2000/MiSeqQphred表示,則有下列關(guān)系:一: illuminaCasava1.8版本錯(cuò)誤率與質(zhì)量值簡(jiǎn)明對(duì)應(yīng)關(guān)系如下.5?I2數(shù)據(jù)質(zhì)量評(píng)2.1錯(cuò)誤率分布檢每個(gè)堿基錯(cuò)誤率是通過(guò)Phred數(shù)值(Phredscore,Qphred)通過(guò)1轉(zhuǎn)化得到,Phred數(shù)值是在堿基識(shí)別(BaseCalling)過(guò)程中通過(guò)一種預(yù)測(cè)堿基判別發(fā)生錯(cuò)誤概率模型Phred分不正確的堿基識(shí)堿基正確識(shí)別Q-于RNA-seq技術(shù),錯(cuò)誤率分布具有兩個(gè)特點(diǎn):(1)錯(cuò)誤率會(huì)隨著序列(SequencedReads)長(zhǎng)度的增加而升高,這是由于過(guò)程中化學(xué)試劑的消耗而導(dǎo)致的,并且為Illumina高通量平臺(tái)都具有的特征(ErlichandMitra,2008;Jiangetal.,2011)。(2)前幾個(gè)堿基的位置也會(huì)發(fā)生較高的錯(cuò)誤率,是要因?yàn)樵赗NA-seq建庫(kù)過(guò)程中反轉(zhuǎn)全結(jié)合(Jiangetal.,2011)。錯(cuò)誤率分布檢查用于檢測(cè)在長(zhǎng)度范圍內(nèi),有無(wú)錯(cuò)誤率異常的堿基位置。一般情況下,每個(gè)堿基位置的錯(cuò)誤率都應(yīng)該低于0.5%。項(xiàng)目結(jié)果見(jiàn)圖 2QC/2.1RawData_ErrorRate)橫坐標(biāo)為reads的堿基位置,縱坐標(biāo)為2.2原始數(shù)據(jù)質(zhì)量情況匯總樣品產(chǎn)出原始數(shù)據(jù)質(zhì)量評(píng)估情況詳見(jiàn) 2.2ErrorGCAB注Sample:樣品idBases:原 序列的長(zhǎng)度,并轉(zhuǎn)化為以G為單位 rate: Q20:Phred數(shù)值大于20的堿基占總體堿基的百分比Q30:Phred數(shù)值大于30的堿基占總體堿基的百分比GCcontentGC的數(shù)量總和占總體堿基數(shù)量的百分比 數(shù)據(jù)過(guò)濾必須對(duì)rawreads進(jìn)行處理,得到cleanreads。去除有5’接頭污染的去除沒(méi)有3’接頭序列和插入片段的trim3’接頭序列RNA5’Adapter(RA5),part:RNA3’Adapter(RA3),N%>lowwithcleanA391194226129767733B228125923540570948174注Sample:樣品idN%>10%N10%reads數(shù)及其占總rawreads數(shù)的比例lowquality:因低質(zhì)量,過(guò)濾掉的reads數(shù)及其占總rawreads5_adapter_contamine:因含有5’接頭,過(guò)濾掉的reads數(shù)及其占總rawreads3_adapter_nullorinsert_null:因沒(méi)有3’接頭或沒(méi)有插入片段,過(guò)濾掉的reads數(shù)及其占總rawreads數(shù)的比例withployA/T/G/C:因ployA/T/G/C,過(guò)濾掉的reads數(shù)及其占總rawreads數(shù)的比例cleanreadscleanreads數(shù)及其占總rawreads數(shù)的比例2.4sRNA長(zhǎng)度篩選RNA(sRNA)的種類(uniq表示)及數(shù)量(total表示)【見(jiàn)表2.4.1】,并對(duì)小RNAmiRNA21~22nt,siRNA24nt等。TotalTotalbasesUniqUniqbasesAB注Sample:樣品idTotalreads:sRNA的總數(shù)(Uniqreads:sRNAUniqbases(bp)sRNA橫坐標(biāo)為reads的長(zhǎng)度,縱坐標(biāo)為該長(zhǎng)度的reads所占的比例,不同的顏色代表不同的長(zhǎng)度類注:結(jié)題報(bào)告中只顯示一個(gè)樣本的sRNA長(zhǎng)度分布結(jié)果(信息見(jiàn)結(jié)果文件夾2QC/2.4length_filter)2.5公共及特有序列分析統(tǒng)計(jì)兩樣品間公共序列和特有序列的種類(uniq表示)及數(shù)量(total表示)分布情況。【見(jiàn)圖2.5】注樣本AspecificA的特有序列樣本A&B樣本Bspecific2 Specific_sRNA中。與轉(zhuǎn)錄本比分布情況(后面的sRNA分類是針對(duì)這些mappedsRNA)。TotalMapped"+"Mapped"-"MappedA770311B933734注Sample:樣品idTotalsRNA:經(jīng)2.4―sRNA長(zhǎng)度篩選‖reads數(shù)MappedsRNAreads中能mapped到參考序列的reads‖MappedsRNA:該樣本reads中能mappedreads―-‖MappedsRNA:該樣本reads中能mappedreadsmiRNA分RNAmiRNARNAmiRNA成熟體序列首位堿基具有很強(qiáng)的偏向性,因此還進(jìn)行了不同長(zhǎng)度miRNA的首位點(diǎn)堿基分布,另外還有miRNA的各位點(diǎn)堿基分布統(tǒng)計(jì)。項(xiàng)目結(jié)果見(jiàn)如下圖表:注:結(jié)題報(bào)告中只顯示部分已知miRNA分析結(jié)果,完整的信息包含在結(jié)果文件夾4Known_miRNAABMappeduniqMappedtotal注第n+2列分別為樣本1到n配上的miRNA成熟體個(gè)數(shù)。MappedhairpinmiRNA2miRNA前體個(gè)數(shù);第3到n+2列分別1到nmiRNA前體個(gè)數(shù)MappeduniqsRNARNA的種類。第2miRNA3到第n+2列分別為樣本1n匹配miRNA前體RNA的種類MappedtotalsRNARNA的個(gè)數(shù)。第2列為所有的樣本總共匹配到已miRNA3到第n+2列分別為樣本1n匹配miRNA前體RNA的個(gè)數(shù)4.2部分匹配上的已知miRNA的二級(jí)結(jié)構(gòu)(示意圖整個(gè)序列是miRNA前體,紅色突出部分為成熟體序列所ABath-ath-ath-ath-ath-2709ath-ath-ath-ath-注1列:miRNAid2n+11到n匹配到該成熟體的sRNA的個(gè)數(shù)(readcount)匹配上已知miRNA的小RNA的細(xì)節(jié)情況展示(詳解,見(jiàn)圖totalreadcountath-miR156areadcount2414remainingreadcount8pri_struct .))))))...))).))))))))).))).))))))))).)))...)))...)))))).#MM _x1 _x3 _x4 _x1 _x230橫坐sRNA長(zhǎng)度,縱坐標(biāo)為該sRNA中首位堿基出現(xiàn)A/U/C/G的百分率(柱形圖上方的數(shù)值為該長(zhǎng)度sRNA的總條數(shù))橫坐標(biāo)為sRNA的堿基位置,縱坐標(biāo)為該位置sRNA中出現(xiàn)堿基A/U/C/G的百ncRNA分當(dāng)有參考組時(shí),用blast、tRNAscan-SE-1.3.1、Cmsearch、snoscan-0.9b等軟件注釋樣品中的ncRNA序列;當(dāng)無(wú)參考組時(shí),選取Rfam中的rRNA、tRNA、snRNA、snoRNA來(lái)注釋所得的小RNA。盡可能的發(fā)現(xiàn)并去除其中可能的rRNA,tRNA,snRNA,snoRNA。AB1列:TypesncRNA2n+11nncRNAsRNA(readcount)重復(fù)序列比若有該物種重復(fù)序列/轉(zhuǎn)座子注釋信息,則用其重復(fù)序列信息來(lái)注釋所測(cè)得的 RNA盡可能的發(fā)現(xiàn)并去除其中可能的repeat序列,并統(tǒng)計(jì)了比對(duì)上各種repeat類型的小RNA(sRNA)種類(uniq表示)sRNA數(shù)量(total表示)Repeat分類統(tǒng)計(jì)情況如圖6.1和6.2重復(fù)序列表示方式:repeattestan(―+表示正鏈,―-‖表示負(fù)鏈)6.1Totalrepeatreads6.2UniqrepeatreadsmiRNA預(yù).,析,基本原理是通過(guò)截取一定長(zhǎng)度sRNA比對(duì)上的參考序列,通過(guò)探尋其二級(jí)結(jié)構(gòu)及DicernovelmiRNA,并進(jìn)行各樣本中匹配上的miRNA的各位點(diǎn)堿基分布情況的統(tǒng)計(jì)。項(xiàng)目結(jié)果見(jiàn)如下圖表:注:結(jié)題報(bào)告中只顯示部分已知miRNA分析結(jié)果,完整的信息包含在結(jié)果文件夾7Novel_miRNA中ABNovelMappeduniqMappedtotal注Novelhairpin:指預(yù)測(cè)到的前體。第2列為總共預(yù)測(cè)到的前體的3到第n+2列分別為樣本1n上檢MappeduniqsRNARNA2miRNA前體的RNA的種類;第3n+2列分別為樣本1nmiRNA前體的小RNA的種類MappedtotalsRNARNA2miRNA前體的RNA的個(gè)數(shù);第3n+2列分別為樣本1nmiRNA前體的小RNA的個(gè)數(shù)整個(gè)序列是miRNA前體,紅色突出部分為成熟體序列所ABnovel注1列:miRNAid2n+11到n匹配到該成熟體的sRNA的個(gè)數(shù)(readcount)匹配上新miRNA的小RNA的細(xì)節(jié)情況展示(詳解,見(jiàn)圖totalreadcount3082novel_1*readcount109novel_1readcount2973remainingreadcount0exp*********************ffffffffffffffffffffffffffffffffffMMMMMMMMMMMMMMMMMMMMMMpri_seqgggauugguggcuuggaaagcuucguucuuuucucuuuugaaugaauuuaauggcuuuccaaguccacccauuccua _x30 _x50 _x70 _x430橫坐sRNA長(zhǎng)度,縱坐標(biāo)為該sRNA中首位堿基出現(xiàn)A/U/C/G的百分率(柱形圖上方的數(shù)值為該長(zhǎng)度sRNA的總條數(shù))橫坐標(biāo)為sRNA的堿基位置,縱坐標(biāo)為該位置sRNA中出現(xiàn)堿基A/U/C/G的百ta-siRNA檢ta-siRNA是植物中發(fā)現(xiàn)的一類siRNA 。TAS分析,一方面,以水稻和擬南芥的已知TAS為數(shù)據(jù)庫(kù)進(jìn)行同源比對(duì);另一方面,運(yùn)用ta-siRNA識(shí)別軟件UEAsRNAtools(Moxonetal.,2008)來(lái)進(jìn)行的TAS預(yù)測(cè)。表8.1比對(duì)上TAS的sRNA統(tǒng)計(jì)AB注(+表示與TAS方向相同,―-‖表示與TAS方向相反第一列:TypesTAS2n+1是樣1到n匹配到該種類TASsRNA的個(gè)數(shù)(readcount)sRNA分類注釋統(tǒng)對(duì)上幾種不同的注釋信息的情況,為了使每個(gè)uniquesRNA有唯一的注釋,按照knownmiRNA>rRNA>tRNA>snRNA>snoRNA>repeat>novelmiRNA>ta-siRNA的優(yōu)先級(jí)順序smallRNArRNA總量可以作為一個(gè)樣品的質(zhì)控標(biāo)準(zhǔn):一般情況rRNA40%rRNA總量所占比例應(yīng)低于60%。9.1比對(duì)上的sRNAAABB注(1)total:指各樣品比對(duì)到參考序列的sRNA數(shù)量,后面都是以它為參照,來(lái)計(jì)算各類sRNA所占的比例。(2)known_miRNA:指各樣本比對(duì)到已知miRNA的sRNA的數(shù)量及所占比例。(3)rRNA/tRNA/snRNA/snoRNA:指各樣rRNA/tRNA/snRNA/snoRNAsRNA的數(shù)量及所占比例。(4)repeat:指各樣本比對(duì)到repeat的sRNA的數(shù)量及所占比例。novel_miRNA:指各樣本比對(duì)到新miRNA的sRNATAS:指各樣本比對(duì)到TAS的sRNA的數(shù)量及所占比例miRNA堿基編輯microRNA可能發(fā)生部分位置堿基的編輯,導(dǎo)致序列改變,進(jìn)而使得作用靶發(fā)來(lái)找出可能發(fā)生了堿基突變編輯的miRNA。pre-miRNA行:miRNA前體名稱、能比對(duì)上該前體的reads總數(shù)、發(fā)生堿基編輯的發(fā)生堿基編輯的reads數(shù)、后者/前者百分比;site[1-n]起下面幾行代表該成熟點(diǎn)n上的堿基編輯情況。site行,各列分別代表該位編輯信息,例如該位點(diǎn)發(fā)生UG的突變,突變發(fā)生的reads數(shù),及其占比對(duì)上該成熟體reads數(shù)的百分比。>pre-miRNA:ath-MIR156a1530613matruemiRNA:ath-miR156a814195site1:1U->A:1site2:1G->C:1site3:1A->G:1site4:1C->U:1注:結(jié)題報(bào)告中只顯示部分miRNA堿基編輯分析結(jié)果,信息見(jiàn)結(jié)果文件夾10miRNA_editingmiRNA分對(duì)檢測(cè)到的已知miRNA和新miRNA進(jìn)行分析,探索其所屬的miRNA在其他測(cè)到的已知和新miRNA前體的名,表格中的數(shù)據(jù)項(xiàng)―+‖表示在該物種中存在對(duì)應(yīng),―-‖表示不存在。結(jié)果見(jiàn)表11.1Hevea+-+--+Solanum-++++Ricinus++++-++-+Vitis++++-++-+Zea++++-+--+Sorghum++++-+-++Cynara+--+-+--+Glycine++++-++-+++++-++-+注:結(jié)題報(bào)告中只顯示部分miRNA分析統(tǒng)計(jì)結(jié)果,信息見(jiàn)結(jié)果文件夾11miRNA_familymiRNA表達(dá)及差異分miRNA表達(dá)水平分析:歸一化表達(dá)量注:結(jié)題報(bào)告中只顯示部分miRNA表達(dá)水平統(tǒng)計(jì)結(jié)果,完整信息12DiffExpr xls1列——―miRNA‖miRNAid2n+1列——―樣本名‖1nreadcountn+22n+1列——―樣本名(TPM)‖,分1nreadcountTPMnormalization后的miRNA表達(dá)量TPM密度分布圖 密度分布能整體檢查樣品的表達(dá)模式,項(xiàng)目結(jié)果見(jiàn)圖12.2.1樣品間相關(guān)性檢查樣品間表達(dá)水平相關(guān)性是檢驗(yàn)實(shí)驗(yàn)可靠性和樣本選擇是合理性的重要指標(biāo)。相關(guān)系1,表明樣品之間表達(dá)模式的相似度越高。若樣品中有生物學(xué)重復(fù),通常生物重復(fù)項(xiàng)目結(jié)果見(jiàn)圖12DiffExprysis/12.3Corysis12.3.1樣品間siRNA橫坐標(biāo)為樣1log10(TPM+1),縱坐標(biāo)2miRNA差異表達(dá)分析結(jié)果物學(xué)重復(fù)的樣品,分析我們采用基于負(fù)二項(xiàng)分布的DESeq(Andersetal.,2010)進(jìn)行分析;TMMreadcountDEGseq(Wangetal.,2010)結(jié)題報(bào)告中只顯示一組比較的miRNA差異表達(dá)分析部分結(jié)果,完整信息見(jiàn)結(jié)果文件 ysisAB注(1)sRNA:miRNA成熟體id。(2)GroupA:樣品A的readcount值。(3)GroupB:樣品B的readcount值。(4)log2.Fold_change.:log2(SampleA/SampleB)。(5)p.value:p值。q.value.Storey.et.al..2003.:校正后的pvalue,qvalue越小,表示表達(dá)差異越顯著差異miRNA篩選value)兩個(gè)水平進(jìn)行評(píng)估,對(duì)差異miRNA進(jìn)行篩選。當(dāng)樣品有生物學(xué)重復(fù)時(shí),差異miRNA的篩選條件項(xiàng)目結(jié)果見(jiàn)圖注:結(jié)題報(bào)告中只顯示一組比較的差異miRNA火山圖,信息見(jiàn)結(jié)果文 ysis/12.5DEsFilter橫坐標(biāo)代表miRNA在不同實(shí)驗(yàn)組中/不同樣品中表達(dá)倍數(shù)變化,縱坐標(biāo)代表miRNA表達(dá)量變化的統(tǒng)計(jì)學(xué)差異的miRNA差異miRNA聚類分析TPM值,用于層次聚類分析(結(jié)果見(jiàn)12.6.1),K-meansSOM聚上圖為整體log10(TPM+1)值進(jìn)行聚類,紅色表示高表miRNA,藍(lán)色表示低表達(dá)miRNA靶預(yù)對(duì)分析得到的已知、novelmiRNA進(jìn)行靶預(yù)測(cè),得到miRNA和靶間的對(duì)應(yīng)關(guān)系。結(jié)果如下(兩列分別是miRNAtargetgeneid):miRNAath-miR156acomp1896_c0ath-miR156gcomp57453_c0ath-miR156jcomp14483_c0ath-miR160acomp79521_c0ath-miR162acomp90511_c0ath-miR166acomp27466_c0ath-miR167acomp77318_c0ath-miR167dcomp270681_c0ath-miR168acomp81631_c1ath-miR169bcomp57059_c0ath-miR171acomp63201_c0ath-miR172acomp458537_c0ath-miR172ccomp458537_c0ath-miR172e注:結(jié)題報(bào)告中只顯示部分miRNA靶預(yù)測(cè)結(jié)果,信息見(jiàn)結(jié)果文件夾13miRNA_target中差異miRNA靶GO和KEGG分得到各組比較間的差異表達(dá)miRNA后,根據(jù)miRNA與其靶間的對(duì)應(yīng)關(guān)系,我們對(duì)每組差異表達(dá)miRNA的靶的集合分別進(jìn)行GeneOntology和KEGG富集分析。后面為了表述方便,把―差異表達(dá)miRNA的靶的集合‖稱為―候選靶‖。注:結(jié)題報(bào)告中只顯示部分富集分析結(jié)果,信息見(jiàn)結(jié)果文件夾14Enrient候選靶GO分GeneOntology(簡(jiǎn)稱GO, )是功能?chē)?guó)際標(biāo)準(zhǔn)分類體系。 的GO注釋,按照GO三個(gè)大類(BPBiologicalprocess,CCCellularcomponent,MFMolecularFunction)的下一層級(jí)進(jìn)行分類。分類結(jié)果如圖橫坐GO三個(gè)大類GOterm,縱坐標(biāo)為注釋到該term下(包括該termterm)的候選靶個(gè)數(shù),及其個(gè)數(shù)占被注釋上的候選靶總數(shù)的比例。3種不同分類表示Goterm的三種基本分因功能上的體現(xiàn)。GO富集分析方法為GOseq(Youngetal,2010),此方法基于Walleniusnon-centralhyper-geometricdistribution,相對(duì)于普通的Hyper-geometricdistribution,此分布的 長(zhǎng)度的偏進(jìn)行估計(jì)得到的,從而能更為準(zhǔn)確地計(jì)算出GOterm被候選靶富集的概率。結(jié)果如表14.1.2所示。chromatingeneRNAmetabolicDNAnucleicacidbiosyntheticprocessregulationofcellularmacromoleculebiosyntheticprocess注GO_accession:GeneOntologyDescription:GeneOntologyTerm_type:該GO的類別( Over_represented_pValue:富集分析統(tǒng)計(jì)學(xué)顯著水平,一般情況下,P-value<0.05該功能為富集項(xiàng)Corrected_pValueP-ValueP<0.05CAD_item:候選 中與該Term相關(guān) 中與該Term相關(guān) 候選靶KEGG分在生物體內(nèi),不同相互協(xié)調(diào)行使其生物學(xué)功能,通過(guò)Pathway顯著性富集能確定候選靶參與的最主要生化代謝途徑和信號(hào)轉(zhuǎn)導(dǎo)途徑。KEGG(KyotoEncyclopediaofGenesandGenomes)Pathway的主要公共數(shù)據(jù)庫(kù)(Kanehisaetal2008)。Pathway顯著性富集分析以KEGGPathway為單位,應(yīng)用超幾何檢驗(yàn),找出與整個(gè)組背景相比,在候選靶中顯著性富集的Pathway。該分析的計(jì)算其中,N為所有中具有Pathway注釋的數(shù)目;n為N中候選靶的數(shù)目;M為所有中注釋為某特定Pathway的數(shù)目;m為注釋為某特定Pathway的候選靶數(shù)目。FDR≤0.05Pathway定義為在候選靶中顯著富集的Pathway。表14.2.1候選靶KEGG顯著性富集列SampleBackgroundP-CorrectedP-5Terpenoidbackbone4Glycerolipid4Basaltranscription3Fanconianemia3Cutin,suberineandwax22Antigenprocessingand33注Term:KEGG通路的描述信息Id:KEGG數(shù)據(jù)庫(kù)中通路唯一的編號(hào)信息 Backgroundnumber:在該通路下的背 CorrectedP-value:矯正后的統(tǒng)計(jì)學(xué)顯著水平,一般情況下,P-value<0.05候選靶KEGG富集散點(diǎn)圖是KEGG富集分析結(jié)果的圖形化展示方式。在此圖中,KEGG富集程度通過(guò)Richfactor、Qvalue和富集到此通的個(gè)數(shù)來(lái)衡量。其中Richfactor指差異表達(dá)的 中位于該pathway條目的數(shù)目與所有有注釋中位于該pathway條目的 總數(shù)的比值。Richfactor越大,表示富集的程度越大。Qvalue是做過(guò)多重20條,則全部展示。圖14.2.2候選靶KEGG富集散點(diǎn)縱軸表示pathway名稱,橫軸表示Richfactor,點(diǎn)的大小表示此pathway中候選靶個(gè)數(shù)多少,而點(diǎn)的顏色對(duì)應(yīng)于不同的Qvalue范圍。將每條有候選靶富集的通路的代謝圖展示出來(lái),如(圖14.2.3),其中的小方框代表蛋白,紅色的小方框代表候選靶對(duì)應(yīng)的蛋白,鼠標(biāo)懸停于該節(jié)點(diǎn),會(huì)彈出相應(yīng)的靶基因id。以上步驟可脫機(jī)實(shí)現(xiàn),如連接互聯(lián)網(wǎng),點(diǎn)擊各個(gè)節(jié)點(diǎn),可以連接到KEGG數(shù)據(jù)庫(kù)中各個(gè)KO的具體信息頁(yè)。圖14.2.3候選靶KEGG富集通路3參考文Anders,S.,Huber,W.(2010).Differentialexpression ysisforsequencecountdata.GenomeBiology,ChenD.,YuanC.,ZhangJ.,ZhangZ.,BaiL.,MengY.,etal.(2011). ntNATsDB:acomprehensivedatabaseofntnaturalantisensetranscripts.NucleicAcidsResearch40:D1:D1187–D1193.(ntNATsDB)Cock,P.J.A.,Fields,C.J.,Goto,N.,Heuer,M.L.,andRice,P.M.(2010).TheSangerFASTQfileformatforsequenceswithqualityscores,andtheSolexa/IlluminaFASTQvariants.Nucleicacidsresearch38,1767-Erlich,Y.,andMitra,P.P.(2008).Alta-Cyclic:aself-optimizingbasecallerfornext-generationsequencing.Naturemethods5,679-682.FriedlanderM.R.,MackowiakS.D.,LiN.,ChenW.,Ra

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論