版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
項目概 項目報告重要名詞及術 合同關鍵指 項目基本信 項目執(zhí)行情 項目結果概 項目流 酶切方案設 實驗流 信息分析流 生物信息學分 酶切方案評 酶切方 酶切均勻性評 數(shù)據(jù)質(zhì) 原始數(shù)據(jù)介 堿基質(zhì)量分 堿基類型分 低質(zhì)量數(shù)據(jù)過 數(shù)據(jù)統(tǒng) 建庫評 比對效率統(tǒng) 酶切效率評估統(tǒng) 片段選擇評 標記開 與參考組比對統(tǒng) SLAF開 SNP檢測及注 標記在組上的分 關聯(lián)分 高質(zhì)量SNP篩 SNP-index方法關聯(lián)結 ED方法關聯(lián)結 候選區(qū)域篩 候選區(qū)域的功能注 候選區(qū)域的SNP注 候選區(qū)域的功能注 結果可視 數(shù)據(jù)..............................................................................................................結果文件查看說 SVG文件格式的查 附件1分子標記輔助選擇 項目概本項目利用百邁客生物科技自主研發(fā)的SLAF-seq(Specific-獲得與性狀緊密關聯(lián)的分子標記和候選區(qū)域并對區(qū)域內(nèi)進行功能注釋和富項目報告重要名詞及術英英文名Pair-end中文名產(chǎn)生的reads,SLAF采用的是雙 ,因 SLAF經(jīng)過SLAF-seq建庫產(chǎn)生的特定酶切片段,一個酶片段就是一個SLAFPolymorphic 多態(tài)性SLAF群體中存在多態(tài)性的SLAF,其中主要存在的SNPRepetitive SLAF簽
位于重復序列區(qū)的SLAF,在數(shù)據(jù)上的表現(xiàn)SLAF的深度遠高于平均水 單核苷酸多態(tài) DNA序列上出現(xiàn)的單堿基變 DNA序列上插入和/或缺失類的結構變異AssociationRegion GeneAnnotation 富集分 對關聯(lián)區(qū)域內(nèi)的注釋進行功能分類,增加研究合同關鍵指完成4個樣品的SLAF簡化組,開發(fā)30萬個SLAF,保數(shù)據(jù)評估:數(shù)據(jù)質(zhì)量和GC含量的統(tǒng)計SLAF標記開發(fā):與參考組比對、SLAF開發(fā)SNP檢測和注釋:SNP檢測及注釋關聯(lián)分析:通過計算兩個混池間等位的型頻率確定與目候選區(qū)域的功能注釋:對關聯(lián)區(qū)域內(nèi)的進行GOKEGG、COG、NR、SwissProt數(shù)據(jù)庫注釋項目基本信樣品信息樣品編 BMK編親本1(父本 親本2(母本 混池 混池 注:BMK編號:百邁客對樣品的統(tǒng)一編號,實驗建庫和后續(xù)信息分析均使用該編號混池規(guī)模:30+30;群體類型:F2群體參考組信息根據(jù)小麥的組大小以及GC含量等信息,最終選取小麥組作為參考組。物種信息:小麥(TriticumaestivumL),實際組大小17,000參考物種信息:小麥(TriticumaestivumL)[2]組,組裝出的組大小為1,454.60Mb,GC含量為46.05%,該組組裝到水平,有注釋信息,版本號為v1,地址:項目執(zhí)行情樣品信息到位時間為20171212日項目啟動時間為20171226日項目分析完成時間為20180214日項目結果概度為264~364bp,預測到302,715個SLAF。數(shù)據(jù)質(zhì)控:共獲得117.50MReads,Q30達到80%SLAF標記開發(fā):共獲得836,089個SLAF,每個SLAF的母本深度為44x,父本深度為43x,混池深度為28x和22x。長度為31.07Mb;ED關聯(lián)算法,共得到18個與性狀相關的侯選區(qū)域,總長度為Mb關聯(lián)區(qū)域內(nèi)注釋到227個,其中非同義突變SNP位點的共3個。項目流酶切方案設利用自主研發(fā)的酶切預測軟件對參考組進行酶切預測選擇最適酶切方酶切片段在組上盡量均勻分布酶切片段長度與具體實驗體系的吻合程度最終獲得酶切片段(SLAF)數(shù)滿足預期數(shù)實驗流根據(jù)選定的最適酶切方案對檢測合格的各樣品組DNA分別進行酶切。對得到的酶切片段(SLAF)進行3′端加A處理、連接Dual-index[4]接PCRIlluminaHiSeqTM2500,PE125bp進序。為評估酶切實驗的準確性,選用擬南芥(ArabidopsisthalianaecotypeColumbia)[5]作為對照(Control)進序。SLAF信息分析流利用Dual-index對得到的原始數(shù)據(jù)進行識別,得到各個樣品的reads。過濾reads的接頭后,進序質(zhì)量和數(shù)據(jù)量的評估。通過Control數(shù)據(jù)評估HaeIII的酶切效率,以此判斷實驗過程的準確性和有效性。通過將reads與參考組比對,在親本和混池中開發(fā)SLAF,尋找在親本中存在多態(tài)性的SLAF和有reads覆蓋區(qū)域的SNP。將得到的SNP進行關聯(lián)分析,獲得與性SLAF-BSASLAF-BSA生物信息學分酶切方案評酶切方對小麥參考組序列進行電子酶切預測根據(jù)上文所述酶切方案選擇原則,RsaI464-484bpSLAF標簽,預測可得到301,104個SLAF,具體信息見下表:464-注:Enzyme:酶切預測確定的限制性內(nèi)切酶;InsertSize:酶切預測確定的酶切片段長度范圍;SLAFNumber:酶切預測確定的酶切方案在參考物種組中可以得到的SLAF數(shù)。酶切均勻性評統(tǒng)計SLAF在各上的數(shù)量見下表SLAF在各上的數(shù)量統(tǒng)ChromosomeChromosomeExpectedSLAF注:注:Chromosome編號;SLAFnumber數(shù);Chromosome長度;AverageSLAFdistanceSLAF繪制SLAF在上的分布圖見下圖評價SLAF在組中分SLAF在參考組各上的分注:橫坐標為長度,每一個黃色條帶代表一條,按照1M的大小對組進行了劃分,每個window內(nèi)的SLAF數(shù)越多,顏色越深,SLAF數(shù)越少,顏色越淺;圖中顏色越深的區(qū)域即SLAF由上可知,SLAF在組各上分布基本均勻,酶切方案可行 數(shù)據(jù)質(zhì)原始數(shù)據(jù)介高通量如IllunimaHiSeq2500等平臺得到的原始圖像數(shù)據(jù)文件,稱之為RawData或RawReads,結果以FASTQ(簡稱為fq)文件格式,其中包含序列(Reads)的序列信息以及其對應的質(zhì)量信息。樣品中真 :110:C3B41ACXX:4:1101:1401:21631:N:0:TAAGGCIllumina識別符(SequenceIdentifiers)和描述文字(選擇性部分);第二行四行是對應序列的質(zhì)量。Illumina識別符(SequenceIdentifiers)詳細信息見如下Illumina標識詳細信 Uniqueinstrument Run Flowcell Flowcell Tilenumberwithintheflowcell 'x'-coordinateoftheclusterwithinthe 'y'-coordinateoftheclusterwithinthe Memberofapair,1or2(paired-endormate-pairreadsonly) Yifthereadfailsfilter(readisbad),Notherwise 0whennoneofthecontrolbitsareon,otherwiseitisaneven Index基的質(zhì)量值。如果錯誤率用e表示,IllunimaHiSeq2500的堿基質(zhì)量值用Qphred=-IllunimaCasava1.8版本錯誤率與質(zhì)量值簡明對應關系如下表所示.5?I堿基識別(BaseCalling)分析軟件:IllunimaCasava1.8版本參數(shù):雙端(Pairedend,PE)堿基質(zhì)量分每個堿基錯誤率是通過Phred數(shù)值(Phredscore,Qphred)得到,而Phred數(shù)值是在堿基識別(BaseCalling)過程通過一種預測堿基判別發(fā)生錯誤Phred分在DNA模板固定到上,在固定DNA模板的過程中,每個DNA分子會形成一個會發(fā)生,在時,軟件通過前4個堿基對這些的點進行分析和識5′端前幾個堿基的錯誤率相對較高另外錯誤率會隨著序(SequencedReads)的長度的增加而升高,這是由于過程中化學試劑的消耗而導致的。因此在進行堿基質(zhì)量分布分析時,樣品的堿基質(zhì)量分布4個堿基和后十錯誤率的關系,質(zhì)量值轉(zhuǎn)換成錯誤率,繪制錯誤率分布圖如下:樣品P堿基錯誤率分注:橫坐標為reads的堿基位置,縱坐標為單堿基錯誤率,前101bp為雙端序列的第一端reads的錯誤率分布情況,后101bp為另一端reads的錯誤率分布情況。堿基類型分AT、GC分離現(xiàn)象,這種分離現(xiàn)象可能是建庫過程中差異擴增引起的,直接影響到后續(xù)的分析。根據(jù)堿基互補配對的原則,A與T和C與G的含量分別是一致的。SLAF-seqreads為組DNA的酶切片段,其堿基分布會受到酶切位點和PCR擴增的影響,reads的前2樣品P各堿基比例分注:橫坐標為rads的堿基位置,縱坐標為堿基所占的比例;不同顏色代表不同的堿基類型,綠色代表堿,藍色代表堿基,紅色代表堿基,紫色代表堿基T,灰色代表中識別不出的堿基。前101bp為雙端序列的第一端rea的堿基分布,后101bp為另一端read堿基分布。每個cyce代表的每個堿基,如第一即示該項目所有在一個堿基的 的分布情況。該圖的結果顯示AT、CG堿本不發(fā)生分離,說明結果正常低質(zhì)量數(shù)據(jù)過得到的原始序列(SequencedReads)或者RawReads,里面含有帶CleanReads,用于后續(xù)信息分析。去除帶接頭(adapter)的reads若一條reads上N(未能確定出具體的堿基類型的比例大于10%,則過掉該Pair-endreadsAdapter_RelatedPM注:BMKID:百邁客對項目樣品的統(tǒng)一編號;Raw_Reads:原始reads數(shù);Adapter_Related:含接頭數(shù)據(jù)統(tǒng)對各樣品的數(shù)據(jù)進行統(tǒng)計,包括reads數(shù)量、Q30和GC含量,具體結各樣品數(shù)據(jù)統(tǒng)計PM注:BMKID:百邁客對項目樣品的統(tǒng)一編號;Raw_Reads:原始reads數(shù)目,以四行為一個單位,統(tǒng)計Pair-end序列的個數(shù);Clean_Readsreads數(shù),計算方法同RawReads;Clean_Bases:過濾后的堿基數(shù),CleanReads數(shù)乘以序列長度;Q30(%)30的堿基占總堿基數(shù)的百分比;GC(%)GCGC類型的堿基占總堿基的百分比;Control:用于評估實驗建庫的擬南芥建庫評)通過對Control(擬南芥數(shù)據(jù)的評估實驗過程是否正常確定酶切方案實施的有效性。本項目中Control所用擬南芥為Arabidopsisthaliana(ecotypeColumbia),組大小為119.48M,版本號為v7.0,地址:)。比對效率統(tǒng)通過BWA[6]軟件將Control的reads與參考組進行比對,比對結果84.79%,比對效率基本正常。Controlreads比對結果統(tǒng)計
mappedreads
mappedreads
Unmap 注:Paired-endmappedreads:一條序列兩端在參考組上的比對跨度介于50bp~1kb的reads占總reads的比例;Single-endmappedreads:一條序列兩端在參考組上的比對跨度小于50bp,或大于1kb的reads占總reads的比例;Unmapreads:未比對到組上的reads占總reads的比例;Single-endmappedreadsUnmapreads來源:由于接頭過濾不全,reads中堿基錯配,異常的插入片段大小等類似情況導致酶切效率評估統(tǒng)酶切效率是評價簡化組實驗是否成功的一個關鍵指標組上的復雜結構區(qū)域(如環(huán)狀結構域、連續(xù)酶切位點等)、組DNA樣品純度較低、酶通過統(tǒng)計reads插入片段中殘留酶切位點的比例,統(tǒng)計比例越低,酶切效率越好。ControlControl數(shù)據(jù)的酶切效率98.83%,表明酶切反應正常。ControlDigestionDigestion注:DigestionNormally:reads中不存在完整的限制性內(nèi)切酶(HaeIII)識別序列;Digestion片段選擇評根據(jù)Controlpair-endmappedreads在組中的位置計算SLAF的實際長度,Controlreads插入片段分布見下圖ControlreadsreadsSLAF方案標記開與參考組比對統(tǒng)使用BWA軟件將樣品得到的reads與unlink組進行比對。比對結果統(tǒng)80%,比對不正常。樣品的比對結果見下表BMK PMB注:BMKID:百邁客對項目樣品的統(tǒng)一編號;Total_Reads:Total_Reads數(shù),雙端分別統(tǒng)計,即read1和read2記為2條reads;Mapped(%):定位到參考組的CleanReads數(shù)占所有CleanReads數(shù)的百分比;Properlymapped:雙端序列均定位到參考組上且距離符合片段的長度分布。此項目樣品的平均比對效率均在90%以上,說明樣品正常SLAF開本項目利用小麥組共開發(fā)836,089個SLAF,SLAF親本平均測序深度為42.67x,混池平均深度為25.16x,具體統(tǒng)計見下表:BMKSLAFPM注:注:BMKID:百邁客對項目樣品的統(tǒng)一編號;SLAFnumberdepth:對應樣品的在SLAF中的總深度,即開發(fā)出SLAF的reads總數(shù);Averagedepth:平均每個SLAF上對應樣品的reads數(shù)。SNP檢測及注樣品與參考組間SNP的檢P的檢測主要使用T[7軟件工具包實現(xiàn)根據(jù)Reads在參考TK進行局部重比對(LocalReligent)TK變異檢測,mtolsTK和mtools[8PP位點集。使用GATK進行變異檢測,主要包括SNPInDel使用samtools進行變異檢測,主要包括SNPInDel使用GATKsamtools分別得到的變異中位點一致的部分作為最終的具體流程可參考GATK的Best分。其中注釋行包含文件數(shù)據(jù)行的INFO和FORMAT列中使用的各種標識符的SNP變異結果信息 .GA .AG .CT .AG 1123.4G5ASNP6789樣品的型信vcf文件的詳細說明信息見網(wǎng)頁SNPreadsSNPSNP類型的變異分為轉(zhuǎn)換和顛換兩種,同種類型堿基之間突變稱為轉(zhuǎn)換基,則該SNP位點稱為純合SNP位點;若同源上的SNP位點包含不同類型樣品之SNP的檢根據(jù)樣品與參考組的比對結果,匯總樣品之間所有有差異的變異位點,各樣品SNP列表示PMCCTCCGGAGGAATAACNTCCTNCTTCCTCCTTCTT注:Chr:SNP位點所在的名稱;Pos:SNP在參考序列的位置;Ref:參考序列的堿基類型;PM、B1、B2:各樣品在該SNP位點對應的堿基類型SNP型的編碼采用標準核苷酸符號,符號表如下所示核苷意核苷意AMAC(aMinoCSGC(StronginGWAT(WeakinTBGTC(notA)(BcomesafterUDGAT(notC)(DcomesafterRGAHACT(notG)(HcomesafterYTCVGCA(notT,notU)(VcomesafterKGTNAGCT樣品間SNP的統(tǒng)計結果如下圖所示樣品間SNP統(tǒng)計Venn注:變異位點數(shù)量venn統(tǒng)計只考慮位置是否相同,不考慮型是否相同SNP注根據(jù)變異位點在參考組上的位置以及參考組上的位置信息可以得到變異位點在組發(fā)生的區(qū)域(間區(qū)、區(qū)或CDS區(qū)等),以及變異EFF=Effect(Effect_Impact|Functional_Class|Codon_Change|Amino_Acid_Change|Amino_Acid_Length|Gene_Name|Transcript_BioType|Gene_Coding|Transcript_ID|Exon_Rank|Genotype_Number[|ERRORS|WARNINGS])EFF=Effect(Effect_Impact|Functional_Class|Codon_Change|Amino_Acid_Change|Amino_Acid_Length|Gene_Name|Transcript_BioType|Gene_Coding|Transcript_ID|Exon_Rank|Genotype_Number[|ERRORS|WARNINGS])類 意 變異所在的區(qū)域或類Effectimpact 變異影響大小(High,Moderate,Low,Modifier)FunctionalClass 功能分類(NONE,SILENT,MISSENSE,NONSENSE)
氨基酸編碼改變(原氨基酸類型、位置、改變后氨基酸類型 氨基酸編碼蛋白的長度(轉(zhuǎn)錄本長度 轉(zhuǎn)錄本功 編碼蛋白(CODING| 轉(zhuǎn)錄本Exon/Intron 變異的型位 SNP注釋結果統(tǒng)PvsB1vs 00PvsM和B1vsB2為兩個樣品間存在的對應類型的SNP 間 內(nèi)(無轉(zhuǎn)錄本信息 上游區(qū)域(5K以內(nèi) 下游區(qū)域(5K以內(nèi) 剪切供體突變(exon2bp內(nèi) 剪切受體突變(exon2bp內(nèi) 非同義的起始子突 起始子丟 終止子獲 終止子丟 同義終止子突 由于gff文件中信息不完整而無法得到準確的判標記在組上的分統(tǒng)計不同上的SLAF與SNP標記的分布,見下表SLAF和SNP標記在上的分布統(tǒng)Chromosome SLAF 注:ChromosomeID:編號;SLAFnumber:位于相于相應上的SNP數(shù)目上的數(shù);SNPnumber根據(jù)SLAF在上的分布繪制SLAF和多態(tài)性SLAF的染色SLAF和SNP標記在上的分注:橫坐標為長度,每一個黃色條帶代表一條,按照1M的大小對組進行了劃分,每個window內(nèi)的SLAF數(shù)越多,顏色越深,SLAF數(shù)越少,顏色越淺;圖中顏色越深的區(qū)域即SLAF集中分布的區(qū)域。左圖為SLAF的分布圖,右圖為SNP標記的分布圖。SLAF關聯(lián)分高質(zhì)SNP篩SNP進行過濾,過濾標準如下:首先過濾掉有多個型的SNP位點,其次過濾掉read支持度小于4SNP位點,再次過濾掉混池之間型一致的SNP位點以及隱性混池不是來自于隱性親本的SNP位點,SNP192,967個。SNP 多個等Read支持 利用親本過濾 總過濾高質(zhì)的位
小于4的位 位
點 B1vs SNP-index是近年來的一種通過混池間的型頻率差異進行標記關聯(lián)SNP與性狀關聯(lián)度越強,Δ(SNP-index)1。Maaaa池來源于母本的深度;PaaaaMabab池來源于母本的深度;Pabab標記的ΔSNP-index值進行擬合[10],本項目并采用SNPNUM方法對△SNP-indexSNPXXSNP的△SNP-index的中值作為該位點擬合SNP-index及△SNP-index的分布如下圖所示:SNP-index關聯(lián)值在上的分注:橫坐標為名稱,彩色的點代表計算出來的SNP-index(或SNP-index)值,黑色的線為擬合后SNP-index(SNP-index)B1混池的SNP-indexB2SNP-index值的分布圖;下圖是SNP-index0.99的閾值線,藍色的線0.950.90的閾值線。用擬合后ΔSNP-index990.341731.07Mb,共包含274個,其中非同義突變的共3個。包含的區(qū)域Chromosome Gene 注:注:Chromosome大小,以Mb為單位;Genenumber:關聯(lián)區(qū)域內(nèi)的數(shù)量ED方法關聯(lián)結顯著差異標記,并以此評估與性狀關聯(lián)區(qū)域的方法[12]。理論上,BSA項目構建目標位點的ED值應趨向于0。ED方法的計算如下所示,ED值越大表明該AmutA堿基在突變混池中的頻率,AwtA堿基在野生型混池中的頻率;CmutC堿基在突變混池中的頻率,CwtC堿基在野生型混池中的頻率;GmutG堿基在突變混池中的頻率,GwtG堿基在野生型混池中的頻率;TmutT堿基在突變混池中的頻率,TwtT堿基在野生型混池中的頻率。在進行分析時,利用兩混池間型存在差異的SNP位點,統(tǒng)計各個堿基EDED進行乘方處理[12],本項目取原始ED的4次方作為關聯(lián)值以達到消除背景噪音的LOESSED值進行擬合,關聯(lián)值分布如下ED關聯(lián)值在上的分注:橫坐標為名稱,彩色的點代表每個SNP位點的ED值,黑色的線為擬合后的ED值,紅色的虛線代表顯著性關聯(lián)閾值,ED值越高,代表該點關聯(lián)效果越好。median+3SD作為分析的關聯(lián)閾值[10]0.14。根據(jù)關聯(lián)閾值判定,共得到18個區(qū)域,總長度為63.91Mb,共包含650個,其中非同義突變SNP位點的共6個。包含的區(qū)域列表如下:Chromosome Gene 注:注:Chromosome大小,以Mb為單位;Genenumber:關聯(lián)區(qū)域內(nèi)的數(shù)量候選區(qū)域篩ChromosomeGene--注:注:Chromosome大小,以Mb為單位;Genenumber:關聯(lián)區(qū)域內(nèi)的數(shù)量候選區(qū)域的功能候選區(qū)域的SNP注本項目樣品間在候選區(qū)域內(nèi)的SNP注釋結果見下表SNPPvsB1vs20328400注:Type:SNP所在區(qū)域或類型;PvsMB1vsB2為兩個樣品間在關聯(lián)區(qū)域內(nèi)存在的對應類SNP數(shù)量。SNP3SNP直接相關,這些SNP所在的我們稱之為非同義突變,共3個;混池間存在非同義突變的SNP共3個,非同義突變共3個。候選區(qū)域的功能注XX個,注釋結果見下表:AnnotatedGeneNon_SynGene333333注:Annotateddatabases:功能注釋數(shù)據(jù)庫;GeneNumber:在相應數(shù)據(jù)庫有注釋信息的候選區(qū)域數(shù)Non_SynGeneNum:候選區(qū)域內(nèi)親本間存在非同義突變的數(shù)候選區(qū)域內(nèi)的GO富集分GO數(shù)據(jù)庫是一個結構化的標準生物學注釋系統(tǒng),建立了及其產(chǎn)物功能節(jié)點所代表的功能越具體。通過GO分析并按照Cellularcomponent、MolecularFunction、Biologicalprocess對進行分類。候選區(qū)域內(nèi)GO分類統(tǒng)計結果見下圖候選區(qū)域內(nèi)GO注釋聚類注:橫坐標為GO各分類內(nèi)容,縱坐標左邊為數(shù)目所占百分比,右邊為數(shù)目。此圖展示的是關聯(lián)區(qū)域內(nèi)所有背景下GO各二級功能的分類情況。topGO有向無環(huán)圖能直觀展示關聯(lián)區(qū)域內(nèi)富集的GOterm及其層級關候選區(qū)域內(nèi)的Cellularcomponent的topGO有向無環(huán)圖如下候選區(qū)域內(nèi)的CellularcomponenttopGO有向無環(huán)圖分注:對每個GO10個節(jié)點在圖中用方框表示,圖中還包含其各層對應關系。每個方框(或橢圓)內(nèi)給出了該GO節(jié)點的內(nèi)容描述和富集顯著性值。不同顏色代表不同的富集顯著性,顏候選區(qū)域GO的富集分析結果見下表ATPATPL-ascorbicacid4protein specific0naringenin3-dioxygenase74ligase7isomerase1methionine 0注:GO.ID:GO節(jié)點的編號;Term:GO節(jié)點名稱;Annotated:所有注釋到該功能的數(shù);Significant:DEG注釋到該功能的數(shù);Expected:注釋到該功能DEG數(shù)目的期望值;KS:富集節(jié)點的顯著性統(tǒng)計,KS值越小,表明富集越顯著。候選區(qū)域內(nèi)的KEGG富集分在生物體內(nèi),不同相互協(xié)調(diào)來行使生物學功能,不同的間相同的作用通路為一個Pathway,基于Pathway分析有助于進一步解讀的功能。候選區(qū)域內(nèi)的KEGG注釋結果按照通路類型進行分類,分類圖如下候選區(qū)域內(nèi)的通路分布注:橫坐標為注釋到該通路下的個數(shù)及其個數(shù)占被注釋上的總數(shù)的,縱坐標為KEGG代謝通路候選區(qū)域內(nèi)的代謝通路結果見下圖KEGG候選區(qū)域內(nèi)的KEGG富集部分結 Proteinprocessinginendosmic Flavonoidnt-pathogenLimoneneandpinenePorphyrinandchlorophyllTyrosinePyruvate注:Pathway:KEGG通路名稱;KO:KEGG通路編號;Enri 候選區(qū)域內(nèi)COG分類統(tǒng)COG數(shù)據(jù)庫是基于細菌、藻類、真核生物的系統(tǒng)進化關系構建而成,利用COG數(shù)據(jù)庫可以對產(chǎn)物進行直系同源分類關聯(lián)區(qū)域內(nèi)COG分類統(tǒng)計候選區(qū)域內(nèi)COG注釋分類結果可圖,軟件:。親本間的結果可視化在上的分布見下親本間結果可視化在上的分注:從外到里依次為:第一圈:坐標,第二圈:分布,第三圈:SNP密度分布(紅數(shù)據(jù)結果文件查看說上傳中有Readme.txt在Windows系統(tǒng)下查看文件推薦使用Editplus或UltraEdit作為文本瀏覽程序,否則會因文件過大造成死機Unix或Linux系統(tǒng)下可以瀏覽較大的文本文件,Less等操作命令可以順利地查看。SVG文件格式的報告文件含有SVG格式的文件,SVG是矢量化的文件,可以隨意SVGSVG插件。【參考文獻Sun,X.etal.SLAF-seq:AnEfficientMethodofLarge-ScaleDeNovoSNPDiscoveryandGenotyUsingHigh-ThroughputSequencing.PLoSOne8,SequencingProjectInternationalRiceGenome.Themap-basedsequenceofthericegenome.Nature436,793–800(2005).Davey,J.W.etal.SpecialfeaturesofRADSequencingdata:implicationsforgenoty.Mol.Ecol.22,3151–3164(2013).Kozich,J.J.,Westcott,S.L.,Baxter,N.T.,Highlander,S.K.&Schloss,P.D.Developmentofadual-indexsequencingstrategyandcurationpipelineforyzingampliconsequencedataonthemiseqilluminasequencingtform.Appl.Environ.Microbiol.79,5112–5120ysisofthegenomesequenceofthefloweringntArabidopsisthaliana.Nature408,796–815(2000).LiH,DurbinR.FastandaccurateshortreadalignmentwithBurrows-WheelerTransform.Bioinformatics,200925:1754-60McKennaA,HannaM,BanksE,SivachenkoA,etal.TheGenomeysisToolkit:aMapReduceframeworkforyzingnext-generationDNAsequencingdata.GenomeRes.201020:1297-303LiH,HandsakerB.,WysokerA.,FennellT.,RuanJ.,HomerN.,MarthG.,etal.TheSequencealignment/map(SAM)formatandSAMtools.Bioinformatics,2009CingolaniP,ttsA,WangleL,etal.Aprogramforannotatingandpredictingtheeffectsofsinglenucleotidepolymorphisms,SnpEff:SNPsinthegenomeofDrosophilamelanogasterstrainw1118;iso-2;iso-3.",Fly(Austin).2012Fekih,R.etal.MutMap+:GeneticMapandMutantIdentificationwithoutCrossinginRice.PLoSOne8,1–10(2013).Takagi,H.etal.QTL-seq:RapidmapoftativetraitlociinricebywholegenomeresequencingofDNAfromtwobulkedpopulations.ntJ.74,174–183Hill,J.T.etal.MMAPPR:MutationMapysisPipelineforPooledRNA-seq.GenomeRes.23,687–697(2013).StephenF.Altschul,ThomasL.Madden,AlejandroA.Sch?ffer,etal.GappedBLASTandPSI-BLAST:ANewGenerationofProteinDatabaseSearchPrograms.NucleicAcidsRes,199725(17):3389YangyangDENG,JianqiLI,SongfengWU,etal.IntegratednrDatabaseinProteinAnnotationSystemandItsLocalization.ComputerEngineering,200632(5):71-74MichaelAshburner,CatherineA.Ball,JudithA.Blake,etal.Geneontology:toolfortheunificationofbiology.TheGeneOntologyConsortium.NatGenet,(25):RomanL.Tatusov,MichaelY.Galperin,DarrenA.Natale,etal.TheCOGdatabase:atoolforgenome_scaleysisofproteinfunctionsandevolution.NucleicAcidsRes,2000_7_128(1):33_6MinoruKanehisa,SusumuGoto,ShuichiKawashima,etal.TheKEGGresourcefordecipheringthegenome.NucleicAcidsRes2004,(32):D277_D2801分子標記輔助選擇分子標記輔助選擇是通過分析與目標緊密或完全連鎖的分子標記的
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年冊亨縣事業(yè)單位招聘考試及答案
- 2025年江蘇省銀行招聘線上筆試及答案
- 2025年北京農(nóng)商青鸞科技筆試及答案
- 2025年滄州市人事考試及答案
- 2025年蘇州 人事考試及答案
- 2025年海曙區(qū)事業(yè)單位考試題目及答案
- 2025年上半年教資時間筆試及答案
- 2026深圳市立數(shù)教育科技有限公司貴州辦事處招聘9人筆試參考題庫及答案解析
- 2025年阿壩州事業(yè)單位遴選考試及答案
- 2025年外國人上北大免筆試及答案
- 2024年度高速公路機電設備維護合同:某機電公司負責某段高速公路的機電設備維護2篇
- 《城鎮(zhèn)液化石油氣加臭技術規(guī)程》
- 新高考數(shù)學之圓錐曲線綜合講義第26講外接圓問題(原卷版+解析)
- 癌癥患者生活質(zhì)量量表EORTC-QLQ-C30
- QCT55-2023汽車座椅舒適性試驗方法
- 孕產(chǎn)婦妊娠風險評估表
- 消化系統(tǒng)疾病健康教育宣教
- 河南省洛陽市2023-2024學年九年級第一學期期末質(zhì)量檢測數(shù)學試卷(人教版 含答案)
- Unit-3-Reading-and-thinking課文詳解課件-高中英語人教版必修第二冊
- 新版出口報關單模板
- 14K118 空調(diào)通風管道的加固
評論
0/150
提交評論