下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、Small RNA :生物體內(nèi)一類高度保守的重要的功能分子,其大小在1 8 3 On t,包括microRNA、siRN A、snRNA、sn o RN A 和 piRNA( p iw i in t er a ctin g RNA)等,它的主要功能 是誘導(dǎo)基因沉默,調(diào)控細(xì)胞生長、發(fā)育、基因轉(zhuǎn)錄和翻譯等生物學(xué)過程。以m i RNA為例介紹它們的功能:mi R NA與RNA誘導(dǎo)沉默復(fù)合體 (RN A indu ce d si lenc i n g c om p lex, RIS C)結(jié)合,并將此復(fù)合體與其互補(bǔ)的m R N A序列結(jié)合,根據(jù)靶序列與miRNA的互補(bǔ)程度,從而導(dǎo)致靶序列降解或干擾靶序列
2、蛋白質(zhì)的翻譯過程。SD區(qū)域:S egm ent duplicati o n,串聯(lián)重復(fù)是由序列相近的一些DNA 片段串聯(lián)組成。串聯(lián)重復(fù)在人類基因多樣性的靈長類基因中發(fā)揮重要作用。Ge notyp e a n d ph e n o type :基因型與表型,基因型是指某一生物個體全部基因組合 的總稱;表型,又稱性狀,是基因型和環(huán)境共同作用的結(jié)果?;蚪M:Genome ,單倍體細(xì)胞核、細(xì)胞器(線粒體、葉綠體)或病毒粒子所含的全部DNA分子或RNA分子。全基因組 de no vo 測序:又稱從頭測序,它不依賴于任何現(xiàn)有的序列資料 ,而直接對某個 物種的基因組進(jìn)行測序,然后利用生物信息學(xué)分析手段對序列進(jìn)
3、行拼接、組裝, 從而獲得該物種的基因組序列圖譜。全基因組重測序:對已有參考序列(Refer e nee Seq u ence)物種的不同個體進(jìn)行基因組測 序,并以此為基礎(chǔ)進(jìn)行個體或群體水平的遺傳差異性分析。 全基因組重測序能夠發(fā)現(xiàn)大量的 單核苷酸多態(tài)性位點(diǎn)(SNP)、拷貝數(shù)變異(Copy Number Va ria t ion , CNV)、插入缺失(I n De l, I n sertio n/Deletion)、結(jié)構(gòu)變異(S truct ur e Va ri atio n,SV、等變異類型,以準(zhǔn)確快速的方法將單個參考基因組信息上升為群體遺傳特征。轉(zhuǎn)錄組:Tra n s c r i pt o
4、 me,是指特定生長階段某組織或細(xì)胞內(nèi)所有轉(zhuǎn)錄產(chǎn)物的集合;狹義上指所有mRNA的集合。轉(zhuǎn)錄組測序:對某組織在某一功能狀態(tài)下所能轉(zhuǎn)錄出來的所有RNA進(jìn)行測序,獲得特定狀態(tài)下的該物種的幾乎所有轉(zhuǎn)錄本序列信息。通常轉(zhuǎn)錄組測序是指對 mR NA進(jìn)行測序獲得相關(guān)序列的過程。其根據(jù)所研究物種是否有參考基因組序列分為轉(zhuǎn)錄組de no vo測序(無參考基因組序列 )和轉(zhuǎn)錄組重測序(有參考基因組序列) .外顯子組測序:是指利用序列捕獲技術(shù)將全基因組外顯子區(qū)域DN A捕捉并富集后進(jìn)行高通量測序的基因組分析方法。外顯子測序相對于基因組重測序成本較低, 對研究已知基因的SNP、I nDe l 等具有較大的優(yōu)勢。目標(biāo)區(qū)
5、域測序 :應(yīng)用相關(guān)試劑盒對基因組上感興趣的目標(biāo)區(qū)域進(jìn)行捕獲富集后進(jìn)行大規(guī)模測 序, 一般需要根據(jù)目標(biāo)區(qū)域?qū)iT定制捕獲芯片。宏基因組:Metag enome,指特定生活環(huán)境中全部微小生物遺傳物質(zhì)的總和。它包含了 可培養(yǎng)的和未可培養(yǎng)的微生物的基因。目前主要指環(huán)境樣品中的細(xì)菌和真菌的基因組總和。 宏基因組 16S rRNA 測序:可以對特定環(huán)境下的細(xì)菌和古細(xì)菌群體的微生物種類和豐度進(jìn) 行有效的鑒定。對不同地點(diǎn)、不同條件下的多個樣本1 6 S rRNA的PCR產(chǎn)物平行測序,可以比較不同樣本間的微生物組成及成分差異,進(jìn)而闡明物種豐度、種群結(jié)果等生態(tài)學(xué)信息。 表觀遺傳學(xué):Epi g enetics,是指在
6、基因組 DNA序列沒有改變的情況下,基因的表達(dá)調(diào)控 和性狀發(fā)生了可遺傳的變化。表觀遺傳的現(xiàn)象很多,已知的有 DNA甲基化(D N A meth ylation ),基因組印記(g enomic i mp ritin g),母體效應(yīng)(maternal e ff ec ts ),基因 沉默(g enesilen c ing),核仁顯性,休眠轉(zhuǎn)座子激活和 RNA編輯(RNA editi n g)等。全基因組甲基化測序 : DNA 甲基化是指在 DNA 甲基化轉(zhuǎn)移酶的作用下 ,在基因組 CpG 二 核苷酸的胞嘧啶 5' 碳位共價鍵結(jié)合一個甲基基團(tuán)。 DNA 甲基化已經(jīng)成為表觀遺傳學(xué)和表觀 基因
7、組學(xué)的重要研究內(nèi)容。甲基化是基因表達(dá)的主要調(diào)控方式之一,研究染色體DNA甲基化情況是了解基因調(diào)控的重要手段。對已經(jīng)有參考基因組的物種的基因組DNA用標(biāo)準(zhǔn)亞硫酸氫鹽(Bi s ul f ite)處理后,未甲基化的胞嘧啶C會脫氨基形成尿嘧啶U,經(jīng)PCR擴(kuò)增,U替換為胸腺嘧啶T ,而發(fā)生甲基化的胞嘧啶C保持不變。將處理組與參考基因組序列進(jìn)行比對,可發(fā)現(xiàn)甲基化位點(diǎn)并對甲基化情況進(jìn)行定量分析的方法叫做全基因組甲基化測序Chi p-Seq : Chr omat i n Immu n oprec i pit atio n se que nc ing,即染色質(zhì)免疫共 沉淀-測序技術(shù),即通過染色質(zhì)免疫共沉淀技術(shù)
8、特異性地富集目的蛋白結(jié)合的DNA片段.對富集得到的DNA片段進(jìn)行純化與文庫構(gòu)建,然后進(jìn)行高通量測序,從而得到全基因組范圍內(nèi) 可以與目的蛋白相互作用的DNA片段的方法叫做 ChIP Seq。數(shù)字表達(dá)譜:Digital Gene Exp r es sion Profile ,利用新一代高通量測序技術(shù)和高性能計算分析技術(shù),能夠全面、經(jīng)濟(jì)、快速地檢測某一物種特定組織在特定狀態(tài)下的基因表達(dá)情 況,即運(yùn)用特定的酶對 mRNAgpo lyA tail 21 25nt的位置進(jìn)行酶切, 所獲得的帶 po lyA 尾的序列(Tag )通過高通量測序,該ta g被測得的次數(shù)即是對應(yīng)基因的表達(dá)值。數(shù)字基因表達(dá)譜已被廣
9、泛應(yīng)用于基礎(chǔ)科學(xué)研究、醫(yī)學(xué)研究和藥物研發(fā)等領(lǐng)域。特點(diǎn)是經(jīng)濟(jì),但獲得的數(shù)據(jù)量有限。若想獲得轉(zhuǎn)錄本的更多信息的話,一般都采用轉(zhuǎn)錄組測序的方法來測序。SBS:se q uen cin g b y sy n t he si s,邊合成邊測序反應(yīng),是指在D NA聚合酶的作用 下延伸堿基所進(jìn)行的測序。Run:指高通量測序平臺單次上機(jī)測序反應(yīng)。La n e:也叫ch an nel,單泳道,每條泳道包含 2列(colum n),每列分布有多個小區(qū)(t il e) o不同的測序平臺 Flow C ell中所含的Lane不一樣,如Hi Se q 2 0 00是2個flow c ell ,每個fl ow cel l
10、中含有8個 la n e;HiSeq 250 0是包含 2 個m ini flow cel l (快 速運(yùn)行模式)和2個h igh ou t p ut f low ce l l,兩個模式不能同時運(yùn)行,其中每個 mini f l ow cell 包含 2 個 I a n e,每個 hi g h out p ut flow cell 中包含 8 個 la n e; M i se q系統(tǒng)的flow c ell僅含有1個l ane .Til e :小區(qū),每條L ane中有2列t ile,合計120個小區(qū)。每個小區(qū)上分布數(shù)目繁多的簇 結(jié)合位點(diǎn)。Cl u ster :簇,在I llu mi n a測序平臺
11、中會采用橋式PCR方式生產(chǎn)DN A簇,每個DNA簇才能產(chǎn)生亮度達(dá)到CC D可以分辨的熒光點(diǎn).I nd ex:標(biāo)簽,在I I l umi na平臺的多重測序(M u l ti p le x ed Seque nci n g)過程中 會使用In dex來區(qū)分樣品,并在常規(guī)測序完成后,針對I n dex部分額外進(jìn)行7個循環(huán)的測序,通過In dex的識別,可以在 1條Lane中區(qū)分1 2種不同的樣品。Barcod e :與Ind e x同義,多指在 Roc he GS FLX 454測序平臺的16 S P C R產(chǎn)物的測序 過程中接頭序列所包含的的用來區(qū)分不同樣本的序列。PF %PF %是指符合測序質(zhì)
12、量標(biāo)準(zhǔn)的簇的百分比,與測序的通量相關(guān)聯(lián)Fas ta: 一種序列存儲格式.一個序列文件若以 FAS TA格式存儲,則每一條序列的第一行以“"開頭,而跟隨“”的是序列的 ID號(即唯一的標(biāo)識符)及對該序列的描述信息;第二行 開始是序列內(nèi)容,序列短于 61nt的,則一行排列完;序列長于 6 In t的,則每行存儲6 1 nt,最后剩下小于 61nt的,在最后一行排列完;第二條序列另起一行,仍然由“"和序列 的ID號開始,以此類推。Fa stq:Fastq 是S o l exa測序技術(shù)中一種反映測序序列的堿基質(zhì)量的文件格式。第一行以“符號開頭,后面緊跟一個序列的描述信息;第二行是該
13、序列的內(nèi)容;第三行以“ +”符號開頭,后面可以是該序列的描述信息,也可省略;而第四行是第二行中的序列內(nèi)容每個堿基 所對應(yīng)的測序質(zhì)量值Re a d:高通量測序平臺產(chǎn)生的序列標(biāo)簽就稱為reads ?;蚪M組裝:進(jìn)行基因組或轉(zhuǎn)錄組deno vo測序時,物種基因組經(jīng)構(gòu)建不同的文庫測序所得的片段需經(jīng)過生物信息學(xué)手段對其進(jìn)行整理拼接,并通過一定的標(biāo)準(zhǔn)(如N5 0)對后 續(xù)組裝結(jié)果進(jìn)行質(zhì)量評估等,最終獲得高準(zhǔn)確度的基因組序列的過程基因組測序深度:測序得到的總堿基數(shù)與待測基因組大小的比值。如測一個物種的全基因組 的重測序,基因組大小約為5G測序獲得100G的數(shù)據(jù)量,則測序深度為2 0X.基因組覆蓋率:指測序獲
14、得的序列占整個基因組的比例。由于基因組中的高GC、重復(fù)序列等復(fù)雜結(jié)構(gòu)的存在,測序最終拼接組裝獲得的序列往往無法覆蓋有所的區(qū)域,這部分沒有獲得的區(qū)域就稱為 Gap,例如一個細(xì)菌基因組測序,覆蓋率是9 8%,那么還有2%的序列區(qū)域 是沒有通過測序獲得的。Con tig:在de novo 測序中拼接軟件基于f eads之間的 overla p 區(qū),拼接獲得的中間沒有g(shù)a p的序列稱為C onti g (重疊群)。Scaffol d :基因組 de nov o測序,通過 re ads 拼接獲得 C on tigs 后,往往還需 要構(gòu)建454 Pair ed end庫或Il 1 umina Mat ep
15、 a i r 庫,以獲得一定大小片段(如3K b、8K b、10K b、20Kb)兩端的序 列.基于這些序列,可以確定一些 Con tig 之間 的順序關(guān)系,這些先后順序已知的Cont i gs 組成S c af fo l d .Cont ig N 5 0 : Reads拼接后會獲得一些不同長度的Con tigs。將所有的Co ntig長度相加,能獲得一個Conti g總長度。然后將所有的C on tig s按照從長到短進(jìn)行排序, 如獲得C ont i g 1, Co nt ig 2, Con tig 3Co nt ig 2 5。將 Con tig 按照這個順序依次相加,當(dāng)相加的長度達(dá)到C o
16、nti g總長度的一半時,最后一個加上的 Con tig長度即為Con tig N50。舉例:Co nt ig 1+Conti g 2+ C o n tig 3 +C ontig 4=Co ntig 總長度 * 1/ 2 時, C on tig4的長度即為 Co ntig N50. C ont i g N5 0可以作為基因組拼接的結(jié)果好壞的一個判斷標(biāo)準(zhǔn).Scaf f o1 d N5 0 : Sc a f f old N 5 0 與 Contig N5 0 的定義類似。Co n t i g s 拼 接組裝獲得一些不同長度的Sea ff o lds.將所有的Sc aff old長度相加,能獲得一個
17、Scaffold總長度。然后將所有的Scaff o lds按照從長到短進(jìn)行排序,如獲得Sc af f ol d 1 , Scaf fold 2, S c a ffo 1 d 3Scaff old 25。將 Scaffol d按照這個順序依次相加,當(dāng)相加的長度達(dá)到Sc a f fold 總長度的一半時,最后一個加上的S ca f f o l d長度即為Scaffold N50 。舉例:Sc a ff o l d 1+Sc a ff o ld 2+ Scaffol d 3 +Scaffold 4 +Sc af f old 5= Sc af fo l d總長度* 1/2 時,Sc a f fo 1
18、d 5 的長度即為 Scaf f ol d N50。Scaf f o 1 d N5 0可以作為基因組拼接的結(jié)果好壞的一個判斷標(biāo)準(zhǔn)。Isotig :指在轉(zhuǎn)錄組d e n o vo測序時,用45 4平臺測序完成后組裝出的結(jié)果,一個isotig可視為一個轉(zhuǎn)錄本。Is ogr oup :指轉(zhuǎn)錄組de no vo測序中,用45 4平臺測序完成后組裝出的結(jié)果獲得的可 聚類到同一個基因的轉(zhuǎn)錄本群。GC%:GC含量,全基因組范圍內(nèi)或在特定基因組序列內(nèi)的4種堿基中,鳥嘌呤和胞嘧啶所占的比率。SNP sing 1e nu c l eo tide p olymorphism ,單核苷酸多態(tài)性, 個體間基因組 DNA
19、序列 同一位置單個核苷酸變異(替代、插入或缺失)所引起的多態(tài)性;不同物種個體基因組 D N A序列同一位置上的單個核苷酸存在差別的現(xiàn)象。有這種差別的基因座、DNA序列等可作為基因組作圖的標(biāo)志°SN P在CG序列上出現(xiàn)最為頻繁,而且多是C轉(zhuǎn)換為T,原因是CG中的C常為甲基化的,自發(fā)地脫氨后即成為胸腺嘧啶。一般而言,S NP是指變異頻率大于1 % 的單核苷酸變異,主要用于高危群體的發(fā)現(xiàn)、疾病相關(guān)基因的鑒定、藥物的設(shè)計和測試以及 生物學(xué)的基礎(chǔ)研究等。I n De1: Insertion /Deletio n,插入/缺失,在基因組重測序進(jìn)行 mappi n g時,進(jìn)行容 Gap的比對并檢測可
20、信的 Short In Del ,如基因組上小片段50bp的插入或缺失.在檢測過 程中,Gap的長度為15個堿基.CNV copy nu mbe r var iati on,基因組拷貝數(shù)變異,是基因組變異的一種形式, 通常使基因組中大片段的DNA形成非正常的拷貝數(shù)量如人類正常染色體拷貝數(shù)是2,有些染色體區(qū)域拷貝數(shù)變成1或3,這樣,該區(qū)域發(fā)生拷貝數(shù)缺失或增加,位于該區(qū)域內(nèi)的基因表達(dá)量也會受到影響。如果把一條染色體分成A -B-C D四個區(qū)域,則A-B-C-C D/A C-B -C - D/A C-C -B-C-D/A-B- D分別發(fā)生了 C區(qū)域的擴(kuò)增及缺失,擴(kuò)增的位置可以是連續(xù) 擴(kuò)增如A B C
21、-C-D也可以是在其他位置的擴(kuò)增,如A- C-B- C- D.SV :structure vari at i on,基因組結(jié)構(gòu)變異,染色體結(jié)構(gòu)變異是指在染色體上發(fā)生了大片段的變異 . 主要包括染色體大片段的插入和缺失 (引起 CNV 的變化),染色體內(nèi)部的某塊 區(qū)域發(fā)生重復(fù)復(fù)制、翻轉(zhuǎn)顛換、易位、兩條染色體之間發(fā)生重組 (i n ter-chrom oso me t r a n s loca ti on) 等?;虮磉_(dá)差異 : 是指某一物種或特定細(xì)胞在特定時期/功能狀態(tài)下 , 多樣本間不同基因在mRNAK平上表達(dá)量的差異,可通過RP KM/FPKM直來體現(xiàn)。RPKMR e a d s Per K
22、 i lo ba se p e r Milli on m appe d read s Mor tazavietal.,20 0 8,是指每1百萬個map上 的re a d s 中map 到外顯子的每1K個堿基上的re ad s個數(shù)。計算公式四 RPKM= 06C/NL/ 1 0 3 ,其中C為唯一比對到目的基因的 read s數(shù);N 為唯一比對到參考基因的總rea d s數(shù)丄 是目的基因編碼區(qū)的堿基數(shù)。 RP KM法可以消除基因長度、數(shù)據(jù)量之間的差異進(jìn)行計算基因表達(dá)量??勺兗羟校篴 1 t e rnativ e s p l i c i ng大多數(shù)真核基因轉(zhuǎn)錄產(chǎn)生的m RNA前體是按一種方 式剪接產(chǎn)生出一種 mRNA因而只產(chǎn)生一種蛋白質(zhì)。但有些基因產(chǎn)生的mRNA前體可按不同的方式剪接,產(chǎn)生出兩種或更多種 mRN A,即可變剪接
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- CCAA - 2023年10月建筑施工領(lǐng)域?qū)I(yè)答案及解析 - 詳解版(65題)
- 山東省煙臺市海陽市2025-2026學(xué)年八年級上學(xué)期期末生物學(xué)試題(含解析)
- 中學(xué)學(xué)生課外活動管理制度
- 【寒假專項】人教版六年級數(shù)學(xué)下冊《百分?jǐn)?shù)(二)》應(yīng)用題專項訓(xùn)練(含答案)
- 養(yǎng)老院環(huán)境衛(wèi)生管理制度
- 企業(yè)薪酬管理制度
- 統(tǒng)編版(2024)七年級上冊歷史第四單元 三國兩晉南北朝時期:政權(quán)分立與民族交融(16-20課)素養(yǎng)提升教案
- 2025年山東省人民檢察院招聘聘用制書記員考試真題
- 稀土拋光粉工操作管理測試考核試卷含答案
- 鑿巖臺車司機(jī)創(chuàng)新方法考核試卷含答案
- 物業(yè)項目綜合服務(wù)方案
- 2025-2026學(xué)年北京市西城區(qū)初二(上期)期末考試物理試卷(含答案)
- 公路工程施工安全技術(shù)與管理課件 第09講 起重吊裝
- 企業(yè)管理 華為會議接待全流程手冊SOP
- 供水企業(yè)制度流程規(guī)范
- 2026年城投公司筆試題目及答案
- 北京市東城區(qū)2025-2026學(xué)年高三上學(xué)期期末考試英語 有答案
- 河南省2025年普通高等學(xué)校對口招收中等職業(yè)學(xué)校畢業(yè)生考試語文試題 答案
- 2023初會職稱《經(jīng)濟(jì)法基礎(chǔ)》習(xí)題庫及答案
- 預(yù)應(yīng)力管樁-試樁施工方案
- GB/T 3500-1998粉末冶金術(shù)語
評論
0/150
提交評論