一步一步教你使用NCBI新_第1頁(yè)
一步一步教你使用NCBI新_第2頁(yè)
一步一步教你使用NCBI新_第3頁(yè)
一步一步教你使用NCBI新_第4頁(yè)
一步一步教你使用NCBI新_第5頁(yè)
已閱讀5頁(yè),還剩11頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、一步一步教你使用NCBI查找 DNA、mRNA、cDNA、Protein 、promoter 、引物設(shè)計(jì)、 BLAST序列比對(duì)等作者: urbest2007-8-1蘇州大學(xué)生命科學(xué)學(xué)院Part fourPart threePart twoPart one一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳最近看到很多戰(zhàn)友在論壇上詢(xún)問(wèn)如何查詢(xún)基因序列、如何進(jìn)行引物設(shè)計(jì)、如何使用BLAST進(jìn)行序列比對(duì),這些問(wèn)題在 NCBI 上都可以方便的找到答案?,F(xiàn)在我就結(jié)合我自己使用 NCBI 的一些經(jīng)歷 (經(jīng)驗(yàn)) 跟大家交流一下 BCBI 的使用。 希望大家都能發(fā)表自己的使用心得,讓我們共同進(jìn)步!我分以下幾個(gè)

2、部分說(shuō)一下NCBI 的使用:如何查找基因序列、 mRNA、Promoter如何查找連續(xù)的 mRNA、cDNA、蛋白序列運(yùn)用 STS 查找已經(jīng)公布的引物序列如何運(yùn)用BLAST進(jìn)行序列比對(duì)、檢驗(yàn)引物特異性特別感謝本版版主,將這個(gè)帖子置頂!從發(fā)帖到現(xiàn)在,很多戰(zhàn)友對(duì)該帖給與了積極的關(guān)注,在此向給我投票的(以及想給我投票卻暫時(shí)不能投票的)各位戰(zhàn)友表示真誠(chéng)的感謝,謝謝各位戰(zhàn)友!請(qǐng)大家對(duì)以下我發(fā)表的內(nèi)容提出自己的意見(jiàn)。關(guān)于 NCBI 其他方面的使用也請(qǐng)水平較高的戰(zhàn)友給予補(bǔ)充First of all,還是讓我們從查找基因序列開(kāi)始。第一部分 利用 Map viewer 查找基因序列、 mRNA序列、啟動(dòng)子( P

3、romoter )下面以人的IL6 (白細(xì)胞介素6)為例講述一下具體的操作步驟1打開(kāi) Map viewer頁(yè)面,網(wǎng)址為:/mapview/index.html在 search 的下拉菜單里選擇物種,for后面填寫(xiě)你的目的基因。操作完畢如圖所示:2點(diǎn)擊“ GO”出現(xiàn)如下頁(yè)面:2一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳3在步驟二圖示的右下角有一個(gè)Quick Filter,下面是讓你選擇的幾個(gè)復(fù)選框,在 Gene前面的小方框里打勾,然后點(diǎn)擊Filter.出現(xiàn)下圖:說(shuō)明一下 :1、染色體的紅色區(qū)域即為你的目的基因所處位置。 2、下面參考序

4、列給出了三個(gè),是不同的部門(mén)做出來(lái)的,經(jīng)我驗(yàn)證,序列有微小的差異,但總體來(lái)說(shuō)基本相同。盡管你分別點(diǎn)擊后,序列代碼、序列代碼等有所差異,但堿基基本一致,不影響大家研究分析序列?,F(xiàn)在普遍采用的是最上面的那個(gè)序列, 這一條是世界范圍的生物科學(xué)家用計(jì)算機(jī)合成的一個(gè)序列。我也推薦大家使用這個(gè)序列。3一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳4點(diǎn)擊上述三條序列第一條序列 (即 reference ) 對(duì)應(yīng)的 Genes seq ,出現(xiàn)新的頁(yè)面,頁(yè)面下方為:5點(diǎn)擊上圖出現(xiàn)的 “ Download/View Sequence/Evidence ” ,即下載查看序列等功能,結(jié)果如圖所示:先對(duì)上面這張圖做

5、點(diǎn)簡(jiǎn)要的說(shuō)明,在Sequence Format(序列輸出格式)后面是一個(gè)下拉式選擇菜單,默認(rèn)的為FASTA格式,還有一個(gè)是GenBank格式。我推薦大家選擇GenBnak格式,因?yàn)檫@個(gè)格式提供了很多該基因的信息,而FASTA格式只有基因序列。6在 Sequence Format后選擇GenBank,然后點(diǎn)擊下面的Display ,目的基因的相關(guān)信息和序列就出現(xiàn)在眼前了。點(diǎn)擊后如圖所示(網(wǎng)頁(yè)較大,只抓取一小部分以作示范):4一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳在上述打開(kāi)的網(wǎng)頁(yè)中,你可以看到基因長(zhǎng)度,基因序列, 以及這個(gè)基因是如何被報(bào)道出來(lái)的等各種信息。你會(huì)看到 : mRNAjoi

6、n(3598.3678,3841.4031,5090.5203,5911.6057,7803.8394)這代表了從基因的 3598 位開(kāi)始就是轉(zhuǎn)錄區(qū)了, 即我們常說(shuō)的 mRNA片斷,由于內(nèi)含子的存在,所以 mRNA在 DNA序列上分成了幾段。CDS join(3660.3678,3841.4031,5090.5203,5911.6057, 7803.7970)CDS代表編碼序列,即蛋白編碼區(qū)是從3660 開(kāi)始的( ATG),由于剪接作用所以CDS區(qū)也是不連續(xù)的。說(shuō)到這里,可能很多朋友都已經(jīng)明白了promoter即啟動(dòng)子區(qū)域在哪里了。但我還是再?lài)Z叨幾句: 轉(zhuǎn)錄起始位點(diǎn)前面是基因的調(diào)控區(qū),啟動(dòng)子區(qū)

7、沒(méi)有明顯的位置定義,大家也只是猜測(cè)它的大體位置,如果你要研究promoter區(qū)的話(huà),建議你選擇轉(zhuǎn)錄起始位點(diǎn)前的2000個(gè)堿基進(jìn)行研究,一般默認(rèn)的是這樣。當(dāng)然你如果覺(jué)得長(zhǎng)度太長(zhǎng)不好研究的話(huà),也可以只研究-1000 到 0 這一千個(gè)堿基,因?yàn)橐话闱闆r下,啟動(dòng)子區(qū)的變異都在這個(gè)區(qū)域內(nèi)。這樣大家就可以找到自己的目的基因序列和啟動(dòng)子了,這種方法可能使用的人不是很多,但我個(gè)人比較喜歡,因?yàn)樗畲蟮膬?yōu)點(diǎn)是可以找到啟動(dòng)子區(qū)域和其他調(diào)控區(qū)域。希望大家可以發(fā)帖交流,讓我們把NCBI 用的更好!5一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳第二部分如何查找連續(xù)的mRNA、cDNA、蛋白序列(依然以人類(lèi)的 I

8、L6 為例)1進(jìn)入 NCBI 主頁(yè): /在 search 后面選擇Gene,在 for 后面填寫(xiě)需要查找的基因的名字。如圖所示:點(diǎn)擊“ Go”,出現(xiàn)以下界面:出現(xiàn)了很多基因序列,在每個(gè)序列的右邊還有“Order cDNA clone ” 的鏈接,這些序列中有些序列是跟你的目的基因同名的,有些是別名(Other Aliases)與你的目的基因一致,根據(jù)每個(gè)序列的介紹認(rèn)真選擇你的目的基因。上圖中我需要的IL6 是標(biāo)號(hào)為2 的序列。2.1查找 cDNA序列2.1.1點(diǎn)擊 Order cDNA clone,出現(xiàn)目的頁(yè)面如圖所示:6一步一步教你使用NC

9、BI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳2.1.2 點(diǎn)擊 Clone Sequence 后面的鏈接即可得到 cDNA序列。點(diǎn)擊后如圖所示(只抓取其中一部分) :2.2查找 mRNA、蛋白序列回到步驟 1 點(diǎn)擊“ Go”之后出現(xiàn)的頁(yè)面,點(diǎn)擊目的基因的名字,出現(xiàn)以下頁(yè)面( 只抓取7一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳相關(guān)部分 ) :頁(yè)面的下半部分,即可以獲取mRNA和蛋白序列的部分:找到“ NCBI Reference Sequences (RefSeq)”,它分為幾個(gè)板塊,第一個(gè)“mRNA andProtein”區(qū)可以讓我們找到連續(xù)的編碼mRNA序列和蛋白序列。在mRNAand Prot

10、ein8一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳下面有兩個(gè)序列代碼 (中間劃有一個(gè)箭頭) ,這代表了 mRNA序列和蛋白序列。 分別點(diǎn)擊就可以得到相應(yīng)的序列頁(yè)面。點(diǎn)擊后如圖所示, mRNA 序列:蛋白序列如下:NCBI Reference Sequences (RefSeq)的第二個(gè)板塊是Reference assembly ,它下面顯示的是 Genomic ,點(diǎn)擊Genomic 下面 Referenceassembly 對(duì)應(yīng)的 Genbank 或 FASTA即可出現(xiàn)編碼的DNA序列 (注意:只是編碼序列,其中包括內(nèi)含子,但一般沒(méi)有5非編碼區(qū)) 。這一步就不做貼圖演示了吧,呵呵。這

11、樣我們就可以找到基因的 cDNA 序列、連續(xù)的編碼 mRNA序列、蛋白序列以及含有內(nèi)含子的編碼 DNA序列了。相信這些操作對(duì)很多戰(zhàn)友還是有用的。如果大家有更好的方法,歡迎發(fā)帖交流!友情提示:在 NCBI 里打開(kāi)的每一個(gè)頁(yè)面都會(huì)給我們提供大量的信息,大家不妨好好看看,可能會(huì)有令我們驚喜的收獲!最后嘮叨一句: 最近我實(shí)驗(yàn)比較忙, 只能在深夜發(fā)帖, 可能要過(guò)幾天再發(fā)第三部分 Part three 運(yùn)用 STS查找已經(jīng)公布的引物序列 ,希望“期待下集”的朋友可以理解。9一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳第三部分 運(yùn)用 STS查找已經(jīng)公布的引物序列STS,序列標(biāo)簽位點(diǎn)( Sequenc

12、e Tagged Site ) :一段短的DNA序列( 200500 個(gè)堿基對(duì)),這種序列在染色體上只出現(xiàn)一次,其位置和堿基順序都是已知的。在PCR反應(yīng)中可以檢測(cè)處 STS來(lái), STS適宜于作為人類(lèi)基因組的一種地標(biāo),據(jù)此可以判定DNA的方向和特定序列的相對(duì)位置。以上內(nèi)容基本是 STS的定義,我主張活學(xué)活用, 下面就介紹一下我個(gè)人用 STS數(shù)據(jù)庫(kù)查找引物的一點(diǎn)經(jīng)驗(yàn)。還是使用人的IL6 基因?yàn)槔呛? 打開(kāi) NCBI 主頁(yè),在Search 后面的下拉菜單選擇UniSTS,在FOR后面填寫(xiě)目的基因。操作完畢如圖所示:點(diǎn)擊 GO以后出現(xiàn)以下頁(yè)面,這是你會(huì)發(fā)現(xiàn)NCBI 又提供了很多序列,下面我們還是要

13、初步篩選我們需要的序列。10一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳2根據(jù)物種、目的陰物所在染色體的位置等選擇相應(yīng)序列(可能不只一個(gè)),點(diǎn)擊。下面以點(diǎn)擊第一個(gè)進(jìn)入的畫(huà)面為例。你會(huì)發(fā)現(xiàn)這個(gè)頁(yè)面直接就給出了引物序列, PCR 之后的片段長(zhǎng)度也是給了的( 247bp) 。下面還有很多相關(guān)的信息3點(diǎn)擊 GeneBank Accession 后面的代碼,進(jìn)入下一個(gè)頁(yè)面。11一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳??!前后引物都呈現(xiàn)在眼前了,還有反應(yīng)體系和反應(yīng)條件!其中Primer A是前引物序列, Primer B則是后引物序列,并且給出了他們?cè)贒NA序列中的位置。有興趣的朋友可

14、以在序列中找一下,是可以找到的, 不過(guò)要注意, PCR 是雙鏈擴(kuò)增,在序列中可以直接找到的是 Primer A 的原序列 和 Primer B 的互補(bǔ)序列。在步驟二里面我只點(diǎn)開(kāi)了一個(gè)序列,繼續(xù)打開(kāi)其他的可能還會(huì)有對(duì)自己有用的引物,不過(guò)這要你自己慢慢發(fā)掘了。這種尋找引物的方法有點(diǎn)投機(jī)取巧的味道, 實(shí)用程度不是很高, 但如果這里面恰好有你想 P 的片段的話(huà),恭喜你,這些引物都是很成熟的引物,可以直接拿過(guò)來(lái)使用了。如果想尋找引物, 大家可以查閱相關(guān)論文, 已經(jīng)報(bào)道的引物我們?yōu)槭裁床挥媚兀浚?既省時(shí)間,可靠性又強(qiáng)。如果這兩種方法都不能找到你需要的引物的話(huà),那就自己設(shè)計(jì)吧, 建議使用Primer 5 和

15、Oligo 。引物設(shè)計(jì)的詳細(xì)內(nèi)容我在這里就不多說(shuō)了,推薦兩個(gè)帖子給大家看一下,第一個(gè)是本版版主 liuzeyi2002發(fā)起的,內(nèi)容很豐富,很值得學(xué)習(xí),另一個(gè)則是我發(fā)的。/bbs/post/view?bid=64&id=9517792&sty=1&tpg=1&age=0/bbs/post/view?bid=67&id=9523263&sty=1&tpg=1&age=012一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳第四部分 如何運(yùn)用 BLAST進(jìn)行序列比對(duì)、檢驗(yàn)引物特異性提到序列比對(duì),絕大多數(shù)戰(zhàn)友都會(huì)想到 BLAST,但 B

16、LAST的使用確實(shí)又是一個(gè)很大的難題,因?yàn)樗墓δ鼙容^強(qiáng)悍, 里面涉及到的知識(shí)比較多, 而且比對(duì)結(jié)束后輸出的結(jié)果參數(shù) (指標(biāo))又很多。如果把 BLAST的使用詳細(xì)的都講出來(lái),我想我發(fā)帖發(fā)到明天也發(fā)不完,更何況我自己也不是完全懂得BLAST的使用。所以我在這里也就“畫(huà)龍點(diǎn)睛”以比對(duì)核酸序列為例來(lái)給大家介紹一下BLAST的使用,也算是 BLAST的入門(mén)課程吧。 請(qǐng)看帖的戰(zhàn)友好好體會(huì),如果你用心看,在看帖完畢之后 BLAST 的基本使用(包括其他序列的比對(duì))應(yīng)該沒(méi)有問(wèn)題了。1打開(kāi) BLAST頁(yè)面, /BLAST/打開(kāi)后如圖所示:對(duì)上面這個(gè)頁(yè)面進(jìn)行一

17、下必要的介紹:BLAST的這個(gè)頁(yè)面主體部分(左面)包括了三部分: BLAST Assembled Genomes、Basic BLAST、Specialized BLAST。相信大家可以看懂這三個(gè)短語(yǔ)的意思,我就不多說(shuō)了;我要說(shuō)的是,可以認(rèn)為這是三種序列比對(duì)的方法,或者說(shuō)是BLAST的三條途徑。第一部分 BLAST Assembled Genomes就是讓你選擇你要比對(duì)的物種,點(diǎn)擊相應(yīng)物種之后13一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳即可進(jìn)入比對(duì)頁(yè)面。第二部分 Basic BLAST 包含了 5 個(gè)常用的 BLAST,每一個(gè)都附有簡(jiǎn)短的介紹。第三部分 Specialized BL

18、AST 是一些特殊目的的 BLAST,如 IgBLAST、SNP 等等,這個(gè)時(shí)候你就需要在 Specialized BLAST 部分做出適當(dāng)?shù)倪x擇了??傊?,這是一個(gè)導(dǎo)航頁(yè)面, 它的目的是讓你根據(jù)自己的比對(duì)目的選擇相應(yīng)的BLAST途徑。下面以最基本的核酸序列比對(duì)來(lái)談一下BLAST的使用,期間我也會(huì)含沙射影的說(shuō)一下其他序列比對(duì)的方法。2 點(diǎn)擊 Basic BLAST 部分的 nucleotide blast鏈接到一個(gè)新的頁(yè)面。打開(kāi)后如圖所示:介紹一下上述頁(yè)面:Enter Query Sequence部分是讓我們輸入序列的,你可以直接把序列粘貼進(jìn)去,也可以上傳序列, 還可以選擇你要比對(duì)的序列的范圍(

19、留空就代表要比對(duì)你要輸入的整個(gè)序列)。Job Title部分還可以為本次工作命一個(gè)名字。Choose Search Set 部分是讓我們選擇要與目的序列比對(duì)的物種或序列種類(lèi)( genome DNA、mRNA 等等)。如果是人或老鼠的話(huà),就可以直接選擇了如果是其他物種就要選擇“others ”了, 這時(shí)候網(wǎng)頁(yè)會(huì)主動(dòng)跳出一個(gè)下拉對(duì)話(huà)框和一個(gè)輸入式對(duì)話(huà)框,你可以分別選14一步一步教你使用NCBI蘇州大學(xué)生命科學(xué)學(xué)院醫(yī)學(xué)遺傳擇和輸入要跟你的序列比對(duì)的序列種類(lèi)和物種。下面的Entrez Query可以對(duì)比對(duì)結(jié)果進(jìn)行適當(dāng)?shù)南拗?。Program Selection部分其實(shí)是讓我們選擇本次比對(duì)的精確度,種內(nèi)種間等等。在 BLAST按鈕下面有一個(gè)“ Algorithm parameters ” ,這是參數(shù)設(shè)置選項(xiàng),一般用戶(hù)使用不到此項(xiàng),所以它比較隱蔽,點(diǎn)擊,原網(wǎng)頁(yè)下方

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論