生物信息學軟件_第1頁
生物信息學軟件_第2頁
生物信息學軟件_第3頁
生物信息學軟件_第4頁
生物信息學軟件_第5頁
已閱讀5頁,還剩51頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

生物信息學軟件第一頁,共五十六頁,2022年,8月28日內(nèi)容概要生物信息學軟件的主要功能簡介分析和處理實驗數(shù)據(jù)和公共數(shù)據(jù),加快研究進度,縮短科研時間提示、指導(dǎo)、替代實驗操作,利用對實驗數(shù)據(jù)的分析所得的結(jié)論設(shè)計下一階段的實驗用計算機管理實驗數(shù)據(jù)尋找、預(yù)測新基因及預(yù)測其結(jié)構(gòu)、功能蛋白高級結(jié)構(gòu)預(yù)測第二頁,共五十六頁,2022年,8月28日軟件在生物信息學研究中的地位和作用

PCR引物及寡核苷酸設(shè)計軟件

核酸序列分析軟件

蛋白質(zhì)序列分析軟件

序列比對軟件第三頁,共五十六頁,2022年,8月28日軟件在生物信息學研究中的地位和作用BioinformaticsComputationalBiology算法是core算法是key算法是soul第四頁,共五十六頁,2022年,8月28日軟件在生物信息學研究中的地位和作用數(shù)學家:實際問題的抽象算法研究生物學家:實際問題的提出軟件應(yīng)用軟件專家:算法的工具化軟件開發(fā)第五頁,共五十六頁,2022年,8月28日

各種序列:DNA,Protein生物信息學處理軟件平臺BlastGenscanBlocks生物學家計算生物學模型/算法軟件并行軟件:Blast,Phrap,SW市場化各種算法串行后基因組學數(shù)據(jù)并行第六頁,共五十六頁,2022年,8月28日生物信息學軟件的分類按功能分類:1、DNA序列分析軟件如:DNACLUB,Chromas1.562、蛋白質(zhì)序列分析軟件如:ANTHEPROT3、RNA結(jié)構(gòu)預(yù)測軟件如:RNAdraw4、引物設(shè)計軟件如:Oligo,PrimerPremier5、基因芯片軟件如:ArrayMaker6、序列比對軟件如:ClustalX7、親緣進化樹軟件如:PHYLIP和PAUP,Treeview8、綜合軟件如:GCG(GeneticsComputerGroup)第七頁,共五十六頁,2022年,8月28日生物信息學軟件的分類

按使用方式分類:1、本地分析軟件,如Lasergene,可在Windows或MacIntosh微機運行,有單機版和網(wǎng)絡(luò)版2、在線分析軟件:內(nèi)聯(lián)網(wǎng)軟件(Genemill,Geneworld,GeneThesaurus)和因特網(wǎng)軟件(如BLAST以及CINEMA)按運行平臺分類:1、UNIX+SGI工作站2、Windows或MacIntosh+PC第八頁,共五十六頁,2022年,8月28日生物信息學軟件的開發(fā)---Perl應(yīng)用具有生物信息學特色的程序語言——PerlPerl語言的特點:1、對過程、檔案和文字有很強的處理能力2、跨平臺3、解釋執(zhí)行4、簡單易學5、適用于網(wǎng)絡(luò)程序開發(fā)bioperl第九頁,共五十六頁,2022年,8月28日生物信息學軟件的開發(fā)---

其他常用的生物信息學軟件開發(fā)語言Java——跨平臺C++、C#——代碼執(zhí)行效率高VB——簡單易學第十頁,共五十六頁,2022年,8月28日生物信息學軟件的發(fā)展方向高通量海量數(shù)據(jù)分析并行處理新算法的提出和應(yīng)用網(wǎng)絡(luò)共享解決方案第十一頁,共五十六頁,2022年,8月28日PCR技術(shù)的應(yīng)用PCR:研究領(lǐng)域:基因克隆、測序、重組疾病診斷法醫(yī)鑒定親子鑒定古生物學研究第十二頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計----PCR原理高溫變性低溫退火適溫延伸第十三頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計----條件一、估測可能形成的DNA雙鏈的穩(wěn)定性(基礎(chǔ))

算法:鄰近熱力學

25℃ΔG(kcal/mol)例:ACGG和其互補TGCC結(jié)合的ΔG:

ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)

=-(1.3+3.6+3.1)=-8.0kcal/mol第十四頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計----問題二、引物可能出現(xiàn)的二級結(jié)構(gòu)(基礎(chǔ))1、發(fā)夾結(jié)構(gòu)(Hairpin)自身互補2、自身二聚體(Dimer)兩個同型引物互補3、交叉二聚體(CrossDimer)

兩個異型引物間互補第十五頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則1、引物3‘末端限制3’端防止連續(xù)三個C或G3’端防止互補(防止出現(xiàn)3‘端二聚體)2、引物互補限制盡量避免發(fā)夾結(jié)構(gòu)、自身二聚體和交叉二聚體出現(xiàn)在不可避免時,按如下原則處理:防3‘端互補>其他區(qū)域|ΔG|小>其他區(qū)域|ΔG|大第十六頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則3、引物長度PCR產(chǎn)物長度≤500bp

引物長度16~18bpPCR產(chǎn)物長度≈5kb

引物長度≈25bpPCR紀錄:23bp長度引物擴增出40kb產(chǎn)物引物長度>20bp產(chǎn)物長度>1kb應(yīng)考慮使用引物設(shè)計軟件!有效長度:L=2(G+C)+(A+T)L≤38第十七頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則4、引物的唯一性防止錯配發(fā)生錯配(或稱假引發(fā))FalsePriming將導(dǎo)致產(chǎn)生非專一產(chǎn)物錯配第十八頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計--規(guī)則三、引物設(shè)計的一般規(guī)則5、引物內(nèi)部穩(wěn)定性(InternalStability)引物與模板應(yīng)具有較高的結(jié)合能量,這樣有利于引物與模板序列的整合,因此5‘端與中間段的ΔG值應(yīng)較高,而3’端ΔG值影響DNA聚合酶對模板DNA的解鏈,過高則不利于這一步驟。引物的ΔG值最好呈正弦曲線形狀,即5'端和中間部分ΔG值較高,而3'端ΔG值相對較低,且不要超過9(ΔG值為負值,這里取絕對值),如此則有利于正確引發(fā)反應(yīng)而可防止錯誤引發(fā)。第十九頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則6、解鏈溫度(Tm值)Tm值的幾種算法:(1)Tm=4(G+C)+2(A+T)(2)Tm=4(G+C)+2(A+T)[引物長度<14]

Tm=64.9+41(G+C-16.4)

-----------[引物長度≥14]

引物長度第二十頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則6、解鏈溫度(Tm值)(3)精確算法(鄰近熱力學)第二十一頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則7、退火溫度(TaOPT)第二十二頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計-引物設(shè)計軟件四、引物設(shè)計軟件常用的引物設(shè)計軟件PrimerPremier5

Oligo6推薦使用WONDERFUL生物信息學系統(tǒng)1700RMB售價US$885售價US$1200第二十三頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計寡核苷酸設(shè)計用于基因芯片、Southernblot和Northernblot

等核酸分子雜交的探針設(shè)計是和引物設(shè)計并列的一個問題的兩個方面常用的探針設(shè)計軟件:ArrayDesigner國產(chǎn)WONDERFUL生物信息學系統(tǒng)也具備該功能第二十四頁,共五十六頁,2022年,8月28日核酸序列分析基礎(chǔ)概念1、相位:任意DNA序列有6個相位核酸序列簡單分析第二十五頁,共五十六頁,2022年,8月28日核酸序列分析------基礎(chǔ)概念2、簡并堿基的表示方法第二十六頁,共五十六頁,2022年,8月28日核酸序列分析----基礎(chǔ)概念3、密碼子表和密碼子偏好性第二十七頁,共五十六頁,2022年,8月28日核酸序列分析----限制酶切位點分析EcoR

I識別片段GAATTC(G'AATT_C)……G

AATTC……

……CTTAA

G……Psp5

II識別片段RGGWCCY(RG'GWC_CY)R=AorGW=AorTY=CorT第二十八頁,共五十六頁,2022年,8月28日核酸序列分析---限制酶切位點分析線型序列:環(huán)型序列:第二十九頁,共五十六頁,2022年,8月28日核酸序列分析---限制酶切位點分析限制酶數(shù)據(jù)庫REBASE網(wǎng)址:數(shù)據(jù)庫中限制酶信息包括甲基化酶、相應(yīng)的微生物來源、識別序列位點、裂解位點、甲基化特性、酶的商業(yè)來源和參考文獻第三十頁,共五十六頁,2022年,8月28日核酸序列分析---核酸基序位點分析基序(motif或稱“模體”)——具有特定功能意義的生物序列片段如:原核生物Pribnow框(-10序列)TATAAT

Sextama框(-35序列)TTGACA真核生物TATA框TATA

CAAT框GGCAATCTA

TA

TC

T(TATAWAW)(GGYCAATCT)第三十一頁,共五十六頁,2022年,8月28日核酸序列分析---基因識別1、ORF(開放閱讀框)的識別ORF——OpenReadingFrame在DNA鏈上,由蛋白質(zhì)合成的起始密碼開始,到終止密碼子為止的一個連續(xù)編碼序列稱為一個開放閱讀框。ORF的識別是證明一個新的DNA序列為特定的蛋白質(zhì)編碼基因的先決條件。第三十二頁,共五十六頁,2022年,8月28日核酸序列分析----基因識別1、ORF(開放閱讀框)的識別算法:a.起始密碼子和終止密碼子所夾區(qū)域>300bpb.選擇跨度最大的c.六個閱讀框都要進行掃描d.起始密碼子可隨物種不同而更改第三十三頁,共五十六頁,2022年,8月28日核酸序列分析----基因識別2、TestCode測試編碼利用編碼區(qū)與非編碼區(qū)密碼子選用頻率的差異進行編碼區(qū)的統(tǒng)計學鑒別方法:由于內(nèi)含子的進化不受約束,而外顯子則受到選擇壓力,因此內(nèi)含子的序列要比外顯子更隨機。TestCode<0.74非編碼序列TestCode>0.95編碼序列0.74<TestCode<0.95不能確定是否編碼第三十四頁,共五十六頁,2022年,8月28日核酸序列分析-----基因識別3、CpG島搜索脊椎動物絕大多數(shù)基因的5‘端都存在CpG島CpG島的判別方法:以每200個堿基為單位掃描DNA序列,如某個片段內(nèi)胞嘧啶(C)與鳥嘌呤(G)的總和超過4種堿基總和的50%,即每10個核苷酸約出現(xiàn)一次雙核苷酸序列CG。具有這種特點的序列僅占基因組DNA總量的10%左右。第三十五頁,共五十六頁,2022年,8月28日核酸序列分析-----核酸序列分析軟件常用的核酸序列分析軟件:DNAsis(HITACHI)

DNAman

DNAtools

DNAstar密碼子圖表

密碼子使用工具

CpG島

DNA特征序列查找

DNA統(tǒng)計

ORF查找器

位置堿基頻率

限制位點概要

堿基比例圖

測試編碼

翻譯

第三十六頁,共五十六頁,2022年,8月28日實踐2:進入以下網(wǎng)站,初步學習分析Nosemabombycis在基因數(shù)據(jù)庫里所有序列的DNA統(tǒng)計分析結(jié)果DNA統(tǒng)計

DNA統(tǒng)計返回輸入序列的每種堿基與某些堿基組的個數(shù)與比例。實踐2:進入以下網(wǎng)站,初步學習分析Nosemabombycis在基因數(shù)據(jù)庫里所有序列的DNA統(tǒng)計分析結(jié)果第三十七頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析----基礎(chǔ)概念氨基酸殘基的簡并邏輯表示法---

位置分隔符;[]允許此位置為括號內(nèi)的任何一個殘基;{}允許此位置為除了括號內(nèi)所包括的任何一個殘基;x代表任何殘基;x(3)代表任何3個氨基酸殘基,N-[PT]-{GM}-x(2)-[ILVM]√N-P-K-G-H-V,N-T-L-K-G-M×N-L-K-G-H-V,N-T-G-K-H-V第三十八頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析---水解酶切點分析Calpain[LV][YMR]X,2第三十九頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析--蛋白質(zhì)基序位點分析蛋白質(zhì)motif:如蛋白質(zhì)的磷酸化位點,糖基化位點等GLYCO_HORMONE_ALPHA_1C-x-G-C-C-[FY]-S-R-A-[FY]-P-T-P蛋白質(zhì)motif數(shù)據(jù)庫PROSITE第四十頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析-----蛋白質(zhì)特性分析對20個氨基酸用物理化學的方法測定相關(guān)性質(zhì)如:疏水性第四十一頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析----蛋白質(zhì)特性分析“開窗”的概念第四十二頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析---蛋白質(zhì)特性分析Window=1Window=15第四十三頁,共五十六頁,2022年,8月28日GPCR蛋白質(zhì)序列分析---蛋白質(zhì)特性分析第四十四頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析----蛋白質(zhì)二級結(jié)構(gòu)預(yù)測

GORII法預(yù)測結(jié)果第四十五頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析蛋白質(zhì)二級結(jié)構(gòu)預(yù)測

五種蛋白質(zhì)二級結(jié)構(gòu)預(yù)測結(jié)果比較第四十六頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析--蛋白質(zhì)高級結(jié)構(gòu)預(yù)測蛋白質(zhì)高級結(jié)構(gòu)預(yù)測網(wǎng)址:第四十七頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析軟件專門用于蛋白質(zhì)序列分析的軟件較少大多集成在綜合軟件之中Wonderful生物信息學系統(tǒng)的蛋白質(zhì)序列分析功能:1、蛋白質(zhì)特性分析2、蛋白質(zhì)二級結(jié)構(gòu)預(yù)測3、蛋白質(zhì)水解酶切位點分析4、蛋白質(zhì)基序位點分析第四十八頁,共五十六頁,2022年,8月28日DNA、蛋白質(zhì)序列同源分析及

進化樹構(gòu)建第四十九頁,共五十六頁,2022年,8月28日相似性與同源性相似性是指一種很直接的數(shù)量關(guān)系,比如部分相同或相似的百分比或其它一些合適的度量??蛇M行自身局部比較。 如DotPlot(點陣序列比較)同源性指從一些數(shù)據(jù)中推斷出的兩個基因或蛋白質(zhì)序列具而共同祖先的結(jié)論,屬于質(zhì)的判斷。

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論