版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
生物信息學軟件第一頁,共五十六頁,2022年,8月28日內(nèi)容概要生物信息學軟件的主要功能簡介分析和處理實驗數(shù)據(jù)和公共數(shù)據(jù),加快研究進度,縮短科研時間提示、指導(dǎo)、替代實驗操作,利用對實驗數(shù)據(jù)的分析所得的結(jié)論設(shè)計下一階段的實驗用計算機管理實驗數(shù)據(jù)尋找、預(yù)測新基因及預(yù)測其結(jié)構(gòu)、功能蛋白高級結(jié)構(gòu)預(yù)測第二頁,共五十六頁,2022年,8月28日軟件在生物信息學研究中的地位和作用
PCR引物及寡核苷酸設(shè)計軟件
核酸序列分析軟件
蛋白質(zhì)序列分析軟件
序列比對軟件第三頁,共五十六頁,2022年,8月28日軟件在生物信息學研究中的地位和作用BioinformaticsComputationalBiology算法是core算法是key算法是soul第四頁,共五十六頁,2022年,8月28日軟件在生物信息學研究中的地位和作用數(shù)學家:實際問題的抽象算法研究生物學家:實際問題的提出軟件應(yīng)用軟件專家:算法的工具化軟件開發(fā)第五頁,共五十六頁,2022年,8月28日
各種序列:DNA,Protein生物信息學處理軟件平臺BlastGenscanBlocks生物學家計算生物學模型/算法軟件并行軟件:Blast,Phrap,SW市場化各種算法串行后基因組學數(shù)據(jù)并行第六頁,共五十六頁,2022年,8月28日生物信息學軟件的分類按功能分類:1、DNA序列分析軟件如:DNACLUB,Chromas1.562、蛋白質(zhì)序列分析軟件如:ANTHEPROT3、RNA結(jié)構(gòu)預(yù)測軟件如:RNAdraw4、引物設(shè)計軟件如:Oligo,PrimerPremier5、基因芯片軟件如:ArrayMaker6、序列比對軟件如:ClustalX7、親緣進化樹軟件如:PHYLIP和PAUP,Treeview8、綜合軟件如:GCG(GeneticsComputerGroup)第七頁,共五十六頁,2022年,8月28日生物信息學軟件的分類
按使用方式分類:1、本地分析軟件,如Lasergene,可在Windows或MacIntosh微機運行,有單機版和網(wǎng)絡(luò)版2、在線分析軟件:內(nèi)聯(lián)網(wǎng)軟件(Genemill,Geneworld,GeneThesaurus)和因特網(wǎng)軟件(如BLAST以及CINEMA)按運行平臺分類:1、UNIX+SGI工作站2、Windows或MacIntosh+PC第八頁,共五十六頁,2022年,8月28日生物信息學軟件的開發(fā)---Perl應(yīng)用具有生物信息學特色的程序語言——PerlPerl語言的特點:1、對過程、檔案和文字有很強的處理能力2、跨平臺3、解釋執(zhí)行4、簡單易學5、適用于網(wǎng)絡(luò)程序開發(fā)bioperl第九頁,共五十六頁,2022年,8月28日生物信息學軟件的開發(fā)---
其他常用的生物信息學軟件開發(fā)語言Java——跨平臺C++、C#——代碼執(zhí)行效率高VB——簡單易學第十頁,共五十六頁,2022年,8月28日生物信息學軟件的發(fā)展方向高通量海量數(shù)據(jù)分析并行處理新算法的提出和應(yīng)用網(wǎng)絡(luò)共享解決方案第十一頁,共五十六頁,2022年,8月28日PCR技術(shù)的應(yīng)用PCR:研究領(lǐng)域:基因克隆、測序、重組疾病診斷法醫(yī)鑒定親子鑒定古生物學研究第十二頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計----PCR原理高溫變性低溫退火適溫延伸第十三頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計----條件一、估測可能形成的DNA雙鏈的穩(wěn)定性(基礎(chǔ))
算法:鄰近熱力學
25℃ΔG(kcal/mol)例:ACGG和其互補TGCC結(jié)合的ΔG:
ΔG(ACGG)=ΔG(AC)+ΔG(CG)+ΔG(GG)
=-(1.3+3.6+3.1)=-8.0kcal/mol第十四頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計----問題二、引物可能出現(xiàn)的二級結(jié)構(gòu)(基礎(chǔ))1、發(fā)夾結(jié)構(gòu)(Hairpin)自身互補2、自身二聚體(Dimer)兩個同型引物互補3、交叉二聚體(CrossDimer)
兩個異型引物間互補第十五頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則1、引物3‘末端限制3’端防止連續(xù)三個C或G3’端防止互補(防止出現(xiàn)3‘端二聚體)2、引物互補限制盡量避免發(fā)夾結(jié)構(gòu)、自身二聚體和交叉二聚體出現(xiàn)在不可避免時,按如下原則處理:防3‘端互補>其他區(qū)域|ΔG|小>其他區(qū)域|ΔG|大第十六頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則3、引物長度PCR產(chǎn)物長度≤500bp
引物長度16~18bpPCR產(chǎn)物長度≈5kb
引物長度≈25bpPCR紀錄:23bp長度引物擴增出40kb產(chǎn)物引物長度>20bp產(chǎn)物長度>1kb應(yīng)考慮使用引物設(shè)計軟件!有效長度:L=2(G+C)+(A+T)L≤38第十七頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則4、引物的唯一性防止錯配發(fā)生錯配(或稱假引發(fā))FalsePriming將導(dǎo)致產(chǎn)生非專一產(chǎn)物錯配第十八頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計--規(guī)則三、引物設(shè)計的一般規(guī)則5、引物內(nèi)部穩(wěn)定性(InternalStability)引物與模板應(yīng)具有較高的結(jié)合能量,這樣有利于引物與模板序列的整合,因此5‘端與中間段的ΔG值應(yīng)較高,而3’端ΔG值影響DNA聚合酶對模板DNA的解鏈,過高則不利于這一步驟。引物的ΔG值最好呈正弦曲線形狀,即5'端和中間部分ΔG值較高,而3'端ΔG值相對較低,且不要超過9(ΔG值為負值,這里取絕對值),如此則有利于正確引發(fā)反應(yīng)而可防止錯誤引發(fā)。第十九頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則6、解鏈溫度(Tm值)Tm值的幾種算法:(1)Tm=4(G+C)+2(A+T)(2)Tm=4(G+C)+2(A+T)[引物長度<14]
Tm=64.9+41(G+C-16.4)
-----------[引物長度≥14]
引物長度第二十頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則6、解鏈溫度(Tm值)(3)精確算法(鄰近熱力學)第二十一頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計---規(guī)則三、引物設(shè)計的一般規(guī)則7、退火溫度(TaOPT)第二十二頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計-引物設(shè)計軟件四、引物設(shè)計軟件常用的引物設(shè)計軟件PrimerPremier5
Oligo6推薦使用WONDERFUL生物信息學系統(tǒng)1700RMB售價US$885售價US$1200第二十三頁,共五十六頁,2022年,8月28日PCR引物及寡核苷酸設(shè)計寡核苷酸設(shè)計用于基因芯片、Southernblot和Northernblot
等核酸分子雜交的探針設(shè)計是和引物設(shè)計并列的一個問題的兩個方面常用的探針設(shè)計軟件:ArrayDesigner國產(chǎn)WONDERFUL生物信息學系統(tǒng)也具備該功能第二十四頁,共五十六頁,2022年,8月28日核酸序列分析基礎(chǔ)概念1、相位:任意DNA序列有6個相位核酸序列簡單分析第二十五頁,共五十六頁,2022年,8月28日核酸序列分析------基礎(chǔ)概念2、簡并堿基的表示方法第二十六頁,共五十六頁,2022年,8月28日核酸序列分析----基礎(chǔ)概念3、密碼子表和密碼子偏好性第二十七頁,共五十六頁,2022年,8月28日核酸序列分析----限制酶切位點分析EcoR
I識別片段GAATTC(G'AATT_C)……G
AATTC……
……CTTAA
G……Psp5
II識別片段RGGWCCY(RG'GWC_CY)R=AorGW=AorTY=CorT第二十八頁,共五十六頁,2022年,8月28日核酸序列分析---限制酶切位點分析線型序列:環(huán)型序列:第二十九頁,共五十六頁,2022年,8月28日核酸序列分析---限制酶切位點分析限制酶數(shù)據(jù)庫REBASE網(wǎng)址:數(shù)據(jù)庫中限制酶信息包括甲基化酶、相應(yīng)的微生物來源、識別序列位點、裂解位點、甲基化特性、酶的商業(yè)來源和參考文獻第三十頁,共五十六頁,2022年,8月28日核酸序列分析---核酸基序位點分析基序(motif或稱“模體”)——具有特定功能意義的生物序列片段如:原核生物Pribnow框(-10序列)TATAAT
Sextama框(-35序列)TTGACA真核生物TATA框TATA
CAAT框GGCAATCTA
TA
TC
T(TATAWAW)(GGYCAATCT)第三十一頁,共五十六頁,2022年,8月28日核酸序列分析---基因識別1、ORF(開放閱讀框)的識別ORF——OpenReadingFrame在DNA鏈上,由蛋白質(zhì)合成的起始密碼開始,到終止密碼子為止的一個連續(xù)編碼序列稱為一個開放閱讀框。ORF的識別是證明一個新的DNA序列為特定的蛋白質(zhì)編碼基因的先決條件。第三十二頁,共五十六頁,2022年,8月28日核酸序列分析----基因識別1、ORF(開放閱讀框)的識別算法:a.起始密碼子和終止密碼子所夾區(qū)域>300bpb.選擇跨度最大的c.六個閱讀框都要進行掃描d.起始密碼子可隨物種不同而更改第三十三頁,共五十六頁,2022年,8月28日核酸序列分析----基因識別2、TestCode測試編碼利用編碼區(qū)與非編碼區(qū)密碼子選用頻率的差異進行編碼區(qū)的統(tǒng)計學鑒別方法:由于內(nèi)含子的進化不受約束,而外顯子則受到選擇壓力,因此內(nèi)含子的序列要比外顯子更隨機。TestCode<0.74非編碼序列TestCode>0.95編碼序列0.74<TestCode<0.95不能確定是否編碼第三十四頁,共五十六頁,2022年,8月28日核酸序列分析-----基因識別3、CpG島搜索脊椎動物絕大多數(shù)基因的5‘端都存在CpG島CpG島的判別方法:以每200個堿基為單位掃描DNA序列,如某個片段內(nèi)胞嘧啶(C)與鳥嘌呤(G)的總和超過4種堿基總和的50%,即每10個核苷酸約出現(xiàn)一次雙核苷酸序列CG。具有這種特點的序列僅占基因組DNA總量的10%左右。第三十五頁,共五十六頁,2022年,8月28日核酸序列分析-----核酸序列分析軟件常用的核酸序列分析軟件:DNAsis(HITACHI)
DNAman
DNAtools
DNAstar密碼子圖表
密碼子使用工具
CpG島
DNA特征序列查找
DNA統(tǒng)計
ORF查找器
位置堿基頻率
限制位點概要
堿基比例圖
測試編碼
翻譯
第三十六頁,共五十六頁,2022年,8月28日實踐2:進入以下網(wǎng)站,初步學習分析Nosemabombycis在基因數(shù)據(jù)庫里所有序列的DNA統(tǒng)計分析結(jié)果DNA統(tǒng)計
DNA統(tǒng)計返回輸入序列的每種堿基與某些堿基組的個數(shù)與比例。實踐2:進入以下網(wǎng)站,初步學習分析Nosemabombycis在基因數(shù)據(jù)庫里所有序列的DNA統(tǒng)計分析結(jié)果第三十七頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析----基礎(chǔ)概念氨基酸殘基的簡并邏輯表示法---
位置分隔符;[]允許此位置為括號內(nèi)的任何一個殘基;{}允許此位置為除了括號內(nèi)所包括的任何一個殘基;x代表任何殘基;x(3)代表任何3個氨基酸殘基,N-[PT]-{GM}-x(2)-[ILVM]√N-P-K-G-H-V,N-T-L-K-G-M×N-L-K-G-H-V,N-T-G-K-H-V第三十八頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析---水解酶切點分析Calpain[LV][YMR]X,2第三十九頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析--蛋白質(zhì)基序位點分析蛋白質(zhì)motif:如蛋白質(zhì)的磷酸化位點,糖基化位點等GLYCO_HORMONE_ALPHA_1C-x-G-C-C-[FY]-S-R-A-[FY]-P-T-P蛋白質(zhì)motif數(shù)據(jù)庫PROSITE第四十頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析-----蛋白質(zhì)特性分析對20個氨基酸用物理化學的方法測定相關(guān)性質(zhì)如:疏水性第四十一頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析----蛋白質(zhì)特性分析“開窗”的概念第四十二頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析---蛋白質(zhì)特性分析Window=1Window=15第四十三頁,共五十六頁,2022年,8月28日GPCR蛋白質(zhì)序列分析---蛋白質(zhì)特性分析第四十四頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析----蛋白質(zhì)二級結(jié)構(gòu)預(yù)測
GORII法預(yù)測結(jié)果第四十五頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析蛋白質(zhì)二級結(jié)構(gòu)預(yù)測
五種蛋白質(zhì)二級結(jié)構(gòu)預(yù)測結(jié)果比較第四十六頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析--蛋白質(zhì)高級結(jié)構(gòu)預(yù)測蛋白質(zhì)高級結(jié)構(gòu)預(yù)測網(wǎng)址:第四十七頁,共五十六頁,2022年,8月28日蛋白質(zhì)序列分析軟件專門用于蛋白質(zhì)序列分析的軟件較少大多集成在綜合軟件之中Wonderful生物信息學系統(tǒng)的蛋白質(zhì)序列分析功能:1、蛋白質(zhì)特性分析2、蛋白質(zhì)二級結(jié)構(gòu)預(yù)測3、蛋白質(zhì)水解酶切位點分析4、蛋白質(zhì)基序位點分析第四十八頁,共五十六頁,2022年,8月28日DNA、蛋白質(zhì)序列同源分析及
進化樹構(gòu)建第四十九頁,共五十六頁,2022年,8月28日相似性與同源性相似性是指一種很直接的數(shù)量關(guān)系,比如部分相同或相似的百分比或其它一些合適的度量??蛇M行自身局部比較。 如DotPlot(點陣序列比較)同源性指從一些數(shù)據(jù)中推斷出的兩個基因或蛋白質(zhì)序列具而共同祖先的結(jié)論,屬于質(zhì)的判斷。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 烏蘭察布2025年內(nèi)蒙古烏蘭察布市委編辦所屬事業(yè)單位選調(diào)3人筆試歷年參考題庫附帶答案詳解
- 臨滄2025年云南臨滄市審計局招聘編外人員10人筆試歷年參考題庫附帶答案詳解
- 中央2025年中國地質(zhì)科學院勘探技術(shù)研究所博士研究生崗位招聘應(yīng)屆生8人筆試歷年參考題庫附帶答案詳解
- 中國人民財產(chǎn)保險股份有限公司吉安市分公司2026屆校園招聘29人筆試參考題庫附帶答案詳解(3卷)
- 2026年新興際華集團有限公司校園招聘450余人(蘭州有崗)筆試參考題庫附帶答案詳解(3卷)
- 2025陜西銅川市路橋工程公司招聘15人筆試歷年參考題庫附帶答案詳解
- 2026濟鋼集團有限公司規(guī)劃投資總監(jiān)公開選聘筆試參考題庫附帶答案詳解
- 2025贛州市建興產(chǎn)業(yè)鏈管理有限公司員工招聘1人筆試參考題庫附帶答案詳解
- 風電場新員工入職培訓方案
- 食品企業(yè)面試題庫及答案
- T/CCPITCSC 120-2023中國品牌影響力評價通則
- 醫(yī)學檢驗免疫課件
- 農(nóng)村土地永久性轉(zhuǎn)讓合同
- 中建市政道路施工組織設(shè)計方案
- 財務(wù)先進個人代表演講稿
- 年度得到 · 沈祖蕓全球教育報告(2024-2025)
- DB23T 2689-2020養(yǎng)老機構(gòu)院內(nèi)感染預(yù)防控制規(guī)范
- 2025屆天津市和平區(qū)名校高三最后一模語文試題含解析
- 專業(yè)律師服務(wù)合同書樣本
- 建筑施工現(xiàn)場污水處理措施方案
- 學生計算錯誤原因分析及對策
評論
0/150
提交評論