版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
生物信息學簡介第1頁/共44頁內(nèi)容生物信息學概念生物信息學的內(nèi)容生物信息學的研究方法和技術(shù)生物信息學軟件和數(shù)據(jù)庫第2頁/共44頁一、生物信息學的概念(p199)生物信息學是用數(shù)理和信息科學的觀點、理論和方法,以計算機為工具對生物信息進行收集、加工、儲存、傳播、檢索和分析的科學。研究材料和結(jié)果是各種各樣的生物學數(shù)據(jù)第3頁/共44頁人基因組海量信息23對=46條染色體30億堿基對(basepairs)3~5萬個基因基因組學3萬種以上蛋白質(zhì)蛋白質(zhì)組學基因表達、作用、調(diào)控網(wǎng)絡第4頁/共44頁已經(jīng)或即將完成的生物全基因組幾百種原核生物酵母菌擬南芥(1-2億bp)水稻人類(32億bp)小鼠大鼠豬雞…..等生物信息學的概念第5頁/共44頁后基因組時代的到來人類首次了解了自身的基因序列,了解了很多遠親生物的基因序列正在面對指數(shù)擴增的基因序列和各種數(shù)據(jù)庫面臨如何將基因序列資料轉(zhuǎn)變?yōu)橛杏玫闹R,進而服務于人類,造福人類健康的挑戰(zhàn)人類功能基因組學必須多學科協(xié)作生物信息學技術(shù)生物芯片技術(shù)蛋白質(zhì)組學技術(shù)高通量細胞篩選技術(shù)等生物信息學是人類功能基因組學研究的必要工具實驗生物學計算生物學理論生物學第6頁/共44頁生物信息的開發(fā)和應用以核酸蛋白質(zhì)等生物大分子為主要研究對象以信息、數(shù)理、計算機科學為主要研究手段以計算機網(wǎng)絡為主要研究環(huán)境以計算機軟件為主要研究工具對序列數(shù)據(jù)進行存儲、管理、注釋、加工對各種數(shù)據(jù)庫進行查詢、搜索、比較、分析構(gòu)建各種類型的專用數(shù)據(jù)庫信息系統(tǒng)研究開發(fā)面向生物學家的新一代計算機軟件生物信息學的概念第7頁/共44頁
計算機學、計算機網(wǎng)絡醫(yī)學生物學、分子生物學生物信息學數(shù)學、
統(tǒng)計學生物信息學和其它學科的關(guān)系生物信息學是一門邊緣學科,它位于生物、醫(yī)學、計算機、數(shù)學等多個領(lǐng)域的交叉點上生物信息學的概念第8頁/共44頁蛋白質(zhì)組學和結(jié)構(gòu)基因組學高通量藥物篩選藥物設計和小分子設計創(chuàng)新藥物和新劑型生物芯片計算機輔助藥物篩選高通量虛擬篩選方法分子數(shù)據(jù)庫,組合化學化合物庫,靶標生物大分子的功能分析...蛋白質(zhì)-蛋白質(zhì)相互作用識別,信號傳導系統(tǒng)、代謝途徑的分子模擬...圖像處理、聚類分析、表達譜和調(diào)控網(wǎng)絡分析...基因組信息…生物信息技術(shù)計算機輔助先導化合物設計、藥物設計二、生物信息學的內(nèi)容(p200)第9頁/共44頁1.基因與基因組分析
可讀框預測和基因標注序列拼接與組裝結(jié)果上傳到數(shù)據(jù)庫堿基讀取載體標識與去除測序儀中原始數(shù)據(jù)的采樣與分析大規(guī)?;蛐蛄袦y定生物信息學的內(nèi)容第10頁/共44頁基因預測DNA序列中編碼區(qū)的鑒定預測方法的依據(jù):
編碼統(tǒng)計學:編碼區(qū)序列同非編碼區(qū)序列相比,有不同的特點,存在一些非隨機的特點
GC含量密碼子偏倚性(CODONFREQUENCY)
第三個堿基組成
基因結(jié)構(gòu)/統(tǒng)計學方法
比較/同源性生物信息學的內(nèi)容第11頁/共44頁原核生物基因結(jié)構(gòu)編碼區(qū)啟動子轉(zhuǎn)錄起始位點非翻譯區(qū)轉(zhuǎn)錄區(qū)
起始密碼子
終止密碼子5’3’轉(zhuǎn)錄終止位點RBS生物信息學的內(nèi)容第12頁/共44頁5’啟動子轉(zhuǎn)錄起始位點非翻譯區(qū)轉(zhuǎn)錄區(qū)
起始密碼子
終止密碼子3’轉(zhuǎn)錄終止位點外顯子
切除和拼接位點GTAG內(nèi)含子真核生物基因結(jié)構(gòu)生物信息學的內(nèi)容第13頁/共44頁HMM?HMM描述了模型中各隱含狀態(tài)的轉(zhuǎn)換概率基因組序列ATGCGTGCAGTCACCAGCAGTCAGTCGIntronsExon隱含狀態(tài)用于基因預測的隱馬爾可夫模型HiddenMarkovModels,HMMATGCGTGCAGTCACCAGCAGTCAGTCG基因組序列生物信息學的內(nèi)容第14頁/共44頁特定狀態(tài)堿基對的概率取決于它前面堿基對的狀態(tài)
向另一種狀態(tài)的轉(zhuǎn)換概率取決于轉(zhuǎn)換信號的出現(xiàn)(剪切位點)和/或在特定隱藏狀態(tài)的堿基對平均數(shù)量(即內(nèi)含子或外顯子大小).IntronsExonP=0.5P=0.8基因組序列ATGCGTGCAGTCACCAGCAGTCAGTCG用于基因預測的隱馬爾可夫模型生物信息學的內(nèi)容第15頁/共44頁研究主要集中在核苷酸序列的存儲、分類、檢索和分析等方面新基因的發(fā)現(xiàn)非蛋白編碼區(qū)生物學意義的分析基因組整體功能及其調(diào)節(jié)網(wǎng)絡的系統(tǒng)把握基因組演化與物種演化基因組分析生物信息學的內(nèi)容第16頁/共44頁蛋白質(zhì)結(jié)構(gòu)新蛋白的完整、精確和動態(tài)的三維結(jié)構(gòu)計算機輔助結(jié)構(gòu)模擬理解蛋白質(zhì)的氨基酸序列和三維結(jié)構(gòu)之間的關(guān)系蛋白質(zhì)序列及特性分析蛋白質(zhì)組學2.蛋白質(zhì)與蛋白質(zhì)組分析生物信息學的內(nèi)容第17頁/共44頁
相當數(shù)量的蛋白質(zhì)、核酸、多糖的三維結(jié)構(gòu)獲得精確測定,基于生物大分子結(jié)構(gòu)知識的藥物設計成為熱點;根據(jù)靶標分子與藥物分子相結(jié)合的活性部位的幾何形狀和化學特征,設計出與其相匹配的具有新穎結(jié)構(gòu)的藥物分子。3新藥設計第18頁/共44頁三、生物信息學的研究方法和技術(shù)數(shù)學統(tǒng)計方法在分析DNA語言中的語義、分析密碼子使用頻率、利用馬爾可夫模型進行基因識別動態(tài)規(guī)劃(DynamicProgramming)方法一種通用的優(yōu)化方法:在狀態(tài)空間中,根據(jù)目標函數(shù),通過遞推,求出一條從狀態(tài)起點到狀態(tài)終點的最優(yōu)路徑(代價最小的路徑)。DNA序列或者蛋白質(zhì)序列的兩兩對比排列模式識別技術(shù)兩種方法根據(jù)統(tǒng)計特征進行識別根據(jù)對象的結(jié)構(gòu)特征進行識別,常用句法識別。DNA序列上功能位點和特征信號的識別第19頁/共44頁數(shù)據(jù)庫技術(shù)生物分子信息的存儲、管理、查詢等功能建立在數(shù)據(jù)庫管理系統(tǒng)之上人工神經(jīng)網(wǎng)絡技術(shù)在功能上、結(jié)構(gòu)上模擬大腦神經(jīng)網(wǎng)絡神經(jīng)網(wǎng)絡計算速度快,更具有分析智能應用:神經(jīng)網(wǎng)絡計算在優(yōu)化和模式識別方面具有非常強的能力基因識別、蛋白質(zhì)結(jié)構(gòu)預測上神經(jīng)網(wǎng)絡都取得了比其它方法更為準確的結(jié)果第20頁/共44頁分子模型化技術(shù)利用計算機分析分子結(jié)構(gòu)。通過交互操作平移、旋轉(zhuǎn)和縮放分子的三維結(jié)構(gòu),從不同的角度觀察分子構(gòu)象和形狀分子力學和量子力學計算主要基于半經(jīng)驗勢函數(shù)的分子力學方法研究生物大分子的構(gòu)象量子力學在確定勢函數(shù)的參數(shù)和研究局部性質(zhì)分子動力學模擬研究蛋白質(zhì)的構(gòu)象及動力學,是計算機模擬實驗的基礎(chǔ)遺傳學運算規(guī)則Optimisers/EvolversDNAcomputingEvolutionaryComputation(MetaphorsfromDNAtoSelection)生物信息學的研究方法和技術(shù)第21頁/共44頁“HalfdayontheWeb,savesyouhalfmonthinthelab”專家系統(tǒng)將有關(guān)專家的知識和經(jīng)驗以一定的知識表示形式(如產(chǎn)生式規(guī)則、語義網(wǎng)絡等)存放在計算中以智能的方式幫助提供參考性決策。如用于基因識別Internet技術(shù)交流:通過Internet網(wǎng)交流生物分子數(shù)據(jù)查閱:從Internet網(wǎng)上查生物分子數(shù)據(jù),如原始的序列、結(jié)構(gòu)數(shù)據(jù),加工處理的數(shù)據(jù)服務:將所要處理的數(shù)據(jù)直接送到相應的網(wǎng)絡服務器上,服務器接受你的處理請求,并將處理結(jié)果返回給你生物信息學的研究方法和技術(shù)第22頁/共44頁
國外一直非常重視生物信息學的發(fā)展,各種專業(yè)研究機構(gòu)和公司如雨后春筍般涌現(xiàn)出來,生物科技公司和制藥工業(yè)內(nèi)部的生物信息學部門的數(shù)量也與日俱增1979年,美國洛斯阿拉莫斯國家實驗室建立起GenBank數(shù)據(jù)庫;1982年,歐洲分子生物學實驗室提供核酸序列數(shù)據(jù)庫EMBL的服務;1984年,日本著手建立國家級的核酸序列數(shù)據(jù)庫DDBJ并于1987年開始提供服務四、常用的分子生物學軟件和數(shù)據(jù)庫(p210)第23頁/共44頁國內(nèi)對生物信息學領(lǐng)域也越來越重視1997年3月,北京大學于成立了生物信息學中心;2000年3月,中科院上海生命科學研究院成立其他,北京大學的羅靜初和顧孝誠教授在生物信息學網(wǎng)站建設方面、中科院生物物理所的陳潤生研究員在EST序列拼接方面以及在基因組演化方面、天津大學的張春霆院士在DNA序列的幾何學分析方面等等……軟件和數(shù)據(jù)庫第24頁/共44頁基因圖譜數(shù)據(jù)庫核酸序列數(shù)據(jù)庫蛋白質(zhì)序列數(shù)據(jù)庫大分子結(jié)構(gòu)數(shù)據(jù)庫等國際著名的生物信息中心NCBINationalCenterforBiotechnologyInformation(US)
EBIEuropeanBioinformaticsInstitute(EU)HGMPHumanGenomeMappingProjectResourceCentre(UK)ExPASyExpertofProteinAnalysisSystem(Switzerland)CMBICentreofMolecularandBiomolecule(TheNetherlands)ANGISNationalGenomeInformationService(Australia)
NIGNationalInstituteofGenetics(Japan)BICNationalBioinformaticsCentre(Singapore)
1.數(shù)據(jù)庫第25頁/共44頁國內(nèi)部分生物信息學和生物醫(yī)學信息服務器北京大學生物信息中心中國生物信息/北京大學物理化學研究所北京醫(yī)科大學生物醫(yī)學信息中國科學院微生物研究所天津大學生物信息中心中科院計算所智能信息處理重點實驗室生物信息學研究組/中國科學院基因組信息學中心/第26頁/共44頁DNA數(shù)據(jù)庫Genbank包含所有已知的核酸序列和蛋白質(zhì)序列,以及相關(guān)的文獻著作和生物學注釋。美國國立生物技術(shù)信息中心(NCBI)建立和維護EMBL核酸序列數(shù)據(jù)庫由歐洲生物信息學研究所(EBI)維護通過因特網(wǎng)上的序列提取系統(tǒng)(SRS)服務完成查詢檢索。DDBJ數(shù)據(jù)庫日本國立遺傳學研究所維護與Genbank和EMBL核酸庫合作交換數(shù)據(jù)。使用主頁上SRS工具進行數(shù)據(jù)檢索和序列分析全球數(shù)據(jù)已實現(xiàn)同步化Globaldatasynchronization軟件和數(shù)據(jù)庫第27頁/共44頁GenBank的增長圖片來自/Genbank/genbankstats.html軟件和數(shù)據(jù)庫第28頁/共44頁資料來自:http://www.ddbj.nig.ac.jp/images/ddbjnew/DBGrowth-e.gif2005年6月發(fā)行的第84版EMBL數(shù)據(jù)庫中,總計超過4525萬條、491億堿基數(shù)量的數(shù)據(jù)庫軟件和數(shù)據(jù)庫第29頁/共44頁PublicfreeAvailableviaInternet三大基因數(shù)據(jù)庫之間的關(guān)系NucleotideSequenceDatabase(entry)-2005.6.15完整序列軟件和數(shù)據(jù)庫第30頁/共44頁蛋白質(zhì)信息資源數(shù)據(jù)庫(PIR)主要提供按同源性和分類學組織的綜合性、非冗余數(shù)據(jù)庫PIR由美國華盛頓的國家醫(yī)學研究基金會支持,德國馬普學會的慕尼黑蛋白質(zhì)序列信息中心(MIPS)和日本國際蛋白質(zhì)序列數(shù)據(jù)庫(JIPID)共同維護。PIR通過提供蛋白質(zhì)序列數(shù)據(jù)庫、衍生的相關(guān)數(shù)據(jù)庫及相應的軟件而支持有關(guān)分子進化、功能基因組學和計算生物學方面的研究,軟件和數(shù)據(jù)庫第31頁/共44頁蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(PDB)由美國自然科學基金會、能源部和國立衛(wèi)生研究院共同投資建立主要由X-射線晶體衍射和核磁共振(NMR)測得的生物大分子三維結(jié)構(gòu)組成用戶可直接查詢、調(diào)用和觀察庫中所收錄的任何大分子三維結(jié)構(gòu)軟件和數(shù)據(jù)庫第32頁/共44頁PBD數(shù)據(jù)的增長軟件和數(shù)據(jù)庫第33頁/共44頁2.軟件序列對比和數(shù)據(jù)庫搜索軟件BLAST,FASTA,BLITZ等生物大分子可視化軟件有Rasmol,Mage,Raster3d,Grasp等與蛋白質(zhì)結(jié)構(gòu)有關(guān)的程序有Procheck,WHATIF,DSSP等大型分子生物學軟件包如GCG.在基因識別著名軟件GRAIL、GeneID、GeneMark等蛋白質(zhì)二級結(jié)構(gòu)預測程序PHD軟件和數(shù)據(jù)庫第34頁/共44頁序列分析軟件——DNAMAN
/
DNAMAN是美國LynnonBioSoft公司開發(fā)的高度集成化的分子生物學應用軟件,幾乎可完成所有日常核酸和蛋白質(zhì)序列分析工作,包括多重序列對齊、PCR引物設計、限制性酶切分析、蛋白質(zhì)序列分析、質(zhì)粒繪圖等。具有面向Windows和Macintosh兩個版本。軟件和數(shù)據(jù)庫第35頁/共44頁綜合序列分析軟件——BioEdit
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 職業(yè)健康促進的精準醫(yī)學策略
- 禁毒普法知識講座課件
- 職業(yè)健康促進與職業(yè)健康管理創(chuàng)新
- 黑龍江2025年黑龍江省知識產(chǎn)權(quán)局所屬事業(yè)單位招聘筆試歷年參考題庫附帶答案詳解
- 遂寧四川遂寧蓬溪縣鄉(xiāng)鎮(zhèn)事業(yè)單位從大學生志愿服務西部人員中招聘5人筆試歷年參考題庫附帶答案詳解
- 茂名廣東茂名高新區(qū)招聘社會化工會工作者筆試歷年參考題庫附帶答案詳解
- 鹽城2025年江蘇鹽城建湖縣人民醫(yī)院招聘合同制工作人員22人筆試歷年參考題庫附帶答案詳解
- 湖北2025年湖北長江職業(yè)學院招聘年薪制工作人員筆試歷年參考題庫附帶答案詳解
- 浙江浙江省農(nóng)業(yè)科學院科院中藥材創(chuàng)新中心招聘筆試歷年參考題庫附帶答案詳解
- 滄州2025年河北滄州運河區(qū)招聘事業(yè)編制教師140人筆試歷年參考題庫附帶答案詳解
- 淺談國土年度變更調(diào)查及林草濕荒監(jiān)測區(qū)別
- 《 證券投資學》教學方案
- 場地規(guī)劃布局手冊
- 南昌地鐵培訓課件
- 升降平臺車輛安全培訓課件
- 2025年工業(yè)和信息化局公務員面試技巧與模擬題解析
- 部編版2025年八年級上冊道德與法治教材習題參考答案匯編
- 止血材料行業(yè)分析研究報告
- 湖南省婁底市新化縣2024-2025學年高一上學期期末考試生物試題(解析版)
- 軍犬專業(yè)考試題及答案
- (一模)烏魯木齊地區(qū)2025年高三年級第一次質(zhì)量英語試卷(含答案)
評論
0/150
提交評論