生物信息學(xué)概述_第1頁
生物信息學(xué)概述_第2頁
生物信息學(xué)概述_第3頁
生物信息學(xué)概述_第4頁
生物信息學(xué)概述_第5頁
已閱讀5頁,還剩74頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、第一章 生物信息學(xué)概述,鄭珩 副教授什么是生物信息學(xué)?(what) 為什么要學(xué)習(xí)生物信息學(xué)?(why) 怎樣學(xué)好這門課程?(how) 通過本課程學(xué)習(xí),要達(dá)到什么要求,1.什么是生物信息學(xué),信息是用符號、信號或消息所包含的內(nèi)容,來直接或間接描述客觀世界,生物信息,分子:,細(xì)胞,核酸,蛋白質(zhì),多糖,dna-遺傳密碼的攜帶者,引自neil campbell著biology第4版,1996,從基因組序列信息到基因功能,染色體,基因,蛋白質(zhì),功能,8,采用信息科學(xué)技術(shù),借助數(shù)學(xué)、生物學(xué)的理論、方法,對各種生物信息(包括核酸、蛋白質(zhì)等)的收集、加工、儲(chǔ)存、分析、解釋的一門學(xué)科。

2、收集、加工、儲(chǔ)存:計(jì)算機(jī)科學(xué)家 分析、解釋:生物學(xué)家,生物信 息學(xué),what is bioinformatics?,9,生物信息學(xué): 研究對象:生物學(xué)(核酸蛋白質(zhì)) 研究內(nèi)容:數(shù)學(xué)模型;生物學(xué)范疇 研究工具:計(jì)算機(jī)科學(xué)(程序) 研究人員:計(jì)算機(jī)科學(xué)家 生物學(xué)家,10,生物信息學(xué)新興的交叉學(xué)科,mathematical sciences,computer sciences,life sciences,2. why?,agcatcgaagttgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgatgcatgacc

3、tagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatga

4、cctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaa

5、gttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctaatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatga

6、cctagcaagttgcatgacgattgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgac

7、ctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagc

8、atcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctaatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatg

9、acgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagt,a c g t,hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromthe

10、ear,hisnationundergodshallhaveanewbirthoffreedooooooooomandthatgovernmentofthepeoplebythepeopleandforthepeoooooooooooooooopleshallnotperishfromtheear that this nation, under god, shall have a new birth of freedom; and that government of the people, by the people and for the people shall not perish f

11、rom the earth,agcatcgaagttgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgca

12、tgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatga

13、cgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctaatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgac

14、ctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctag

15、cagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatga

16、cctagcaagttgcatgacgattgacctagtgcatgactgacctagcagcatcgaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagaagttgcatgacgatgcatgacctaatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatg

17、catgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagttgcatgacgatgcatgacctagcaagttgcatgacgattgacctagtgcatgacgatgcatgacctagcagcatcgcgatgcatgacctagcaagaagttgcatgacgatgcatgacctagtgcatgacgatgcatgacctagcagcatcgaagt,a c g t,15,人類基因組計(jì)劃開始 (human genome project, h

18、gp) 人類基因組計(jì)劃帶來了 生物信息學(xué)。,第一節(jié) 生物信息學(xué)發(fā)展簡史,16,曼哈頓原子彈計(jì)劃,阿波羅登月計(jì)劃,人類基因組計(jì)劃,人類自然科學(xué)史上的 3 大計(jì)劃,17,基因組(genome):包含細(xì)胞或生物體全套的遺傳信息的全部 遺傳物質(zhì)。 細(xì)胞核基因組dna 細(xì)胞質(zhì)(線粒體、葉綠體)基因組dna,人類基因組: 3.2109 bp,18,人類基因組計(jì)劃準(zhǔn)備用15年時(shí)間投入30億美元,完成人全部24(22+x+y)條染色體中3.2109個(gè)堿基對的序列測定,主要任務(wù)包括做圖(遺傳圖譜物理圖譜以及轉(zhuǎn)錄圖譜的繪制)、測序和基因識別,其根本任務(wù)是解讀和破譯生物體的生老病死以及與疾病相關(guān)的遺傳信息。,19,

19、hgp的 歷史回顧,1984.12 猶他州阿爾塔組織會(huì)議,初步研討測定人類整個(gè)基 因組dna序列的意義 1985 dulbecco在science撰文 “腫瘤研究的轉(zhuǎn)折點(diǎn):人 類基因組的測序” 美國能源部(doe)提出“人類基因組計(jì)劃”草案 1987 美國能源部和國家衛(wèi)生研究院(nih)聯(lián)合為“人類 基因組計(jì)劃”下?lián)軉?dòng)經(jīng)費(fèi)約550萬美元 1989 美國成立“國家人類基因組研究中心”,watson擔(dān)任 第一任主任 1990.10 經(jīng)美國國會(huì)批準(zhǔn),人類基因組計(jì)劃正式啟動(dòng) 1998.5 塞萊拉遺傳公司成立,宣布3年內(nèi)完成hgp,james watson,20,2000 celera公司宣布完成果蠅

20、基因組測序 國際公共領(lǐng)域宣布完成第一個(gè)植物基因組擬南芥全基 因組的測序工作 2001.2.15 nature刊文發(fā)表國際公共領(lǐng)域結(jié)果 2001.2.16 science刊文發(fā)表celera公司及其合作者結(jié)果,drosophila melanogaster 果蠅,arabidopsis thaliana 擬南芥,21,at the white house on june 26, francis collins (r), director of the national human genome research institute, president clinton, and j. craig

21、 venter, president of celara genomics, lauded the thousands of scientists who contributed to the genome sequence. 公共領(lǐng)域和celera公司同時(shí)宣布完成人類基因組工作草圖,22,2001年2月15日nature封面,2001年2月16日science封面,23,我國對人類基因組計(jì)劃的貢獻(xiàn),24,human,arabidopsis 擬南芥,thermotoga maritima,escherichia coli大腸桿菌,buchnerasp. aps,rickettsia prowa

22、zekii,ureaplasma urealyticum,bacillus subtilis,drosophila melanogaster,thermoplasma acidophilum,plasmodium falciparum,helicobacter pylori,mouse,caenorhabitis elegans,rat,borrelia burgorferi,borrelia burgorferi,aquifex aeolicus,neisseria meningitidis z2491,mycobacterium tuberculosis,1,000 1,000,000 1

23、,000,000,000 1,000,000,000,000 1,000,000,000,000,000 1,000,000,000,000,000,000 1,000,000,000,000,000,000,000 1,000,000,000,000,000,000,000,000,103 kilo 106 mega 109 giga 1012 tera 1015 peta 1018 exa 1021 zetta 1024 yotta, 100 tera-bytes (1014) / a typical gene lab / year all the words ever spoken by

24、 human beings account to about 5 exa-bytes (51018) soon using 1 zetta-bytes (1021) and 1 yotta-bytes (1024) 生物信息量至少是所有人類說過的話的200倍!,至2004年,國際數(shù)據(jù)庫記錄的核酸堿基數(shù)目已超過200億!如果用傳統(tǒng)的紙張來書寫,以每個(gè)核苷酸作為一個(gè)字符,則需要印制2萬本每本1000頁每頁1000字的書! 另外,二維凝膠電泳技術(shù)、測序質(zhì)譜技術(shù)以及生物芯片技術(shù)的高速發(fā)展和廣泛應(yīng)用,也使得大量的數(shù)據(jù)信息已經(jīng)無法用傳統(tǒng)的文獻(xiàn)形式發(fā)表,而更多的需以數(shù)據(jù)庫形式,通過文字、圖象、超鏈接等多種方

25、式來記錄。,計(jì)算機(jī)工具的介入,30,生物分子信息的特征,生物分子信息數(shù)據(jù)量大 生物分子信息復(fù)雜 生物分子信息之間存在著密切的聯(lián)系,31,生物信息學(xué)(bioinformatics) 這一名詞的來由,八十年代末期,馬來西亞的美籍學(xué)者林華安(hwa a. lim)認(rèn)識到將計(jì)算機(jī)科學(xué)與生物學(xué)結(jié)合起來的重要意義,開始留意要為這一領(lǐng)域構(gòu)思一個(gè)合適的名稱。起初,考慮到與將要支持他主辦一系列生物信息學(xué)會(huì)議的佛羅里達(dá)州立大學(xué)超型計(jì)算機(jī)計(jì)算研究所的關(guān)系,他使用的是“compbio”;之后,又將其更改為兼具法國風(fēng)情的“bioinformatique”,看起來似乎有些古怪。因此不久,他便進(jìn)一步把它更改為“bio-in

26、formatics(或bio/informatics)”。但由于當(dāng)時(shí)的電子郵件系統(tǒng)與今日不同,名稱中的-或/符號經(jīng)常會(huì)引起許多問題,林博士于是將其去除, “bioinformatics”就正式誕生了,林博士也因此贏得了“生物信息學(xué)之父”的美譽(yù)。,32,bioinformatics,第二節(jié) 生物信息學(xué)的研究領(lǐng)域,基因組序列裝配 基因識別 基因功能預(yù)報(bào) 基因多態(tài)性分析 基因進(jìn)化 mrna結(jié)構(gòu)預(yù)測 基因芯片設(shè)計(jì) 基因芯片數(shù)據(jù)分析 疾病相關(guān)基因分析,蛋白質(zhì)序列分析 蛋白質(zhì)家族分類 蛋白質(zhì)結(jié)構(gòu)預(yù)測 蛋白質(zhì)折疊研究 代謝途徑分析 轉(zhuǎn)錄調(diào)控機(jī)制 蛋白質(zhì)芯片設(shè)計(jì) 蛋白質(zhì)芯片數(shù)據(jù)分析 藥物設(shè)計(jì),(一)、核酸及基

27、因組信息 1、大規(guī)模核酸測序及拼接 2、基因識別與定位 3、基因相關(guān)的snp研究 4、非編碼區(qū)信息結(jié)構(gòu)分析 5、比較基因組學(xué),一、生物學(xué)領(lǐng)域,35,1.大規(guī)模基因組測序,36,37,運(yùn)用計(jì)算機(jī)軟件進(jìn)行序列拼接,2、基因識別與定位,3.基因相關(guān)的snp研究,single nucleotide polymorphisms (snp),是指在基因組上單個(gè)核苷酸的變異,一般而言,snp 是指變異頻率大于1 %的單核苷酸變異,40,基因變異與疾病,4、非編碼區(qū)信息結(jié)構(gòu)分析,在微生物中,非編碼區(qū)只占整個(gè)基因組序列的10%20;但在高等生物和人類基因組中,非編碼序列則占了基因組序列的絕大部分。在人的基因組中

28、,非編碼序列超過95%,5、比較基因組學(xué),比較基因組學(xué)(comparative genomics)是基于基因組圖譜和測序基礎(chǔ)上,對已知的基因和基因組結(jié)構(gòu)進(jìn)行比較,來了解基因的功能、表達(dá)機(jī)理和物種進(jìn)化的學(xué)科。,(二)蛋白質(zhì)及蛋白質(zhì)組信息 1、蛋白質(zhì)結(jié)構(gòu)模擬 2、蛋白質(zhì)功能預(yù)測 3、基因表達(dá)及蛋白質(zhì)組信息學(xué),44,蛋白質(zhì)三維結(jié)構(gòu)測定主要方法:x射線晶體結(jié)構(gòu)分析、多維核磁共振(nmr)波譜分析和電子顯微鏡二維晶體三維重構(gòu)(電子晶體學(xué),ec)等物理方法,difficult! expensive! too much time!,蛋白質(zhì)結(jié)構(gòu)及功能預(yù)測,蛋白質(zhì)組研究,(三)、分子相互作用及代謝調(diào)控網(wǎng)絡(luò),對生

29、物功能的分析表明基因和蛋白質(zhì)很少單獨(dú)起作用,它們傾向于成組地通過網(wǎng)狀的交互作用而影響生物系統(tǒng)的功能,分子相互作用信息和單個(gè)分子的信息一樣重要。,48,結(jié)構(gòu)與功能,信號網(wǎng)絡(luò) 代謝途徑,細(xì)胞重建,系統(tǒng)重建,基因組,基因,后基因組時(shí)代,單個(gè)基因的結(jié)構(gòu)與功能 基因家族 代謝途徑 基因組,(四)、生物進(jìn)化的研究,序列相似性比較,生物信息數(shù)據(jù)庫 數(shù)據(jù)庫接口和檢索工具的研制 新的算法和軟件 1、多序列比較方法 2、序列拼接與分析 3、基因組大尺度作圖和功能基因組分析方法 4、蛋白質(zhì)結(jié)構(gòu)和功能預(yù)測 5、生物大分子結(jié)構(gòu)圖形化顯示 6、細(xì)胞代謝過程模擬 7、藥物設(shè)計(jì)相關(guān)軟件開發(fā),二、在計(jì)算機(jī)領(lǐng)域,第三節(jié) 在藥學(xué)領(lǐng)

30、域應(yīng)用,一、初始階段:信息收集 初步調(diào)研確定合適的藥物作用靶 可行性分析:靶點(diǎn)結(jié)構(gòu)、化合物信息,1、診斷類藥物:生物芯片設(shè)計(jì) 遺傳病:基因診斷 感染性疾?。嚎贵w、基因芯片、pcr技術(shù),二、藥物設(shè)計(jì):,53,病人 健康人,基因芯片診斷,及早治療,對癥下藥,2、預(yù)防類藥物: 計(jì)算機(jī)輔助疫苗設(shè)計(jì) 計(jì)算機(jī)預(yù)測抗原表位,epimmune imgt/hla database http:/www.ebi.ac.uk/imgt/hla hla sequence database .uk/hig epimatrix /re

31、search/tb-hiv_lab/epimatrix/epimatrix.html epipredict http:/www.epipredict.de,http:/www.jenner.ac.uk/mhcpred/,mhcpred,所謂基因組藥物(genomic drug)是指利用基因序列數(shù)據(jù),經(jīng)生物信息學(xué)分析、高通過基因表達(dá)、高通量功能篩選和體內(nèi)外藥效研究開發(fā)得到的新藥候選物 實(shí)際上利用了反向生物學(xué)的原理沿著從基因序列一蛋白質(zhì)一功能一藥物的途徑研制新藥,其優(yōu)勢是取自龐大的人類基因資源及其編碼蛋白質(zhì)做為原材料,具有巨大的開發(fā)潛力。,3、開發(fā)基因組藥物,58,人類基因組約有10萬左右的基因編碼10萬以上的蛋白質(zhì),其中至少5即5000以上的基因編碼蛋白質(zhì)可能具有藥物開發(fā)前景而目前利用常規(guī)技術(shù)開發(fā)的人類重組蛋白質(zhì)藥物已上市的只有20多種,進(jìn)入臨床實(shí)驗(yàn)的只有100多種。,美國的人類基因組科學(xué)公司(hgs公司)。根據(jù)其1999年2月公布的消息,在功能基因組研究領(lǐng)域,hgs公司己發(fā)現(xiàn)95的人類cdna;克隆了9000個(gè)人類分泌蛋白質(zhì)的全長cdna;發(fā)現(xiàn)了3000個(gè)基因的可能醫(yī)學(xué)應(yīng)用;發(fā)現(xiàn)了35個(gè)新的白細(xì)胞介素類分子和40個(gè)新的生長因子類分子;已有3個(gè)基因組藥物進(jìn)入臨床。,4、尋找藥物作用新靶點(diǎn),基因組比較:抗微生物 同源性搜索 表達(dá)差異分析,理想的抗生素

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論