版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
一、生物信息學的概念
生物信息學(Bioinformatics)是現(xiàn)代生物學、物理學、數(shù)學、計算機科學、信息學等學科交叉而形成的一門新興學科。生物信息學還有另一個經常被使用的名字:“計算生物學”(computationalbiology),此外“計算分子生物學”(computationalmolecularbiology)和“生物分子信息學”(biomolecularinformatics)等也被使用過。
緒論
生物信息學研究基因組相關生物信息的獲取、加工、儲存、分配、分析和解釋的科學。這一定義包括了兩層含義,一是對數(shù)據(jù)的收集、整理與服務,也就是管好這些數(shù)據(jù);另一個是從中發(fā)現(xiàn)新的規(guī)律,也就是用好這些數(shù)據(jù)。實驗生物學計算生物學理論生物學生命現(xiàn)象的眾多層次生態(tài)系統(tǒng)生物多樣性、種群動力學個體、器官、組織細胞及其通信、信號傳導免疫網(wǎng)絡、調控網(wǎng)絡、代謝網(wǎng)絡復制、轉錄、剪接、翻譯、運輸生物大分子:蛋白質、核酸(DNA、RNA)、多糖小分子(寡糖、單糖、脂肪、核苷酸、氨基酸、激素、維生素)、金屬離子、水分子和原子的相互作用動物、植物、微生物現(xiàn)存物種知多少?從2百萬到10億的種種估計2003年11月初GenBank核酸數(shù)據(jù)庫中有
154089種生物至少有1條數(shù)據(jù)其中只有約半數(shù)有某些分類學信息生物多樣性植物細胞動物細胞HIV病毒人類23對染色體Nature171,737-734(1953)(C)MacmillanPublishersLtd.MolecularstructureofNucleicAcidsWATSON,J.D.&CRICK,F.H.C.MedicalResearchCouncilUnitfortheStudyofMolecularStructureofBiologicalSystems,CavendishLaboratory,Cambridge.Figure1Thisfigureispurelydiagrammatic.Thetworibbonssymbolizethetwophophate-sugarchains,andthehorizonalrodsthepairsofbasesholdingthechainstogether.Theverticallinemarksthefibreaxis.AStructureforDeoxyriboseNucleicAcid引自NeilCampbell著Biology第4版,1996中心法則模式生物噬菌體(Bacteriophage:lambda,T4,T7)病毒(Viruses:SV40,HIV)大腸桿菌(Escherichiacoli)酵母(Saccharomycescerevisiae,yeastbudding)線蟲(Caenorhabitidiselegans,nematode,worm)果蠅(Drosophilamelanogaster,fruitfly)擬南芥(Arabidopsisthaliana)水稻(Oryzasativa,rice)非洲爪蟾(Xenopuslaviae,Africanfrog)斑馬魚(Daniorerio,Zebrafish)小鼠(Musmusculus,mouse)智人(Homosapiens)以蛋白質核酸等生物大分子為主要研究對象以信息、數(shù)理、計算機科學為主要研究手段以計算機網(wǎng)絡為主要研究環(huán)境以計算機軟件為主要研究工具對序列數(shù)據(jù)進行存儲、管理、注釋、加工對各種數(shù)據(jù)庫進行查詢、搜索、比較、分析構建各種類型的專用數(shù)據(jù)庫信息系統(tǒng)研究開發(fā)面向生物學家的新一代計算機軟件生物信息的開發(fā)和應用生物信息學研究方法和目標利用數(shù)理統(tǒng)計、模式識別、動態(tài)規(guī)劃、密碼解讀、語意解析、信號傳遞、神經網(wǎng)絡、遺傳算法以及隱馬氏模型等各種方法對序列、結構數(shù)據(jù)進行定性和定量分析,從中獲取基因編碼、基因調控、序列-結構-功能關系等理性知識闡明細胞、器官和個體的發(fā)生、發(fā)育、病變、衰亡的基本規(guī)律和時空聯(lián)系探索生命起源、生物進化、生命本質等重大理論問題,最終建立“生物學周期表”生物信息學–研究方向基因組序列裝配基因識別基因功能預報基因多態(tài)性分析基因進化mRNA結構預測基因芯片設計基因芯片數(shù)據(jù)分析疾病相關基因分析蛋白質序列分析蛋白質家族分類蛋白質結構預測蛋白質折疊研究代謝途徑分析轉錄調控機制蛋白質芯片設計蛋白質芯片數(shù)據(jù)分析藥物設計二、生物信息學發(fā)展簡史(1)萌芽期(60-70年代):以Dayhoff的替換矩陣和Neelleman-Wunsch算法為代表,它們實際組成了生物信息學的一個最基本的內容和思路:序列比較。它們的出現(xiàn),代表了生物信息學的誕生(雖然“生物信息學”一詞很晚才出現(xiàn)),以后的發(fā)展基本是在這2項內容上不斷改善;(2)形成期(80年代):以分子數(shù)據(jù)庫和BLAST等相似性搜索程序為代表。1982年三大分子數(shù)據(jù)庫(GenBank、EMBL和DDBJ)的國際合作使數(shù)據(jù)共享成為可能,同時為了有效管理與日俱增的數(shù)據(jù),以BLAST、FASTA等為代表的工具軟件和相應的新算法大量被提出和研制,極大地改善了人類管理和利用分子數(shù)據(jù)的能力。在這一階段,生物信息學作為一個新興學科已經形成,并確立了自身學科的特征和地位;(3)高速發(fā)展期(90年代-至今):以基因組測序與分析為代表。基因組計劃,特別是人類基因組計劃的實施,分子數(shù)據(jù)以億計;基因組水平上的分析使生物信息學的優(yōu)勢得以充分表現(xiàn),基因組信息學成為生物信息學中發(fā)展最快的學科前沿。歐美各國及日本相繼成立了生物信息中心,如美國的國家生物技術信息中心(NationalCenterforBiotechnologyInformatics,NCBI)、歐洲生物信息學研究所(EuropeanBioinformaticInstitute,EBI)、日本信息生物學中心(CenterforInformationBiology,CIB)等。NCBI、EBI和CIB相互合作,共同維護著GenBank、EMBL、DDBJ三大基因序列數(shù)據(jù)庫。它們每天通過計算機網(wǎng)絡互相交換數(shù)據(jù),使得三個數(shù)據(jù)庫能同時獲得最新數(shù)據(jù)。此外,他們每年召開兩個年會討論合作事宜。
國外發(fā)展現(xiàn)狀清華大學在基因調控及基因功能分析、蛋白質二級結構預測方面、天津大學物理系和中科院理論物理所在相關算法方面、中科院生物物理所在基因組大規(guī)模測序數(shù)據(jù)的組裝和標識方面、北京大學化學學院物理化學研究所在蛋白質分子設計方面、華大基因組研究中心(中科院遺傳所人類基因組研究中心)在大規(guī)模測序數(shù)據(jù)處理自動化流程體系及數(shù)據(jù)庫系統(tǒng)建立方面均已展開相關研究。北京大學已建立了EMBL中國鏡像數(shù)據(jù)庫,將該數(shù)據(jù)庫移植到中國本地,并提供部分的檢索服務http://www.I/mirror/mirror.html;http://www.E);復旦大學遺傳學研究所為克隆新基因而建立的一整套生物信息系統(tǒng)也已初具規(guī)模;中科院上海生化所、生物物理所等單位在結構生物學和基因預測研究方面也有相當?shù)幕A。國內發(fā)展現(xiàn)狀1962Pauling提出分子進化理論1967Dayhoff構建蛋白質序列替換矩陣1970Needleman-Wunsch算法被提出1977Staden利用計算機軟件分析DNA序列1981Smith-Waterman算法出現(xiàn)1981序列模序(motif)的概念被提出(Doolittle)1982GenBank數(shù)據(jù)庫(Release3)公開。三大核酸數(shù)據(jù)庫(GenBank、EMBL和DDBJ)開始國際合作1982λ-噬菌體基因組被測序1983Wilbur和Lipman提出序列數(shù)據(jù)庫的搜索算法(Wilber-Lipman算法)1985快速序列相似性搜索程序FASTP/FASTN發(fā)布1988美國家生物技術信息中心(NCBI)創(chuàng)立1988歐洲分子生物學網(wǎng)絡EMBnet創(chuàng)立1990快速序列相似性搜索程序BLAST發(fā)布1991表達序列標簽(EST)概念被提出,從此開創(chuàng)EST測序1993英國Sanger中心遷址英國Hinxton1994歐洲生物信息學研究所在英國Hinxton成立1995第一個細菌基因組測序完成1996酶母基因組測序完成1997PSI-BLAST(BLAST系列程序之一)發(fā)布1998PhilGreen等人研制的自動測序組裝系統(tǒng)Phred-Phrap-Consed系統(tǒng)正式發(fā)布1998多細胞線蟲基因組測序完成1999果蠅基因組測序完成2000人類基因組測序基本完成2001人類基因組初步分析結果公布2004年人類基因組測序計劃完成
基因(gene)是脫氧核糖核酸(DNA)分子上具有遺傳效應的特定核苷酸序列的總稱,遺傳信息通過基因得到表達,也就是使遺傳信息以一定的方式反映到蛋白質的分子結構上從而使后代表現(xiàn)出與親代相似的性狀?;蚪M(genome)是基因(gene)和染色體(chromosome)的縮合。對于細菌等低等的簡單生物(所謂的原核生物)而言,它們的基因組就是指其單個染色體上所含的全部基因,而復雜生物(真核生物)的基因組是指維持正常的遺傳功能的最基本的一套染色體及其所攜帶的全部基因。人類基因組約含6萬至10萬個基因,由約30億對堿基組成。人類基因組計劃(HumanGenomeProject,HGP):美國科學家在1985年提出,旨在闡明人類基因組DNA中大約30億
個核苷酸的序列,發(fā)現(xiàn)所有人類基因并闡明其在染色體上的位置,破譯人類全部遺傳信息,使得人類第一次在分子水平上全面地認識自我?;蚪M和人類基因組計劃人類基因組計劃的主要內容構建生物高分辯率的遺傳圖譜、物理圖譜、轉錄圖(或基因圖)和序列圖譜:遺傳圖(Geneticmap)的繪制:是指以具有遺傳多太性的遺傳標記為“路標”,以遺傳學(重組)距離為“圖距”的基因組圖,是基于遺傳功能而建立的圖譜。單位為分摩爾根(cM)。物理圖(Physicalmap)的繪制:是指以一段已知核苷酸序列的DNA片段為標記(序列標記位置,sequenceteggedsits,STS)、以堿基對的大小為圖距(Mb,Kb)作出的基因組DNA圖譜。表達序列標簽(expressedequencetag,EST)和轉錄圖(或基因圖)的制作:通過從不同組織提取mRNA,合成cDNA,然后進行大規(guī)模測序。cDNA片段被稱為表達序列標簽。轉錄圖將龐大的人類基因組分隔成較小的結構單位,從而為大規(guī)模測序奠定基礎。序列圖:約30億個核苷酸組成的人基因組DNA全序列。1985Sinsheimer在美國加州大學主持召開了會議,討論人類基因組測序的可能性1988美國衛(wèi)生研究院(NIH)成立人類基因組研究辦公室,沃森任負責人(9月)1991文特爾(Venter)提出利用表達序列標簽(EST)發(fā)現(xiàn)基因的策略(6月)
1992美國和法國科學家完成染色體的第一張物理圖譜(圖中為美國Page領導的研究小組)(10月)
1993Sanger中心在英國Hinxton建立,由Sulston領導。該中心后來成為國際協(xié)作組的主要測序實驗室之一(10月)
1994Murray和Cohen等發(fā)表完整的人類基因組遺傳連鎖圖譜,標記平均間距0.7cM(9月)
2000國際人類基因組計劃(HGP)和塞萊拉公司在美國白宮聯(lián)合宣告人類基因工作草圖完成。圖中分別為(從左到右)文特爾、克林頓和科林斯(6月)
2001國際人類基因組計劃(HGP)協(xié)作組織在Nature(2月15日)上發(fā)表人類基因組工作草圖,塞萊拉公司在Science(2月16日)上公開他們的草圖
三、生物信息學的主要研究內容生物信息的收集、存儲、管理與提供。包括:獲取人和各種生物的完整基因組信息建立國際基本生物信息庫和生物信息傳輸?shù)膰H聯(lián)網(wǎng)系統(tǒng);建立生物信息數(shù)據(jù)質量的評估與檢測系統(tǒng);生物信息的在線服務;生物信息可視化和專家系統(tǒng)。編號:U00096名稱:Escherichiacoli菌株:K-12MG1655基因數(shù):4293個堿基數(shù):4639221bp水稻葉綠體基因組可能曾經是一種光合細菌全部由A、C、G、T四種核苷酸組成的序列粳稻(日本1989):134525個字母秈稻(中國2001):134559個字母cccaatatcttgcttcagcaagatattgggtatttctagctttcctttcttcaaaaattgctatatgttagcagaaaagccttatccattaagagatggaacttcaagagcagctaggtctagagggaagttgtgagcattacgttcgtgcattacttccataccaagattagcacggttgatgatatcagcccaagtattaataacgcgaccttggctatcaactacagattggttgaaattgaatccgtttagattgaaagccatagtactaatacctaaagcagtgaaccaaatccctactacaggccaagcagccaagaagaagtgtaaagaacgagagttgttaaaactagcatattggaagattaatcggccaaaataaccatgagcggccacaatattataagtttcttcctcttgaccaaatctgtaaccctcattagcagattcgttttcagtggtttccctgatcaaactagaggttaccaaggaaccatgcatagcactgaatagggaaccgccgaatacaccagctacacctaacatgtgaaatggatgcataaggatgttatgctctgcctggaatacaatcataaagttgaaagtaccagatattcctaaaggcataccatcagagaaacttccttgaccaatagggtaaatcaagaaaacagcagtagcagctgcaacaggagctgaatatgcaacagcaatccaaggacgcatacccagacggaaactcagttcccactcacgacccatataacaagctacaccaagtaagaagtgtagaacaattagctcataaggaccaccattgtataaccactcatcaacagatgcagcttcccaaattgggtaaaagtgcaatccgatcgccgcagaagtaggaataatggcaccagagataatattgtttccgtaaagtaaagaaccagaaacaggctcacgaataccatcaatatctactggaggggcagcgatgaaggcgataataaatacagaagttgcggtcaataaggtagggatcatcaaaacaccgaaccatccgatgtaaagacggttttcggtgctagttatccagttgcagaagcgaccccacaggcttgtactttcgcgtctctctaaaattgcagtcatggtaagatcttggtttattcaaattgcaaggactcccaagcacacgtattaactagaaagataatagaaggcttgttatttaacagtataatatagactatataccaatgtcaaccaagccagccccgacagttgtatatccatacaacaaaatttaccaaaccaaaaaattttgtaaatgaagtgagtgaaaaatcaaaactcagattgctcctttctagtttccatatgggttgcccgggactcgaacccggaactagtcggatggagtagataattattccttgttacaatagagaaaaaacctctccccaaatcgtgcttgcatttttcattgcacacgactttccctatgtagaaataggctatttctattccgaagaggaagtctactaatttttttagtagtaagttgattcacttactatttattatagtacagagaacatttcagaatggaaactgtgaaagttttaccttgatcatttatcaatcatttctagtttattagttttgtttaatgattaattaagaggattcaccagatcattgatacggagaatatccaaataccaaatacgctcactgtgcgatccacggaaagaaaagtaagttgttttggcgaacatcaaagaaaaaacttgctcttcttccgtaaaaaattcttctaaaaataccgaacccaaccattgcataaaagctcgtaccgtgcttttatgtttacgagctaaagttctagcgcatgaaagtcgaagtatatactttagtcgatacaaagtcttcttttttgaagatccactgtgataatgaaaaagatttctacatatccgaccaaaccgatcaagaatatcccaatccgataaatcggtccaaattggtttactaataggatgccccgatccagtacaaaattgggcttttgctaaagatccaatgagaggagtaacagggactttggtatcgaattttttcatttgagtatctattagaaatgaattctccagcatttgattccttactaacaaagaatttattggtacacttgaaaagtaccccagaaaatcgaagcaagagttttctaattggtttagatggatcctttgcggttgagtccaaaaagagaaagaatattgccacaaacggacaaggtaacatttccatttcttcttcaaaagaagagttccttttgatgcaagaattgcctttccttgatatcgaacataatgcataaggggatccataacgaaccatatggttttccgaaaaaaagcagggtacattaacccaaaatgttccatcttcctagaaaagatgattcgttccagaaaggttccggaagaagttaatcgcaagcaagaagattgtttacgaagaaacaacaagaaaaattcatattctgatacataagagttatataggaaccgaaatagtcttttattttcttttttcaaaataaaaatggatttcattgaagtaataaaactattccaattcgagtagtagttgagaaagaatcgcaataaatgcaaggatggaacatcttggatccggtattgaaggagttgaagcaagatatccaaatggataggatagggtatttctatatgtgctagataatgtaagtgcaaaaatttgtcttctaaaaaaggaaatattgaatgaatagatcgtaaattctgaaactttggtatttctttttcttccggacaagactgttctcgtagcgagaatgggatttctacaacgatcgcaaacccctcagatagaatctgagaataaaactcagaataaaaaaaattgttgtaatccaataatcgatcttggttaggatgattaaccaaattaatccaaaaattctgctgatacattcgaatcattaaccgtttcacaagtagtgaactaaatttcttgttattagaaccaataatttcgacaagttcggaaccatttaatccataatcatgggcaaacacataaatgtactcctgaaagagtagtgggtagacgaaatattgtctaggaaatttaagtttttctgaataaccctcgaatttttccatttgtatttctacttgaatcagagagagagaaatatttctcggtttatcaaatggtgatacatagtacaatatggtcagaacagggtgttgcattttttaatacaaacccctggggaagaaaaggagtctaatccacggatctttttccgctccttttctatccaatttgtttatgtttgttctaattacaaaagagaacaaatcctttatttttgcaggccaattgctcttttgactttgggatacagtctctttatcaatatactgcttcttttacacattcaatccataacatccttttcaatccaaaatcaagaataattaggatttctaaaaaaaaaagaaaaaatcaaaggtctactcataggaaaaccagcttttccctacatcaggcactaatctatttttaacgtctaattagatcagggagttcttccaattaagaagttaagctcgttgctttttgttttaccagaattggagccaggctctatccatttattcattagacccagaaaatcagaatttttttattccattccaaaaatccaaaataagaaattgattttattacgacatgctattttttccattcattacccttgaggatcagtcgcggtcttatagactctaccaagagtctggacgaattttttgcttcatccaaatgtgtaaaagatcatagtcgcacttaaaagccgagtactctaccattgagttagcaacccagataaactaggatcttagatacgatcgaaatccaaaaatcaatggaattacaccgcacacccctgtcaaaatcttaaaatagcaagacattaaaagaaagattttatcaccattgaaaacactcagataccaaaaggaacgggtctggttaaatttcactaaggttaaaagtggcaccaatcacgatcgtaaaattgtcatttttttagcatttttatttaaataaataaataaatcttgtatgagagtacaaacaagagggacaaccctaccatttgagcaaagtgtaggcaaaaaacctaatagggagtgaggataaagagacttatccatctacaaattctagatgttcaatggacctttgtcaatggaaatacaatggtaagaaaaaaattagatagaaaaactcaaaaaaataaaggcttatgttggattggcacgacataaatccagtcaaaaataggattaagaaagaggcaaattatttctaaatagttagacaacaagggatactagtgagcctctcctagttttttattcatttagttcttcaattaactcaaagttctttctttttctttaaagaattccgccttccttaaaatatcagaaacggttcttgtaggttgagcacctttttcaaggaaatagagaatagctggaacatttaaacaagtttgattctttatcggatcataaaaacctacttttcgaagatctcttccttctcttcgagatcgaacatcaattgcaacgattcgatagacagcttattgggatagatgtagataaataaagccccccctagaaacgtataggaggttttctcctcatacggctcgagaatatgacttgcattaatttccgtacagaaaaaacaaatttcatttatactcatgactcaagttgactaattttgattgacagacttgaaagaaaaaaatcctttgaaattttttgagtcgtctctaaactcttttctttgcctcatctcgaacaaattcacttttattccttattccggtccaattctattgttgagacagttgaaaatcgtgtttacttgttcgggaatcctttatctttgatttgtgaaatccttgggtttaaacattacttcgggaattcttattcttttttctttcaaaagagtagcaacatacccttttttcttatttccttcgataaagcatttccctcttctatagaaatcgaatatgagcgattgattctgatagactttaatcaaaagagttttcccatatcttccaaaattggactttcttcttattttaaccttttgatttctatattatttcgatttctatattaagggtagaatgacaaagttggcctaatttattagttttcactaaccctagattctttcccttgataaaaaataaattctgtcctctcgagctccatcgtgtactatttacttagcttacttacaaacaacccagcgaaaattcggttcgggacgaatagaacagactatgtcgagccaagagcattttcattactatggaaaatggtggatagcaaaatccacaatcgatcgtgtccttcaagtcgcacgttgctttctaccacatcgttttaaacgaagttttaacataacattcctctaatttcattgcaaagtgttatagggaattgatccaatatggatggaatcatgaatagtcattagtttcgttttttgtatactaattcaaacttgctttgctatctatggagaaatatgaataaaagaaattaagtatttatcgggaaagactccgcaaagagccaatttatttaaacccatattctatcatatgaatgaaatatagttcgaaaaaagggaataaacaagtttgcttaagacttatttattatggaatttccatcctcaacagaggactcgagatgatcaatccaatcctgaaatgataagagaagaattgactcttctccaacaaataaactatcaacctcccgtttaattaatttaattaatatattagattagcaatctatttttccataccatttttccgtaacaaaactaattaactattaactagttaaactattgcaatgaaaagaaagttttttggtagttatagaattctcgtatttcttcgactcgaataccaaaagaaagaaaaaaatgaagtaaaaaaaacgcatttcctgtaaagtaaaattaaggtctttgcttttacttattttttcttttacctaaaagaagcaactccaaatcaaaattgaatccattctatctaacgagcagttcttatcttatctttaccgggatggatcattctggatatttaaaaaatcgcggatcgagatcgtttttgcttaaccaaagaaagaaaaagaagaaggaaccttttttactaataaaatactataaaaaaaatttatctctatcataaatctatctctaccataaaggaataggtctcgttttttatacaatgttctacgtcaagtttaaaattttttcatgaaaaaaagattttcaatttgactggacttgacactggattatgttttctgagacagaaaatgaacgcattaggactgcatcgaatctaagagtttataagagaaaaaaattctctttaataaactttatgtctcgtgcagaatacaatacgatttcatctttcgtttcatcagaaaaaatctgggacggaaggattcgaacctccgagtaacgggaccaaaacccgctgccttaccacttggccacgccccatttcgggttttatgcgacactaataaacagtattatgtttatttcttattcgtcaatcctacttcaattacataaaaatggggggtattctcttggtaggattctagacatgcgaataatatagaatccaaaaaatgcattgatcattacatggaattctattaagatattatatgaaagtcgaatttcttccactctcatttgagagtgcgaatacaaggaggtattttgtgtttgggaaagtccgaagaaaaaaggattttgaatcctccttttcctttttcccttagaaaaataactcaatcaaaatccaattatctactctacaagaacgaaacgcttgttatgcctaatatacttagtttaacctgtatttgttttaattctgttatttatccgactagttttttcttcgccaaattgcccgaagcttatgccattttcaatccaatcgtggattttatgcctgtcatacctgtactcttttttctattagcctttgtttggcaagctgctgtaagttttcgatgaaatctttactactctgtctgccaaattgaatcatgtattcattctaaaaaaattcgaaaaatggataagagccgagaagtcttatattatgaaccttcgattctaaaattcaaattcttctacattgaatgtatagctgcagcaataaatttggatcagcctttctactccctgcatctacgttgagcaggtatctttaggtaaccgcacaatacctaacctaatttattgataagagtgcttattataaatcaattcttgcaatttttttcaaaaattgatttttgcatttttaggtgtcaaaataaacaaaacccatcctagtggatttgtgtggtaaggaaaaacgggtaatctattccttaaaaaaaaatcttggagattatgtaatgcttactctcaaactttttgtttatacagtagtgatattctttgtttccctctttatctttggattcttatctaatgatccaggacgtaatcctgggcgtgacgagtaaaaatccaaaattttttcttacaaattggatttgtttcatacatttatctacgagaaaatccgggggtcagaattccttccaattcgaaagtcccaaacgatccgagggggcggaaagagagggattcgaaccctcggtacaaaaaaattgtacaacggattagcaatccgccgctttagtccactcagccatctctccccgttccaaatcgaaaggtttccgtgatatgacagaggcaagaaataacgattgcaaaaaatccttcctttttctttcaaaagttcaaaaaaattatattgccaattccattttagttatattcttttttcttaatgttaataaaaaaaagaagaaaattcttcttttttctttctaattctaaaattggatattggctaaaagacaatcagatagattttctcttcagcaggcatttccatataggacttgttataataaaacaagcaggttatagaaaaaaactcttttttttattatttatcaacaaagcaaaaaggggtcttatcaaaccaacccaccccataaaattggaaagaaagataaagtaagtggacctgactccttgaatgaggcctctatccgctattctgatatataaattcgatgtagatgaaattgtataagtggatttttttgtatttccttagacttagaccacgcaaggcaagaatttctcgctatttactatttcatattcttgttactagatgttctataggaataagaagaaatcgcaacccctttccgctacacataaaaatggatttcgaaagtcaatttttcttttcaatatctttactttttttcagaatcctatttttgttcttatacccatgcaatagagagcgagtgggaaaagggaggttactttttttcattttttccttaaaaaataggctttcttggaaataggaatcatggaataatctgaattccaatgtttatttctatagtataagaaaaactaattgaatcaaattcatggatttaccacgacctcggctgtgaccccatagataaaaatgcaaaatttctatcttcgagaccattgaaaaaaggcattgaacgagaaaaaatcgtccacagataatctatcgtatgccttggaagtgatataaggtgctcggaaatggttgaagtaattgaataggaggatcactatgactatagcccttggtagagttactaaagaagaaaatgatttatttgatattatggacgactggttacgaagggaccgttttgtttttgtaggatggtctggcctattgctttttccttgtgcttatttcgctttaggaggttggtttacagggacaacttttgtaacttcttggtatacccatggattggcgagttcctatttggaaggttgcaatttcttaaccgcagcagtttccacccctgccaatagtttagcacactctttgttgctactatggggcccggaagcacaaggggattttactcgttggtgtcaattaggtggtctgtggacttttgttgctctccatggggcttttgcactaataggtttcatgttacgtcaatttgaacttgctcggtctgttcaattgcggccttataatgcaatttcattctctggcccaatcgctgtttttgtttccgtattcctgatttatccactggggcaatccggttggttctttgcgccgagttttggcgtagcagcgatatttcgattcatcctcttcttccaaggatttcataattggacgttgaacccatttcatatgatgggagttgccggagtattaggcgcggctctgctatgcgctattcatggggcaaccgtgga
國際著名生物信息中心
BioinformaticsCentresNCBI NationalCenterforBiotechnologyInformation(US)
EBI EuropeanBioinformaticsInstitute(EU)
HGMP HumanGenomeMappingProjectResourceCentre(UK)ExPASyExpertofProteinAnalysisSystem(Switzerland)CMBI CentreofMolecularandBiomolecule(TheNetherlands)ANGIS NationalGenomeInformationService(Australia)NIG NationalInstituteofGenetics(Japan)BIC NationalBioinformaticsCentre(Singapore)歐洲分子生物學網(wǎng)絡組織
(EMBnet)
EuropeanMolecularBiologyNetworkEMBnet為國際著名生物信息學組織,為世界各國提供生物信息資源,并合作進行生物信息的研究、開發(fā)、應用和人才培訓。EMBnet國家節(jié)點歐洲:奧地利、比利時、丹麥、法國、芬蘭、德國、希臘匈牙利、愛爾蘭、以色列、意大利、挪威、波蘭、葡萄牙、斯洛伐克、西班牙、瑞典、瑞士、荷蘭、土耳其、英國亞洲:
中國、印度澳洲:
澳大利亞北美洲:
加拿大非洲:南非南美洲:
阿根廷、古巴、智利、墨西哥核酸序列數(shù)據(jù)庫
Genbank,美國國家生物技術信息中心的數(shù)據(jù)庫(availableat)。
EMBL,建立在歐洲分子生物實驗室的數(shù)據(jù)庫(availableathttp://www.embl-heidelberg.de)。DDBJ,日本的DNA數(shù)據(jù)庫銀行(availableat
http://www.nig.ac.jp)。其他重要數(shù)據(jù)庫酵母基因組數(shù)據(jù)庫(SGD)酵母蛋白質數(shù)據(jù)庫(YPD)擬南芥數(shù)據(jù)庫(AtDB)醫(yī)學數(shù)據(jù)庫(OMIM)線蟲數(shù)據(jù)庫(ACEDB)三維結構數(shù)據(jù)庫PDB(availableat/npdb
)等。與蛋白質結構有關的數(shù)據(jù)庫還有:SCOP(availableat/scop/
)等。與基因組有關的數(shù)據(jù)庫:OMIM(availableat/omim/)。生物信息數(shù)據(jù)庫的主要服務借助特定的算法模型提供同源性分析是目前各種生物信息數(shù)據(jù)庫的最重要內容之一。生物技術和信息技術是21世紀的兩大經濟發(fā)展支柱,生物信息學是生命科學和信息科學的結合點,是當今自然科學新的前沿領域。生物信息資源建設是生物信息研究開發(fā)的基礎。1996年,北京大學加入歐洲分子生物學網(wǎng)絡組織,成為該組織的中國國家節(jié)點,并成立生物信息中心,為生物、醫(yī)學、制藥、農業(yè)、環(huán)境等領域的研究開發(fā)提供生物信息資源服務,并開展二次數(shù)據(jù)庫構建、軟件集成、基因組分析等研究。歐洲分子生物學網(wǎng)絡組織中國國家節(jié)點NationalNodeEuropeanMolecularBiologyNetwork北京大學生物信息中心CentreofBioinformaticsPekingUniversity亞太生物信息學網(wǎng)絡組織中國節(jié)點2000年CBI主服務器頁面訪問量安裝了70多個數(shù)據(jù)庫,提供200多種軟件下載建立了14個國外著名生物信息中心鏡象提供了數(shù)據(jù)庫和文獻查詢、搜索構建了中華民族基因多樣性等專用數(shù)據(jù)庫集成和開發(fā)了基于Web的生物信息軟件工具開展了分子模擬、序列分析等應用研究舉辦了國際國內培訓班、講習班、討論會開設了生物信息學概論研究生課程構建二次數(shù)據(jù)庫中華民族基因多樣性數(shù)據(jù)庫轉錄因子細胞特異性數(shù)據(jù)庫Cytomer蛋白質結構域數(shù)據(jù)庫Domain蛋白質回環(huán)數(shù)據(jù)庫Loop水稻矮縮病毒數(shù)據(jù)庫RDV二硫鍵信息數(shù)據(jù)庫Bridge中華民族基因多態(tài)性數(shù)據(jù)庫水稻矮縮病毒基因組數(shù)據(jù)庫蛋白質二硫鍵數(shù)據(jù)庫廖黔寧,羅靜初,周培愛,顧孝誠,梁宋平,虎紋捕鳥蛛毒素-I突變體的設計、合成和活性鑒定,中國生物化學和分子生物學學報,5(5):756-761,1999年。SYLu,PCDeng,XCLiu,JCLuo,RSHan,XCGu,SPLiang,XCWang,FLi,VLozanov,APatthyandSPongor,SolutionstructureoftheMajora-amylaseinhibitorofthecropplantamaranth,J.Biol.Chem.274(29):20473-20478,1999.擬南芥突變體庫數(shù)據(jù)庫—北大耶魯合作項目1.生物大分子結構模擬和藥物設計包括
RNA(核糖核酸)的結構模擬和反義RNA的分子設計;蛋白質空間結構模擬和分子設計;具有不同功能域的復合蛋白質以及連接肽的設計;生物活性分子的電子結構計算和設計;納米生物材料的模擬與設計;基于酶和功能蛋白質結構、細胞表面受體結構的藥物設計;基于DNA結構的藥物設計等。ComputerAidedVaccineDesignSystemDatabaseArticlesLabWorkAlgorithm(ANN),AnalysisProgram,AdjustProgram…DataFlowRight/Wrong?Right/Wrong?AnswerAnswer2.生物信息分析的技術與方法研究包括發(fā)展有效的能支持大尺度作圖與測序需要的軟件、數(shù)據(jù)庫以及若干數(shù)據(jù)庫工具,諸如電子網(wǎng)絡等遠程通訊工具;改進現(xiàn)有的理論分析方法,如統(tǒng)計方法、模式識別方法、隱馬爾科夫過程方法、分維方法、神經網(wǎng)絡方法、復雜性分析方法、密碼學方法、多序列比較方法等;創(chuàng)建一切適用于基因組信息分析的新方法、新技術。包括引入復雜系統(tǒng)分析技術、信息系統(tǒng)分析技術等;建立嚴格的多序列比較方法;
發(fā)展與應用密碼學方法以及其他算法和分析技術,用于解釋基因組的信息,探索DNA序列及其空間結構信息的新表征;發(fā)展研究基因組完整信息結構和信息網(wǎng)絡的研究方法等;發(fā)展生物大分子空間結構模擬、電子結構模擬和藥物設計的新方法與新技術。3.應用與發(fā)展研究。匯集與疾病相關的人類基因信息,發(fā)展患者樣品序列信息檢測技術和基于序列信息選擇表達載體、引物的技術;
建立與動植物良種繁育相關的數(shù)據(jù)庫以及與大分子設計和藥物設計相關的數(shù)據(jù)庫。
發(fā)酵工程
第一節(jié)發(fā)酵工程概況發(fā)酵工程的定義發(fā)酵工程反應過程的特點發(fā)酵工程的內容和發(fā)展1.發(fā)酵工程的定義發(fā)酵:利用微生物在有氧和無養(yǎng)條件下的生命活動來制備微生物菌體或其代謝產物的過程發(fā)酵工程:利用生物的生命活動產生的酶,對無機或有機原料進行酶加工獲得產品的工業(yè)。
是將傳統(tǒng)的發(fā)酵與現(xiàn)代DNA重組、細胞融合、分子修飾和改造等新技術結合并發(fā)展起來的發(fā)酵技術。是滲透工程學的微生物學。發(fā)酵產品:人干擾素、乙肝疫苗、心活素、紅細胞生成素、血凝因子、青霉素?;?、成纖維細胞生長因子等等2.發(fā)酵工程反應過程的特點a.反應條件溫和b.原料來源廣泛c.反應以生命體的自動調節(jié)方式進行,若干個反應過程能夠像單一反應一樣,在單一反應器內很容易地進行d.發(fā)酵產品多為小分子,但能很容易的生產出復雜的高分子化合物e.高度選擇性的進行復雜化合物在特定部位的反應f.發(fā)酵液一般對生物體無害g.易發(fā)生雜菌污染h.通過菌種改良,可以利用原有設備較大幅度的提高生產水平需注意的一些問題1.副產物的產生,造成提取和精制的困難2.活細胞的反應,細胞容易發(fā)生變異,影響反應物的生成率,不易控制3準備工作量大,花費高4.底物濃度不能過高,要使用較大反應器5廢水具有較高的BOD/COD(水質生物耗氧量和化學需氧量),需進行處理3.發(fā)酵工程的研究內容內容:生產菌種的選育、發(fā)酵條件的優(yōu)化與控制、反應器的設計及產物的分離、提取與精致等過程有價值的發(fā)酵產物:微生物菌體本身;菌體代謝產物;菌體或酶系實現(xiàn)生物轉化得到的產物第二節(jié)微生物工業(yè)菌種與培養(yǎng)基真核生物:細胞含有具體的細胞核,細胞核有核膜、核仁和染色體,如原生動物、單細胞藻類、真菌等。原核生物:細胞含有不具體的細胞核,細胞核沒有核膜、核仁,遺傳物質(DNA)不組成典型的染色體,如細菌和立克次氏藍綠藻類。非細胞微生物:病毒如噬菌體1.發(fā)酵工業(yè)對菌種的要求a.原料廉價、生長迅速、代謝產物產量高b.培養(yǎng)條件易于控制,所需酶活力高c.發(fā)酵周期短,生長速度和反應速度快d.菌株選擇單產高的營養(yǎng)缺陷型突變菌株、調節(jié)突變菌株或野生菌株e.菌株抗噬菌體能力強f.菌種性能穩(wěn)定,不宜變異退化g.菌種不是病原菌,不產生任何有害的生物活性物質和毒素2.工業(yè)常用的微生物菌種2.1細菌2.1.1形態(tài)和大小球狀、桿狀和螺旋狀1×10-10~1×10-9mg2.1.2屬原核生物包括細胞壁、細胞膜、細胞質和核質體等特殊結構:鞭毛、莢膜和芽孢2.1.3細菌的繁殖方式裂殖方式芽孢:某些細菌在其生活史的一定階段,于營養(yǎng)細胞內形成的一個內生孢子一般濕熱滅菌以殺死在自然界中抗熱性最強的嗜熱脂肪芽孢桿菌的芽孢為標準,
規(guī)定在121℃滅菌15分鐘2.1.4發(fā)酵工業(yè)常用的細菌大腸桿菌、乳酸桿菌、枯草芽孢桿菌、醋酸桿菌等2.2放線菌2.2.1形態(tài)及構造菌落呈放射狀屬于原核生物由菌絲體構成,菌絲體包括基內菌絲體(營養(yǎng)菌絲體)和氣生菌絲體氣生菌絲體發(fā)育到一定階段形成孢子絲,然后形成孢子2.2.2放線菌的繁殖無性方式繁殖,菌絲斷裂的片斷可繁殖成新的菌體2.2.3放線菌在微生物中的分類及地位介于細菌和絲狀真菌之間,在微生物分類位置上屬于細菌2.2.4發(fā)酵工業(yè)常用的放線菌主要用于生產抗生素:龜裂酶素:土霉素金霉素鏈霉菌:四環(huán)素紅霉素鏈霉菌:紅霉素其中小單胞菌屬產抗生素最多另外放線菌還可產生酶和維生素2.3酵母2.3.1酵母的形態(tài)大小屬真菌類單細胞出芽方式進行無性繁殖形態(tài):球形、橢圓形、卵圓形、檸檬形、臘腸形和菌絲狀等大?。喊l(fā)酵工業(yè)用酵母一般4~6μm2.3.2酵母的細胞結構真核細胞典型的細胞結構2.3.3酵母的繁殖方式無性繁殖:芽殖和裂殖,酵母的主要繁殖方式有性繁殖:產生子囊和子囊孢子2.3.4工業(yè)上常用的酵母啤酒酵母卡爾斯伯酵母啤酒酵母橢圓變種德巴利氏酵母屬漢遜氏酵母畢赤氏酵母屬假絲酵母屬絲酶母屬2.4霉菌2.4.1形態(tài)及構造屬于真菌,亦稱絲狀真菌營養(yǎng)體由菌絲構成菌絲:無橫膈,整個菌絲是一個單細胞,含多個細胞核;有橫膈每一段就是一個細胞2.4.2酶菌的繁殖及生活史通過孢子繁殖,通過無性和有性方式形成孢子2.4.3工業(yè)常用霉菌藻狀菌綱:根酶、毛酶、犁頭酶子囊菌綱:紅曲霉半知菌類:曲霉、青酶2.5噬菌體2.5.1特點、形態(tài)和化學成分形態(tài):有頭尾之分化學成分:核酸和蛋白質占粒子質量90%以上,其中核酸40-50%特點形態(tài)微小,體積比細菌小的多
為非細胞類型,屬于病毒對寄主細胞有嚴格的專一性2.5.2生長和繁殖吸附:尾部吸附侵入侵入增值成熟釋放2.5.3噬菌體的防治杜絕噬菌體生存增殖的環(huán)境條件選育和使用抗噬菌體菌株菌種輪換使用2.培養(yǎng)基的制備2.1培養(yǎng)基的營養(yǎng)成分及來源
碳源:供給微生物生命活動所需的能量和構成菌體細胞以及代謝產物的物質基礎氮源:構成微生物細胞中蛋白質和核酸的主要元素無機鹽:參與細胞結構物質的組成,作為酶活性中心的組成部分或維持酶的活性,調節(jié)滲透壓、PH值等生長因子:提供微生物細胞所需要的化學物質、輔助因子的組分和參與代謝的物質能源和水2.2培養(yǎng)基的類型2.2.1根據(jù)營養(yǎng)基來源劃分天然培養(yǎng)基合成培養(yǎng)基綜合培養(yǎng)基2.2.2根據(jù)培養(yǎng)基原物質狀態(tài)液體培養(yǎng)基固體培養(yǎng)基2.2.3根據(jù)培養(yǎng)基的用途劃分基礎培養(yǎng)基鑒別培養(yǎng)基增殖培養(yǎng)基:加入額外的營養(yǎng)物質,促進某一類菌生長選擇培養(yǎng)基:加入某種具殺菌作用的物質活體培養(yǎng)基:活的動植物體或離體的生活細胞2.2.4根據(jù)生產目的劃分種子培養(yǎng)基發(fā)酵培養(yǎng)基2.3發(fā)酵培養(yǎng)基的選擇基本原則提供合成微生物細胞和發(fā)酵產物的基本成分有利于減少培養(yǎng)基原料的消耗,增加產率有利于提高培養(yǎng)基和產物的濃度有利于提高產物合成的速度,縮短發(fā)酵周期減少副產物的形成原料價格低廉,質量穩(wěn)定有利于提高氧的利用率,降低成本能耗有利于產品的分離純化,減少三廢的出現(xiàn)2.4菌種的擴大培養(yǎng)2.4.1目的:為生產提供相當數(shù)量的代謝旺盛的種子,以縮短發(fā)酵周期,提高發(fā)酵罐利用率,有利于減少雜菌污染的機會。對種子要求:純、壯、活力旺盛、接種數(shù)量足夠2.4.2工業(yè)微生物菌種培養(yǎng)的類型種子擴大培養(yǎng)階段液體培養(yǎng)法:液體試管、三角瓶搖床震蕩或回旋培養(yǎng)。通氣量大小可控。表面培養(yǎng)法:茄子瓶、克氏瓶、瓷盤培養(yǎng)固體培養(yǎng)法:三角瓶、蘑菇瓶、克氏瓶和培養(yǎng)皿等大規(guī)模生產階段:淺盤固體培養(yǎng)、深層固體培養(yǎng)、淺盤液體培養(yǎng)、深層液體通氣培養(yǎng)固體培養(yǎng)培養(yǎng)基原料:小麥麩皮等設備:較淺的曲盤、較深的大池、能旋轉的轉鼓和通風曲槽等特點:設備簡單,生產成本低,產量較高,耗費勞動力較多,占地面積達,PH、溶解氧、溫度等不易控制,易污染,生產規(guī)模難以擴大液體培養(yǎng)按是否需氧靜置培養(yǎng):厭氧菌發(fā)酵通氣培養(yǎng):好氧菌發(fā)酵按培養(yǎng)罐類型淺盤培養(yǎng):沒有通氣攪拌設備,勞動強度大,生產效率低,易污染液體深層培養(yǎng):發(fā)酵罐內進行,發(fā)酵罐內有攪拌器,通入空氣。大型發(fā)酵罐的發(fā)酵一般也分幾級,進行多級培養(yǎng),谷氨酸發(fā)酵二級培養(yǎng),青霉素和鏈霉素等需三級培養(yǎng)第三節(jié)發(fā)酵操作方法和工藝控制1.發(fā)酵操作方法2影響發(fā)酵的主要因素3.發(fā)酵設備1.發(fā)酵操作方法發(fā)酵的一些指標:底物轉化成產品的比率:控制原料對產品成本影響產率:單位時間,單位體積生產的成品半成品數(shù)量發(fā)酵產物濃度:確定下一步提取和精制方法及費用殘留底物量:實際轉化率,防止雜菌1.1分批發(fā)酵又稱間歇發(fā)酵法。在一個密閉系統(tǒng)內一次性加入營養(yǎng)物和菌種進行培養(yǎng),直到結束放出,中間除了空氣進入和尾氣排出,與外界沒有物料交換。見p40圖3-1分批發(fā)酵過程微生物的生長可分為四個不同的階段遲滯期:細胞不分裂(不生長),但細胞變大,細胞內RNA含量增高,原生質呈堿性,合成代謝活躍,易合成新的誘導酶,對外界環(huán)境變化敏感。接種物中死細胞較多或培養(yǎng)基不豐富時延滯期較長。對數(shù)期:細胞分裂(生長)最快,細胞進行平衡生長,酶系活躍,代謝旺盛。生長速率由營養(yǎng)成分和培養(yǎng)條件決定。
穩(wěn)定期:新繁殖的細胞與死亡細胞數(shù)目相等,菌體產量達到最高,細胞開始儲藏糖原、脂肪等儲藏物,產芽孢的開始形成芽孢,開始合成次生代謝產物。可能由于營養(yǎng)物的消耗或抑制生長的代謝產物積累,細胞停止增殖,但仍存活。
衰亡期:死亡細胞數(shù)目超過新生細胞,細胞形態(tài)多樣,細胞開始自溶,開始釋放次生代謝產物。
1.2連續(xù)發(fā)酵法向發(fā)酵罐中連續(xù)供給新鮮培養(yǎng)基的同時,將含有微生物和產物的培養(yǎng)液以相同的速度連續(xù)放出,從而使發(fā)酵液中的液量維持恒定,微生物在穩(wěn)定狀態(tài)下生長。優(yōu)點:提高設備利用率、原料利用率和便于實現(xiàn)自動化缺點:1)開放系統(tǒng),容易雜菌污染2)對設備、儀器要求高1.3補料分批發(fā)酵法指在分批培養(yǎng)過程中,間歇的或連續(xù)的補加新鮮培養(yǎng)基,但所需產物不到一定時刻不放出的培養(yǎng)方法。又稱半連續(xù)發(fā)酵,是分批發(fā)酵和連續(xù)發(fā)酵之間的一種過渡培養(yǎng)方法。優(yōu)點:1)與連續(xù)發(fā)酵相比,不需要嚴格的無菌條件,不會產生菌種老化和變異問題,以及適用范圍廣2)與分批發(fā)酵比較:可以解除底物的抑制,產物反饋抑制和葡萄糖分解阻遏根據(jù)流加方式不同,分為單一補料反復補料分批發(fā)酵:發(fā)酵過程中每隔一定時間按一定比例放出一部分發(fā)酵液,直至發(fā)酵產率明顯下降。目前應用十分廣泛,面包酵母、氨基酸、抗生素、單細胞蛋白質等發(fā)酵工業(yè)2.影響發(fā)酵的主要因素溫度:根據(jù)發(fā)酵不同階段,確定最適溫度。發(fā)酵中釋放發(fā)酵熱,一般需要進行冷卻操作PH:PH不同產物不同,基質加緩沖性物質,生產過程中加入無機酸、堿等通風和攪拌:可以生長和最適生長氧濃度染菌的控制:1)設備、管道、閥門漏損2)設備及管道滅菌不徹底存在死角3)空氣凈化不徹底4)菌種不純或培養(yǎng)基滅菌不徹底5)無菌操作不嚴格,生產操作出錯3.發(fā)酵設備3.1厭氧發(fā)酵罐設備簡單主要用于酒精、乳酸及啤酒等厭氧發(fā)酵3.2好氧發(fā)酵罐3.2.1機械攪拌式發(fā)酵罐(通用式發(fā)酵罐):大部分通風發(fā)酵采用。特點:溶氧速率高,氣液混合效果好,結構嚴密,有利于避免雜菌污染缺點:結構較復雜,動力消耗大結構p46圖3-43.2.1通風攪拌式發(fā)酵罐通風目的:a)供給微生物所需要的氧b)代替攪拌器使發(fā)酵液均勻混合1)循環(huán)式通風發(fā)酵罐2)高位塔式發(fā)酵罐1.目的及基本要求.目的:發(fā)酵液中雜質含量較多,代謝產物的濃度較低,低濃度的發(fā)酵產品不能直接作為工業(yè)生產的原料或為我所用
基本要求(1)操作簡單費用低(2)提取率高,能夠達到要求純度,廢液中最終產品含量低(3)不影響產品質量(4)提取所用試劑對設備腐蝕性?。?)產生廢物能夠處理,對環(huán)境污染少
2.流程和方法下游技術兩個階段:(1)發(fā)酵液的預處理和固液分離(2)純化a提?。ǔ醪郊兓゜精制(高度純化)c成品加工2.1發(fā)酵液的預處理和固液分離目的1)分離細胞、菌體和其它懸浮顆粒2)除去部分可溶性雜質3)改變?yōu)V液性質胞外產物胞內產物方法:調節(jié)PH、加熱、過濾、離心分離等2.2純化方法(1)提?。撼ヅc目標產物性質有很大差別的物質,濾液體積減小但純度不高
吸附法、離心分離、萃取、沉淀、超濾(2)精制:除去有類似化學功能和物理性質的不純物
沉淀、超濾、層析、電泳、高效液相(3)精制:進一步濃縮、無菌過濾、干燥、加穩(wěn)定劑等等
結晶、干燥等第五節(jié)發(fā)酵工程的應用
基因工程20世紀40年代科學家發(fā)現(xiàn)從一種具有夾膜、致病性的肺炎球菌中提取的核酸,可使另一種無夾膜、不具致病性的球菌的遺傳性狀發(fā)生改變,變成有夾膜和致病性的肺炎球菌,其中的奧秘不言而喻,核酸將攜帶有夾膜和致病性等的遺傳信息傳至另一種球菌中,因此,核酸是遺傳信息的載體,也是遺傳的物質基礎。
50年代初Watson和Crick又揭示了DNA的分子結構一、歷史回顧Watson、Crick的DNA雙螺旋結構Nature171,737-734(1953)(C)MacmillanPublishersLtd.MolecularstructureofNucleicAcidsWATSON,J.D.&CRICK,F.H.C.MedicalResearchCouncilUnitfortheStudyofMolecularStructureofBiologicalSystems,CavendishLaboratory,Cambridge.AStructureforDeoxyriboseNucleicAcid
Wewishtosuggestastructureforthesaltofdeoxyribosenucleicacid(D.N.A.).Thisstructurehasnovelfeatureswhichareofconsiderablebiologicalinterest.Figure1Thisfigureispurelydiagrammatic.Thetworibbonssymbolizethetwophophate-sugarchains,andthehorizonalrodsthepairsofbasesholdingthechainstogether.Theverticallinemarksthefibreaxis.
70年代初,DNA已可在體外被隨意拼接并轉回到細菌體內遺傳和表達一、歷史回顧今天,人們在超市貨價上可以買到保質期很長的轉基因土豆,“多利”克隆綿羊走進實驗室,基因工程正在使整個人類生活方式發(fā)生重大變革。2000.6.26宣告人類基因組“工作框架圖”繪制完畢。目前還有許多有價值的微生物,動物,植物的測序工作正在進行中。/genomics/
歷史回顧2000年,法國科學家利用基因技術“制造”出了一只可以發(fā)出綠色熒光的兔子“Alba”。應用了受精卵顯微注射技術,從水母身上采集了熒光蛋白,基因改良后,使它的發(fā)光率比原先提高了兩倍,再將該基因植入到了兔子的受精卵中,由此培養(yǎng)出了會發(fā)光的兔子Alba。在普遍光線下,它看上去與其它同類沒有區(qū)別,但是在較暗的光線下,它的身體就會放射出奇異的綠光來。
二、基本概念基因工程的基本定義:
基因工程(GeneticEngineering)原稱遺傳過程。從狹義上講,基因工程是指將一種或多種生物體(供體)的基因與載體在體外進行拼接重組,然后轉入另一種生物體(受體)內,使之按照人們的意愿遺傳并表達出新的性狀。基本概念基因工程的基本定義:供體、受體和載體稱為基因工程的三大要素,其中相對于受體而言,來自供體的基因屬于外源基因?;靖拍罨蚬こ痰幕径x:除了少數(shù)RNA病毒外,幾乎所有的基因都存在于DNA結構中,而用于外源基因重組拼接的載體也都是DNA分子,因此基因工程也稱為重組DNA技術(DNARecombination)。另外,DNA重組分子大都需在受體細胞中復制擴增,故還可將基因工程表征為分子克隆或基因的無性繁殖(Molecularcloning)?;靖拍罨蚬こ痰幕径x:
廣義的基因工程定義為DNA重組技術的產業(yè)化設計與應用,包括上游技術和下游技術兩大組成部分?;靖拍罨蚬こ痰幕径x:上游技術指的是外源基因重組、克隆和表達的設計與構建(即狹義的基因工程);而下游技術則涉及到含有重組外源基因的生物細胞(基因工程菌或細胞)的大規(guī)模培養(yǎng)以及外源基因表達產物的分離純化過程?;靖拍罨蚬こ痰幕径x:廣義的基因工程概念更傾向于工程學的范疇。值得注意的是,廣義的基因工程是高度統(tǒng)一的整體。上游DNA重組的設計必須以簡化下游操作工藝和裝備為指導思想,而下游過程則是上游重組藍圖的體現(xiàn)與保證,這是基因工程產業(yè)化的基本思想。三、理論基礎不同基因具有相同的物質基礎;基因是可切割的;基因是可以轉移的;多肽和基因之間存在對應關系;遺傳密碼是通用的;基因可以通過復制把遺傳信息傳給下一代。三、理論基礎1.不同基因具有相同的物質基礎?;蚴且粋€具有遺傳功能的特定核苷酸序列的DNA片段。堿基的結構A腺嘌呤T胸腺嘧啶G鳥嘌呤C胞嘧啶U尿嘧啶DNA的結構三、理論基礎2.基因是可切割的;限制性內切酶(RestrictionEnzyme),如EcoRI,HindIII等。限制性內切酶常用限制性內切酶種類及特性W.Arber和H.O.Smith其它工具酶連接酶T4DNALigase1967修補工具酶DNA聚合酶I大片斷Klenow1971末端加工酶S1核酸酶,堿性磷酸單脂酶末端轉移酶人工加polyA或polyT尾反轉錄酶三、理論基礎3.基因是可以轉移的;4.多肽和基因之間存在對應關系;OneGene,OneProtein
OneGene,OnePolypeptideChain鐮刀形細胞貧血癥。正常HbA四條多肽鏈(2條鏈,兩條鏈)VernonM.Ingram證明鏈第六位氨基酸HbA是谷氨酸,HbS是纈氨酸。證明基因與氨基酸之間存在直接對應關系的第一個直接證據(jù)三、理論基礎5.遺傳密碼是通用的;生命的語言所謂“中心法則”,是指遺傳信息在細胞內的生物大分子之間轉移或傳遞的基本法則。三、理論基礎6.基因可以通過復制把遺傳信息傳給下一代。四、基因工程的基本過程依據(jù)定義,基因工程的整個過程由工程菌(細胞)的設計構建和基因產物的生產兩大部分組成。前者主要在實驗室里進行,其單元操作過程如下:基因工程的基本過程(1)從供體細胞中分離出基因組DNA,用限制性核酸內切酶分別將外源DNA(包括外源基因或目的基因)和載體分子切開(簡稱“切”);基因工程的基本過程(2)用DNA連接酶將含有外源基因的DNA片斷接到載體上,形成DNA重組分子(簡稱“接”);基因工程的基本過程(3)借助于細胞轉化手段將DNA重組分子導入受體細胞中(簡稱“轉”);基因工程的基本過程(4)短時間培養(yǎng)轉化細胞,以擴增DNA重組分子或使其整合到受體細胞的基因組中(簡稱“增”);基因工程的基本過程(5)篩選和鑒定轉化細胞,獲得使外源基因高效表達的基因工程菌或細胞(簡稱“檢”);基因工程的基本過程由此可見,基因工程的上游操作過程可簡化為:“切、接、轉、增、檢”五步);Example:TransferoftheInsulin(胰島素)geneintoaplasmidvectorAgenomiclibrarycomprisesasetofbacteria,eachcarryingadifferentsmallfragmentofhu
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年江蘇無錫消防考試題及答案培訓試卷
- 環(huán)境保護獎懲管理制度(3篇)
- 疫情時期居民管理制度內容(3篇)
- 獸藥行業(yè)培訓課件模板
- 西安市小區(qū)管理制度(3篇)
- 《GA 526-2010監(jiān)室門》專題研究報告
- 企業(yè)招投標規(guī)范制度
- 企業(yè)項目管理制度
- 養(yǎng)鴨養(yǎng)鵝知識培訓課件
- 交通執(zhí)法監(jiān)督與責任追究制度
- 種雞免疫工作總結
- 河南省商丘市柘城縣2024-2025學年八年級上學期期末數(shù)學試題(含答案)
- 河南省信陽市2024-2025學年高二上學期1月期末英語試題(含答案無聽力原文及音頻)
- 給女朋友申請書
- 八下《桃花源記》《小石潭記》全文背誦(原文+譯文)
- 房顫搶救流程護理
- 【8地RJ期末】安徽省蕪湖市2024-2025學年八年級上學期期末考試地理試卷+
- 智能法理學習通超星期末考試答案章節(jié)答案2024年
- 長護險護理培訓課件
- 福建省廈門市2023-2024學年高二上學期期末考試英語試題(解析版)
- 藍絲帶的故事
評論
0/150
提交評論