生物信息學(xué)簡(jiǎn)答題_第1頁(yè)
生物信息學(xué)簡(jiǎn)答題_第2頁(yè)
生物信息學(xué)簡(jiǎn)答題_第3頁(yè)
生物信息學(xué)簡(jiǎn)答題_第4頁(yè)
生物信息學(xué)簡(jiǎn)答題_第5頁(yè)
已閱讀5頁(yè),還剩17頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

生物信息學(xué)簡(jiǎn)答題生物信息學(xué)簡(jiǎn)答題生物信息學(xué)簡(jiǎn)答題V:1.0精細(xì)整理,僅供參考生物信息學(xué)簡(jiǎn)答題日期:20xx年X月1. 生物分子至少攜帶著三種信息遺傳信息功能相關(guān)的結(jié)構(gòu)信息進(jìn)化信息2. 生物信息學(xué)的目標(biāo)和任務(wù)收集和管理生物分子數(shù)據(jù)數(shù)據(jù)分析和挖掘開(kāi)發(fā)分析工具和實(shí)用軟件3. 生物信息學(xué)研究意義認(rèn)識(shí)生物本質(zhì)改變生物學(xué)的研究方式在醫(yī)學(xué)上的重要意義4. 生物信息學(xué)與實(shí)驗(yàn)生物學(xué)的關(guān)系實(shí)驗(yàn)生物學(xué)(傳統(tǒng)生物學(xué)or現(xiàn)代生物學(xué)):是實(shí)驗(yàn)性的;為生物信息學(xué)提供相應(yīng)的數(shù)據(jù)生物信息學(xué):生物信息的搜集、整理、注釋、管理;建立并利用生物信息學(xué)數(shù)據(jù)庫(kù);開(kāi)發(fā)生物信息學(xué)軟件;研究生物信息學(xué)算法生物信息學(xué)對(duì)實(shí)驗(yàn)數(shù)據(jù)分析與利用的結(jié)果,為進(jìn)一步合理、有效地設(shè)計(jì)實(shí)驗(yàn)方案,研究方向等提供有力的指導(dǎo)和合理的建議。使得新的生物學(xué)研究的出發(fā)點(diǎn)是理論的生物信息學(xué)分析的結(jié)果必須通過(guò)生物實(shí)驗(yàn)科學(xué)來(lái)進(jìn)一步驗(yàn)證5. 生物信息學(xué)主要研究?jī)?nèi)容1、生物分子數(shù)據(jù)的收集與管理2、數(shù)據(jù)庫(kù)搜索及序列比較3、基因組序列分析4、基因表達(dá)數(shù)據(jù)的分析與處理5、蛋白質(zhì)結(jié)構(gòu)與功能預(yù)測(cè)6、代謝途徑分析與解析6. 生物分子數(shù)據(jù)庫(kù)應(yīng)滿足:(1)時(shí)間性(2)注釋(3)支撐數(shù)據(jù)(4)數(shù)據(jù)質(zhì)量(5)集成性(6)非冗余性7. 一個(gè)數(shù)據(jù)庫(kù)記錄(entry)一般由兩部分組成:1. 原始序列數(shù)據(jù)2.描述這些數(shù)據(jù)生物學(xué)信息的注釋8. FASTA格式序列分析軟件最常用的格式,包括三部分:在注釋行的第一列用字符“>”標(biāo)識(shí),后面是序列的名字和來(lái)源;標(biāo)準(zhǔn)的單字符標(biāo)記的序列;序列中沒(méi)有數(shù)字或其他非字符??蛇x的“*”表示序列的結(jié)束,它可能出現(xiàn)也可能不出現(xiàn),但它是許多序列分析程序正確讀取序列所必須的。9. SWISS-PROT的三個(gè)特點(diǎn):注釋、非冗余、交叉索引(1)注釋SWISS-PROT數(shù)據(jù)分為核心數(shù)據(jù)和注釋兩大類。(2)最小冗余盡量將相關(guān)的數(shù)據(jù)歸并,降低數(shù)據(jù)庫(kù)的冗余程度。如果不同來(lái)源的原始數(shù)據(jù)有矛盾,則在相應(yīng)序列特征表中加以注釋。(3)與其它數(shù)據(jù)庫(kù)的連接:對(duì)于每一個(gè)登錄項(xiàng),有指向其它數(shù)據(jù)庫(kù)的指針10. SWISS-PROT數(shù)據(jù)的來(lái)源:(1)從核酸數(shù)據(jù)庫(kù)經(jīng)過(guò)翻譯推導(dǎo)而來(lái);(2)從蛋白質(zhì)數(shù)據(jù)庫(kù)PIR挑選出合適的數(shù)據(jù);(3)從科學(xué)文獻(xiàn)中摘錄;(4)研究人員直接提交的蛋白質(zhì)序列數(shù)據(jù)11. 導(dǎo)致的結(jié)果:冗余數(shù)據(jù)可能導(dǎo)致的潛在錯(cuò)誤如果一組DNA或氨基酸序列包含了大量非常相關(guān)序列族,則相應(yīng)的統(tǒng)計(jì)分析將偏向這些族,在分析結(jié)果中,這些族的特性被夸大;序列間不同部分的顯著相關(guān),在數(shù)據(jù)樣本抽樣時(shí)可能是有偏的和不正確的;如果這些數(shù)據(jù)是被用于預(yù)測(cè),則這些序列將使預(yù)測(cè)方法—如人工智能方法—發(fā)生偏離12. 消除誤差合理利用數(shù)據(jù)庫(kù):嚴(yán)格、合理地構(gòu)建數(shù)據(jù)庫(kù)去除污染的序列,合理地把握數(shù)據(jù)庫(kù)的非冗余和冗余的標(biāo)準(zhǔn)合理、恰當(dāng)?shù)厥褂脭?shù)據(jù)庫(kù)結(jié)合實(shí)驗(yàn)研究,合理有效利用數(shù)據(jù)庫(kù)堅(jiān)持實(shí)驗(yàn)第一原則,實(shí)踐是檢驗(yàn)真理的唯一標(biāo)準(zhǔn)13. Entrez系統(tǒng)的使用進(jìn)入NCBI主頁(yè)(www.ncbi.nlm.nih),即可看到位于頁(yè)面上部的數(shù)據(jù)庫(kù)檢索欄,其缺省檢索選項(xiàng)為核酸序列數(shù)據(jù)庫(kù)AllDatabases,應(yīng)該先選擇適當(dāng)?shù)臄?shù)據(jù)庫(kù),然后在檢索欄中輸入需要查詢的內(nèi)容。14. 如何設(shè)計(jì)科研計(jì)劃資料查詢資料匯總分析優(yōu)劣尋找出路制定方案斗膽創(chuàng)新15. 序列比較的根本任務(wù)是:尋找序列之間的相似性辨別序列之間的差異16. 目的:1.相似序列:相似的結(jié)構(gòu),相似的功能2.判別序列之間的同源性3.推測(cè)序列之間的進(jìn)化關(guān)系17. 序列比對(duì)的基本思想,是找出檢測(cè)序列和目標(biāo)序列的相似性。比對(duì)過(guò)程中需要在檢測(cè)序列或目標(biāo)序列中引入空位(一般用”-”來(lái)表示),以表示插入或刪除(圖2)來(lái)比較兩個(gè)(雙序列比對(duì))或多個(gè)序列(多序列比對(duì)),使得這些序列獲得最大匹配。18. 蛋白質(zhì)打分矩陣等價(jià)矩陣氨基酸突變代價(jià)矩陣GCM疏水矩陣PAM矩陣BLOSUM矩陣PAM矩陣19. BLAST程序結(jié)果解讀程序名稱、版本號(hào)以及文獻(xiàn)引用出處檢索序列的名稱、數(shù)據(jù)庫(kù)名稱;圖示主要比對(duì)結(jié)果列出相似性值較高的序列條目,以及它們?cè)跀?shù)據(jù)庫(kù)中的編號(hào)和簡(jiǎn)要說(shuō)明,每個(gè)條目后面給出相似性分?jǐn)?shù)值Score和期望頻率值E,以相似性分?jǐn)?shù)值大小為序排列,相似性分?jǐn)?shù)越高,相似性越大;E值則表示隨機(jī)擊中(匹配)其他序列的可能性,E值越大,隨機(jī)匹配的可能性也越大。最后給出檢測(cè)序列和目標(biāo)序列的比對(duì)結(jié)果。20. 核酸序列分析的主要任務(wù)預(yù)測(cè)基因的編碼區(qū)分析基因表達(dá)的調(diào)控特點(diǎn)21. 分析的步驟(1)找出序列中的非編碼區(qū)序列中載體污染的剔除重復(fù)元件的發(fā)現(xiàn)CpG島啟動(dòng)子位點(diǎn)Poly-A位點(diǎn)間質(zhì)締合區(qū)(Matrixassociationregion,MAR)轉(zhuǎn)錄因子結(jié)合位點(diǎn)(2)找到和鑒定基因序列的編碼區(qū)(外顯子)構(gòu)建基因的外顯子模型數(shù)據(jù)庫(kù)相似性搜索與模式生物基因組的同源區(qū)比對(duì)22. 核酸序列分析應(yīng)注意的問(wèn)題對(duì)真核生物序列,首先遮蔽重復(fù)序列程序的特定生物物種適用性程序的序列特定性(DNA或cDNA)序列的長(zhǎng)度多方面的證據(jù)與驗(yàn)證23. 序列污染的來(lái)源載體序列接頭和引物序列轉(zhuǎn)座子和插入序列DNA和RNA樣品污染24. 序列污染的后果導(dǎo)致無(wú)意義的分析對(duì)序列的生物顯著性作出錯(cuò)誤的判斷導(dǎo)致錯(cuò)誤的疊連群拼接和ESTs分群導(dǎo)致數(shù)據(jù)庫(kù)的污染25. 密碼子偏好性編碼區(qū)特有的序列組成特征編碼區(qū)堿基頻率的周期性模式堿基在密碼子不同位置的傾向性分布密碼子的使用頻率26. 編碼區(qū)特有的序列組成特征編碼區(qū)堿基頻率的周期性模式堿基在密碼子不同位置的傾向性分布密碼子的使用頻率27. 常用的方法(1)堿基組成偏好性(basecompositionalbias)①編碼序列中密碼子的3個(gè)位置上,4種堿基出現(xiàn)的概率有明顯差別②密碼子的3個(gè)位置各有其特征堿基概率分布。(2)密碼子使用頻率(codonusage)(3)密碼子偏好性(codonbias)①氨基酸的同義密碼子的使用頻率與相應(yīng)的同功tRNA的水平相一致②大多數(shù)高效表達(dá)的基因僅使用那些含量高的同功tRNA所對(duì)應(yīng)的密碼子28. 密碼子偏好性的分析作用⑴密碼子偏好性分析可預(yù)測(cè)編碼區(qū)⑵檢測(cè)DNA測(cè)序錯(cuò)誤導(dǎo)致的移碼突變29. 為什么預(yù)測(cè)剪接位點(diǎn)和編碼區(qū)尚不足以揭示基因結(jié)構(gòu)?⑴編碼區(qū)預(yù)測(cè)會(huì)錯(cuò)過(guò)短的外顯子,難以可靠預(yù)測(cè)外顯子內(nèi)含子邊界⑵剪接位點(diǎn)預(yù)測(cè)可能會(huì)產(chǎn)生大量假陽(yáng)性位點(diǎn)⑶必須綜合考慮功能性位點(diǎn)和編碼區(qū)及非編碼區(qū)的全局特征30. 核酸序列的物理性質(zhì)分析:基本理化性質(zhì)、統(tǒng)計(jì)信息限制性內(nèi)切酶位點(diǎn)堿基組成、GC含量穩(wěn)定性、解鏈溫度31. 蛋白質(zhì)數(shù)據(jù)庫(kù)都具備三種功能⑴數(shù)據(jù)的注釋(annotation)所有提交到數(shù)據(jù)庫(kù)的數(shù)據(jù)都要由作者或數(shù)據(jù)庫(kù)管理人員進(jìn)行注釋方能發(fā)布;⑵數(shù)據(jù)的檢索(search)數(shù)據(jù)經(jīng)注釋之后,訪問(wèn)者可以通過(guò)數(shù)據(jù)庫(kù)網(wǎng)頁(yè)上提供的搜索引擎進(jìn)行搜索,找到自己所需的蛋白質(zhì)信息;⑶數(shù)據(jù)的生物信息分析(analysis)訪問(wèn)者一旦找到感興趣的蛋白質(zhì),就可以運(yùn)用數(shù)據(jù)庫(kù)提供的生物信息分析工具對(duì)蛋白質(zhì)序列的未知數(shù)據(jù)進(jìn)行預(yù)測(cè),如預(yù)測(cè)蛋白質(zhì)的理化性質(zhì),預(yù)測(cè)蛋白質(zhì)的二級(jí)結(jié)構(gòu),多重序列比對(duì)等等。32. 蛋白質(zhì)序列分析及結(jié)構(gòu)預(yù)測(cè)策略⑴實(shí)驗(yàn)數(shù)據(jù)——蛋白質(zhì)序列⑵理化特性分析——跨膜區(qū)、等電點(diǎn)、親水性、疏水性、酶切特性、電荷等⑶數(shù)據(jù)庫(kù)搜索——多序列比對(duì)、結(jié)構(gòu)域搜索⑷二級(jí)結(jié)構(gòu)預(yù)測(cè)——如有PDB中同源體——蛋白質(zhì)折疊識(shí)別——折疊家族分析——序列與結(jié)構(gòu)比對(duì)——比較建模⑸三級(jí)結(jié)構(gòu)預(yù)測(cè)⑹三維蛋白模型33. 序列特征的初步分析理化特性的預(yù)測(cè)修飾位點(diǎn)的預(yù)測(cè)是否為跨膜蛋白或片段是否包含螺旋卷曲結(jié)構(gòu)是否還有低復(fù)雜度序列等等34. 折疊子分析和二級(jí)結(jié)構(gòu)組分比對(duì)分析的幾個(gè)方面①存在極多相似序列時(shí),看其是否具有相似功能②弱相似時(shí),只有結(jié)構(gòu)相似,而無(wú)序列同源,預(yù)測(cè)可能的功能域,及與已知折疊子內(nèi)部的核心二級(jí)結(jié)構(gòu)的相似區(qū)域。③如果不存在以上情況,只能考慮其中是否含有與已知折疊子中核心結(jié)構(gòu)元件以外的其它區(qū)域相似的區(qū)域35. 蛋白質(zhì)的結(jié)構(gòu)預(yù)測(cè)理化特性分析蛋白質(zhì)的鑒定二級(jí)結(jié)構(gòu)預(yù)測(cè)幾種重要結(jié)構(gòu)分析36. 根據(jù)序列預(yù)測(cè)功能的一般過(guò)程①根據(jù)序列預(yù)測(cè)蛋白質(zhì)功能的唯一方法是通過(guò)數(shù)據(jù)庫(kù)搜尋,比較該蛋白是否與已知功能的蛋白質(zhì)相似。②比較未知蛋白序列與已知蛋白質(zhì)序列的相似性;③查找未知蛋白中是否包含與特定蛋白質(zhì)家族或功能域有關(guān)的亞序列或保守區(qū)段。37. 結(jié)構(gòu)簇分類(1)全α型:三級(jí)結(jié)構(gòu)主要是由α螺旋束組成(2)全β型:這里指的是蛋白質(zhì)中所有的鏈全是β折疊。折疊可以是反向平行,或者是平行的(3)α+β型:其α螺旋區(qū)與β折疊區(qū)相對(duì)分離(4)α/β型:大量β-α-β結(jié)構(gòu)單元組成,β折疊之間相互平行,而α螺旋和β折疊之間呈一種連續(xù)的狀態(tài)38. 三級(jí)結(jié)構(gòu)預(yù)測(cè)的方法1)同源建模:先在蛋白質(zhì)結(jié)構(gòu)數(shù)據(jù)庫(kù)中尋找未知結(jié)構(gòu)蛋白的同源伙伴,再利用一定計(jì)算方法把同源蛋白的結(jié)構(gòu)優(yōu)化構(gòu)建出預(yù)測(cè)的結(jié)果。2)折疊識(shí)別3)從頭預(yù)測(cè):是一種理想方法、是蛋白質(zhì)預(yù)測(cè)的終極目標(biāo)39. SCOP蛋白質(zhì)結(jié)構(gòu)分類折疊子(fold)——主要是結(jié)構(gòu)相似超家族(superfamily)——可能具有相同的進(jìn)化起源家族(Family)——進(jìn)化關(guān)系清楚的蛋白質(zhì)類群40. 基因突變1、核苷酸替代、插入/缺失、重組2、基因轉(zhuǎn)換41. DNA序列突變對(duì)氨基酸序列的影響同義(沉默)替代:仍然為同義密碼子的核苷酸替代非同義替代:導(dǎo)致產(chǎn)生非同義密碼子的

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論