版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
生物命名法規(guī)簡介生物命名法規(guī)簡介生物命名法規(guī)簡介V:1.0精細(xì)整理,僅供參考生物命名法規(guī)簡介日期:20xx年X月生物命名法規(guī)簡介植物命名法規(guī)概要人類基因命名的規(guī)則和過程楊泉勝,楊岐生(浙江大學(xué),杭州310027)關(guān)鍵詞:人類基因;命名;GDB/HUGO1.概述如今,至少已有10000多條人類基因被發(fā)現(xiàn),而且每天約有9條新基因登錄。在下一個10年中,人類的所有基因?qū)⒈话l(fā)現(xiàn)。這些基因的命名往往在它的結(jié)構(gòu)功能闡明以前就要進(jìn)行,因此如果要求基因的命名能表明其功能就不可能。而且,當(dāng)一個基因的功能已相當(dāng)清楚時,一些習(xí)用的命名仍在使用,這就容易引起誤解。白介素轉(zhuǎn)化酶相關(guān)蛋白酶就是一個典型的例子。按命名者的偏好,這個酶曾被使用過FILCE、MACH、Mch5、ICErelⅡ、ICH-2和TX等名字,現(xiàn)在則統(tǒng)一命名為caspase,依據(jù)該酶是一個在“天冬氨酸后切斷的半胱氨酸蛋白酶”(cysteineproteasewithabilitytocleaveafterasparticacid)。因此建立一個統(tǒng)一命名規(guī)則及命名程序就顯得非常迫切[1~3]。人類基因命名由人類基因命名委員會(CommitteeofHumanGeneNomenclature,網(wǎng)址http://www.gene.ucl.ac.uk/nomenclature)管理。2.獲得一個人類新基因命名符號的過程2.1根據(jù)人類基因命名規(guī)則命名一個基因命名的原則將在本文第3節(jié)中詳細(xì)說明。2.2查找GDB(genomedatabase)數(shù)據(jù)庫GDB網(wǎng)址http://。通過查找GDB以確定命名的新基因名在GDB數(shù)據(jù)庫中沒有出現(xiàn)過。要注意的是,新基因名在GDB中沒有出現(xiàn)過不僅是指新基因的全名在GDB數(shù)據(jù)庫中沒有出現(xiàn)過,而且新基因符號的詞根在GDB中也要沒有出現(xiàn)過。如要命名一個基因為“PTGG1”,雖然在GDB數(shù)據(jù)庫中沒有出現(xiàn)過“PTGG1”,但“PTGG1”仍不能作為基因符號,因為“PTG”已用于代表前列腺素(prostaglandin),用“PTGG1”將干擾已用“PTG”為頭命名的基因系列:PTGDR前列腺素D2受體基因
PTGDS前列腺素D2合酶基因
PTGER1前列腺素E受體1基因
PTGER2前列腺素E受體2基因
PTGER3前列腺素E受體3基因
PTGER4前列腺素E受體4基因
PTGIR前列腺素I2受體基因
PTGIS前列腺素I2合酶基因此外,如果一個要命名的新基因已有一些相關(guān)的基因符號存在,則新基因的命名應(yīng)借鑒相關(guān)基因的命名模式,這就是“平行規(guī)則”。如前列腺素I2合酶基因不能用基因符號“PIS”來命名,而應(yīng)根據(jù)平行規(guī)則命名為“PTGIS”。2.3查詢?nèi)祟惢蛎麛?shù)據(jù)庫(網(wǎng)址http://www.gene.ucl.ac.uk/cgibin/nomenclature/searchgenes.pl)確認(rèn)命名的基因沒有與基因家族的基因符號相沖突。有些基因家族和超家族有自己專門的命名小組。例如,細(xì)胞色素P450基因超家族[4]用“CYP”為頭命名所有超家族成員,以數(shù)字區(qū)分家族成員,再用字母加數(shù)字表示亞家族成員,如CYP2C38等。其它一些有自己專門命名規(guī)則的還有HLA[5]、CD抗原[6]及磷酸二酯酶[7]等。2.4將命名的基因符號遞交給HUGO/GDB基因符號如果得到確認(rèn),將進(jìn)入GDB數(shù)據(jù)庫,網(wǎng)址http://www.gene.ucl.ac.uk/nomenclature/submit.html。通過以上步驟就獲得了一個基因的命名符號。3.人類基因命名規(guī)則[8]3.1一般規(guī)則(1)基因符號應(yīng)為大寫的拉丁字母或大寫的拉丁字母和阿拉伯?dāng)?shù)字的組合?;蚍枮榱擞惺褂玫膬r值應(yīng)盡可能地簡潔,而且不要試圖它包含一個基因所有的已知信息。理想的符號應(yīng)不超過6個字符?;蚍栐跁鴮憰r應(yīng)用斜體或加下劃線,但在目錄中例外。新的基因符號不能與已存在的基因符號重復(fù)。(2)基因符號的第一個字符必須是字母,隨后的字符可以是字母或字母與數(shù)字的組合。(3)基因符號在書寫時應(yīng)在同一行,不允許在基因符號中使用上標(biāo)或下標(biāo)。(4)不能使用羅馬數(shù)字。在以前使用的基因符號中的羅馬數(shù)字應(yīng)改成相應(yīng)的阿拉伯?dāng)?shù)字。(5)不能使用希臘字母,所有的希臘字符應(yīng)改成相應(yīng)的拉丁字母。希臘拉丁字母互換表請查閱網(wǎng)頁http://www.gene.ucl.ac.uk/nomenclature/guidelines.html(6)在以希臘字母打頭的基因符號中須將它改成相應(yīng)的拉丁字母并放在基因符號的后面。如GLA(galactosidase,alpha)、GLB(galatosidase,beta)。(7)基因符號應(yīng)簡潔和特異,并能傳達(dá)基因的功能或特性。3.2基因符號的構(gòu)建建議3.2.1等級符號,基因家族和系列(1)為了方便一批相關(guān)基因從計算機(jī)數(shù)據(jù)庫中獲取,應(yīng)盡量使用等級方式。(2)當(dāng)不同的基因編碼具有類似功能的基因產(chǎn)物時,基因位點的命名應(yīng)緊跟在基因符號后加阿拉伯?dāng)?shù)字,字母和數(shù)字之間不能使用空格,如ADH1、ADH2、ADH3(三個乙醇脫氫酶基因位點)。但是,如果它們已在歷史上存在,單個字母的后綴也可來命名這些基因位點,如LDHA、LDHB、LDHC(三個乳酸脫氫酶位點)。(3)基因符號的最后一個字符可用來指定基因的某一特性。在歷史上曾用組織分布指定基因特性,但如今更傾向于使用阿拉伯?dāng)?shù)字。因為以前認(rèn)為的組織特異性在后來證實基因可能并不局限在這些組織中表達(dá)。3.2.2同源基因(1)在不同脊椎動物中的同源基因應(yīng)有相同的命名。(2)如果一個基因先在其它物種中發(fā)現(xiàn),然后發(fā)現(xiàn)它在人中的同源基因,則人的基因不應(yīng)以H開頭予以命名。(3)為了區(qū)分來自不同物種的同源基因,可在基因符號前加由人類細(xì)胞遺傳學(xué)標(biāo)準(zhǔn)化委員會(CommitteeonStandardizationinHumanCytogenetics)制定的三字母代碼(物種縮寫表請查閱網(wǎng)頁http://www.gene.ucl.ac.uk/nomenclature/guidelines.html)。但要注意的是,這三字母代碼僅用作出版,而不作為基因符號的一部分。這個物種代碼是加在基因符號前。如HAS代表人類(Homosapiens),MMU代表家鼠(Musmusculus)。使用這些物種符號的基因符號的例子如(HSA)G6PD、(HSA)HBB、(MMU)A1b。(4)如果與非脊椎動物或原核生物同源,人類基因可用這些同源基因的名字,并可在后面加L表示類似的(like)和加上數(shù)字編號(如果在人中有多個同源基因)。用H來表示同源的方法已不推薦,將被停止使用。3.2.3酶和蛋白質(zhì)酶和蛋白質(zhì)的命名應(yīng)參照國際生物化學(xué)和分子生物學(xué)聯(lián)盟命名委員會(NomenclatureCommitteeoftheInternationalUnionofBiochemistryandMolecularBiology,網(wǎng)址http://alpha.qmw.ac.uk/~ugca000/iupac/jcbn)的推薦[9]。3.2.4一些具有特殊用途的保留字一些字母或字母的組合放在基因符號的最后一個字母的后面表示特定的意義,如P代表假基因(但要注意BP代表結(jié)合蛋白),L代表類似的,R代表受體或調(diào)節(jié)因子,N或NH代表抑制子。在其它場合應(yīng)避免使用這些字母或字母的組合。4.DNA片段的命名DNA片段的命名一般由四部分組成。第一部分用D表示DNA;第二部分用0、1、2、...22、X、Y、XY表示DNA片段所在的染色體位置,其中0代表還不知染色體位置,而XY表示片段在X和Y染色體上都有該片段;第三部分表示用探針檢測到的DNA片段的復(fù)雜程度,S代表這是一條獨一無二的DNA片段,Z代表在染色體一個單一位置重復(fù)出現(xiàn)的DNA片段,F代表在多條染色體上都存在同源序列但還沒有定義家族的DNA片段;第四部分為區(qū)分不同的DNA片段加上一個數(shù)字編號,比如微衛(wèi)星DNA標(biāo)簽(microsatelliteDNAmarker)DXS990表示在X染色體上獨一無二的編號990的DNA片段。如果DNA片段是一個表達(dá)序列,可在上述四部分后加一個后綴E。5.推測基因的命名推測基因包括從EST簇或染色體序列中推測而來的基因、假基因及通過交叉雜交(crosshybridization)或計算機(jī)搜索序列數(shù)據(jù)庫而來的基因三種。從EST簇或染色體序列中推測得來的基因的命名是在基因所在染色體的編號后加一個絕對數(shù)字編號。假基因是指該序列自己不轉(zhuǎn)錄但是與轉(zhuǎn)錄的結(jié)構(gòu)基因在序列上高度同源的基因。為了表示假基因與結(jié)構(gòu)基因的對應(yīng)關(guān)系,假基因的命名是在結(jié)構(gòu)基因后加一個P表示,如ACTBP2(actinbetapseudogene2)。通過交叉雜交或計算機(jī)搜索序列數(shù)據(jù)庫得來的基因的命名一般是在已知基因后加一個L以表示類似的。6.基因命名的發(fā)展趨勢人類基因的命名不僅僅只與人類基因相關(guān)?;蛲ㄟ^同源性分析而來的同源基因往往借用其它物種中同源基因的名字。一些基因家族和超家族有自己專門的命名體系。因此不同物種命名委員會之間及命名委員會與家族或超家族命名體系間的相互協(xié)調(diào)對于提高命名有用性,減少命名的管理費用及方便用戶查詢是必不可少的[10]。參考文獻(xiàn)
[1]WhiteBJetal.Nature,1999,401:411
[2]Nature,1999,401:411
[3]WhiteBJ.Nature,1997,390:397
[4]NelsonDRetal.Pharmacogenetics,1996,6(1):1--2
[5]TissueAntigen,2000,55(1):100
[6]BullWorldHea
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 高頻堆棧的面試題及答案
- 證券投資顧問業(yè)務(wù)考試題庫及答案
- 漢中市城固縣輔警招聘考試試題庫附完整答案
- 高頻儲備獸醫(yī)面試題及答案
- 注冊安全工程師真題詳解《安全生產(chǎn)管理知識》附答案
- 有趣有獎問答試題及答案
- 3-6歲兒童發(fā)展指南題庫及答案
- 三基考試題庫及答案2025年康復(fù)
- 山東省青島市招聘協(xié)管員考試真題及答案
- 心理競賽題目及答案多選
- 2026貴州省省、市兩級機(jī)關(guān)遴選公務(wù)員357人考試備考題庫及答案解析
- 兒童心律失常診療指南(2025年版)
- 北京通州產(chǎn)業(yè)服務(wù)有限公司招聘備考題庫必考題
- (正式版)DBJ33∕T 1307-2023 《 微型鋼管樁加固技術(shù)規(guī)程》
- 2026年基金從業(yè)資格證考試題庫500道含答案(完整版)
- 2025年寵物疫苗行業(yè)競爭格局與研發(fā)進(jìn)展報告
- 綠化防寒合同范本
- 2025年中國礦產(chǎn)資源集團(tuán)所屬單位招聘筆試參考題庫附帶答案詳解(3卷)
- 氣體滅火系統(tǒng)維護(hù)與保養(yǎng)方案
- GB/T 10922-202555°非密封管螺紋量規(guī)
- ESD護(hù)理教學(xué)查房
評論
0/150
提交評論