版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
1、單核苷酸多態(tài)單核苷酸多態(tài)(Single Nucleotide Polymorphisms, SNPs)是人類染色體上)是人類染色體上的單個核苷酸的差異。的單個核苷酸的差異。一、什么是單核苷酸多態(tài)一、什么是單核苷酸多態(tài)二、二、SNP相關(guān)的基本概念相關(guān)的基本概念 1. 等位等位(allele)SNP是一種雙等位多是一種雙等位多態(tài)(即態(tài)(即SNP的二態(tài)性)的二態(tài)性)2. 基因型基因型(genotype)同源染色體上)同源染色體上一對一對SNP等位的組合等位的組合3. 單體型單體型(haplotype)特定染色體區(qū))特定染色體區(qū)域相鄰近的域相鄰近的SNP的組合的組合SNP等位、基因型、單體型與等位、基
2、因型、單體型與TagSNP4. 最小等位頻率最小等位頻率(minor Allele Frequency, MAF)群體中,一對)群體中,一對SNP等位等位中出現(xiàn)較少的等位的頻率,以中出現(xiàn)較少的等位的頻率,以5%(1%)為界為界將將SNP分為常見分為常見SNP和罕見和罕見SNP5. 非同義非同義SNP(non-synonymous SNP) 能夠改變基因產(chǎn)物結(jié)構(gòu)或影響基因能夠改變基因產(chǎn)物結(jié)構(gòu)或影響基因表達(dá)量的表達(dá)量的SNP 一、一、SNPSNP檢測和分型技術(shù)檢測和分型技術(shù) SNP分型分型(genotyping)是對)是對SNP基因基因型的檢測過程型的檢測過程SNP分型包括兩方面內(nèi)容:對未知分型包
3、括兩方面內(nèi)容:對未知SNP的進行分析和對已知的進行分析和對已知SNP進行分析進行分析直接測序技術(shù)獲得的直接測序技術(shù)獲得的SNP分型數(shù)據(jù)分型數(shù)據(jù)二、連鎖不平衡、單體型與二、連鎖不平衡、單體型與Tag SNP Tag SNP (一一)連鎖不平衡連鎖不平衡連鎖不平衡連鎖不平衡(linkage disequilibrium,LD)是指相鄰基因座上等位基因的非隨機相)是指相鄰基因座上等位基因的非隨機相關(guān)關(guān) 。導(dǎo)致連鎖不平衡的主要因素有遺傳漂變、導(dǎo)致連鎖不平衡的主要因素有遺傳漂變、人口增長與群體結(jié)構(gòu)改變、重組率變化、突變?nèi)丝谠鲩L與群體結(jié)構(gòu)改變、重組率變化、突變率變化和基因轉(zhuǎn)換。率變化和基因轉(zhuǎn)換。 (二二)
4、連鎖不平衡的量度連鎖不平衡的量度常用的連鎖不平衡量度方法主要有常用的連鎖不平衡量度方法主要有D、r2和和LOD值值1r2值量度值量度LD r2代表兩位點在統(tǒng)計學(xué)代表兩位點在統(tǒng)計學(xué)上的關(guān)系,其表達(dá)式為:上的關(guān)系,其表達(dá)式為:PPPPPPPrBaABAAB/22r2的數(shù)值表示一個位點可反映另一位點信的數(shù)值表示一個位點可反映另一位點信息量的程度,息量的程度, r2 =1稱為完全連鎖不平衡,這稱為完全連鎖不平衡,這時兩位點等位基因頻率相同,只觀察一個標(biāo)時兩位點等位基因頻率相同,只觀察一個標(biāo)記即可提供另一個標(biāo)記的全部信息。記即可提供另一個標(biāo)記的全部信息。 2D值量度值量度LD D值又稱為連鎖不平衡值又稱
5、為連鎖不平衡系數(shù),其表達(dá)式為系數(shù),其表達(dá)式為 :max/DDD BAABPPPD當(dāng)當(dāng)D=1時,說明兩個位點間沒有發(fā)生重組,時,說明兩個位點間沒有發(fā)生重組,與與r2相比較,當(dāng)相比較,當(dāng)D于于1時兩位點等位基因頻率時兩位點等位基因頻率并不需要相同,它只是反映最近一次突變發(fā)生并不需要相同,它只是反映最近一次突變發(fā)生后突變位點與臨近多態(tài)性位點的關(guān)系。后突變位點與臨近多態(tài)性位點的關(guān)系。 三、國際人類單體型圖計劃及其應(yīng)用三、國際人類單體型圖計劃及其應(yīng)用 (一一)國際人類單體型圖計劃概況國際人類單體型圖計劃概況 國際人類基因組單體型圖計劃(The International HapMap Project,H
6、apMap)是繼國際人類基因組計劃之后,人類基因組研究領(lǐng)域的又一個重大國際合作項目。 1. 1. HapMapHapMap計劃起始于計劃起始于20022002年,由美、加、中、年,由美、加、中、日、英、尼日利亞等國研究機構(gòu)發(fā)起、參與及完成,日、英、尼日利亞等國研究機構(gòu)發(fā)起、參與及完成,中國科學(xué)家承擔(dān)總計劃的中國科學(xué)家承擔(dān)總計劃的1010。2. 2. 項目共取樣項目共取樣270270個正常個體個正常個體:歐裔美國人和尼:歐裔美國人和尼日利亞雅魯巴人日利亞雅魯巴人( (非洲非洲) )各各3030個核心家系,中國北京漢個核心家系,中國北京漢族人及日本東京人各族人及日本東京人各4545個個體。個個體。
7、3. 3. 一期已于一期已于20052005年完成,成功分型年完成,成功分型100100多萬個常多萬個常見見SNPSNP位點的識別,達(dá)到平均位點的識別,達(dá)到平均每每3kb3kb一個一個SNPSNP的測定。的測定。4. 4. 二期計劃在一期基礎(chǔ)上完成二期計劃在一期基礎(chǔ)上完成300300多萬個多萬個SNPSNP位位點的分型,構(gòu)建起一張精度更高、信息更完整的多點的分型,構(gòu)建起一張精度更高、信息更完整的多人種遺傳多態(tài)圖譜。人種遺傳多態(tài)圖譜。5. 5. 三期計劃已經(jīng)開展,在進一步測定原有群體三期計劃已經(jīng)開展,在進一步測定原有群體基因型基礎(chǔ)上,加入另外基因型基礎(chǔ)上,加入另外7 7個不同歷史遺傳背景的人個不
8、同歷史遺傳背景的人群群,部分分型數(shù)據(jù)已經(jīng)發(fā)布。,部分分型數(shù)據(jù)已經(jīng)發(fā)布。6. 6. HapMapHapMap計劃期望在全部完成時能夠提供一個計劃期望在全部完成時能夠提供一個包括全部人類遺傳差異的多態(tài)組圖譜包括全部人類遺傳差異的多態(tài)組圖譜,同時帶動其,同時帶動其他人類遺傳變異的發(fā)現(xiàn)和研究。他人類遺傳變異的發(fā)現(xiàn)和研究。HapMap中中SNP的分布密度(截至的分布密度(截至2005年年10月)月)(二二) HapMap數(shù)據(jù)特點數(shù)據(jù)特點1. 1. 在多個個體的在多個個體的DNADNA樣品中鑒定單核苷酸多態(tài)樣品中鑒定單核苷酸多態(tài)(SNPSNP)。)。2. 2. 將群體中頻率大于將群體中頻率大于1%1%的那
9、些共同遺傳的相鄰的那些共同遺傳的相鄰SNPSNP組合成單體型。組合成單體型。3. 3. 在單體型中找出用于識別這些單體型的標(biāo)簽在單體型中找出用于識別這些單體型的標(biāo)簽SNPSNP。這樣,。這樣,HapMapHapMap提供的每個研究個體的數(shù)據(jù)包提供的每個研究個體的數(shù)據(jù)包括括SNPSNP等位、基因型、基因型頻率、等位、基因型、基因型頻率、200kb200kb范圍內(nèi)范圍內(nèi)SNPSNP之間的之間的LDLD量度。量度。 (二二) HapMap數(shù)據(jù)的拓展應(yīng)用數(shù)據(jù)的拓展應(yīng)用1. 1. 基于大群體、多種群的人類單核苷酸多態(tài)數(shù)基于大群體、多種群的人類單核苷酸多態(tài)數(shù)據(jù)的重組率推算提供了我們一張基因組進化痕跡圖。據(jù)
10、的重組率推算提供了我們一張基因組進化痕跡圖。2. 2. 連鎖不平衡的計算給了我們一張基因組塊狀連鎖不平衡的計算給了我們一張基因組塊狀連鎖結(jié)構(gòu)圖。連鎖結(jié)構(gòu)圖。3. 3. 種群差異研究讓我們看到一張種群間基因組種群差異研究讓我們看到一張種群間基因組結(jié)構(gòu)差異圖。結(jié)構(gòu)差異圖。4. SNP4. SNP的雜合情況告訴我們?nèi)祟惢蚪M上受到選的雜合情況告訴我們?nèi)祟惢蚪M上受到選擇的區(qū)域或區(qū)域內(nèi)的基因。擇的區(qū)域或區(qū)域內(nèi)的基因。5. 5. 利用利用SNPSNP位點向兩邊延伸的長度差異情況,我位點向兩邊延伸的長度差異情況,我們可以觀察到一些基因組上近期正在進行的選擇事們可以觀察到一些基因組上近期正在進行的選擇事件。
11、件。6. 6. 高密度的高密度的SNPSNP位點,為進一步加強和完善基因位點,為進一步加強和完善基因組范圍的表型和遺傳相關(guān)性分析(關(guān)聯(lián)研究或數(shù)量組范圍的表型和遺傳相關(guān)性分析(關(guān)聯(lián)研究或數(shù)量性狀定位)提供了可能性狀定位)提供了可能 。(四四)利用利用HapMart進行科學(xué)研究進行科學(xué)研究 為了便于科研工作者快速提取感興趣的為了便于科研工作者快速提取感興趣的SNP數(shù)據(jù),數(shù)據(jù),BioMart開發(fā)了方便、友好的開發(fā)了方便、友好的SNP獲取網(wǎng)絡(luò)獲取網(wǎng)絡(luò)平臺平臺HapMart。HapMart建立在建立在HapMap數(shù)據(jù)基礎(chǔ)上。數(shù)據(jù)基礎(chǔ)上。支持研究者支持研究者輸入輸入SNP、基因、染色體區(qū)段、基因、染色體區(qū)
12、段等等信息進行限定條件下的信息進行限定條件下的SNP查詢及相關(guān)信息輸出。查詢及相關(guān)信息輸出。以以IL10為例介紹基于基因的為例介紹基于基因的SNP查詢過程:查詢過程: 1. 輸入設(shè)置輸入設(shè)置 選擇中國群體,并在選擇中國群體,并在GENE FILTERS框中輸入感興趣的基因名框中輸入感興趣的基因名IL102. 輸出設(shè)置輸出設(shè)置 選擇感興趣的輸出信息選擇感興趣的輸出信息3. 結(jié)果導(dǎo)出結(jié)果導(dǎo)出 以界面和文件形式輸出限定條件以界面和文件形式輸出限定條件下下IL10上的上的SNP位置、基因型、群體頻率等信息位置、基因型、群體頻率等信息四、重要的四、重要的SNPSNP數(shù)據(jù)庫數(shù)據(jù)庫 (一一) SNP存儲與維
13、護數(shù)據(jù)庫存儲與維護數(shù)據(jù)庫dbSNP為了滿足對基因組范圍總體變異的需求,解為了滿足對基因組范圍總體變異的需求,解決在決在關(guān)聯(lián)研究、基因定位、功能和藥理遺傳學(xué)、關(guān)聯(lián)研究、基因定位、功能和藥理遺傳學(xué)、群體遺傳學(xué)、進化生物學(xué)以及定位克隆、物理作群體遺傳學(xué)、進化生物學(xué)以及定位克隆、物理作圖等圖等領(lǐng)域中大規(guī)模抽樣設(shè)計的需求,領(lǐng)域中大規(guī)模抽樣設(shè)計的需求,NCBI與與NHGRI協(xié)作創(chuàng)建了協(xié)作創(chuàng)建了dbSNP。 dbSNP中中SNP數(shù)據(jù)的增長速度數(shù)據(jù)的增長速度1dbSNP的主要功能的主要功能(1)遺傳變異序列環(huán)境分析)遺傳變異序列環(huán)境分析 :對變異本身:對變異本身進行基于周圍序列環(huán)境的功能分析進行基于周圍序列環(huán)
14、境的功能分析(2)基于)基于NCBI的遺傳變異交叉注釋的遺傳變異交叉注釋 :輔助:輔助進行染色體功能元件的功能發(fā)現(xiàn)和識別進行染色體功能元件的功能發(fā)現(xiàn)和識別(3)外部資源整合)外部資源整合 :跨平臺的交叉引用:跨平臺的交叉引用(4)遺傳變異的功能分析)遺傳變異的功能分析 :連系多種數(shù)據(jù):連系多種數(shù)據(jù)平臺進行變異功能發(fā)現(xiàn)平臺進行變異功能發(fā)現(xiàn)2dbSNP數(shù)據(jù)特征數(shù)據(jù)特征 (1)收錄人類已知的所有)收錄人類已知的所有SNP數(shù)據(jù),及已知數(shù)據(jù),及已知的跨物種的的跨物種的SNP、插入、插入/缺失、拷貝數(shù)和微衛(wèi)星多態(tài)。缺失、拷貝數(shù)和微衛(wèi)星多態(tài)。(2)部分)部分SNP包含頻率和基因型數(shù)據(jù)、實驗包含頻率和基因型數(shù)
15、據(jù)、實驗條件、分子背景,以及功能特性和臨床變異的定位條件、分子背景,以及功能特性和臨床變異的定位信息。信息。(3)到)到2009年年10月,月,dbSNP涉及到涉及到55個物種個物種的的1.5億個億個SNP,編碼區(qū)編碼區(qū)SNP超過超過2千萬千萬,具有頻率,具有頻率信息的信息的SNP超過超過300萬個。萬個。 3dbSNP的檢索界面的檢索界面4dbSNP與與Entrez Gene的交叉引用的交叉引用(二)關(guān)聯(lián)研究基因型數(shù)據(jù)的存儲與整理(二)關(guān)聯(lián)研究基因型數(shù)據(jù)的存儲與整理dbGap 1. dbGap的主要功能的主要功能(1)dbGaP的開發(fā)是為了的開發(fā)是為了存儲和發(fā)布基因型存儲和發(fā)布基因型和表型相
16、關(guān)的研究數(shù)據(jù)和表型相關(guān)的研究數(shù)據(jù)及研究結(jié)果。及研究結(jié)果。(2)包括全基因組關(guān)聯(lián)研究、醫(yī)療測序、分)包括全基因組關(guān)聯(lián)研究、醫(yī)療測序、分子診斷化驗,以及基因型與非臨床性狀(數(shù)量性狀)子診斷化驗,以及基因型與非臨床性狀(數(shù)量性狀)之間的關(guān)聯(lián)性。之間的關(guān)聯(lián)性。(3)用于高通量、低成本、高效率的分析方用于高通量、低成本、高效率的分析方法研究,發(fā)現(xiàn)海量基因型和表型數(shù)據(jù)相關(guān)性法研究,發(fā)現(xiàn)海量基因型和表型數(shù)據(jù)相關(guān)性。2. dbGap中的數(shù)據(jù)類型中的數(shù)據(jù)類型(1)研究文件)研究文件 包括研究項目的說明,協(xié)議文包括研究項目的說明,協(xié)議文件和數(shù)據(jù)收集文書。件和數(shù)據(jù)收集文書。(2)表型數(shù)據(jù))表型數(shù)據(jù) 包括在個體水平上
17、的和以摘要包括在個體水平上的和以摘要形式進行個體的表型信息介紹。形式進行個體的表型信息介紹。(3)遺傳數(shù)據(jù))遺傳數(shù)據(jù) 包括研究對象的個體基因型、包括研究對象的個體基因型、譜系信息、精細(xì)定位結(jié)果和重新測序的描述。譜系信息、精細(xì)定位結(jié)果和重新測序的描述。(4)統(tǒng)計結(jié)果)統(tǒng)計結(jié)果 包括原始的關(guān)聯(lián)或連鎖分析獲包括原始的關(guān)聯(lián)或連鎖分析獲得的結(jié)果。得的結(jié)果。 基于群體分子標(biāo)記頻率的統(tǒng)計分析方法進行遺基于群體分子標(biāo)記頻率的統(tǒng)計分析方法進行遺傳特性與疾病發(fā)生之間的相關(guān)性研究,實現(xiàn)疾病基傳特性與疾病發(fā)生之間的相關(guān)性研究,實現(xiàn)疾病基因的染色體定位,不需要先驗的生物學(xué)知識,是一因的染色體定位,不需要先驗的生物學(xué)知識
18、,是一種強大的疾病基因識別手段。種強大的疾病基因識別手段。 隨著隨著SNP分型技術(shù)的發(fā)展,分型技術(shù)的發(fā)展,SNP作為一種最重作為一種最重要的分子標(biāo)記,能夠應(yīng)用于孟德爾遺傳病的研究,要的分子標(biāo)記,能夠應(yīng)用于孟德爾遺傳病的研究,同時被廣泛的用來進行復(fù)雜疾病的染色體定位。同時被廣泛的用來進行復(fù)雜疾病的染色體定位。 一、疾病定義與樣本選取偏好一、疾病定義與樣本選取偏好 1. 臨床表型臨床表型 選取具有典型臨床特征和明確診選取具有典型臨床特征和明確診斷依據(jù)的個體作為疾病研究對象。斷依據(jù)的個體作為疾病研究對象。2. 發(fā)病年齡發(fā)病年齡 具有早發(fā)特征的患病個體更傾向具有早發(fā)特征的患病個體更傾向于有較明顯的遺傳
19、特點。于有較明顯的遺傳特點。3. 家族史家族史 有家族史的個體能夠較為準(zhǔn)確的診有家族史的個體能夠較為準(zhǔn)確的診斷疾病種類。斷疾病種類。4. 嚴(yán)重程度嚴(yán)重程度 較為嚴(yán)重的患病個體,具有較明較為嚴(yán)重的患病個體,具有較明顯的遺傳特點。顯的遺傳特點。5. 群體分層群體分層 選取的研究群體應(yīng)具有同質(zhì)性。選取的研究群體應(yīng)具有同質(zhì)性。二、連鎖分析進行風(fēng)險二、連鎖分析進行風(fēng)險SNPSNP定位原理定位原理 連鎖分析連鎖分析(linkage analysis)是根據(jù)家系中遺)是根據(jù)家系中遺傳標(biāo)記重組率來計算兩等位之間距離的方法。傳標(biāo)記重組率來計算兩等位之間距離的方法。連鎖分析主要是通過分析已知的性狀或疾病表連鎖分析
20、主要是通過分析已知的性狀或疾病表型與基因型在家系中遺傳模式,來定位新的易感位型與基因型在家系中遺傳模式,來定位新的易感位點和易感區(qū)域。點和易感區(qū)域。連鎖分析是用于研究家系中標(biāo)記傳遞的一種分連鎖分析是用于研究家系中標(biāo)記傳遞的一種分析策略,根據(jù)連鎖分析過程中是否依賴于假設(shè)模型,析策略,根據(jù)連鎖分析過程中是否依賴于假設(shè)模型,我們將連鎖分析方法分為兩類:參數(shù)連鎖分析和非我們將連鎖分析方法分為兩類:參數(shù)連鎖分析和非參數(shù)連鎖分析。參數(shù)連鎖分析。 (一)參數(shù)連鎖分析方法(一)參數(shù)連鎖分析方法 對于孟德爾遺傳病,易于比較清楚的知道該疾對于孟德爾遺傳病,易于比較清楚的知道該疾病的遺傳方式、外顯率、基因頻率等指標(biāo)
21、,從而確病的遺傳方式、外顯率、基因頻率等指標(biāo),從而確定一個準(zhǔn)確的遺傳模型進行連鎖分析。定一個準(zhǔn)確的遺傳模型進行連鎖分析。統(tǒng)計方法的發(fā)展,某些遺傳模型并不清楚的疾統(tǒng)計方法的發(fā)展,某些遺傳模型并不清楚的疾病也通過改變策略而適用于連鎖分析,但相對準(zhǔn)確病也通過改變策略而適用于連鎖分析,但相對準(zhǔn)確的模型建立是參數(shù)連鎖分析成功的基本條件。的模型建立是參數(shù)連鎖分析成功的基本條件。直接計分法和直接計分法和LOD值法是最常用的參數(shù)連鎖定值法是最常用的參數(shù)連鎖定位方法。位方法。 這里我們以這里我們以LOD值法為例對參數(shù)連鎖分析方法值法為例對參數(shù)連鎖分析方法進行簡要的介紹:進行簡要的介紹:1. LOD值法進行連鎖分
22、析首先針對某一疾病收值法進行連鎖分析首先針對某一疾病收集一定數(shù)量的家系資料進行分離分析,確定遺傳模集一定數(shù)量的家系資料進行分離分析,確定遺傳模型。型。2. 通過文獻檢索了解其可能的決定性狀的染色通過文獻檢索了解其可能的決定性狀的染色體區(qū)域,并對該區(qū)域的體區(qū)域,并對該區(qū)域的SNP進行查詢和篩選,基于進行查詢和篩選,基于選定的選定的SNP,對該家系成員進行,對該家系成員進行SNP分型。分型。3. 通過連鎖分析估計疾病與通過連鎖分析估計疾病與SNP在子代中重組在子代中重組的發(fā)生率,計算的發(fā)生率,計算LOD值,確定重組分?jǐn)?shù)及相應(yīng)的遺值,確定重組分?jǐn)?shù)及相應(yīng)的遺傳距離,并進行假設(shè)檢驗,判斷易感基因是否與遺
23、傳距離,并進行假設(shè)檢驗,判斷易感基因是否與遺傳標(biāo)記連鎖。傳標(biāo)記連鎖。 LOD值是指在一定重組率條件下,兩個位點相值是指在一定重組率條件下,兩個位點相連鎖的似然性和不連鎖的似然性比值的對數(shù)值,即連鎖的似然性和不連鎖的似然性比值的對數(shù)值,即 兩位點不連鎖的似然性兩位點連鎖的似然性10logLOD在進行連鎖分析時,要計算在進行連鎖分析時,要計算0(不重組)到(不重組)到0.5(隨機分配)的一系列(隨機分配)的一系列LOD得分。得分。當(dāng)當(dāng)LOD得分為得分為+3或更大時,肯定連鎖;當(dāng)或更大時,肯定連鎖;當(dāng)LOD得分小于或等于得分小于或等于-2時,排除連鎖。時,排除連鎖。常用的基于常用的基于LOD的連鎖分
24、析工具有的連鎖分析工具有LIPED 、LINKAGE 、S.A.G.E. 等自由軟件包等自由軟件包早期的連鎖分析方法對模型的依賴性較強,計早期的連鎖分析方法對模型的依賴性較強,計算速度慢等原因,算速度慢等原因, “混合模型混合模型”方法、多位點連鎖方法、多位點連鎖分析方法、吉布斯取樣及蒙特卡羅方法等逐步發(fā)展。分析方法、吉布斯取樣及蒙特卡羅方法等逐步發(fā)展。 參數(shù)連鎖分析過程中的注意事項:參數(shù)連鎖分析過程中的注意事項:1. 參數(shù)連鎖分析家系選擇過程中需要考慮到基參數(shù)連鎖分析家系選擇過程中需要考慮到基本要求做出合理的家系篩選。本要求做出合理的家系篩選。2. 對于某些外顯率并不明確的疾病,還需要對對于
25、某些外顯率并不明確的疾病,還需要對外顯率進行估計,而采用疾病個體特異的分析策略。外顯率進行估計,而采用疾病個體特異的分析策略。3. 家系中某些個體的疾病表型并不典型,難以家系中某些個體的疾病表型并不典型,難以確定是否受累,如某些精神疾病,需要進行人為的確定是否受累,如某些精神疾病,需要進行人為的判斷或重新劃分。判斷或重新劃分。 (二)非參數(shù)連鎖分析方法(二)非參數(shù)連鎖分析方法 非參數(shù)連鎖分析是一種在分析前不需要確定疾非參數(shù)連鎖分析是一種在分析前不需要確定疾病遺傳模式(如基因型頻率、外顯率等)或半依賴病遺傳模式(如基因型頻率、外顯率等)或半依賴模型的分析方法。模型的分析方法。最常用的是等位共享方
26、法,不依賴于遺傳模型最常用的是等位共享方法,不依賴于遺傳模型的構(gòu)建,而是一個排除模型的過程。的構(gòu)建,而是一個排除模型的過程。通過顯示受累親屬間高于隨機情況的共享遺傳通過顯示受累親屬間高于隨機情況的共享遺傳相同的染色體區(qū)域(或位點)概率來證實染色體區(qū)相同的染色體區(qū)域(或位點)概率來證實染色體區(qū)域的遺傳模式與孟德爾遺傳之間的差別。域的遺傳模式與孟德爾遺傳之間的差別。等位共享方法研究家系中親屬共享來源于同一等位共享方法研究家系中親屬共享來源于同一祖先的特定染色體區(qū)域或位點的頻率,也叫做祖先的特定染色體區(qū)域或位點的頻率,也叫做血源血源一致性一致性(identical-by-descent, IBD),
27、然后將某),然后將某個位點共享個位點共享IBD的情況與隨機進行比較。的情況與隨機進行比較。還有一個與之相似的概念還有一個與之相似的概念狀態(tài)一致性狀態(tài)一致性(identical-By-State, IBS),用來描述親屬對之),用來描述親屬對之間共享同一等位的頻率。間共享同一等位的頻率。隨著遺傳標(biāo)記分型技術(shù),特別是隨著遺傳標(biāo)記分型技術(shù),特別是SNP分型技術(shù)分型技術(shù)的進步,的進步,IBD和和IBS方法也逐漸應(yīng)用于基因組范圍關(guān)方法也逐漸應(yīng)用于基因組范圍關(guān)聯(lián)研究中。聯(lián)研究中。IBD和和IBS示意示意等位共享的方法是一種非參數(shù)方法,比參數(shù)連等位共享的方法是一種非參數(shù)方法,比參數(shù)連鎖分析方法有更寬泛的應(yīng)用
28、范圍,而且即使在受累鎖分析方法有更寬泛的應(yīng)用范圍,而且即使在受累親屬中不完全顯性、表型復(fù)制、遺傳異質(zhì)性和高頻親屬中不完全顯性、表型復(fù)制、遺傳異質(zhì)性和高頻等位等影響因素存在時,也有較好的表現(xiàn)。等位等影響因素存在時,也有較好的表現(xiàn)。唯一的缺陷是等位共享方法提供的結(jié)果一般說唯一的缺陷是等位共享方法提供的結(jié)果一般說來沒有參數(shù)連鎖分析方法顯著。來沒有參數(shù)連鎖分析方法顯著。 三、關(guān)聯(lián)研究發(fā)現(xiàn)疾病風(fēng)險三、關(guān)聯(lián)研究發(fā)現(xiàn)疾病風(fēng)險SNP SNP 關(guān)聯(lián)研究關(guān)聯(lián)研究(association study)是(一般情況)是(一般情況下)不依賴于家系信息的一種遺傳定位策略,由于下)不依賴于家系信息的一種遺傳定位策略,由于資
29、源豐富,分析方法簡便,是目前遺傳定位研究中資源豐富,分析方法簡便,是目前遺傳定位研究中最常用的分析方法。最常用的分析方法。關(guān)聯(lián)研究通過檢驗?zāi)硞€特定的等位在疾病組和關(guān)聯(lián)研究通過檢驗?zāi)硞€特定的等位在疾病組和對照組中出現(xiàn)的頻率差異來判斷此等位是否是疾病對照組中出現(xiàn)的頻率差異來判斷此等位是否是疾病易感等位。以易感等位。以SNP而言,發(fā)現(xiàn)風(fēng)險而言,發(fā)現(xiàn)風(fēng)險SNP的過程可以的過程可以采用四格表采用四格表2檢驗進行等位頻率分析,也可以采用檢驗進行等位頻率分析,也可以采用2*32檢驗進行基因型分析。檢驗進行基因型分析。SNP與疾病關(guān)聯(lián)性進行分析,方法上的簡捷性與疾病關(guān)聯(lián)性進行分析,方法上的簡捷性顯而易見,但關(guān)
30、聯(lián)研究也有比較明顯的缺點:顯而易見,但關(guān)聯(lián)研究也有比較明顯的缺點:1. 對照組樣本選取具有嚴(yán)格的限制對照組樣本選取具有嚴(yán)格的限制2. 由于關(guān)聯(lián)研究可能針對任何一個分子標(biāo)記進由于關(guān)聯(lián)研究可能針對任何一個分子標(biāo)記進行,而不存在先驗的假設(shè),對關(guān)聯(lián)研究發(fā)現(xiàn)的風(fēng)險行,而不存在先驗的假設(shè),對關(guān)聯(lián)研究發(fā)現(xiàn)的風(fēng)險SNP尚需要進行可靠的功能驗證。尚需要進行可靠的功能驗證。研究中對標(biāo)記信息的分析比研究方法本身更重研究中對標(biāo)記信息的分析比研究方法本身更重要,下面我們將從關(guān)聯(lián)研究機理上來探討風(fēng)險要,下面我們將從關(guān)聯(lián)研究機理上來探討風(fēng)險SNP發(fā)現(xiàn)應(yīng)注意的問題。發(fā)現(xiàn)應(yīng)注意的問題。 關(guān)聯(lián)研究中發(fā)現(xiàn)關(guān)聯(lián)研究中發(fā)現(xiàn)SNP與疾病
31、發(fā)生之間的顯著相與疾病發(fā)生之間的顯著相關(guān)性可能存在三個原因:關(guān)性可能存在三個原因:(1)SNP本身就是一個致病的本身就是一個致病的SNP。(2)SNP本身不能導(dǎo)致疾病,但與導(dǎo)致疾病的本身不能導(dǎo)致疾病,但與導(dǎo)致疾病的基因處于連鎖不平衡狀態(tài)?;蛱幱谶B鎖不平衡狀態(tài)。(3)研究群體選擇失誤造成的統(tǒng)計顯著性。)研究群體選擇失誤造成的統(tǒng)計顯著性。其中第三種情況是關(guān)聯(lián)研究過程中需要避免的,其中第三種情況是關(guān)聯(lián)研究過程中需要避免的,所以關(guān)聯(lián)研究過程中還應(yīng)注意三點:所以關(guān)聯(lián)研究過程中還應(yīng)注意三點:(1)關(guān)聯(lián)分析的樣本選取要嚴(yán)格限制在同質(zhì)性)關(guān)聯(lián)分析的樣本選取要嚴(yán)格限制在同質(zhì)性群體中。群體中。(2)關(guān)聯(lián)研究對照
32、組選取應(yīng)當(dāng)謹(jǐn)慎,必要時選)關(guān)聯(lián)研究對照組選取應(yīng)當(dāng)謹(jǐn)慎,必要時選擇未受累親屬作為內(nèi)對照。擇未受累親屬作為內(nèi)對照。(3)如條件允許,對于獲得的陽性位點可進行)如條件允許,對于獲得的陽性位點可進行傳遞不平衡檢驗(傳遞不平衡檢驗(transmission disequilibrium test, TDT)來確認(rèn)發(fā)現(xiàn)的致病等位在家庭遺傳中傾)來確認(rèn)發(fā)現(xiàn)的致病等位在家庭遺傳中傾向于向患病子代遺傳。向于向患病子代遺傳。 由于復(fù)雜疾病發(fā)生過程中,存在遺傳位點間的由于復(fù)雜疾病發(fā)生過程中,存在遺傳位點間的相互作用,單個位點的關(guān)聯(lián)分析方法有時不能獲得相互作用,單個位點的關(guān)聯(lián)分析方法有時不能獲得足夠的信息來發(fā)現(xiàn)某些區(qū)
33、域與疾病之間的關(guān)聯(lián)性。足夠的信息來發(fā)現(xiàn)某些區(qū)域與疾病之間的關(guān)聯(lián)性?;趩误w型、羅杰斯特回歸、主成分分析、隨基于單體型、羅杰斯特回歸、主成分分析、隨機森林等統(tǒng)計學(xué)和機器學(xué)習(xí)方法的遺傳定位方法成機森林等統(tǒng)計學(xué)和機器學(xué)習(xí)方法的遺傳定位方法成為有用的研究手段,得到了比較廣泛的應(yīng)用。為有用的研究手段,得到了比較廣泛的應(yīng)用。 關(guān)聯(lián)研究和連鎖分析有很多重要的區(qū)別:關(guān)聯(lián)研究和連鎖分析有很多重要的區(qū)別:1. 關(guān)聯(lián)研究檢驗疾病與等位頻率在群體中是否關(guān)聯(lián)研究檢驗疾病與等位頻率在群體中是否存在相關(guān)性,連鎖分析檢驗疾病與位點是否在家系存在相關(guān)性,連鎖分析檢驗疾病與位點是否在家系中共同傳遞。中共同傳遞。2. 當(dāng)群體中致病
34、因素是多樣的,而且致病位點當(dāng)群體中致病因素是多樣的,而且致病位點相互獨立,散在存在的時候,每個位點與疾病關(guān)聯(lián)相互獨立,散在存在的時候,每個位點與疾病關(guān)聯(lián)都將很弱,遺傳定位中往往只能檢測到連鎖而難以都將很弱,遺傳定位中往往只能檢測到連鎖而難以發(fā)現(xiàn)關(guān)聯(lián)。發(fā)現(xiàn)關(guān)聯(lián)。3. 當(dāng)致病位點等位效應(yīng)較弱,對疾病貢獻較小當(dāng)致病位點等位效應(yīng)較弱,對疾病貢獻較小時,但在疾病個體中有較高的等位頻率時,基于家時,但在疾病個體中有較高的等位頻率時,基于家系的連鎖分析難以發(fā)現(xiàn)潛在的傳遞模式,而關(guān)聯(lián)研系的連鎖分析難以發(fā)現(xiàn)潛在的傳遞模式,而關(guān)聯(lián)研究卻能識別出這種致病位點。究卻能識別出這種致病位點。4. 關(guān)聯(lián)研究和連鎖研究本身并
35、不存在孰強孰弱,關(guān)聯(lián)研究和連鎖研究本身并不存在孰強孰弱,而需要考慮實際解決的問題進行選擇。而需要考慮實際解決的問題進行選擇。四、遺傳分析中的統(tǒng)計顯著性四、遺傳分析中的統(tǒng)計顯著性 遺傳分析方法雖然籠統(tǒng)的分為兩類,但相應(yīng)的遺傳分析方法雖然籠統(tǒng)的分為兩類,但相應(yīng)的研究方法眾多,既有傳統(tǒng)的統(tǒng)計分析方法,也有衍研究方法眾多,既有傳統(tǒng)的統(tǒng)計分析方法,也有衍生而來的機器學(xué)習(xí)方法。生而來的機器學(xué)習(xí)方法。但無論采用何種方法進行復(fù)雜疾病的遺傳分析,但無論采用何種方法進行復(fù)雜疾病的遺傳分析,最終都將面對統(tǒng)計結(jié)果的取舍問題,即如何進行統(tǒng)最終都將面對統(tǒng)計結(jié)果的取舍問題,即如何進行統(tǒng)計顯著性的閾值設(shè)定。計顯著性的閾值設(shè)定
36、。這個問題,還將因為遺傳分析中分子標(biāo)記的增這個問題,還將因為遺傳分析中分子標(biāo)記的增多或檢驗?zāi)P偷脑黾佣兊酶鼮閲?yán)峻。多或檢驗?zāi)P偷脑黾佣兊酶鼮閲?yán)峻。 對于遺傳定位的結(jié)果取舍,特別是多重檢驗問對于遺傳定位的結(jié)果取舍,特別是多重檢驗問題一向都是人們關(guān)注的重點,采用多次隨機進行題一向都是人們關(guān)注的重點,采用多次隨機進行SNP與疾病相關(guān)性檢驗進行顯著性水平選取是目前與疾病相關(guān)性檢驗進行顯著性水平選取是目前為回避多重檢驗校正而廣泛采用的一種方法。為回避多重檢驗校正而廣泛采用的一種方法。另外,考慮到基因組中廣泛存在的連鎖不平衡另外,考慮到基因組中廣泛存在的連鎖不平衡問題,對待檢的問題,對待檢的SNP進行進行LD修正是降低多重檢驗校修正是降低多重檢驗校正影響的一種有效方法。正影響的一種有效方法。此外,在芯片分析中采用的此外,在芯片分析中采用的FDR方法也經(jīng)常用
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 芳香烴生產(chǎn)工操作規(guī)程考核試卷含答案
- 光敏電阻器制造工安全文明評優(yōu)考核試卷含答案
- 社群健康助理員安全演練考核試卷含答案
- 碳九石油樹脂裝置操作工風(fēng)險評估與管理模擬考核試卷含答案
- 2024年孝感市特崗教師招聘筆試真題匯編附答案
- 裂解汽油加氫裝置操作工班組建設(shè)水平考核試卷含答案
- 2024年承德醫(yī)學(xué)院輔導(dǎo)員考試參考題庫附答案
- 電視調(diào)頻天線工崗前安全生產(chǎn)意識考核試卷含答案
- 低速載貨汽車司機6S執(zhí)行考核試卷含答案
- 2024年滄州航空職業(yè)學(xué)院輔導(dǎo)員招聘備考題庫附答案
- 綜合能源管理系統(tǒng)平臺方案設(shè)計及實施合集
- 共享單車對城市交通的影響研究
- 學(xué)校宿舍樓施工組織設(shè)計方案
- GB/T 7216-2023灰鑄鐵金相檢驗
- 學(xué)術(shù)論文的撰寫方法
- 上海市汽車維修結(jié)算工時定額(試行)
- 貴州省晴隆銻礦采礦權(quán)出讓收益評估報告
- 中心小學(xué)11-12學(xué)年度教師年度量化評分實施方案
- SH/T 1627.1-1996工業(yè)用乙腈
- JJG 1030-2007超聲流量計
- 基礎(chǔ)研究類成果評價指標(biāo)成果評價指標(biāo)
評論
0/150
提交評論