已閱讀5頁,還剩19頁未讀, 繼續(xù)免費(fèi)閱讀
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
摘要 基因交互是一個極其重要而又復(fù)雜的概念傳統(tǒng)上定義基因交互效應(yīng)為單個基因主效應(yīng)的 統(tǒng)計(jì)殘差,這被稱為統(tǒng)計(jì)交互統(tǒng)計(jì)交互最大的缺點(diǎn)是缺乏生物學(xué)上的解釋,而且檢驗(yàn)的功效 比較低z h a oe ta 1 ( 2 0 0 6 ) 提出了兩個不連鎖位點(diǎn)的新的交互定義,使其在生物上有一定的解 釋本文把這個定義推廣到連鎖的情形,并且用y i ne ta 1 ( 2 0 0 7 ) 提出的異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量進(jìn)行 檢驗(yàn)在全基因組研究中,我們用兩步法來檢驗(yàn)基因交互,即先檢驗(yàn)位點(diǎn)的主效應(yīng)是否顯著, 然后再檢驗(yàn)?zāi)切┲餍?yīng)顯著的位點(diǎn)的交互作用 關(guān)鍵詞:基因交互;連鎖不甲衡系數(shù);異質(zhì)性檢驗(yàn);兩步法 i a b s t r a c t g e n e - g e n ei n t e r a c t i o ni sav e r yi m p o r t a n tb u tc o m p l e xc o n c e p t t r a d i t i o n a l l y , g e n e - g e n e i n t e r a c t i o ni sd e f i n e d 嬲as t a t i s t i c a ld e v i a n c ef r o mt h ea d d i t i v ee f f e c t so fs i n g l eg e n e s w h i c h i so f t e nr e f e r r e dt oa s “s t a t i s t i c a li n t e r a c t i o n ”b e t w e e ng e n e s t h em a x i m a ld i s a d v a n t a g eo f s t a t i s t i c a li n t e r a c t i o ni sl a c k i n go fc l e a rb i o l o g i c a li n t e r p r e t a t i o no fg e n e - g e n ei n t e r a c t i o n ,a n d t h ep o w e rt od e t e c tg e n e - g e n ei n t e r a c t i o ni s1 0 w z h a oe ta 1 ( 2 0 0 6 1p u tf o r w a r dan e wd e f i n i t i o n f o ri n t e r a c t i o no ft w ou n l i n k e dl o c i ,w h i c hc a nb ei n t e r p r e t e di nb i o l o g y h o m o p l a s t i c a l l y , w ew i l l p u tf o r w a r dan e wd e f i n i t i o nf o ri n t e r a c t i o no ft w ol i n k e dl o c i ,a n dw ew i l lu s eh o m o g e n e i t yt e s t g a i n e db yy i n e ta 1 ( 2 0 0 7 ) i ng e n o m e w i d ea s s o c i a t i o ns t u d i e s ,w ef o c u so nt w o - s t a g e - a n a l y s e s : a n a l y s e si nw h i c hw eo n l yt e s tf o ri n t e r a c t i o n sb e t w e e ns i n g a ln u c l e o t i d ep o l y m o r p h i s m st h a t s h o w ss o m em a r g i n a le f f e c t k e y w o r d s :g e n 爭g e n ei n t e r a c t i o n ;l i n k a g ed i s e q u i l i b r i u mp a r a m e t e r ;h o m o g e n d t yt e s t ; t w o - s t a g ea n a l y s e s i i 獨(dú)創(chuàng)性聲明 本人鄭重聲明:所提交的學(xué)位論文是本人在導(dǎo)師指導(dǎo)下獨(dú)立進(jìn)行研究 工作所取得的成果。據(jù)我所知,除了特別加以標(biāo)注和致謝的地方外,論文 中不包含其他人已經(jīng)發(fā)表或撰寫過的研究成果。對本人的研究做出重要貢 獻(xiàn)的個人和集體,均已在文中作了明確的說明。本聲明的法律結(jié)果由本人 承擔(dān)。 學(xué)位論文作者簽名: 整殮 日期: 學(xué)位論文使用授權(quán)書 本學(xué)位論文作者完全了解東北師范大學(xué)有關(guān)保留、使用學(xué)位論文的規(guī) 定,即:東北師范大學(xué)有權(quán)保留并向國家有關(guān)部門或機(jī)構(gòu)送交學(xué)位論文的 復(fù)印件和電子版,允許論文被查閱和借閱。本人授權(quán)東北師范大學(xué)可以將 學(xué)位論文的全部或部分內(nèi)容編入有關(guān)數(shù)據(jù)庫進(jìn)行檢索,可以采用影印、縮 印或其它復(fù)制手段保存、匯編本學(xué)位論文。 ( 保密的學(xué)位論文在解密后適用本授權(quán)書) 學(xué)位論文作者簽名: 整遜 指導(dǎo)教師簽名: 日 期:趁坌2 。吐,跎 e t期: 學(xué)位論文作者畢業(yè)后去向: 工作單位: 通訊地址: 電話: 郵編: 東北師范大學(xué)碩士學(xué)位論文 1 引言 遺傳學(xué)研究表明生物的性狀是基因和環(huán)境相互作用的結(jié)果,其中基因起到?jīng)Q定性的作用, 但基因和性狀之間并不是嚴(yán)格的一一對應(yīng)的關(guān)系,有些性狀是多個基因共同作用的結(jié)果,例如 很多疾病足由于多個基因共同導(dǎo)致的復(fù)雜疾病是人類生命的重大威脅,科學(xué)家一直在探索復(fù) 雜疾病的發(fā)病原因現(xiàn)代科學(xué)研究表明,復(fù)雜疾病往往是由多個基因共同導(dǎo)致的比方說,糖 尿病( c o xe ta 1 ( 1 9 9 9 ) 1 1 ,e l s t o ne ta 1 ( 1 9 7 4 ) :1 ) ,乳腺癌( r i t h c h i ee ta 1 ( 2 0 0 1 ) 3 ) 都是由多個 位點(diǎn)共同導(dǎo)致的傳統(tǒng)上我們做關(guān)聯(lián)分析直接去找致病基因,但對復(fù)雜疾病這往往是不夠的, 此時研究“基因基因”交互,“基因環(huán)境”交互顯得尤為重要發(fā)現(xiàn)基因與基因的交互 可能有助于發(fā)現(xiàn)潛在的疾病關(guān)聯(lián)途徑,從而有利于發(fā)現(xiàn)那些處于極度危險(xiǎn)中的人1 4 基因交互是一個極其重要而又復(fù)雜的概念【5 】,時至今日都沒有一個被廣為接受的交互的定 義f i s h e r ( 1 9 1 8 ) 6 定義基因交互效應(yīng)為單個基因主效應(yīng)的統(tǒng)計(jì)殘差,后來c o c k e r h a m ( 1 9 5 4 ) 7 , k e m p t h o r n e ( 1 9 5 4 ) i s 把這個定義發(fā)展為線性模型或廣義線性模型中的交互項(xiàng),這就是傳統(tǒng)的 統(tǒng)計(jì)交互應(yīng)該說統(tǒng)計(jì)交互概念的提出是一個質(zhì)的飛躍,至少給我們提供了基因交互的一種理 解但統(tǒng)計(jì)交互也有許多不足之處,首先足缺乏生物學(xué)上的解釋,即使發(fā)現(xiàn)了統(tǒng)計(jì)交互,也無 法說存在生物上的交互;其次識別交互的功效非常依賴于數(shù)據(jù)結(jié)構(gòu)基于以上幾點(diǎn)考慮,z h a o e ta 1 ( 2 0 0 6 ) 9 年提出了兩個不連鎖位點(diǎn)的新的交互定義,使其和連鎖不平衡系數(shù)聯(lián)系在一起, 從而在生物上有一定的解釋通過模擬表明,檢驗(yàn)的功效能大大提高 本文的目的是把z h a oe ta 1 ( 2 0 0 6 ) o 提出的基因交互的定義推廣到一般的情形( 連鎖) , 新的基因交互定義為病例組與對照組連鎖不平衡系數(shù)差的絕對值,同時我們引用了y i ne t a 1 ( 2 0 0 7 ) f l o 】提出的異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量進(jìn)行檢驗(yàn)值得注意的是我們關(guān)心的事情不一樣,但所 用的工具是一樣的,表明了異質(zhì)性檢驗(yàn)與交互檢驗(yàn)有著密切的聯(lián)系 為了更好的認(rèn)識和研究復(fù)雜疾病,人們發(fā)現(xiàn)不能只針對單個基因進(jìn)行研究,而必須要考慮 基因之間的交互作用以及基因與環(huán)境之間的交互作用,因此要從全基因組中尋找和定位致病 基因在此啟發(fā)下,被譽(yù)為生命科學(xué)“阿波羅登月計(jì)劃”的國際人類基因組計(jì)劃( t h eh u m a n g e n o m ep r o j e c t ,h g p ) 于1 9 9 0 年正式啟動該計(jì)劃旨在精確測序由3 0 億個堿基對構(gòu)成的 人類基因組序列,發(fā)現(xiàn)所有人類的基因,并且確定這些基因在染色體上的位置,并最終弄清所 有基因的具體功能人類基因組計(jì)劃草圖于2 0 0 0 年提前宣告完成,2 0 0 1 年發(fā)表人類基因組初 稿,并于2 0 0 3 年全部宣告完成現(xiàn)在人類基因組的研究重心已經(jīng)由結(jié)構(gòu)轉(zhuǎn)向功能,疾病基 因關(guān)聯(lián)分析也由單個基因轉(zhuǎn)向全基因組在全基因組中不僅要研究單個基因與疾病的關(guān)系, l 東北師范大學(xué)碩士學(xué)位論文 更重要的是研究多個基因是如何共同導(dǎo)致疾病的,也就是基因之間的交互作用在全基因組中 研究基因交互最大的困難就是位點(diǎn)的數(shù)目大,如果所有可能的交互都檢驗(yàn)的話,那么計(jì)算量很 大,效率很低,檢驗(yàn)的功效很低針對這個問題,k o o p e r b e r ge ta 1 ( 2 0 0 s ) 【1 1 】提出了兩步法識 別基因交互,基本想法是先檢驗(yàn)位點(diǎn)的主效應(yīng)是否顯著,然后檢驗(yàn)主效應(yīng)顯著的位點(diǎn)的交互 本文借鑒兩步法的思想,不過無論在檢驗(yàn)主效應(yīng)還是交互效應(yīng)都和原文有很大差別 2 東北師范大學(xué)碩士學(xué)位論文 基因交互的定義及發(fā)展 2 1 傳統(tǒng)的統(tǒng)計(jì)交互 基因交互是一個非常重要而又復(fù)雜的問題, f i s h e r ( 1 9 1 8 ) 6 在數(shù)學(xué)上定義基因交互效應(yīng) 為單個基因主效應(yīng)的統(tǒng)計(jì)殘差,這個定義往往被稱為統(tǒng)計(jì)交互后來c o c k e r h a m ( 1 9 5 4 ) 7 , k e m p t h o r n e ( 1 9 5 4 ) i s 把這個定義發(fā)展為線性模型或廣義線性模型中的交互項(xiàng),下面首先介紹 一下傳統(tǒng)的統(tǒng)計(jì)交互 設(shè)z l i ,x 2 i ,i = 1 ,佗為預(yù)測變量,m 為響應(yīng)變量,當(dāng)取連續(xù)值時,我們考慮用線性 回歸模型 。 = 風(fēng)+ 島x l i + 2 x 2 i + 島z n z 2 + e i ; 當(dāng)m 取離散值( 兩值) 時,我們考慮用l o g i s t i c 回歸模型 l o g i t ( p ( y i = 1 i z l i ,x 2 i ) ) = 風(fēng)+ p l z l i + 3 2 x 2 i + 8 3 z l i x 2 i 在我們研究基因交互效應(yīng)時,z 1 ,z 2 i 為我們考慮的兩個位點(diǎn),其上等位基因取值分別為0 或 1 ,k 為人的性狀,可以是身高等連續(xù)取值變量,也可以是得不得病( 取值為0 或1 ) 等離 散取值變量我們關(guān)心的問題是兩個位點(diǎn)是否交互,對應(yīng)的檢驗(yàn)是 h o :風(fēng)= 0h 風(fēng):島0 這就足傳統(tǒng)的統(tǒng)計(jì)交互基于l o g i s t i c 回歸模型的統(tǒng)計(jì)交互被統(tǒng)計(jì)工作者廣泛應(yīng)用 1 2 “1 4 ,但 統(tǒng)計(jì)交互有許多缺點(diǎn): ( 1 ) 統(tǒng)計(jì)交互純粹從數(shù)據(jù)出發(fā),缺乏生物學(xué)上的解釋,即使發(fā)現(xiàn)了有統(tǒng)計(jì)交互,也無法 在生物學(xué)上解釋; ( 2 ) 是否交互和選取的模型有關(guān),比方說我們剛剛只選取了z 1 ,z 2 t 兩個預(yù)測變量,但 如果加上其它的預(yù)測變量所得的結(jié)果可能不一樣; ( 3 ) 檢驗(yàn)交互的功效受數(shù)據(jù)結(jié)構(gòu)的影響比較大 , 鑒于以上考慮,許多統(tǒng)計(jì)工作者都在試圖找一個合適的基因交互的定義,使其在生物學(xué)上 有一定的解釋,而且能夠提高檢驗(yàn)的功效z h a oe ta 1 ( 2 0 0 6 ) 9 1 提出了兩個不連鎖位點(diǎn)交互的 新的定義,使得其與連鎖不平衡系數(shù)聯(lián)系在一起,從而有了生物學(xué)上的解釋,通過模擬表明, 3 東北師范大學(xué)碩士學(xué)位論文 檢驗(yàn)的功效能大大提高下面我們介紹z h a oe ta 1 ( 2 0 0 6 ) 9 提出的兩個不連鎖位點(diǎn)交互的新的 定義及其檢驗(yàn) 2 2 兩個不連鎖位點(diǎn)交互的定義 假設(shè)有兩個疾病位點(diǎn)a 和b ,滿足哈代溫伯格甲衡( h w e ) 且不連鎖兩個位點(diǎn)上的 等位基因分別為( a o ,a 1 ) ,( 玩,b 1 ) ,取值分別為0 和1 p a 。,( i = 0 ,1 ) 表示a ,鼠在 普通人群中的等位基因頻率,磁,磷,磋,磋表示a o ,a 1 ,島,b 1 在得病人群的等位基因頻 率兩位點(diǎn)的基因型用i j k l 表示,對應(yīng)的兩條單倍型為i 忌與歹z ,雙倍型的外顯率為向艦 p o o ,1 o l ,t 1 0 ,只1 表示在普通人群中單倍型e 4 。b o ,e 4 0 b 。,e 4 ,b 0 ,鞏,b ,的頻率,定義單倍型玩 的外顯率為 h i k = p a l b l 五1 詹1 + p a l 尸l b o f i l k o + p a o p b l 知k l + 尸a 0 尸磽f t o k o 令6 = r 。b 。一r ,島。表示在普通人群中連鎖不平衡( l d ) 系數(shù),由定義知得病人群中的連鎖 不甲衡系數(shù)為弘= 磁b 。一磁磁,通過推導(dǎo)得到 6 a :p a lp b i p a o p b o 面( h 廠l lh o o - h l o h 0 1 ) , 1a 由此在文獻(xiàn)9 中定義 i = h 1 1 h o o h l o h m 為兩個不連鎖位點(diǎn)交互的測度當(dāng)i = 0 時表示兩個位點(diǎn)無交互,當(dāng),0 時表示兩個位點(diǎn) 在普通人群中是連鎖平衡的,但在得病人群中是連鎖不平衡的,這主要是由兩個位點(diǎn)交互導(dǎo)致 的 為了進(jìn)一步理解這個定義,我們從兩方面進(jìn)行解釋首先當(dāng)無交互時通過推導(dǎo)得到 = 警,魯= 萬h a l 萬h b l , 這表明當(dāng)無交互時在得病人群中含有某單倍型的比例等于在得病人群中含有此單倍型中的等 位基因的比例之積,類似連鎖平衡,從而表明只有當(dāng)兩位點(diǎn)對疾病的作用相互影響時才會產(chǎn)生 交互,這符合我們對交互作用的直觀理解;其次這篇文章還得到了一個重要的結(jié)論,一般我們 都足考慮標(biāo)記位點(diǎn),標(biāo)記位點(diǎn)在生物上交互是沒有意義的,但是當(dāng)兩個標(biāo)記位點(diǎn)和兩個不連鎖 的交互的疾病位點(diǎn)靠得很近時,他們之間的交互也可以被發(fā)現(xiàn)假設(shè)標(biāo)記位點(diǎn)m 與疾病位點(diǎn) a 是連鎖不平衡的,標(biāo)記位點(diǎn)m 2 與疾病位點(diǎn)b 是連鎖不平衡的,可以得出以下關(guān)系 翰= ( f 1 ( f 2 ( h l lh o o h i o h 0 1 ) 焉 4 = 砑p a 器瓦護(hù), = = 一u 。p b 。p b 。 東北師范大學(xué)碩士學(xué)位論文 其中嘞為兩個標(biāo)記位點(diǎn)在得病人群中的連鎖不平衡系數(shù),6 1 是尬與a 在普通人群中的連 鎖不甲衡系數(shù),如為m 2 與b 在普通人群中的連鎖不平衡系數(shù)這個結(jié)論有非常重要的理論 和現(xiàn)實(shí)意義:首先,當(dāng)6 1 0 ,如0 時6 芻= 0 與鏟= 0 是等價(jià)的,換句話說,要想檢驗(yàn)兩 個疾病位點(diǎn)的交互就等價(jià)與檢驗(yàn)它們附近的標(biāo)記位點(diǎn)的交互;退一步說當(dāng)我們對6 1 和6 2 不作 任何假設(shè),也有。當(dāng)翰0 時必有5 a 0 ,這說明如果我們發(fā)現(xiàn)了兩個標(biāo)記位點(diǎn)有交互,那 么它們附近必然有疾病位點(diǎn),并且疾病位點(diǎn)是有交互的,這在某種程度上可以看成是我們通過 尋找標(biāo)記位點(diǎn)的交互來發(fā)現(xiàn)疾病位點(diǎn)的理論基礎(chǔ) 我們關(guān)心的檢驗(yàn)是h o :i = 0 一h 1 :i 0 ,用的統(tǒng)計(jì)量是 其中 乃= 等等, 以= 簏一彪罄,知= a 。一戶a ,戶b 。, 以= 絲蔓凼垡導(dǎo)盟絲型出, 移p a ,( 1 一p a 。) p b ,( 1 一p b 。) + ( 1 2 尸a 。) ( 1 2 p b 。) j 一6 齋i , r := 。 2 n c n a ,佗g 是病例組與對照組各自的樣本量我們稱此統(tǒng)計(jì)量為基于l d 的統(tǒng)計(jì)量,這里構(gòu)造此統(tǒng) 計(jì)量的原因是由于兩個不連鎖位點(diǎn)交互會導(dǎo)致這兩個位點(diǎn)在普通人群中是連鎖平衡的,但在 得病人群中是連鎖不平衡的,所以可以通過比較病例組與對照組中的連鎖不平衡水平來檢驗(yàn) 交互可以證明,在凰下,丑一x 齊、 5 東北師范大學(xué)碩士學(xué)位論文 3 一般情形下兩個位點(diǎn)交互的定義及其檢驗(yàn) 3 1一般情形下兩個位點(diǎn)交互的定義 本文的主要目的是把z h a oe ta 1 ( 2 0 0 6 ) t 9 1 提出的兩個不連鎖位點(diǎn)交互的定義推廣到一般 情形當(dāng)兩個位點(diǎn)連鎖時,這里存在的最大的混雜是連鎖信息,所以我們想試圖把這種混雜消 去受文獻(xiàn)9 的啟發(fā),下面我們給出本文提出的一般情形下兩個位點(diǎn)交互的定義 定義3 1 設(shè)以,n 分別表示病例組與對照組中的連鎖不平衡系數(shù),我們定義一般情形下 兩個位點(diǎn)交互的測度為 i = i n 一以| 對這個定義我們可以從以下幾方面理解; ( 1 ) 首先這個定義適合于不連鎖的情形,所以它可以作為一般情形下交互的定義; ( 2 ) 當(dāng)i = 0 時表示兩位點(diǎn)是不交互的,當(dāng),0 表示兩位點(diǎn)是交互的 前面我們在介紹兩個不連鎖位點(diǎn)交互的定義時,我們都是在討論普通群體與得病群體,令 曲為普通群體中的連鎖不平衡系數(shù),下面我們要研究n = 以與6 t = 以之間的關(guān)系,并解 釋為什么用病例組與對照組連鎖不平衡系數(shù)之間差異,而不用普通群體與得病群體連鎖不平 衡系數(shù)之間的差異作為交互的測度 命題3 1 設(shè)磷,碟表示對照組中a 1 ,b 1 等位基因頻率,磁,磺表示病例組中a 1 ,b 1 等位基因頻率,當(dāng)磷= 磷或磷= 磷時,n = 以車號而= 以 證明:設(shè)對照組中的樣本量為佗1 ,病例組中的樣本量為n 2 ,則總樣本量為n = n 1 + 佗2 先證必要性,由定義得 n = 磷b ,一磷磷,以= 磁島一磁磋, 再由條件蚧= 以,令6 = 6 n = 以,因此 由定義 磷b 。= 6 + 磷磷,硫b ,= 6 + 硫磺, 吩= p a l b l 一p a l p b l 竺! 型星! 竺絲星一竺! 叢竺絲蘭! 型2 1 絲 n l + n 2n l + n 2n l + n 2 1 11 叢型! 生型絲墮塑一蘭! 叢竺絲2 1 叢竺垡 n l + n 27 2 1 + n 2 n l + n 2 6 東北師范大學(xué)碩士學(xué)位論文 :6 + 墊叢里;竺絲魚些型二紐些竺絲迎! 型竺絲2 i n :十n 2j :j + 2 1 型叢二絲叢竺二絲2 【扎1 + 禮2 ) 。 ,、o 當(dāng)磷= 磁或磷= 磋時有西= 5 = 以 再證充分性,由條件5 t = 以,令j = 而= 5 a ,由定義 g n = 磷b 。一磷磷 佗p a l b l 一n 2 尸盆日竹p a l 一n 2 尸乏n p 1 一t t 2 尸參 := :- - - - - _ - - - - - - - - - - - - - - - - - 二:- - :;一- - - - - - - - - - - - - - - - - - 二- - - - - - - - - - - - ,- - - - - 二 n 1n 1n l 幾( 6 + p a l - p s l ) 一n 2 ( 5 + 磷磺)億r l n 2 p a a l 幾p b l 一n 2 磁 孔1n 1幾l 。n n 2 ( p a 。一磁) ( 島。一磺) 一一可一 所以當(dāng)p a ,= 硫或p b ,= 磋時,如= 占= 5 a 容易證明p a 。= 磁告凈p 。n 。= 磁, p s ,= 磋甘p 。n 。= 磋,所以當(dāng)磷= 咒或磷= 磴時,g n = 5 = 5 a 證畢 通過這個命題我們可以看出,在一定條件下用病例組與對照組連鎖不平衡系數(shù)之間的差異 與用普通群體與得病群體連鎖不平衡系數(shù)之間的差異作為交互的系數(shù)是等價(jià)的一般情況下, 兩者是不等價(jià)的因?yàn)槠胀ㄈ后w中含有病例組與對照組,本身就存在群體分層,這個時候普通群 體中的連鎖不平衡系數(shù)的估計(jì)值在很大程度上就依賴于病例組與對照組樣本量的比值,這時檢 驗(yàn)就很不穩(wěn)定而且從交互本身的含義也知道,交互導(dǎo)致的是對疾病的作用,它是與正常人作比 較的,所以我們認(rèn)為用病例組與對照組連鎖不平衡系數(shù)之問的差異作為交互的測度是合理的 3 2 兩種情況 在遺傳統(tǒng)計(jì)學(xué)的研究中,我們經(jīng)常會碰到混雜的問題比方說我們在研究吸煙是否與肺癌 有關(guān)聯(lián)時,如果我們把所有的數(shù)據(jù)等同視之,很有可能會得到偽關(guān)聯(lián),因?yàn)檫@里面可能存在年 齡,性別等混雜因素,很有可能是這些混雜導(dǎo)致了關(guān)聯(lián)在實(shí)際研究中我們處理混雜因素有兩 種方法t 分層抽樣與匹配抽樣分層抽樣就是根據(jù)混雜因素把整個群體分成若個子群體,每個 子群體中的混雜因素是一樣的,然后在每個子群體中抽樣和檢驗(yàn)比方說研究吸煙是否與肺癌 有關(guān)聯(lián)時,我們可以分若干個年齡段進(jìn)行抽樣,然后在每個年齡段進(jìn)行關(guān)聯(lián)分析,這樣就可以 避免因年齡混雜造成的偽關(guān)聯(lián)鑒于以上考慮,下面我們分兩種情況來討論:無群體分層,有 群體分層 7 東北師范大學(xué)碩士學(xué)位論文 ( 1 ) 無群體分層情形 我們關(guān)心的問題足h o :,= 0 一h 1 :i 0 ,由我們剛剛定義的基因交互新的定義我們 關(guān)心的檢驗(yàn)就等價(jià)于h o :5 n = 以一h 1 :5 5 a 從文獻(xiàn)9 推導(dǎo)過程中不難發(fā)現(xiàn)原文在 推導(dǎo)方差的估計(jì)值時并未用到5 = 0 信息,所以原文中的統(tǒng)計(jì)量依然可以用,容易知道水平 為q 的拒絕域?yàn)?乃 x ;,( 1 一。) ) 下面我們給出以,h 的另外兩個表達(dá)式,可以證明這兩個 表達(dá)式與原來是相等的 我們用的是6 方法,記戶= ( 戶1 1 ,a o ,p 0 1 ,p o o ) r ,p = ( 只1 ,只o ,p 0 1 ,) t ,則 戶一( p ,去) ,其中e = d i a g ( p 1 1 ,p 1 0 ,p 0 1 ,p o o ) 一p p t 記t = ( t 1 1 ,t l o ,t 0 1 ,t o o ) 丁,令 i ( t ) = ,( t 1 1 ,t l o ,t 0 1 ,t o o ) = t 1 1 t o o t l o t m 由于知= p 4 1 ,p “o o 一矗o p o l = f ( p ) ,由中心極限定理知 2 v 嚦- s ( p p ) 一n ( o ,) 又因?yàn)?而o f k p = 島。,瓦o f 。i t = p = - - 昂,瓦a y 。i t = p = - - - - p 1 。蒜k p = 只, 記c = ( ,一r 1 ,一只o ,p 1 1 ) r ,則由5 方法,知 佤( ,( 戶) 一,( p ) ) 一n ( o ,c t c ) , 從而 廄( 知一h ) 一n ( o ,c t c ) , 即 知 ( 去噸以 令v = c t e c ,則 v = p g o p l l + 瑞日。十瑞島1 + 瑋r o 一4 ( p 1 1 p o o 只。局1 ) 2 = p 1 1 p o o ( p 1 1 + r o ) + 只o r l ( p 1 0 + 晶1 ) 一面2 由于p a ,= p n + r i o ,p u ,= 島1 + p l l ,可以驗(yàn)證我們得到的方差與原文是相等的( 只需把兩 式相減驗(yàn)證等于0 即可) 以后在用基于l d 的統(tǒng)計(jì)量時,方差也可以用這里推導(dǎo)的 在后面我們會介紹y i ne ta 1 ( 2 0 0 7 ) 1 0 】提出的異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量,此統(tǒng)計(jì)量也可用來檢驗(yàn) 這里關(guān)心的問題 ( 2 )有群體分層情形 8 東北師范大學(xué)碩士學(xué)位論文 在實(shí)際問題中,除了連鎖還會有許多其它的混雜因素比方說年齡,性別,種族等,所以 考慮群體分層是很有必要的假設(shè)有k 個群體,每個群體混雜因素的水甲是一樣的,關(guān)心的 問題是兩位點(diǎn)是否有交互,即檢驗(yàn) h o l :3 a 1 = 6 lh 玩l :以1 3 n 1 , h 0 2 :6 a 2 = t i n 2 h h 1 2 : 5 a 2 5 n :, h o k :以k = 3 n kh 研k :5 a k 占, 其中以。,5 n k ( k = 1 ,k ) 分別表示第k 個群體中病例組與對照組中的連鎖不甲衡系數(shù) 我們判斷兩位點(diǎn)是否交互的標(biāo)準(zhǔn)是: ( 1 ) 當(dāng)所有原假設(shè)均接受時,說明兩位點(diǎn)無交互; ( 2 ) 當(dāng)其中有某個原假設(shè)不成立時,說明兩位點(diǎn)有交互 容易看出這樣檢驗(yàn)比混在一起檢驗(yàn)效果要好,因?yàn)樗苊饬嘶祀s導(dǎo)致的偽交互這里有幾 種方法去檢驗(yàn),比方說可以用多重檢驗(yàn),但多重檢驗(yàn)效率比較低,所以本文中就不采用多重檢 驗(yàn)的方法在本文中我們采用y i ne ta 1 ( 2 0 0 7 ) 1 0 】提出的異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量,在下面一節(jié)我們 將介紹這個統(tǒng)計(jì)量及其漸近分布 3 3 異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量 假設(shè)有k 個群體,關(guān)心兩位點(diǎn)a 和b ,兩個位點(diǎn)上的等位基因分別為( a o ,a 1 ) ,( 島,b 1 ) 用r 知表示第k 個群體中a 島的概率,其中i ,j = 0 ,1 ;k = 1 ,k ,第k 個群體的連鎖不 平衡系數(shù)是以= p 1 l k p x + k p + l k 其中p x + k = p l o k + p 1 1 k ,p + l k = p o l k + 尸1 1 七,這里關(guān)心的 問題是檢驗(yàn) h o :6 1 = = 6 khh 1 :甌6 j ,3 i j 值得注意的是本文與y i ne ta 1 ( 2 0 0 7 ) 1 0 】所關(guān)心的問題足不一樣的,本文關(guān)心的是交互,而y i n e ta 1 ( 2 0 0 7 ) 1 0 】關(guān)心的是異質(zhì)性檢驗(yàn)但細(xì)看又有相似之處,比方說在檢驗(yàn)h o :5 n 1 = “。一 風(fēng):6 】以,其實(shí)可以看成是異質(zhì)性檢驗(yàn)k = 2 的特例,因此我們可以用y i n e ta 1 ( 2 0 0 7 ) 1 0 】 的統(tǒng)計(jì)量來檢驗(yàn)兩個位點(diǎn)足否交互,但值得注意的是我們并不需要保證以。= 3 a := = 3 a k , 允許它們有差別,這一點(diǎn)和異質(zhì)性檢驗(yàn)是不一樣的下面我們給出異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量的提出及 其漸近分布的簡要過程 令x i j k ( i ,j = 0 ,1 ,k = l ,k ) 表示在第k 個群體中單倍型a 馬的數(shù)目,n k = x o o k + x o x kx l o kx l l k ,則 z 玎七:i ,j = 0 ,1 】一m ( n k , 知】) 注意到p o o k = p o + 七p + o k + c i k ,p i n k = 9 東北師范大學(xué)碩士學(xué)位論文 p o + k p + l k 一5 k ,p l o k = p 1 + k p + o k 一以,p 1 1 k = p 1 + k p + 1 k + 以,第k 組的對數(shù)似然為 如( 以,只+ 知,p + 1 知) = x o o kl n ( p o + 知p + o 七+ 6 七) + x o l kl n ( p o + 七j 9 + 1 七一6 鳧) - x l o ki n ( p l + k p + o k 一5 k ) + x l l kl n ( p 1 + j c p + 1 七+ 5 k ) 令6 表示在凰下公共的連鎖不平衡系數(shù), p 1 + = ( 只+ 1 ,? 一,毋+ 七) ,p + 1 = ( p + 1 1 ,p + l k ) , 則在日。下,k 個群體總的對數(shù)似然為 我們構(gòu)造得分統(tǒng)計(jì)量 其中 f ( 占,p 1 + ,p + i ) = x 2 :f j ,一 k = l k = l i k ( 5 ,p l + 南,p + l k ) s 磊( 6 ,p 1 + _ i c ,p + 1 七) 厶6 l p l + p + l k ( 6 ,p 1 + k ,p + l k ) & a ( 6 ,p 1 拍p + ,知) = 等= 瓦麗x o o k 一面麗x o l k 一瓦麗x l o k + 鼠p 1 + k ( 瓦p 1 + 七,p + 1 七) = x l l k 片+ 南p + 1 南+ 5 擾憊x o o k p + o kx o l k 耳l kx l o k p + o 南 一:= :一一+ 一一 l - - o p t + 七p o + 七p + o 知+ 6晶+ 南p + 1 七一j 。只+ 七4 0 七一6 。 鼠p + 。( 巧,p 1 + 七,p + ,- | c ) = 瓦o l k = 一瓦= x o o 瓦k p 而o + k一萬= x l o 瓦k p 習(xí)l + k+ 瓦= x o l 瓦k p 習(xí)o + k + x l l k 尸+ 1 七 p l + 七p + 1 七+ 6 x l l kp 1 + 七 p 1 + 七p + 1 七十6 i k 6 1 p 。+ 。p + 。是& 6 ,甌p 1 + 。,鼠p + 。的方差,協(xié)方差的一個函數(shù),形式比較復(fù)雜,后面會給出簡單 的表達(dá)式可以證明,在凰下,x 2 服從自由度為k 一1 的卡方分布但是由于6 ,p l + ,p + 1 在凰下的m l e 無顯示表達(dá)式,從而使x 2 的應(yīng)用受限 鑒于以上考慮,我們運(yùn)用擴(kuò)展到討厭參數(shù)上的異質(zhì)性得分統(tǒng)計(jì)量的理論1 1 5 】,對x 2 進(jìn)行 修改修改后的統(tǒng)計(jì)量為 p = 喜案糍 1 0 籌熹攔 其中 p ;+ 知,霹1 膏滿足以下方程組 肚弩掣 怎,蒜 可以證明,6 + 的相合性及在一定條件下足漸近有效的,為了計(jì)算方便我們得到了k 6 l p l + 。p + 。 的簡單表達(dá)式: 其中 k 6 j p l + k p + l k = n k 峨( 6 ,p 1 + 太,p + 1 知) 魄( 正p 1 + 七,p + 1 七) = p l l k p 愛。七十p l o k p :;2 1 七+ p 0 1 知瑞七+ 礙七一4 6 2 可以證明,在凰下,x 2 + 服從自由度為k 一1 的卡方分布,所以水平為o l 的拒絕域是 x 2 。 ) ( 凳一1 ,( 1 一。) ) 1 1 0 0 i i = 擄 拙凡凡 知 島 + + r b 幸 幸 p 咕 蠊 r 4 & & ,ljl【 東北師范大學(xué)碩士學(xué)位論文 4 在全基因組中基因交互的檢驗(yàn) 在全基因組中研究基因交互作用最大的困難就是位點(diǎn)數(shù)量很大比方說當(dāng)有5 0 0 0 0 0 個 s n p 位點(diǎn)時,要檢驗(yàn)所有的二階和三階交互的數(shù)量分別有1 0 1 1 與1 0 1 6 ,這個數(shù)量足相當(dāng)驚人 的如果所有可能的情況都檢驗(yàn),那么檢驗(yàn)的功效肯定很低,而且會浪費(fèi)計(jì)算機(jī)許多資源針 對這個問題,k o o p e r b e r ge ta 1 ( 2 0 0 s ) 1 1 】提出了兩步法,基本思想是先檢驗(yàn)單個位點(diǎn)主效應(yīng)是 否顯著,然后再在這些主效應(yīng)顯著的位點(diǎn)中檢驗(yàn)兩兩是否有交互本文可以借鑒這種思想,基 本策略是首先檢驗(yàn)主效應(yīng)是否顯著,然后再用異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量或基于l d 的統(tǒng)計(jì)量檢驗(yàn)兩 位點(diǎn)是否有交互 下面我們介紹兩種檢驗(yàn)主效應(yīng)是否顯著的檢驗(yàn)統(tǒng)計(jì)量:皮爾遜卡方統(tǒng)計(jì)量 1 6 1 與a r m i t a g e 趨勢檢驗(yàn)【1 7 1 假設(shè)我們隨機(jī)抽樣得到了n 1 個有病的個體和佗2 個正常的個體我們研究 的位點(diǎn)是a ,兩個等位基因分別為a 1 和a o ,所得到的數(shù)據(jù)為下列的基因型數(shù)據(jù);病例組 中基因型a i a l ,a 1 a o ,a o a o 的數(shù)目為現(xiàn),d 1 ,d o ,對照組中基因型a 1 a 1 ,a 1 a o ,a o a o 的數(shù)目 為q ,a ,島,記病例組與對照組總?cè)藬?shù)為扎= 禮1 + n 2 對應(yīng)的等位基因數(shù)據(jù)為:病例組 等位基因a 1 ,a o 的數(shù)目分別為2 d 2 + d l ,2 d o + d 1 ,對照組等位基因a 1 ,a o 的數(shù)目分別為 2 6 2 + g ,2 c o + g ,病例組與對照組等位基因總數(shù)分別為2 n l ,2 n 2 ( 1 ) 皮爾遜卡方統(tǒng)計(jì)量 我們構(gòu)造的皮爾遜卡方統(tǒng)計(jì)量為 y 專:堅(jiān)堡里12 蘭( ! 魚魚2 二! 蘭魚望12 蘭! ! 魚魚進(jìn)蘭! 竺 a a ( 2 d 2 + d 1 十2 c 2 + c 1 ) ( 2 d o + d l + 2 c o + c 1 ) 2 n 1 2 n 2 如果記p d = 尸1l a f f ) ,p c = p ( a 1 l u n a f f ) ,則它們可以用相應(yīng)的頻率估計(jì),即 戶d = # ,島= 瓦2 6 2 + - c 1 ,戶= 墮號警監(jiān), 構(gòu)造統(tǒng)計(jì)量 ,pdpc 、尸( 1 一p ) ( 擊+ 壺) 可以證明x 芻= ( 互么) 2 注意到乙近似服從正態(tài)分布的,因此x 芻服從自由度為1 的卡方分 布 上述檢驗(yàn)統(tǒng)計(jì)量被廣泛應(yīng)用到基因與疾病的關(guān)聯(lián)分析中,但它有個隱含的假設(shè):假設(shè)滿足 哈代溫伯格平衡但是我們前面分析可能有混雜因素造成群體分層,此時滿足哈代溫伯格甲衡 1 2 東北師范大學(xué)碩士學(xué)位論文 往往是不成立的,此時我們考慮用a r m i t a g e 趨勢檢驗(yàn),這樣可以減少第一類錯誤 ( 2 ) a r m i t a g e 趨勢檢驗(yàn) 假設(shè)有k 種風(fēng)險(xiǎn)因素,各狀態(tài)對結(jié)果的( 有病與無病) 的影響不一樣第k 種狀態(tài)有k 個有病的個體,厶一如個正常的個體,其對病的影響值為z 知,記z = 七k :1l k ,l = 七k :1l k , 則構(gòu)造統(tǒng)計(jì)量 y 2 : 坐叁! 照二! 叁;壘鯊 凡一z ( 三一z ) l 各。l 七z 2 一( 冬1l k z 七) 2 】 此統(tǒng)計(jì)量對應(yīng)的檢驗(yàn)方法被稱為a r m i t a g e 趨勢檢驗(yàn),此檢驗(yàn)可解決兩個問題: 1 。結(jié)果是否 與風(fēng)險(xiǎn)因素有關(guān);2 。結(jié)果是否與風(fēng)險(xiǎn)因素的狀態(tài)次序有關(guān) a r m i t a g e 趨勢檢驗(yàn)可用來分析前面的基因型數(shù)據(jù),此時基因型a 1 a 1 ,a 1 a o ,a o a o 為風(fēng)險(xiǎn) 因素的三種狀態(tài),對疾病的影響值分別為z 1 = 2 ,x 2 = 1 ,z 3 = 0 ,則相應(yīng)的a r m i t a g e 趨勢檢 驗(yàn)x 2 統(tǒng)計(jì)量為 + ) 一 十+ )】2a2 n n ( 2 d 2 d 1 n l ( 2 d 2 d 1 2 c 2c 1 ”2 而面承西i i 再酉石可= 砸f 西訂忑i 瓦研 令 ,pdpc 戶( 1 一戶) + ( r 。a ,一戶2 ) 】( 擊+ 赤) 其中p a ,a ,= 畢可以證明【1 8 】 ( z g ) 2 = x 各 大家注意到z 0 與乙的差別在于多了p a ,a ,一戶2 項(xiàng),當(dāng)哈代溫伯格平衡定律成立時 = 乙,所以可以把看成是乙的一個修正當(dāng)近親結(jié)婚或群體分層時,哈代一溫 伯格平衡定律不成立,可以考慮用a r m i t a g e 趨勢檢驗(yàn) 1 3 東北師范大學(xué)碩士學(xué)位論文 5 模擬和結(jié)論 5 1模擬 這部分我們主要是用m o n t ec a r l o 方法比較基于l d 的統(tǒng)計(jì)量和異質(zhì)性統(tǒng)計(jì)量的第一類 錯誤和功效 首先我們生成x 1 一s ( 1 ,p 1 ) ,x 2 一b ( 1 ,仡) ,這里分兩種情況產(chǎn)生數(shù)據(jù):獨(dú)立與不獨(dú)立 然后我們根據(jù)l o g i s t i c 回歸模型 l o g i t ( p ( y = 1 1 x 1 ,恐) ) = 風(fēng)+ p l x l + 僥恐+ 尻x 1 x 2 生成響應(yīng)變量y 這里我們?nèi)∪? - 2 ,p 1 = 皮,樣本量為1 0 0 0 ( 包括病例組與對照組) ,總 共模擬1 0 0 0 次,模擬的顯著性水平為0 0 5 ,我們主要是比較兩個統(tǒng)計(jì)量的經(jīng)驗(yàn)第一類錯誤和 經(jīng)驗(yàn)功效 ( 1 ) 模擬一s 選取p 1 = 0 7 ,p 2 = 0 6 ,x 1 與恐獨(dú)立,盧1 = p 2 ,島= 0 下圖表示的是經(jīng)驗(yàn) 第類錯誤與主效應(yīng)脅之間的關(guān)系可以看出,兩個統(tǒng)計(jì)量都能夠比較好地控制第一類錯誤 橫軸表示角,縱軸表示經(jīng)驗(yàn)第一類錯誤,實(shí)線表示用基于l d 的統(tǒng)計(jì)量計(jì)算的結(jié)果,虛線表示 用異質(zhì)性統(tǒng)計(jì)量計(jì)算的結(jié)果 ( 2 ) 模擬二:選取p a = 0 7 ,p 2 = 0 6 ,x l 與x 2 獨(dú)立下面圖2 a 表示p 1 = 倪= 0 時功效 1 4 東北師范大學(xué)碩士學(xué)位論文 與風(fēng)之間的關(guān)系,下面圖2 b 表示1 = 島= - 1 時功效與風(fēng)之間的關(guān)系,下面圖2 c 表示 島= 倪= 1 時功效與傀之間的關(guān)系由以上三圖可以看出在三種情況下檢驗(yàn)的功效都隨著 風(fēng)的增大而增大,這與我們的直觀相符,在某種程度上也反映了我們定義的基于l d 的交互 與傳統(tǒng)的統(tǒng)計(jì)交互有必然的聯(lián)系另外我們還可以看出,在相同條件下,當(dāng)p 1 = 倪= 1 時功 效最大,當(dāng)盧1 = 島= 0 次之,歷= 島= - 1 時最差,表明主效應(yīng)對交互效應(yīng)的檢驗(yàn)有很大的 影響值得一提的是圖2 b 與文獻(xiàn)l l 中得出的結(jié)論不同,文獻(xiàn)1 1 得出在p 1 = 懇= - 1 時功 效不足傀的單調(diào)函數(shù)當(dāng)p 1 = 阮= 0 與p 1 = 島= 1 時,異質(zhì)性統(tǒng)計(jì)量比基于l d 的統(tǒng)計(jì)量 檢驗(yàn)的功效稍大,當(dāng)盧1 = 仍= - 1 時,基于l d 的統(tǒng)計(jì)量比異質(zhì)性統(tǒng)計(jì)量檢驗(yàn)的功效稍大 ( b ) 以上三幅圖橫軸表示風(fēng),縱軸表示經(jīng)驗(yàn)功效, 表示用異質(zhì)性統(tǒng)計(jì)量計(jì)算的結(jié)果 ( c ) 實(shí)線表示用基于l d 的統(tǒng)計(jì)量計(jì)算的結(jié)果,虛線 1 5 東北師范大學(xué)碩士學(xué)位論文 ( 3 ) 模擬一 - - s 選取p 1 = 0 7 ,仇= 0 6 ,盧1 = 尾= 0 ,島= 0 , x 1 與恐不獨(dú)立,相關(guān)系數(shù)為 p 下圖表示的是經(jīng)驗(yàn)第一類錯誤與相關(guān)系數(shù)之間的關(guān)系由此表可知,在p 取不同值時,兩 個統(tǒng)計(jì)量都能夠比較好地控制第一類錯誤,p 對第一類錯誤影響不大 橫軸表示p ,縱軸表示經(jīng)驗(yàn)第一類錯誤,實(shí)線表示用基于l d 的統(tǒng)計(jì)量計(jì)算的結(jié)果,虛線表示 用異質(zhì)性統(tǒng)計(jì)量計(jì)算的結(jié)果 ( 4 ) 模擬四:選取島= 尾= 0 ,圖4 a ,圖4 b ,圖4 c 分別表示尻為1 , 1 5 ,2 時,檢驗(yàn) 的功效與相關(guān)系數(shù)之間的關(guān)系從以下三個圖中可以看出當(dāng)p = 0 1 時功效最大,其次是當(dāng) p = 0 2 ,0 5 時,兩種情況功效相當(dāng),當(dāng)p = 0 3 ,0 4 時功效最低當(dāng)p = o 1 ,0 2 時,異質(zhì) 性統(tǒng)計(jì)量比基于l d 的統(tǒng)計(jì)量檢驗(yàn)的功效稍大,當(dāng)p = 0 4 ,0 5 時,基于l d 的統(tǒng)計(jì)量比異 質(zhì)性統(tǒng)計(jì)量檢驗(yàn)的功效稍大總得來說,兩個統(tǒng)計(jì)量在各種情況下表現(xiàn)相當(dāng)另一方面,當(dāng) p = 0 1 ,0 2 ,0 3 ,0 4 時,功效都隨著島的增大而增大,當(dāng)p = 0 5 時功效不足風(fēng)的單調(diào)函數(shù), 這說明p 對功效的影響比較復(fù)雜 1 6 東北師范大學(xué)碩士學(xué)位論文 ( b )( c ) 以上三幅圖橫軸表示p ,縱軸表示經(jīng)驗(yàn)功效,實(shí)線表示用基于l d 的統(tǒng)計(jì)量計(jì)算的結(jié)果,虛線 表示用異質(zhì)性統(tǒng)計(jì)量計(jì)算的結(jié)果 ( 5 ) 模擬五:選取島= 尾= 1 ,z 3 = 0 5 ,x 1 一b ( 1 ,0 9 ) ,下面圖表示的是檢驗(yàn)的功效與第 二個位點(diǎn)等位基因頻率之間的關(guān)系可以看出當(dāng)優(yōu)= 0 5 ,0 6 時,異質(zhì)性統(tǒng)計(jì)量比基于l d 的 統(tǒng)計(jì)量檢驗(yàn)的功效稍大,當(dāng)p 2 = 0 8 ,0 9 時,基于l d 的統(tǒng)計(jì)量比異質(zhì)性統(tǒng)計(jì)量檢驗(yàn)的功效稍 大當(dāng)p 2 = 0 5 ,0 6 ,0 7 ,0 8 時檢驗(yàn)的功效都很高,當(dāng)p 2 = 0 9 時,功效要明顯下降,基于l d 的統(tǒng)計(jì)量要比異質(zhì)性檢驗(yàn)統(tǒng)計(jì)量功效稍高 1 7 東北師范大學(xué)碩士學(xué)位論文 橫軸表示p 2 ,縱軸表示經(jīng)驗(yàn)功效,實(shí)線表示用基于l d 的統(tǒng)計(jì)量計(jì)算的結(jié)果,虛線表示用異質(zhì) 性統(tǒng)計(jì)量計(jì)算的結(jié)果 5 2結(jié)論 通過以上模擬,我們發(fā)現(xiàn)總體上講,在各種情況下,兩個統(tǒng)計(jì)量檢驗(yàn)的功效相當(dāng)由于在 文獻(xiàn)9 中已經(jīng)比較了基于l d 的統(tǒng)計(jì)量與傳統(tǒng)的l o g i s t i c 統(tǒng)計(jì)量,發(fā)現(xiàn)基于l d 的統(tǒng)計(jì)量明顯 好于傳統(tǒng)的統(tǒng)計(jì)量,所以可以說異質(zhì)性統(tǒng)計(jì)量也是要明顯好于傳統(tǒng)的統(tǒng)計(jì)量大體上講,兩個 統(tǒng)計(jì)量在兩個位點(diǎn)獨(dú)立時功效要高些,這說明我們在兩位點(diǎn)不獨(dú)立時有必要引進(jìn)一個更好的統(tǒng) 計(jì)量當(dāng)然由于都是模擬數(shù)據(jù),在實(shí)際問題中,當(dāng)有群體分層時,可根據(jù)我們提出的檢驗(yàn)標(biāo)準(zhǔn) 進(jìn)行檢驗(yàn),這樣得出的結(jié)果應(yīng)該要比混在一起做要好 另外我們也看到無論哪種情況下,檢驗(yàn)的功效都隨著島的增大而增大,這也表明我們提 出的基于l d 的基因交互的定義與傳統(tǒng)的統(tǒng)計(jì)交互有必然的聯(lián)系本文本來想在理論上證明 兩者之間的關(guān)系,但由于島無顯示表達(dá)式,無從證明,這是將來需要進(jìn)一步研究的工作 將來可以研究的工作:( 1 ) 在全基因組中檢驗(yàn)基因交互,這里我們只是提出了策略,沒 有具體實(shí)施;( 2 ) 檢驗(yàn)高階交互;( 3 ) 在兩位點(diǎn)不獨(dú)立時提出一個更好的統(tǒng)計(jì)量 1 8 東北師范大學(xué)碩士學(xué)位論文 參考文獻(xiàn) 【1 】c o xnj ,f r i g g em ,n i c o l a edl ,c o n c a n n op l o c io nc h r o m o s o m e s2 ( n i d d m1 ) a n d 1 5i n t e r a c tt oi n c r e a s es u s c c p t i b i l i t yt od i a b e t e si nm e x i c a na m e r i c a n s j n a tg e n e t ,1 9 9 9 ,2 1 : 2 1 3 - 2 1 5 【2 】e l s t o nrc ,n a m b o o d i r ikk ,n i n ohm s t u d i e so nb l o o da n du r i n eg l u c o s ei ns e m i n o l e i n d i a n s :i n d i c a t i o n sf o rs e g r e g a t i o n
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年九龍縣幼兒園教師招教考試備考題庫帶答案解析(必刷)
- 2026年包頭輕工職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫及答案詳解(全優(yōu))
- 工業(yè)機(jī)器人考試題庫及答案
- 2025年湖南電氣職業(yè)技術(shù)學(xué)院馬克思主義基本原理概論期末考試模擬題帶答案解析(必刷)
- 2026年石家莊鐵路職業(yè)技術(shù)學(xué)院單招職業(yè)傾向性考試模擬測試卷附答案解析
- 飲品店加盟店培訓(xùn)
- 2026年南昌理工學(xué)院單招綜合素質(zhì)考試題庫附答案詳解(奪分金卷)
- 2026年南京視覺藝術(shù)職業(yè)學(xué)院單招職業(yè)技能考試題庫含答案詳解(完整版)
- 2026年信陽航空職業(yè)學(xué)院單招職業(yè)技能考試題庫及答案詳解(全優(yōu))
- 2026年六安職業(yè)技術(shù)學(xué)院單招職業(yè)技能考試題庫含答案詳解(預(yù)熱題)
- 消火栓安全培訓(xùn)知識課件
- 熔鹽儲熱材料研發(fā)-洞察與解讀
- 人教版7到9年級單詞表打印版
- 2025年高壓電工復(fù)審?fù)暾}庫(附答案)
- 2025年湖北高考真題化學(xué)試題(原卷版)
- 呼吸衰竭的早期識別和緊急處理方法
- 中華姓氏大辭典
- 密閉式靜脈輸血技術(shù)操作規(guī)范
- 肢體功能障礙的心理康復(fù)課件
- 26.1.2 反比例函數(shù)的圖像和性質(zhì)第二課時作業(yè)設(shè)計(jì)
評論
0/150
提交評論