關(guān)聯(lián)分析完整版_第1頁(yè)
關(guān)聯(lián)分析完整版_第2頁(yè)
關(guān)聯(lián)分析完整版_第3頁(yè)
關(guān)聯(lián)分析完整版_第4頁(yè)
關(guān)聯(lián)分析完整版_第5頁(yè)
已閱讀5頁(yè),還剩31頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

關(guān)聯(lián)分析

(AssociationMapping)

紅葉石楠新葉為什么會(huì)變紅?甘藍(lán)為什么會(huì)結(jié)球?(一)關(guān)聯(lián)分析基礎(chǔ)知識(shí)1.關(guān)聯(lián)分析的概念2.關(guān)聯(lián)分析的基礎(chǔ)——連鎖不平衡3.影響關(guān)聯(lián)分析的因素4.關(guān)聯(lián)分析的優(yōu)點(diǎn)5.關(guān)聯(lián)分析的方法6.關(guān)聯(lián)分析的兩種策略和發(fā)展趨勢(shì)1.關(guān)聯(lián)分析的概念關(guān)聯(lián)分析:以長(zhǎng)期重組后保留下來(lái)的基因(位點(diǎn))間連鎖不平衡(linkagedisequilibrium,LD)為基礎(chǔ),在獲得群體表型數(shù)據(jù)與基因型數(shù)據(jù)后,采用統(tǒng)計(jì)方法檢測(cè)遺傳多態(tài)性與性狀可遺傳變異之間的關(guān)聯(lián)。其目標(biāo)是找尋可能引發(fā)性狀變異的基因組功能變異基因位點(diǎn)或標(biāo)記位點(diǎn)。2.關(guān)聯(lián)分析的基礎(chǔ)——連鎖不平衡

生物在進(jìn)化的過(guò)程中,對(duì)于某一特定基因座,在自然選擇、人工選擇、重組、突變、遺傳漂變、遷移、群體擴(kuò)張和瓶頸效應(yīng)等因素的影響下,某一“有利”變異(或等位基因)在正向選擇的過(guò)程中被保留下來(lái),因而群體中具有此等位基因個(gè)體的比例將會(huì)不斷增加,成為優(yōu)勢(shì)變異而被固定下來(lái);

同時(shí),攜帶其它等位基因的個(gè)體則會(huì)逐漸減少甚至消失。因此,該基因座的遺傳多樣性就會(huì)急劇下降。由于存在連鎖關(guān)系,該基因座兩側(cè)一定范圍內(nèi)的序列(包括中性基因座)也會(huì)隨著該“有利”等位基因的固定而被大量保留下來(lái),從而使其遺傳多樣性也大大降低。連鎖不平衡概念連鎖不平衡(linkagedisequilibrium,LD),又稱(chēng)等位基因關(guān)聯(lián),是指同一條染色體上,兩個(gè)等位基因間的非隨機(jī)相關(guān)。即,當(dāng)位于同一條染色體的兩個(gè)等位基因(A,B)同時(shí)存在的概率,大于群體中因隨機(jī)分布而同時(shí)出現(xiàn)的概率時(shí),就稱(chēng)這兩個(gè)位點(diǎn)處于LD狀態(tài)。SNP1(A,a)SNP2(B,b)兩個(gè)相鄰的基因(A,B),

他們各自的等位基因?yàn)椋╝,b)。

假設(shè)A,B相互獨(dú)立遺傳,則后代群體中觀察得到的單倍體基因型

AB

中出現(xiàn)的P(AB)的概率為P(A)

*

P(B)。實(shí)際觀察得到群體中單倍體基因型AB

同時(shí)出現(xiàn)的概率為P(AB)。計(jì)算這種不平衡的方法為:

D

=

P(AB)-P(A)

*

P(B)。D

LD(連鎖不平衡)

的基本單位,度量觀察到的單倍型頻率與平衡狀態(tài)下期望頻率的偏差。

LD的度量LD的度量一般不直接使用LD定義式,而對(duì)D進(jìn)行歸一化后,用LD系數(shù)D’和r2進(jìn)行檢驗(yàn)。Dmax=Dmin(PAPb,PaPB)(D>0)Dmin=Dmax(-PAPB,-PaPb)(D<0)r2=D2/(PAPaPBPb)D’的意義

1.當(dāng)D’=1時(shí),這兩個(gè)位點(diǎn)處于完全連鎖不平衡態(tài);2.當(dāng)D’<1時(shí),表示祖先中的完全連鎖不平衡被打破,在群體演化過(guò)程中兩個(gè)位點(diǎn)間發(fā)生了重組;

盡管D’可以測(cè)量連鎖不平衡的強(qiáng)度,但D’值在很大程度上依賴(lài)于樣本的大小,當(dāng)樣本較小,特別是標(biāo)記中有出現(xiàn)頻率很小的等位基因時(shí),D’值將偏高。

因而很難比較不同樣本間連鎖不平衡的水平及衰減程度。當(dāng)值接近1時(shí)表示群體演化中幾乎沒(méi)有重組發(fā)生,而當(dāng)D’值小于1時(shí),不管是用來(lái)測(cè)量連鎖不平衡的大小還是比較不同研究之間連鎖不平衡的強(qiáng)度都需要謹(jǐn)慎使用。

r2的意義1.當(dāng)r2=0時(shí),說(shuō)明兩個(gè)位點(diǎn)之間是完全獨(dú)立的;2.當(dāng)r2=1時(shí),

說(shuō)明兩個(gè)位點(diǎn)無(wú)重組;4種可能單倍型中僅表現(xiàn)2種單倍型(AB,ab)。3.r2在連鎖不平衡作圖中更加有用,因?yàn)槠渚哂休^強(qiáng)的群體遺傳學(xué)理論基礎(chǔ)和一些統(tǒng)計(jì)學(xué)上的優(yōu)勢(shì)

A,aB,b

]]]]AB3(25%)Ab3(25%)aB3(25%)a

b3(25%)D

=

P(AB)-P(A)

*

P(B)

=0.25-0.5*0.5

=0;D’=0;r2=0;表明:兩位點(diǎn)之間無(wú)LD,4種單倍型頻率相等

A,aB,b

AB6(50%)a

b6(50%)D

=

P(AB)-P(A)

*

P(B)

=0.5-0.5*0.5

=0.25;D’=D/Dmax=0.25/(0.5*0.5)

=1Dmax=Dmin(PAPb,PaPB)r2=D2/(PAPaPBPb)

=(0.25*0.25)/(0.5*0.5*0.5*0.5)

=1r2=1,說(shuō)明兩位點(diǎn)之間無(wú)重組;4種單倍型最多只能出現(xiàn)兩種,且等位基因頻率相同;稱(chēng)為完美LD:觀察一個(gè)標(biāo)記即可得到另一個(gè)標(biāo)記的全部信息。

A,aB,b

AB6(50%)a

b3(25%)]]Ab3(25%)D

=

P(AB)-P(A)

*

P(B)

=0.5-0.75*0.5

=0.125;D’=D/Dmax=0.125/(0.25*0.5)

=1Dmax=Dmin(PAPb,PaPB)r2=D2/(PAPaPBPb)

=(0.125*0.125)/(0.75*0.25*0.5*0.5)

=0.33r2=0.33,表示存在LDLinkageDisequilibrium

(norecombination:timeisimportant)ADiseaseOccurredduetoaPointMutation因點(diǎn)突變而引起的疾病HaplotypeThePointMutationInheritedfromGenerationtoGeneration(Pedigree譜系

1)點(diǎn)突變繼承了一代一代timeThePointMutationInheritedfromGenerationtoGeneration(Pedigree2)timeTheCurrentPopulationPhenotypeandHaplotype表型和單體型AmarkeriscorrelatedwiththetraitYouknowthephenotypebutnotthecausalmutation你知道的表型,但不是引起突變的原因DecayofLDwithDistance(LD隨著距離的減弱)1.什么是LD的衰減?

LD的衰減指位點(diǎn)間由連鎖不平衡到連鎖平衡的演變過(guò)程。2.影響LD的因素

突變和重組是影響LD高低的主要因素,LD是由突變產(chǎn)生的多態(tài)形成的,因重組的發(fā)生而打破。

不同物種的LD衰減距離不同,同一作物的不同群體、同一群體的不同基因座的LD衰減距離也不同。3.研究LD的衰減有什么用?

LD的衰減距離決定關(guān)聯(lián)分析時(shí)所需標(biāo)記密度,也在一定程度上決定關(guān)聯(lián)分析的精度DecayofLD(LD的衰減)3.影響關(guān)聯(lián)分析的因素1)樣本的遺傳多樣性2)LD的衰減(decayofLD)3)樣本的大小4)群體結(jié)構(gòu)(populationstructure)5)材料間親緣關(guān)系(Kinship)6)交配體系(CalculatebyGeneticPowerCalculatorPurcelletal.(2003)Bioinformatics,19:149-150).HighGenotype-phenotypeCovariance

高基因型—表型協(xié)方差

Eyecolor眼睛顏色GWASpopulation500Chinese,500European關(guān)聯(lián)分析全體:500中國(guó)人&500歐洲人Populationstructure:Chinesearealike,whileEuropeansarealike.群體結(jié)構(gòu):中國(guó)人是相似的而歐洲人是一致的Chinese:blackeye,blackhair,facialstructure,height,bodyhair,etc.中國(guó)人:黑眼圈、黑頭發(fā)、面部結(jié)構(gòu)、身高、體發(fā)等。

群體結(jié)構(gòu):thenon-randomdistributionofgenotypesamongindividualswithinapopulation(種群中個(gè)體間基因型的非隨機(jī)分布,可能導(dǎo)致基因多態(tài)性位點(diǎn)與性狀的相關(guān)性并非由功能性等位基因引起,從而提供假陽(yáng)性結(jié)果。(b)multi-familysample多家庭樣本(d)samplewithpopulationstructure(c)samplewithbothpopulationstructureandfamilialrelationships群體結(jié)構(gòu)和家族關(guān)系的樣本(e)samplewithseverepopulationstructureandfamilialrelationships(a)idealsamplewithsubtlepopulationstructureandfamilialrelatedness理想的樣本具有微妙的群體結(jié)構(gòu)和家族關(guān)聯(lián)性MAGIC(Multi-parentadvancedgenerationinter-cross)

Population多父代雜交群體.MylesSetal.PlantCell2009;21:2194-2202(A)Thepowerofanassociationtestisafunctionoftheallelefrequencyandtheeffectsize.(B)Theallelefrequencyspectrumfrom3641SNPsgenotypedin25diversemaizeinbredlines()demonstratesthatmostallelesinapopulationarerare.Therefore,ifthefrequencyspectrumoffunctionalallelesissimilartothefrequencyspectrumofrandomSNPs,mostfunctionalalleleswillremainundetectedthroughpopulationmappingbecauseoflowpower.For(A),phenotypedataweresimulatedfor1000haploidsamplesasanormaldistributionwithmean=0and=1foronealleleandmean0+effectsizeand=1fortheotherallele.Effectsizeisthereforedefinedasthedifferencebetweenthemeanphenotypicvaluesofthetwoalleles.Powerisdefinedastheproportionofassociationtests(Pearsoncorrelation)significantatP<0.05outof5000simulateddatasets.RareAlleleIsDifficulttoBedetected罕見(jiàn)等位基因很難被發(fā)現(xiàn)4.關(guān)聯(lián)分析的優(yōu)點(diǎn)1)不需要專(zhuān)門(mén)構(gòu)建作圖群體,自然群體或種質(zhì)資源都可作為研究材料;2)廣泛的遺傳材料可同時(shí)考察多個(gè)性狀大多數(shù)QTL的關(guān)聯(lián)位點(diǎn)及其等位變異,不受傳統(tǒng)的“兩親本范圍”的限制;3)自然群體經(jīng)歷了許多輪重組后,LD衰減,存在于很短的距離內(nèi),保證了定位的更高精確性;AFictionalDepictionofaSimpleGenotype-PhenotypeAssociationTest.ThefunctionalSNPresponsibleforvariationinberrynumberingrapevineisingrayandisnotgenotyped.ThegenotypedSNPslieoneithersideofthefunctionalSNP.ThegenotypedSNPtotherightisinhighLDwiththefunctionalSNP,whilethegenotypedSNPtotheleftisnotinLDwiththefunctionalSNP.Theresultsofasimpleassociationtest(Pearsoncorrelat

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論