R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座_第1頁
R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座_第2頁
R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座_第3頁
R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座_第4頁
R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座_第5頁
已閱讀5頁,還剩16頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第1頁遺傳與疾病人類一些性狀及部分疾病與人體遺傳原因親密相關(guān)說明遺傳原因與人體疾病或健康狀態(tài)關(guān)系有非常主要意義遺傳統(tǒng)計(jì)學(xué)在這其中起著至關(guān)主要作用R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第2頁遺傳與疾病R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第3頁疾病易感基因研究R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第4頁研究特點(diǎn)搜集數(shù)據(jù)即包含普通表型數(shù)據(jù)也包含基因型數(shù)據(jù)數(shù)據(jù)分析時需要用到不一樣遺傳模型需要一些遺傳統(tǒng)計(jì)特有分析方法:LD計(jì)算,家系圖繪制等R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第5頁R在遺傳統(tǒng)計(jì)中應(yīng)用數(shù)據(jù)整理獲取位點(diǎn)基本信息Hardy-Weinberg平衡檢驗(yàn)連鎖不平衡計(jì)算關(guān)聯(lián)研究慣用分析方法家系圖繪制……R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第6頁數(shù)據(jù)整理R中g(shù)enetics包專門為基因型數(shù)據(jù)提供一個新類—genotypegenotype函數(shù)是genetics包里最基本函數(shù),能夠?qū)⒁韵滤姆N形式初始基因型數(shù)據(jù)轉(zhuǎn)換成便于分析帶有g(shù)enotype類數(shù)據(jù)R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第7頁以一個字符分隔向量

g1<-genotype(c('C-C','C-T','C-C','T-T','C-C',''),sep='-')2.能夠按某一位置分隔向量

g2<-genotype(c('DD','DI','DD','II',''),sep=1)3.兩個分開向量

allele1<-c('D','D','D','I','')allele2<-c('D','I','D','I','')g3<-genotype(allele1,allele2)R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第8頁4.數(shù)據(jù)框或矩陣中兩列

data<-data.frame(allele1=c('D','D','D','I',''),allele2=c('D','I','D','I',''))g4<-genotype(data$allele1,data$allele2)

data1<-cbind(allele1=c('D','D','D','I',''),allele2=c('D','I','D','I',''))g5<-genotype(data1)R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第9頁獲取位點(diǎn)基本信息多態(tài)位點(diǎn)基本信息包含:位點(diǎn)分型成功率(callrate)、等位基因頻率、基因型頻率、雜合度和多態(tài)信息含量(PIC)一個簡單例子:#載入popn數(shù)據(jù)data(popn,package="DGCgenetics")

#獲取A位點(diǎn)基本信息summary(popn$A)Numberofsamplestyped:1489(96.9%)AlleleFrequency:(2alleles)CountProportion117860.6211920.4NA94NAGenotypeFrequency:CountProportion1/27040.472/22440.161/15410.36NA47NAHeterozygosity(Hu)=0.4802686Poly.Inf.Content=0.3648558R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第10頁Hardy-Weinberg定律Hardy-Weinberg定律是由英國數(shù)學(xué)家哈迪(D.H.Hardy)和德國醫(yī)生溫伯格(W.Weinberg)于1908年分別獨(dú)立發(fā)覺,也稱遺傳平衡定律~(geneticequilibriumlaw)該定律能夠簡單描述為,遺傳平衡群體等位基因頻率與基因型頻率在世代間維持恒定該定律適用條件是:隨機(jī)婚配,群體足夠大,沒有突變、選擇、遷移和遺傳漂變R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第11頁Hardy-Weinberg平衡檢驗(yàn)關(guān)聯(lián)研究中Hardy-Weinberg平衡檢驗(yàn)常被用來評價基因分型質(zhì)量。我們通常對病例和對照組分別進(jìn)行Hardy-Weinberg平衡檢驗(yàn)假如某一位點(diǎn)在對照組中不符合Hardy-Weinberg平衡,我們通常會懷疑該位點(diǎn)基因型判定質(zhì)量假如該位點(diǎn)在對照組平衡而在病例組出現(xiàn)不平衡,則該位點(diǎn)可能和疾病相關(guān)R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第12頁Hardy-Weinberg平衡檢驗(yàn)genetics包里面提供兩種不一樣檢驗(yàn)方法一個是Pearson‘schi-squaretest,能夠用HWE.chisq函數(shù)進(jìn)行該檢驗(yàn),另一個是Fisherexacttest,對應(yīng)于HWE.exact函數(shù)HWE.chisq慣用于MAF較高、樣本量較大場所;MAF較低位點(diǎn)提議使用HWE.exact函數(shù)R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第13頁LD計(jì)算連鎖不平衡則是指人群中兩個位點(diǎn)處于同一個單體型頻率比期望值高評價連鎖不平衡程度指標(biāo)包含D'、r2等genetics包提供計(jì)算LD各種指標(biāo)函數(shù),并能以文字和圖形兩種形式顯示位點(diǎn)間連鎖不平衡程度R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第14頁LD計(jì)算#用LD函數(shù)計(jì)算位點(diǎn)間LDldresult<-LD(popn)#用文字顯示D'值summary(ldresult,which="D'")#用圖形顯示結(jié)果LDtable(ldresult,which="D'")PairwiseLD-----------BCDAD'0.9790.9760.976BD'0.9980.991CD'0.997R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第15頁關(guān)聯(lián)研究慣用分析方法卡方檢驗(yàn)Logistic回歸線性回歸……R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第16頁卡方檢驗(yàn)>data(popn,package="DGCgenetics")#首先載入popn數(shù)據(jù)>(geno<-table(popn$A,popn$affected))ControlCase1/12612801/24062982/216183>chisq.test(geno)Pearson'sChi-squaredtestdata:genoX-squared=23.7385,df=2,p-value=7.003e-06>(alle<-allele.table(popn$A,popn$affected))

popn$affectedpopn$AControlCase19288582728464>chisq.test(alle)

Pearson'sChi-squaredtestwithYates'continuitycorrectiondata:alleX-squared=23.6881,df=1,p-value=1.133e-06R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第17頁Logistic回歸1.共顯性模型>summary(glm(affected~A+sex,family=binomial,data=popn))Call:glm(formula=affected~A+sex,family=binomial,data=popn)DevianceResiduals:Min1QMedian3QMax-1.4081-1.2428-0.65151.11341.8190Coefficients:EstimateStd.ErrorzvaluePr(>|z|)(Intercept)-0.65890.1354-4.8681.13e-06***A1/2-0.37520.1234-3.0410.00236**A2/2-0.78320.1695-4.6203.84e-06***sexFemale1.18660.13358.890<2e-16***R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第18頁Logistic回歸2.加性模型>summary(glm(affected~allele.count(A,'2')+sex,family=binomial,data=popn))Call:glm(formula=affected~allele.count(A,"2")+sex,family=binomial,data=popn)DevianceResiduals:Min1QMedian3QMax-1.410-1.239-0.6551.1171.814Coefficients:EstimateStd.ErrorzvaluePr(>|z|)(Intercept)-0.653960.13054-5.0105.45e-07***allele.count(A,"2")-0.388170.08107-4.7881.69e-06***sexFemale1.186760.133498.890<2e-16***R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第19頁Logistic回歸3.顯性或隱性模型>summary(glm(affected~carrier(A,'2')+sex,family=binomial,data=popn))Call:glm(formula=affected~carrier(A,"2")+sex,family=binomial,data=popn)DevianceResiduals:Min1QMedian3QMax-1.4078-1.1979-0.74651.15711.6817Coefficients:EstimateStd.ErrorzvaluePr(>|z|)(Intercept)-0.65660.1352-4.8571.19e-06***carrier(A,"2")TRUE-0.47880.1164-4.1153.87e-05***sexFemale1.18350.13328.884<2e-16***R語言在遺傳統(tǒng)計(jì)學(xué)中的應(yīng)用專家講座第20頁家系圖繪制library(kinship)#載入kinship包p1<-scan(nlines=6,what=list(0,0,0,0,0,0))1100101102111101001

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論