版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、基因表達(dá)譜數(shù)據(jù)基因表達(dá)譜可以用一個(gè)矩陣來(lái)表示,每一行代表一個(gè)基因,每一列代表一個(gè)樣本(如圖1)。所有基因的表達(dá)譜數(shù)據(jù)在“gene_exptxt”文件中存儲(chǔ),第一列為基因的entrezgeneid,第261列是疾病樣本的表達(dá),第6276列是正常樣本的表達(dá)。137871-Gene60個(gè)疾病樣本15個(gè)正常樣本圖1基因表達(dá)譜的矩陣表示尋找差異表達(dá)的基因:原理介紹:差異表達(dá)分析是目前比較常用的識(shí)別疾病相關(guān)miRNA以及基因的方法,目前也有很多差異表達(dá)分析的方法,但比較簡(jiǎn)單也比較常用的是Foldchange方法。它的優(yōu)點(diǎn)是計(jì)算簡(jiǎn)單直觀,缺點(diǎn)是沒(méi)有考慮到差異表達(dá)的統(tǒng)計(jì)顯著性;通常以2倍差異為閾值,判斷基因是
2、否差異表達(dá)0Foldchange的計(jì)算公式如下:xFoldC=Disease_Xnormal即用疾病樣本的表達(dá)均值除以正常樣本的表達(dá)均值。差異表達(dá)分析的目的:識(shí)別兩個(gè)條件下表達(dá)差異顯著的基因,即一個(gè)基因在兩個(gè)條件中的表達(dá)水平,在排除各種偏差后,其差異具有統(tǒng)計(jì)學(xué)意義。我們利用一種比較常見(jiàn)的T檢驗(yàn)(T-test)方法來(lái)尋找差異表達(dá)的miRNA。T檢驗(yàn)的主要原理為:對(duì)每一個(gè)miRNA計(jì)算一個(gè)T統(tǒng)計(jì)量來(lái)衡量疾病與正常情況下miRNA表達(dá)的差異,然后根據(jù)t分布計(jì)算顯著性p值來(lái)衡量這種差異的顯著性,T統(tǒng)計(jì)量計(jì)算公式如下:tmiRNAX_XDiseasenormal2/n+s2/nDiseasenormal
3、對(duì)于得到的顯著性p值,我們需要進(jìn)行多重檢驗(yàn)校正(FDR),比較常用的是BH方法(BenjaminiandHochberg,1995)G1G2GmIS1,case二因(l,iXl,case)2i-1S1,廠X1,contrl)2判斷基因在兩種不同條件下的表達(dá)差異是否具有顯著性1,contrlt分布圖q.i自由度為1、気*的瑣布|vn+N212當(dāng)自由度為8時(shí),t分布就是標(biāo)準(zhǔn)正態(tài)分布程序?qū)崿F(xiàn):基因表達(dá)譜數(shù)據(jù)-gene_exp.txtMatlab軟件實(shí)現(xiàn)mRNA差異表達(dá)分析:MATLAB軟件安裝好之后,雙擊系統(tǒng)桌面的MATLAB圖標(biāo),或在開(kāi)始菜單的程序選項(xiàng)中選擇MATLAB快捷方式,即開(kāi)始啟動(dòng)MATL
4、AB。初次啟動(dòng)MATLAB后,將進(jìn)入MATLAB默認(rèn)設(shè)置的桌面平臺(tái)。桌面平臺(tái)包括命令窗口、歷史窗口、當(dāng)前目錄窗口和工作間管理窗口等窗口(如圖2)。工作空間主要包含了目前用戶定義的一些變量,用戶可以在命令窗口執(zhí)行一些特定的命令操作來(lái)完成特定的功能。我們首先將工作目錄選擇到我們數(shù)據(jù)存放的硬盤目錄下,然后導(dǎo)入要分析的基因表達(dá)譜數(shù)據(jù),進(jìn)行差異表達(dá)分析。在命令窗口輸入main_MTDN_end.m程序中的1-21行命令(注意要將程序中的目錄改變到自己數(shù)據(jù)的存儲(chǔ)目錄下),即可得到差異表達(dá)的基因。這段程序主要包含兩個(gè)函數(shù):mattest和mafdr。mattest函數(shù)是進(jìn)行t檢驗(yàn)的,輸入的數(shù)據(jù)為疾病和正常的
5、表達(dá)譜數(shù)據(jù),返回每個(gè)miRNA的T統(tǒng)計(jì)量和對(duì)應(yīng)的p值。這個(gè)參數(shù)還可以利用Permute參數(shù)進(jìn)行隨機(jī)擾動(dòng),Showhist參數(shù)用來(lái)顯示T統(tǒng)計(jì)量和p值的分布。mafdr函數(shù)是用來(lái)計(jì)算FDR的函數(shù),可以利用參數(shù)來(lái)選擇計(jì)算FDR的方法,這里我們利用“BHFDR”參數(shù)來(lái)選擇BH方法對(duì)p值進(jìn)行校正,利用showplot參數(shù)來(lái)顯示FDR的圖示結(jié)果。結(jié)果可以在工作空間窗口中通過(guò)雙擊變量進(jìn)行查看。結(jié)果展示:T-統(tǒng)計(jì)量和p值的分布圖以及FDR:Hiislogramsoft-testRuh&r-abrea処LIIIL1JdgalbELL.nQ.11Ij|jIII111-I.ftI.-io-eq&int-sconeZ
6、QflGIiIiLlL.P-V3bC圖3T-score,P-values以及FDR的分布差異表達(dá)mRNA:我們卡的閾值為FDRvO.l;2倍foldchange(Fold_2or聚類分析結(jié)果展示:A聚類做heatmap,我比較喜歡用pheamap,簡(jiǎn)單又好看,但是很多做heatmap的函數(shù)都不帶輸出聚類后基因名字的功能。heatmap旁標(biāo)注基因是很有用的信息論文中經(jīng)常會(huì)用到,所以我們可以更改pheatmap的源代碼,讓它輸出基因列表其實(shí)如果能夠給出基因list,在heatmap旁邊標(biāo)注出list中的基因就好了,但有了基因列表也可以做這個(gè)事情。從eran上下載pheatmap的源代碼,打開(kāi)phe
7、atmap的R文件夾中pheatmap.R文件,在一大串#上面添加write_matrix=funetion(mat,out_file)write.table(as.data.frame(mat),sep二t,quote二FALSE,file=out_file)在一大串#下面的pheatmap中添加out_file=NA,此乃默認(rèn)參數(shù)設(shè)定。在helust之后,就是當(dāng)cluster_mat函數(shù)處理了mat矩陣后,添加if(!is.na(out_file)write_matrix(mat,out_file)*割線*打開(kāi)Rstudio,tools-installpackages-選擇那個(gè)壓縮包ok啦用法:setwd(F:/project/PTEN/01.RPKM/correlation)dataframepheatmap(
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 小區(qū)空調(diào)協(xié)議書
- 賬戶代掛協(xié)議書
- 藥材質(zhì)保協(xié)議書
- 要賬公司協(xié)議書
- 資產(chǎn)認(rèn)購(gòu)協(xié)議書
- 小三還錢協(xié)議書
- 要錢分成協(xié)議書
- 裝飾延期協(xié)議書
- 資金參股協(xié)議書
- 小麥出口協(xié)議書
- 2026年動(dòng)物檢疫檢驗(yàn)員考試試題題庫(kù)及答案
- 中國(guó)淋巴瘤治療指南(2025年版)
- 2025年云南省人民檢察院聘用制書記員招聘(22人)考試筆試模擬試題及答案解析
- 療傷旅館商業(yè)計(jì)劃書
- 臨床腫瘤診療核心技巧
- 購(gòu)買電影票合同范本
- 2025西部機(jī)場(chǎng)集團(tuán)航空物流有限公司招聘考試筆試備考題庫(kù)及答案解析
- 2025年廣西公需科目答案6卷
- 生化檢測(cè)項(xiàng)目原理及臨床意義
- 玉米秸稈飼料銷售合同
- DGTJ08-10-2022 城鎮(zhèn)天然氣管道工程技術(shù)標(biāo)準(zhǔn)
評(píng)論
0/150
提交評(píng)論