下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
(statastataSASSPSS應該一通百通,除了編程代第一Stata概機資源中心(ComputerResourceCenter)19851998的十四年時間里,已連1.1,1.2,1.3,1.4,1.5,……2.0,2.1,3.0,3.1,4.0,5.0,6.0等多個版WORD等直接調用。Stata Stata640k內存的微機,3.1Stata2400個記錄×99個變量,并隨計算機擴展內存的增加而4.0WINDOWS版本,Stata4800個記錄×99WINDOWS95下的5.0版本,可根據(jù)計算機的配置情況設置變量數(shù)和記錄數(shù),如32M擴展內存的計算機,可處理2千萬個數(shù)據(jù)。變量數(shù)和記錄數(shù)可以互相交易(trade),即減少記錄數(shù)可可以將分組變量轉換成指示變量(啞變量)可以對數(shù)據(jù)文件進行橫向和縱向,可以將行數(shù)據(jù)轉為列數(shù)據(jù),或反之可以恢復、修改執(zhí)行過令StataStata20法,如Cox比例風險回歸,指數(shù)與Weibull回歸,多類結果與有序結果的logistic回歸Poisson回歸、負二項回歸及廣義負二項回歸,隨機效應模型等。具體說,Stata具有如 數(shù)值變量資料的一般分析:參數(shù)估計,t分類資料的一般分析:參數(shù)估計,列聯(lián)表分析(2檢驗,列聯(lián)系數(shù),確切概率)元線性回歸,逐步回歸,回歸,穩(wěn)鍵回歸,二階段回歸,百分位數(shù)(中位數(shù))回歸,殘 度分析:條件和非條件的logistic回歸,多類結果與有序結果的logistic回歸,ProbitlogisticPoisson回歸,等。生存分析:基線生存曲線的估計、相對度的估計,Kaplan-Meier生存曲線、表分析,對數(shù)秩檢驗,Man-Haenszel檢驗,Wilcoxon-Gehan檢驗,Cox比例風險模型,正TobitWeibull回歸,等。三、Stata的作圖功能Stata的作圖模塊,主要提供如下八種基本圖形的制作:直方圖(histogram),條形圖(bar),Stata如矩陣的加、積、逆、Cholesky分解、Kronecker內積等;還提供了一些高級運算,如特盡管Stata的容量最大只容許400400的矩陣(默認為4040),用它來完成日常工作中的Stata所欲。事實上,Stata的ado文件(高級統(tǒng)計部分)Stata自己的語言編寫的。下面這n個參數(shù)為的Poisson分布的隨機數(shù)。progdefine/*setobs/*setseed/*設置隨機數(shù)gen/*定義變量rpPoissonlocal/*lamda0=exp(local/*while`j’<`2’+1j<n循環(huán),jjPoissonlocallocalwhile`i’>0ilocalr1=均勻分布的隨機localif`r0’<localn0=`i’-n0=i-locali=-i=-}locali=i}quietreplacerp=`n0’ifjlocalj=j}§1.3DOSStataStataautoexec.batDOS下任何位Statad:\盤上進行。進入Stata后,屏幕顯示Stata的版本號,公司所在地等信息,Dos版本下的Stata即出現(xiàn)Stata的各種命令。若已在Stata狀態(tài)讀入了數(shù)據(jù),并且已將數(shù)據(jù)按Stata指令存盤,或讀入的數(shù)據(jù)雖經(jīng)分析,.inputxxy1.1..即可退出Stata動修改數(shù)據(jù)結構,如按某變量排序等),這時,Stata將退出Stata狀態(tài)。若確實不需要存盤而退出Stata,可鍵入:.(e為exit的簡寫)即可強行退出Stata.drop.WINDOWS版本的Stata的進入和退出在桌面上雙擊Wstata的圖標:StataStataFileexitStata。如數(shù)據(jù)未存盤,Stata給出如下提示:“Datahaschangedwithoutbeingsaved.Doyoureallywanttoexit?”(數(shù)據(jù)已改變,但未存盤,是否真的要退出?)如要退出,則按確定,否則按取WINDOWS令退出StataStata可以從鍵盤輸入數(shù)據(jù),也可以從文件讀入數(shù)據(jù)。WINDOWS下的Stata還可以用x12345y5.56.. 142345Statad:\mydata\子ex1.dta,命令為:.savefiled:\temp\ex1replace.dta該指令在d:盤的mydata子 中建立了一個名為“ex1.dta”的Stata格式的數(shù)據(jù)文件。后綴dta是Stata內定的數(shù)據(jù)格式文件。該格式文件只能在Stata中用use命令打開:.use 中已有相同文件名的文件存在,則該命令將給出如下信息:filed:\mydata\ex1.dtaalreadyexists,告訴用戶在該目標盤及子 如欲覆蓋已有文件,則加選擇項replace。命令及結果如下:.saved:\mydata\ex1,replacefiled:\temp\ex1.dtasaved這樣,Stata在d:盤的mydata子 Stata在屏幕上顯示的運行結果有兩種,一種是純字符型的(如方差分析結果,回歸分析結log.logusingresult1Stata自動加上后綴“.log”,亦可由用戶自己加上其他后綴。執(zhí)行該指令后的所有操作指令和文字結果(help下顯示的結果)將記錄在結果文件“result1.log”中。若執(zhí)行某一指令后的結果沒有必要記錄下來,則可事先用指令“l(fā)ogoff”暫停記錄,需要記錄時再用“l(fā)ogon”繼續(xù)記錄,最后用“l(fā)ogclose”關閉文件。如果結果文件“result1.log”已經(jīng)存在,用“l(fā)ogusingresult1”result1.logresult1.logreplace。即鍵入:.logusingresult1,.logusingresult1,文件“result1.log”可在EDIT、PE2、WPS或WORD等字處理軟件下編輯、打印,也可DOS下用type或print命令通過顯示器瀏覽 輸出硬拷貝若要將圖形結果打印下來,需要在繪圖指令中加上“saving”1.1中xy的散點圖并存入文件“ex1.gph”,可用下述指令.graphyx,c(l)這時屏幕上顯示y與x的散點圖,并將被存入d:\mydata\子 “ex1.gph”(gph是Stata內定的圖形文件后綴,用戶亦可自己定義后綴名)。該圖形可在Stata狀態(tài)用“graphusingd:\mydata\ex1”重新顯示在屏幕上,可在File的PrintGraphDOS版本的Stata可在DOS提示符下用“gphdot”D:\MYDATA>gphdot Stata的操作方Stata狀態(tài)直接鍵入指令,每輸入一個指令,Stata執(zhí)行一個,這種方式稱為交互式操例 用例1.1數(shù)據(jù)建立回歸方程.use..regy 令文件(文本格式,即ASCII碼),并仔細核對分析內容、命令格式,直至組織數(shù)據(jù)文件的合理性等,修改好后再在Stata狀態(tài)執(zhí)行該命令文件。例 用非交互式操作對例1.1數(shù)據(jù)進行相關和回歸分析setmore/*指定結果窗口中,當輸出結果滿一屏后,不再顯示--logusinguse/*gray/*yxcoryyxregyyxlogsetmore/*指定結果窗口中,當輸出結果滿一屏后,顯示-,直到按任意鍵后,再顯示下一第二步,在Stata狀態(tài)鍵入.doStata執(zhí)行這些命令是自動的,不間斷的。 Stata的幫助功 helpStataHelp此時輸入需要幫 ,如regress,按OK即可得到幫助StatahelpcontentsStata的全部命令及其簡單解釋;或在幫助窗口按Contents,則出現(xiàn)如下的幫助內容窗口。 令時,用菜單操作更好。Stata的常用命令見附錄。下面以多元線性回歸命令為例,介紹Stata 欲得到命令格式,鍵入helpregress即可得到:[byvarlist:]regress[depvar[varlist1[(varlist2)]]][weight][ifexp][inrange][,level(#)betahasconsnoconstantnoheadereform(string)depname(varname)mse1]命令中,[]這里介紹命令的公共選擇部分,該命令 選擇項將在相應章節(jié)作介紹byvarlistvarlistgroup,且1,2,3,4,則“bygroup:”Statagroup=1,group=2,group=3和group=44個回歸方程。在選用該選擇項前,要對變量排序,即先執(zhí)行.sort ifexp,if /*group=1if /*group>2ifgroup==1| /*對滿足group=1或group=2if /*group3ifgroup==1& /*group=1,sex=0inrange,指定觀察值的范圍,對在范圍內的觀察值作分析。下列語句是合法的:in1/25 /*對觀察值范圍為1~25號的觀察值作分析in /*26~44in26/l /*對觀察值范圍為26~最后(last)的觀察值作分析in5/l /*對最后5個觀察值進行分析另外一個選擇項,也可用于很多命令,它就是for。例如,在作回歸分析時,自變量為x1,x2,…,x2222變量,而因變量有y1,y2,…,y10,z1,…,z515個變量。欲分別建立每個yizix1,x2,…,x2215for選擇項只需一個命fory1-y10z1-z5:regress@x1-命令中,for后面的變量是選定的,regress是作回歸分析,@是替換符,Statafory*:summ本節(jié)STATA命令摘要[[1]]input12…(end結束)infile12…musing(save路徑](STATAdta,replaceFileSAVEasSAVE進行操作)outfileusing路徑](raw,replace)調用已存的STATA格式文件use路徑](Fileopengen=修改變量值replace=[in][if((miningdata)STATA(ASC)讀入數(shù)據(jù)和在DOSFoxStata1命令格式:input12…10(<>,pp蛋在下列STATAx1x2STATA令1.inputinputx1x2113140150150135128100100110120130123STATA命令:infile12…musing路徑]如:上例數(shù)據(jù)已以文本方式存在C:\user子 STATAinfilex1x2usingSTATAsave 中存盤(STATA格式的數(shù)據(jù)文件的缺省擴展名為如果ex1.dta在當前 在的文件ex1.dta,則:saveex1.dtac:\usersavesavec:\user\ex1.dta,STATAoutfile12…musing路徑]文本數(shù)據(jù)文件名[,replace]相同的文件STATA文本數(shù)據(jù)文件ex1.txt并存入c:\user,則:STATA令outfilex1x2usingc:\userex1.txt,并打算用當前STATA蓋它。則outfilex1x2using(STATASTATA數(shù)據(jù)文件)use]STATAclear子命令,表示清除原如:調用在c:\user 下的ex1.dtaSTATA系統(tǒng)數(shù)據(jù)文件,則useuse注意:use與save是一對調用STATA系統(tǒng)數(shù)據(jù)文件和以STATA系統(tǒng)格式存 令infile和outfile也是一對調用外部文本數(shù)據(jù)文件和以文本文件格式存 令STATAgen新變量名=STATAx1x2的數(shù)據(jù),因此需要genx=x1-STATAreplace變量=[if邏輯表達式in范圍x999STATA缺省值的記號,所有大于1002;x10051;x5的所0。replacex=.ifreplacereplacex=0ifreplacex=1ifx>5&x<=100[2]replacex=2ifx>100第二章描述性統(tǒng)計命令與輸出結果STATAby分組變量:]summarize12…變量名m[,detail]ci12…m[,level(#)binomialpoissonexposure(varname)by(ciilevel(#)tab1變量名[,generate(變量名)](衛(wèi)生統(tǒng)計學,1978,p21):組變量group=0表示患者組和group=1表示健康組(如:患者組中第一個數(shù)據(jù)為2.6,x=2.6,group=0;又如:健康組中第三個數(shù)據(jù)為1.98,則x為1.98以及group為1),STATAex2a.dtasummarizeuseex2,clearsummarizex1x2Variable|ObsMeanStd.Dev.Min++x1|114.7109091.3029772.6x2|133.3546151.3043681.673.35461.30441.675.78。計算資料均數(shù),標準差,中位數(shù),低四分位數(shù)和高四分位數(shù)令summarize以及子命令detail,仍以述資料為例:useex2,clearsummarizex1x2,detailPercentilesSmallest()1%2.62.65%2.610%3.243.73Obs11(樣本數(shù)25%3.73低四分位3.73SumofWgt50%4.73中位數(shù)最大值Mean4.710909(均數(shù))LargestStd.Dev.1.302977(標準差)75%5.78(高四分位90%6.45.78Variance1.697749方差95%6.536.4Skewness 99%6.536.53Kurtosis1.809951峰度④Percentiles1%1.675%1.6710%1.981.98Obs25%①2.332.33SumofWgt.50%②3.6Mean⑤LargestStd.Dev.1.30436875%③4.174.1790%4.824.57⑥Variance95%5.784.82⑦Skewness99%5.785.78⑧Kurtosis由上述結果可知:summarize命令并使用子命令detail,不僅可以得到各變量資料的均和⑥標準差,而且可以得到主要的非參數(shù)描述指標:①低四分位(lowerquartile),②中位(Median)以及③高四分位(upperquartile)。對于非正態(tài)資料,一般不應用均數(shù)±標準差進描述,而應使用中位數(shù)以及(低四分位-高四分位,稱interquartilerange,IQR)進行描若調用ex2a.dta文件,進行描述性統(tǒng)計,可用下列命令usesortgroup(group)bygroup:summarizex->group=xPercentiles1%2.65%2.610%3.243.73Obs25%3.733.73SumofWgt.50%4.73MeanLargestStd.Dev.1.30297775%5.785.5890%6.45.78Variance95%6.536.4Skewness-99%6.536.53Kurtosis->group=1PercentilesSmallest1%1.671.675%1.6710%1.981.98Obs25%2.332.33SumofWgt.50%3.6MeanLargestStd.Dev.1.30436875%4.174.1790%4.824.57Variance95%5.784.82Skewness99%5.785.78Kurtosis[2]95%可信限計算:ci0-1ci變量名poissonci90%90%()正態(tài)數(shù)據(jù):ci變量名,level(90)0-1ci變量名level(90poissoncilevel(90)ex2.dtax1,x295use①②③Variable|ObsMeanStd.Err.[95%Conf.+||..95%x195[3.8356,5.5863],x2的95[3]95cii90401295%cii9040Variable|ObsMeanStd.Err.[95%Conf.+|90401.26491137.4866590%[37.48665,cii9040Variable|ObsMeanStd.Err.[90%Conf.+|90401.26491137.89752STATAtab1[,g(因為該命令主要適用描述計數(shù)資料(即:屬性資料),當使用子命令g(新變量)這些指示變量作為亞元變量進行分析。例:50510養(yǎng)一定時間后,測定鼠肝中的鐵的含量(mg/g)各組鼠肝中鐵的含量是否有顯著性差別(摘自醫(yī)學統(tǒng)計方法,金丕煥主編,p220)。用x表示鼠肝中鐵的含量以及用group=1,2,3,4,5分別表示對應的5個組。11111111111222222222263333333333444444444435555555555tab1->tabulationof①②group|Freq.Percent+1|1020.002|1020.003|1020.004|1020.005|1020.00+Total|50比;③為累計百分比。50510樣本數(shù)的10%。因為使用了子命令g(a),從而產生5個指示變量(a1,a2,a3,a4a5a11資料:即:當資料屬于第1組的(group=1),則a1=1;其它組的資料(group11)a1=0a22a3,a4和a5相應分別指示第3,4,5組的資料(詳細見下表)。1111111111111111111110000000000000000000000000000000000000000222222222200000000001111111111000000000000000000000000000000600000000000000000000[1][1]分布。正[2]可11111111110000000000000000000033333333334444444444000000000000000000000000000000111111111100000000003555555555500000000000000000000000000000000000000001111111111算相應0.95中,獨立地抽樣10095%9595%所對應[3]為立即命令第三態(tài)檢驗與作圖STATAswilkswilk12…mgraph變量名[,bin(#)]graph12[,在t檢驗、方差分析、線性回歸、相關系數(shù)等檢驗中,都假設數(shù)據(jù)服從正態(tài)分布,因此需要對數(shù)據(jù)作正態(tài)性檢驗。一般需要從頻數(shù)分布直方圖上考察數(shù)據(jù)是否偏態(tài)以及用Shapiro-Wilk方法進行正態(tài)檢驗。因為僅使用Shapiro-Wilk方法進行正態(tài)性檢驗,雖然能了解數(shù)據(jù)整體分布情況,但不能了解少量數(shù)據(jù)偏態(tài)情況,而性判斷。以下以ex2.dta數(shù)據(jù)為例,進行正態(tài)檢驗。useex2.dta,clearswilkx1x2Shapiro-WilkWtestfornormal①Variable|ObsWVzPr>+x1|110.962630.605-0.856x2|130.930791.2190.388H0:p值,若p值<0.05graph#15graph1m(31)graph12…mc(c1…cmc(c1…cm)為連接設置:c1…cm為對應m()l點與點之間用直線連接?LsOO(STodp.i例:graphy1y2x,c(l.)則:y1xy2x線圖為散點圖且用小菱形表示這些散點。第四t檢驗和單因素方差分析(上STATAttestvarname=ttestvarname1varname2unequalunpairedttestvarname,by(分組變量)[unequal]ttestittesti111222unequal]sdtest1=2onewaymeansbonferronischeffesidaktN(m,s2)H0m=m0ttest=#(#m0)10如下(數(shù)據(jù)摘自金丕煥主編<醫(yī)用統(tǒng)計方法>,pp37):ex1.dta(x1數(shù)據(jù)為x2),問:患者治療前后的血紅蛋白是否有顯著改變?gend=x2-H0t(ttest①Variable|ObsMeanStd.+d|10 Ho:mean=③t=1.31with9④Pr>|t|=上準tp[1]結果(t)tttSTATAttest1=ex1.dta)usettest |ObsMeanStd.+x1|1012.59x2|1013.27+diff.|10- Ho:diff=0(paireddata)t=-1.31with9d.f.Pr>|t|=t對于兩組數(shù)據(jù)的t檢驗,要求兩組數(shù)據(jù)均服從正態(tài)分布,兩組(不能應用兩組數(shù)據(jù)的t檢驗)。STATA令ttest1=2,ttest1=2,unequal(x1x2入ex2.dta文件中)。H0:相同。useex2.dta,ttestx1=x2,unpaired(①Variable|ObsMeanStd.+x1|114.710909x2|133.354615+③combined|243.97625Ho:mean(x)=mean(y)(assumingequal④t=2.54with22⑤Pr>|t|=tt值;⑤Ho的tpp=0.0187(<0.05)[2]本例也可以使用ex2a.dta(在STATA如何輸入數(shù)據(jù)這一)x分組變量group表示健康組(group=1)或患者組(group=0),則:useex2a.dta,clearttestx,by(group)|ObsMeanStd.+①0|114.7109091|133.354615+combined|243.97625Ho:mean(x)mean(y)(assumingequalvariances)t=2.54with22d.f.Pr>|t|=0.0187group=0group=1ttestunequal.ex2a.dta方差不滿足齊性要求(僅僅是假設而已,實際上兩組方差是齊性的),則usettestx,by(group)Variable|ObsMeanStd.+0|114.7109091|133.354615+combined|24Ho:mean(x)mean(y)(assumingunequalvariances)t=2.54with21.35Pr>|t|=tt(t)ptm=m0STATAttesti#m01.280.92210.2ttesti211.280.92|ObsMeanStd.+x|211.28Ho:mean=t=5.38with20d.f.Pr>|t|=0.0000t5.3820p<0.0001顯著地大于0.2。STATA命令為:ttesti11122211101.91412.82.3若兩組假定方差齊性,則:ttesti11101.91412.8Variable|ObsMeanStd.+x|1110y|1412.8+combined|2511.568Ho:mean(x)=mean(y)(assumingequalvariances)t=-3.25with23d.f.Pr>|t|=tttesti11101.91412.82.3,Variable|ObsMeanStd.+x|1110y|1412.8+combined|25Ho:mean(x)=mean(y)(assumingunequalvariances)t=-3.33with22.92d.f.Pr>|t|=STATAsdtest1=2sdtestby()ex2.dtax1x2(性),則:usesdtestx1=x2(①Variable|ObsMeanStd.+x1|114.710909x2|133.354615+combined|24.③Ho:sd(x)=sd(y)(two-sided④F(12,10)=⑤2*(Pr>F)=F值;⑤Hop值(p于1p11)p<0.05x1和x2p0.05近1,ex2a.dtax(group)useex2a.dta,clearsdtestVariable|ObsMeanStd.+0|114.7109091|133.354615+combined|24.Ho:sd(x)=sd(y)(two-sidedtest)F(12,10)=1.002*(Pr>F)=ex2.dta和ex2a.dta[1](Ho)p值。pHopHo[2]t驗這個變量總體均數(shù)是否大于另一個變量的總體均數(shù),但是t檢驗統(tǒng)計量結果與這兩個均數(shù)的差的95%可信限一一對應:t檢驗的p值<0.05,則對應的兩個均數(shù)的差的95%可信限不包含095%0tp<0.05;們的樣本均數(shù)的差<0以及t檢驗的p值<0.05,則95%可信限的兩個區(qū)間邊界均為負數(shù)。由于95%可信限是總體均數(shù)的區(qū)間估計,因此兩個總體均數(shù)的差<0的概率不小于0.95;反之若樣本均數(shù)的差>0以及t檢驗的p值<0.05,則95%可信限的兩個區(qū)間邊界均為正數(shù),因此兩個總體均數(shù)的差>0的概率不小于0.95。由兩個總體均數(shù)之差大于0或小于0,便可得知哪一個變量的總體均數(shù)更大一些。t··單因素方差分析又稱為OnewayANOVA,用于比較多組樣本的均Ho:STATA中可用命令:onewaymeansbonferroni例:測定健康男子各年齡組的淋巴細胞轉化率(%),結果見表,(資料摘自衛(wèi)生統(tǒng)計學,四川醫(yī)學院主編,p30)(%)11-20歲組:58616162636870707441-50545757586060636461-7543525556x11-2041-5061-75x111111111122x222222233333STATAonewayxgroup,mean|Summaryofxgroup|Mean+1|2|3|+Total|61.25ysisofSourceSSdfMSFProb>③④⑤⑥Betweengroups616.3111112308.1555569.77⑧⑨Withingroups662.18888921Total1278.5023Bartlett'stestforequalvariances:chi2(2)=2.1977Prob>chi2=0.333ComparisonofxbygroupRowMean-|ColMean|1|2|-6.61111|0.054|3|- -| ①為對應三個年齡組的淋巴細胞轉化率的均數(shù);②三組合并在一起的總的樣本均數(shù);③組間離均差平方和;④組間離均差平方和的自由度;⑤組間均方和(即:⑤=③/④);⑧組內離均差平方和;⑨組內離均差平方和的自由度; 組內均方和(即:=⑧/⑨);⑥為F統(tǒng)計值(即為⑤/ );⑦為相應的p值; 為方差齊性的Bartlett抯檢 方差齊性檢驗相應的p值; 第二組的淋巴細胞轉化率樣本均數(shù)-第一組的淋巴細胞轉化率的樣本均數(shù)的差; 第二和第一組均數(shù)差的顯著性檢驗所對應的p值; 第三組的淋巴細胞轉化率樣本均數(shù)-第一組的淋巴細胞轉化率的樣本均數(shù)的差;p值;-數(shù)的差;第三和第二組均數(shù)差的顯著性檢驗所對應的p值。似服從正態(tài)分布,無效假設Ho檢驗所對應的p值<0.01,可以認為這三組均數(shù)有顯著差異。由Bonferroni統(tǒng)計檢驗結果表明:第一組淋巴細胞轉化率顯著地高于第三組淋巴細胞轉化率(p<0.005),其它各組之間均數(shù)無顯著性差異。第五章STATAranksumby(分組變量kwallisby(分組變量Mann,WhitneyandWilcoxon料的中位數(shù)是否有差異。STATA命令為:ranksumby((金丕煥主編,p218)。表中用x表示雌鼠體重增加(克),用group=1表示高蛋白飼料組以及用group=2表示低蛋白飼料組。x1111111111x112222222Ho:ranksumx,Test:Equalityofmedians(Two-SampleWilcoxonRank-①SumofRanks:49.5(group==2)ExpectedSum:70②③z-statistic-Prob>|z|0.0832()70zp在本例中,雖然第二組的秩和為49.5而期望值估計為70,但p0.0832白飼料喂養(yǎng)能明顯增加雌鼠的體重。(布(即:至少有一組的資料均不服從正態(tài)分布)或各組的資料方KruskalandWallis(Ho:數(shù)相同)。STATA命令為:kwallisby(分組變量例:50510(mg/g)各組鼠肝中鐵的含量是否有顯著性差別(摘自醫(yī)學統(tǒng)計方法,金丕煥主編,p220)。用x表示鼠肝中鐵的含量以及用group=1,2,3,4,5分別表示對應的5個組。 1 11111111 22222222 6 33333333 44444444 3 55555555x,Test:Equalityofpopulations(Kruskal-Wallis①group_Obs110210310410510chi-squared=27.856bability=0.0001c2驗所對應的p值。本例結果表明:5組的中位數(shù)有顯著的差異。即:5個不同飼料量與喂養(yǎng)的飼料有關。作者:登:醫(yī)學統(tǒng)計STATA命令摘要[by分層變量名:]tab212[,allchi2exactcellcolumnrow]tabi#1112[#21#22allchi2exactcellcolumnrow]·STATA令[by分層變量tab212,allchi2lichi2exactcellcolumn上述命令中,變量12為列計數(shù)變量;all表示卡方(c2)檢驗,似然比(likelihoodratio)檢驗以及一些統(tǒng)計描述指標和Fisherexact表示Fisherchi2表c2lichi2likelihoodratiocell示每個觀察計數(shù)值占該列聯(lián)表總觀察計數(shù)值的比例;row表示輸出的列聯(lián)表中顯示每個觀察計數(shù)值占該觀察計數(shù)值所在行coloumn每個觀察計數(shù)值占該觀察計數(shù)值所在的列各觀察計數(shù)值總數(shù)的比例。“”()group=1表示肝癌組患者和group=2custom=1custom=2飲用醋冷水和飲用醋冷水和custom=3表示從不飲用醋冷水。具體資料為:(摘自醫(yī)學統(tǒng)計方法,金丕煥主編,p163)。組 經(jīng) 偶 從不飲 合肝癌 健康 合 "",""""檢驗患肝癌是否與飲水習慣有關。tab2groupcustom,row->tabulationofgroupby|group|123| 1|①264428||②26.5344.9028.57| 2|③284917||④29.7952.1318.09| Total|⑤549345||⑥28.1248.4423.44|Pearsonchi2(2)=2.9497Pr=()3(健康組)的3個觀察數(shù);④該行表示第二組的各個觀察數(shù)的占三個分類:“經(jīng)?!?,“偶爾”和“從不”的合計數(shù);⑥該行表示上述三個合計數(shù)分別占總樣本數(shù)的百分比。2.94972,p0.229以根據(jù)當前資料和結果顯示:患肝癌病與是否飲用醋冷水無·tabi#11#12[...]\[#21#22[...][\...][,allchi2exactcellcolumn#11#12一行第二列的觀察數(shù);\表示換一行;#21表示列聯(lián)表中第二行第一列的觀察數(shù),其它以此類推。子命令:allchi2exactcellcolumnrow與上述命令完全相同。以上例的資料為STATAtabi264428\284917,chi2|row|123| 1|264428||26.5344.9028.57| 2|284917||29.7952.1318.09| Total|549345||28.1248.4423.44|Pearsonchi2(2)=2.9497Pr=0.229likelihood-ratiochi2(2)=2.9760Pr=0.226方檢驗(Pearsonchi2test)與似然比檢驗(likelihoodratiochi2test)趨向一·Fisher()(6547(Ho成立時的期望頻數(shù))。5Fisher精確檢驗法。相應的tabi42\05,exactcol|row|12| 1|42||66.6733.33||100.0028.57| 2|05||0.00100.00||0.0071.43| Total|47||36.3663.64||100.00100.00|①Fisher'sexact=②1-sidedFisher'sexact=FisherFisher在Fisher精確檢驗中,假定每列和每行的合計數(shù)都是常數(shù)情況FisherFisherFisherp0.04545+0.01515?0.061·由于Fisher檢驗是在每列和每行的合計數(shù)都是常數(shù)的假定下的(的人數(shù)是常數(shù),即:僅每行的合計數(shù)是常數(shù)),橫斷面抽樣調查()Fisher[1]Fisherp值:觀察數(shù)理論數(shù)>1.8ptptt樣本計算值ptt-t樣本計數(shù)值的面積之和,而Fisher雙側檢驗:計算|觀察剩-理論數(shù)|>1.8的p值的和。即:在本例中,觀察數(shù)-理論數(shù)=1.8相應t檢驗中的t樣本計算值。STATA-理論數(shù)5-3.2=1.8起的,所以不僅要計算所有觀察數(shù)-理論數(shù)(3.2)1.8的p值[1],還要計算所有理論數(shù)(3.2)-觀察數(shù)大于1.8的p值。即:計算|-|1.8p(3.2)-442605547Fisher察數(shù)大:06641547correlate12…spearman11,…mSTATA命令為:pwcorrpwcorr12…m,例:上海醫(yī)科大學兒科醫(yī)院研究某種代乳粉的營養(yǎng)價值時,用(克)(克)的原始數(shù)據(jù)如下表,用x表示大白鼠進食量和用y表示大白鼠增加體重,試作相關分析(資料摘自醫(yī)學統(tǒng)計分析,金丕煥主進食量(克增加體重(克x和ypwcorrx|y+x|||y|①0.9395|②|①為xyr(Ho:r=0)應的p量與(xy布)xy對于那些不能滿足正態(tài)分布的數(shù)據(jù)之間的相關分析應采用非Spearman方法。STATA命令為:spearman1spearmanxNumberofobs=Spearman'srho=0.8994TestofHo:xandyindependent③Pr>|t|=SpearmanHo:xySpearman相關顯著性檢驗所對應的p值。由上述結果表明:Spearman相關系數(shù)為0.8994,相應的p值為0.0004大白鼠體重增加呈正相關。STATAlogrank[,by(分組變量在醫(yī)學研究中,除了計量資料和計數(shù)資料外,還經(jīng)常遇到生存分析的資料,這種資料不僅描述所觀察對象是否有結果(死亡或沒死亡以及失訪)而且還記錄了從觀察開始起至觀察結束的時間長度。這種資料容許失訪資料參加分析。因此這類資料至量(死亡或未死亡),失訪資料記錄了從開始觀察至到失訪時的觀察時間長短以及失訪結果作為未死亡的情況(因為在失訪)檢驗的方法,一般采用logrank檢驗方法(無效假設:兩組死亡人數(shù)的期望值相同)。STATA命令為:logrank生存時間變量果變量[,by(分組變量例:25A、B1974531并用group=0表示A組和group=1表示B組;t表示參加試驗的日數(shù)();e=0e=1ex7.dta0000000t88e10111100000011te 10011 11111t e 11101 11t e 11logranke,①GroupEvents06111③chi2(1)=④Pr>chi2=logrankHologrankp值由上述統(tǒng)計結果表明:兩組死亡人數(shù)期望值無顯著性差異,因性差異。因素方差分析命令與輸出結果說STATAanova12…tabulate12,summarize(anova1*2例:治療缺鐵性貧血病人12例,分為4組,采用4種不同治療方(/mm3)(稱一般療法組);第二組為一般療法+A藥(稱+A藥組);第三組為—般療法—般療法+B藥(稱+B藥組);第四組為一般療法+A藥+B藥(稱+A+B藥組)(用y表示)。用X1=2A藥以及用X1=1表示未加用A藥;用X2=2表示加用B藥以及用X2=1表示未加用B藥;研究問題為“哪一種治療方案療效最佳?"(資料如下表所示,摘自醫(yī)學統(tǒng)計方法,金丕煥主編,p71)。+A+B+A藥+B2tabulatex1x2Means,StandardDeviationsandFrequenciesof|x1|12 1|① 1||② ||③33| 2|1.22.1|| ||33| Total|11.55|| ||66|的標準差;③為該組的樣本數(shù);其它各組的結果也對應相同。A0.4(百萬/mm3)B0.2(0.2(百萬/mm3);加AB多1.3(百萬/mm3),超過了單獨加A藥與一般療法的紅細胞增加數(shù)均數(shù)差值(0.4百萬/mm3)與單獨加B藥與一般療法的紅細胞增加數(shù)均數(shù)差值(0.2百萬/mm3)之和(0.6百萬/mm3),因此需要用二因素方差分析的方法檢驗這些不同的治療方法所對應不同的紅細胞增加數(shù)是否有顯著性差異?anovayx1x2Numberofobs=12R-squared=0.9737RootMSE=.10AdjR-squared=0.9638①②③④Source|PartialSSdfMSFProb>+Model| 3 98.75|⑥x1|1.687511.6875168.75⑦x2| 1 90.75⑧x1*x2| 1 0.0003|⑨Residual| .01+Total| 11FFpA藥;⑦加BAB藥()項 所有因素的變異度之和以及對應的統(tǒng)計量和檢驗值(p=0.0003)AB藥具有協(xié)同作用,即:其療效顯著地超過了分別加A藥和加B藥療效之和。第第十章線性回歸和逐步回歸命令和輸出結果說STATAregress因變12stepwise12m,baforwstfe(#)fs(#)test表達式predict新變predict新變量,resipredictstdppredictregressbeta()。stepwisebaformstfe(#)F(#)STATA0.54;fs(#)F(#)STATA0.14。testpredicty值()。predict,resipredicty(標準誤也不同)。predict新變量,stdr是計算因變量y的預測值的標準誤。例:對15名對象的血漿粘度(Y)及其3個血漿成分:白蛋白(x1),球蛋白(x2)和纖維蛋白原(x3)進行測定,試建立多元線性回歸方():編號y123456789regressyx1x2 ①①②Source|SSdfMSNumberofobs=+④F(3,11)=⑤Model|3⑦Prob>F=⑥Residual|11⑧R-squared=-⑨AdjR-squared=Total|14RootMSE=y|Coef.Std.Err.tP>|t|[95%Conf.+x1|9.57e-060.1610.875-.x2|.0.5120.619-.x3|.2.4970.030._cons|1.1327322.6500.023FFp度后的決定系數(shù) 為殘差均方和的根號 回歸系數(shù) 回系數(shù)的標準誤 回歸系數(shù)檢驗的t值 回歸系數(shù)檢驗相應p值 回歸系數(shù)的95%可信限變量,因此應對殘差作正態(tài)性檢驗和殘差分析,由于這部分內容已超出了本教材的范圍,所以不在此處詳細介紹。以本例數(shù)據(jù)介紹逐步線性回歸分析,設篩選變量進入模型的F值等于變量從模型中剔除的F值,并均為1.5,其輸出內容對應相同:stepwiseyx1x2x3,fe(1.5) :x1F=0.02577 :x2F=Source|SSdfMSNumberofobs=+F(1,13)=Model|1Prob>F=Residual|13R-squared=+AdjR-squared=Total|14RootMSE=y|Coef.Std.Err.tP>|t|[95%Conf.+x3|.2.8250.014._cons|1.28797411.7410.0001.050982x1的Fpredictyhatyhatpredicte,resi計算殘差epredictpredictymuse,stdppredictyhatse,stdr第第十一章Logistic回歸分析命令與輸出結果說logistic因變量12變量mclogit因變量12m,strata(配對編號變量logisticlogistic,logistic1(=1)(=0)以及P(Y=0)=1-logistic的模型,x1,x2,…,xm為協(xié)變量,用這些協(xié)變量刻劃研究問題中P(Y=1)。lfitclogit是條件logistic回歸命令。例:為了分析研究一組病患者,經(jīng)治療后的病情恢復情況。設Y(Y=0Y=1)x1情嚴重程度(x1=0表示不嚴重,x1=1表示嚴重),變量x2為年齡(歲),變量x3為療法(x3=0表示新療法,x3=1表示傳統(tǒng)療法)?,F(xiàn)40logistic析()YY110100121010018100011100000000000000001000Y=1Y=0(化)logisticyx1x2LogitEstimatesNumberofobs=①chi2(3)=③②Prob>chi2=LogLikelihood=-22.509701④PseudoR2=⑤⑥⑦⑧y|OddsRatioStd.Err.zP>|z|[95%Conf.+|.-.|.-.|.-.①為(1)比檢驗();應的p標準Z95%x1x2(x3=1)(Odds)小于新療法(x3=0)的恢復和未恢復的比數(shù)(Odds)(比數(shù)比logistic(logisticSTATA令clogit12…變量m,strata(配對編號變量YY=1Y=0類似情況與其對應)12…m為協(xié)變量。在配對1:1的條件下,發(fā)病的概率為:數(shù)據(jù)對模型擬合才能
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026廣西桂林市象山區(qū)兵役登記參考考試題庫及答案解析
- 深度解析(2026)《GBT 26004-2010表面噴涂用特種導電涂料》(2026年)深度解析
- 2025四川雅安市滎經(jīng)縣縣屬國有企業(yè)招聘14人備考考試試題及答案解析
- 2025年大慶高新區(qū)公益性崗位招聘10人參考筆試題庫附答案解析
- 古典戲曲“才子佳人”模式中的性別協(xié)商與倫理沖突
- 2025廣東工業(yè)大學物理與光電工程學院高層次人才招聘備考筆試試題及答案解析
- 2025湖北武漢市蔡甸區(qū)公立小學招聘教師1人參考考試題庫及答案解析
- 2025年南昌市第一醫(yī)院編外專技人才自主招聘1人備考筆試試題及答案解析
- 《克、千克的認識》數(shù)學課件教案
- 2025浙江嘉興市海寧市中心醫(yī)院招聘2人備考筆試題庫及答案解析
- 大學生(英語專業(yè))生涯發(fā)展展示 適用于職業(yè)規(guī)劃模板1
- 激光光子的后期護理
- 小學美術活動策劃方案
- 2025至2030中國醫(yī)用多參數(shù)監(jiān)護儀行業(yè)項目調研及市場前景預測評估報告
- 重要客戶開發(fā)匯報
- 2025化工和危險化學品生產經(jīng)營單位重大生產安全事故隱患判定標準解讀
- 2025-2030中國物流園區(qū)陸港型國家物流樞紐申報與建設指南報告
- (完整版)混凝土質量缺陷修補專項方案
- 公安派出所建筑外觀形象設計規(guī)范
- DB42T 1771-2021 湖北省河湖健康評估導則
- 征兵體檢內科標準與流程
評論
0/150
提交評論