下載本文檔
版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
1、STATA統(tǒng)計軟件操作,Stata入門 Stata的數(shù)據(jù)讀入 數(shù)據(jù)庫的描述 變量的生成與處理 數(shù)據(jù)的合并 數(shù)據(jù)的轉(zhuǎn)換 單變量描述 雙變量描述,描述數(shù)據(jù)的統(tǒng)計量 圖形的制作 參數(shù)估計:區(qū)間估計 假設(shè)檢驗 方差分析 相關(guān)分析 線性回歸分析,Stata入門,五大功能: 數(shù)據(jù)管理、統(tǒng)計分析、圖形制作、矩陣運算和程序設(shè)計。 界面: Command(命令)、Results(結(jié)果)、Review(回顧)、Variables(變量)。 菜單基本功能: 文件(File)、編輯(Edit)、偏好(Prefs,用戶界面設(shè)置菜單)、數(shù)據(jù)(Data,數(shù)據(jù)的基本處理、描述、排序、改變變量、生成新變量、整合數(shù)據(jù)、拆分數(shù)據(jù)等
2、)、圖表(Graphics)、統(tǒng)計(Statistics數(shù)據(jù)分析)、使用者(User)、窗口(Window)、幫助(help) 快捷根據(jù)圖表的基本功能: Log(記錄文件窗口)、Viewer(幫助窗口)、Results(分析結(jié)果窗口)、Do-file Editor(編程窗口)、Data Editor(數(shù)據(jù)編輯窗口)、Data Browse(數(shù)據(jù)瀏覽窗口)、Clear-more-Condition(顯示更多結(jié)果)、Break(不要顯示更多結(jié)果)。,Stata數(shù)據(jù)的讀入,log文件。 創(chuàng)建文件:log using “文件路徑和名稱”,其后帶append表示在原有文件的基礎(chǔ)上增加新內(nèi)容,其后帶rep
3、lace表示取代原記錄文件; 暫停:log off; 再次開始:log on; 關(guān)閉:log close。 數(shù)據(jù)的存儲空間: 增加存儲空間(set mem 40m) 清空存儲空間(clear,相當于drop all)。,Stata數(shù)據(jù)的讀入,數(shù)據(jù)的讀入: 可直接讀入下列尾綴形式的數(shù)據(jù).dta/.txt/.raw/.xls; 讀入文件中的部分變量:use a b c using“文件路徑和名稱”; 讀入文件中的部分樣本:use “文件路徑和名稱” in X/Y(X、Y表示個案序號); 讀入文件中某些特征的樣本:use“文件路徑和名稱”if 條件句;,數(shù)據(jù)庫的描述,描述數(shù)據(jù)的基本情況:descri
4、be, d describe, simple:只展示變量名; describe,short:報告變量總體情況; describe,detail:輸出全部變量的全部信息; describe a b c:描述部分變量的情況。 變量編碼本: codebook。 codebook+變量名:描述變量特征。,Stata數(shù)據(jù)類型及特點,與數(shù)據(jù)類型對應的是數(shù)據(jù)庫中變量的存儲類型(storage type):。 字符型:保存格式為str,省略表示的是字符位數(shù) 數(shù)值型:保存格式有byte, int, long, float, double。默認格式是float,前三種只保留整數(shù),占空間最大到最小的順序是doubl
5、e, float, long, int, byte 壓縮變量的命令為compress Compress為壓縮所有變量; Compress yr*為壓縮共同前綴的變量; Compress a-c為壓縮從a到c之間的所有變量。,數(shù)據(jù)庫的描述,描述變量取值的基本命令參數(shù): inspect。 顯示數(shù)據(jù): browse直接進入數(shù)據(jù)的瀏覽窗口; list最好指定變量,否則會輸出數(shù)據(jù)中所有變量的分布。 數(shù)據(jù)排序: sort。 例:比較城鄉(xiāng)孩子的性別bysort urban: inspect girl或者sort urban然后by urban: inspect girl.,變量的生成與處理,注意事項: 不要
6、使用新變量取代舊變量; 充分了解原始變量的分布以及每個數(shù)值代表的含義; 遵循不重不漏; 將原始變量和新變量的取值進行對比,檢查是否有誤;注意原始變量的缺失值。 使用genreplace命令生成新變量; genreplace if共同使用形成分組變量 recode v , gen(nv) recode v v的取值nv的取值 *=其他取值(*表示所有其他沒有列出的數(shù)值),gen(新變量名) recode yrsch 0=0 11=1 12=2 13=3 14=4 15=5 16=6 21=7 *=.,gen (edu),變量的生成與處理,生成分類變量: egen 新變量命cut(舊變量名),at
7、(取值的下限) eg:egen agegrp1=cut(age),at(0,7,13,16,20) 按照變量b的分類生成均值變量: egen a_mean=mean(a),by (b) 生成一個變量b和c的行均值變量(avg),忽略缺失值: egen avgrmean(b c) 生成標準數(shù)值: egen zweight=std(weight) 計算每一年觀察的樣本,從而了解在每年的調(diào)查中,有多少相同的樣本(或相同的個體): gen numobs=count(personid), by(personid year),數(shù)據(jù)的合并(縱向),縱向合并: 作用:增加樣本量 命令:append 菜單:Da
8、ta-Combine datasets-Append datasets; 程序:append using“文件路徑和名稱”;append using“文件路徑和名稱”,keep 變量名。,數(shù)據(jù)的合并(橫向),橫向合并 作用:增加變量(merge)。 菜單:Data-Combine datasets-Merge two datasets或Data-Combine datasets-Merge multiple datasets 程序:先看使用數(shù)據(jù):use “文件路徑和名稱”,sort 關(guān)鍵變量名,save“文件路徑和名稱”,replace; 再看主要數(shù)據(jù),use“文件路徑和名稱”,sort關(guān)鍵變
9、量名; 最后,合并數(shù)據(jù):merge 關(guān)鍵變量名 using “文件路徑和名稱”,keep(變量)。,數(shù)據(jù)的合并(系統(tǒng)變量),關(guān)于系統(tǒng)變量:_merge,它的取值限于 1觀察值僅來自主要數(shù)據(jù),使用數(shù)據(jù)沒有匹配的樣本, 2觀察值僅來自使用數(shù)據(jù),主要數(shù)據(jù)沒有匹配的樣本, 3觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù)。 若使用update選項,還會有: 4觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù),且主要數(shù)據(jù)的缺失值得到更新, 5觀察值來自于主要數(shù)據(jù)和使用數(shù)據(jù),且兩個數(shù)據(jù)的數(shù)值不匹配。,數(shù)據(jù)的轉(zhuǎn)換(reshape),數(shù)據(jù)的結(jié)構(gòu): 寬數(shù)據(jù)(wide format) 長數(shù)據(jù)(long format) 菜單: Data-Creat
10、e or change variables-Other variable transformation commands-Convert data between wide 按變量x的分類,生成一張其取值圖histogram x,discrete; 箱線圖。 按變量x的分類,生成變量y的箱線圖: graph box y, over(x); 按變量x的分類,生成變量y1和y2的箱線圖graph box y1 y2, over(x); 按變量x的分類,生成變量y的橫向箱線圖:graph hbox y, over(x); 矩陣圖。 生成x1、x2、x3的矩陣圖,只顯示一半:graph matrix
11、x1 x2 x3, half 將圖形x1和x2合并:graph combine x1 x2,區(qū)間估計,單個總體均值的區(qū)間估計: 求多個變量的置信區(qū)間,對變量的數(shù)目沒限制:ci x1 x2 x3。 eg:bysort urban: ci x1 x2 x3 if age14. mean x1 x2 x3,輸出均值、標準誤和95%的置信區(qū)間。 按變量e分類來求取a、b、c三個變量的區(qū)間估計:mean a b c,over(e),區(qū)間估計,單個總體比例的區(qū)間估計 計算a這個二分變量的比例、標準誤和95%的置信區(qū)間:proportion a。 按b分類來計算a這個二分變量的區(qū)間估計:proportion
12、 a,over(b)。,區(qū)間估計,單個總體比率的區(qū)間估計 按城鄉(xiāng)分類,估計體重身高之比的區(qū)間估計:ratio(weight/height),over(urban) 注意:stata默認輸出的是95%的置信區(qū)間,若想要99%或90%的置信區(qū)間,則須在命令最后寫“,level(99)”或“,level(90)”,假設(shè)檢驗,一個總體均值的檢驗:ttest 變量=數(shù)值。 例如:ttest height=160 if age14或者ttest height=160 if age14,level(99) 兩個獨立樣本均值比較的t檢驗: ttest a,by(b)。 eg:分城鄉(xiāng)孩子的體重差異檢驗:ttes
13、t weight,by(urban),假設(shè)檢驗,配對樣本均值比較的t檢驗: ttest a1=a2。 多個總體均值差異的檢驗,即方差分析: oneway y x(y為因變量,x為類別自變量) 例如:oneway weight sibs if age13,tab scheffe。(tab輸出各組描述性統(tǒng)計結(jié)果,scheffe采用scheffe方法提供多重組間比較結(jié)果),方差分析,雙(多)因素方差分析: anova y a b(a、b為因素) anova y a b a*b(加入a、b的交互作用) 協(xié)方差分析: anova y a b c,cont(c); 指定c為連續(xù)變量,相應地a、b、c為類別變量。 anova y a b c,category(a b), 指明a、b為分類變量,從而暗示其他變量c為連續(xù)變量。,相關(guān)分析,corr a b c。 輸出a、b、c的相關(guān)系數(shù)矩陣。 pwcorr
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026年土壤污染修復工程技術(shù)課
- 2026福建廈門市思明區(qū)招聘社區(qū)工作者21人備考題庫帶答案詳解
- 2026青海果洛西寧民族中學國家公費師范生招聘2人備考題庫帶答案詳解
- 電力負荷監(jiān)測與調(diào)控手冊
- 11第十一章 消費品廣告文案寫作
- 拉絲廠機修工年終總結(jié)(3篇)
- 七年級語文下冊駱駝祥子和《海底兩萬里》名著導讀-試題及答案
- 職業(yè)健康電子檔案與居民健康檔案的協(xié)同管理
- 職業(yè)健康應急中的倫理決策與多學科共識
- 職業(yè)健康促進長效機制的系統(tǒng)化構(gòu)建
- (一模)烏魯木齊地區(qū)2026年高三年級第一次質(zhì)量監(jiān)測物理試卷(含答案)
- 江蘇省南通市如皋市創(chuàng)新班2025-2026學年高一上學期期末數(shù)學試題+答案
- 2026年年長租公寓市場分析
- 生態(tài)環(huán)境監(jiān)測數(shù)據(jù)分析報告
- 2025年下半年四川成都溫江興蓉西城市運營集團有限公司第二次招聘人力資源部副部長等崗位5人考試參考試題及答案解析
- 內(nèi)科護理科研進展
- 煤炭裝卸施工方案(3篇)
- 浙江省杭州市蕭山區(qū)2024-2025學年六年級上學期語文期末試卷(含答案)
- 學堂在線 雨課堂 學堂云 實繩結(jié)技術(shù) 章節(jié)測試答案
- 英譯中國現(xiàn)代散文選(漢英對照)
- 國有企業(yè)干部選拔任用工作系列表格優(yōu)質(zhì)資料
評論
0/150
提交評論