第五章-常用過程步課件_第1頁
第五章-常用過程步課件_第2頁
第五章-常用過程步課件_第3頁
第五章-常用過程步課件_第4頁
第五章-常用過程步課件_第5頁
已閱讀5頁,還剩43頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

一、SAS過程中常用的語句

SAS過程實際是一個個已經(jīng)寫好的經(jīng)過編譯可以直接調(diào)用的程序,本節(jié)課開始介紹在調(diào)用這些過程中常用的語句。一、PROC步和PROC語句(一)、PROC步

PROC步是以一個PROC語句開頭,以RUN語句結束的一組或幾組SAS語句。(二)、PROC語句功能:該語句是PROC步開始的標志,指定該PROC步調(diào)用一個SAS過程,對指定的SAS數(shù)據(jù)集進行處理和分析、存放結果和輸出。格式:PROC過程名選擇項;說明:選擇項隨過程名的不同而不同。

PROCPRINTDATA=AA;PORCMEANSMEANSTDT;/*做描述性統(tǒng)計,求均數(shù)、標準差、T檢驗*/PROCTTESTDATA=HEART;二、VAR語句和MODEL語句(一)、VAR語句功能:該語句指定調(diào)用過程分析中的變量格式:VAR變量1變量2……;說明:1、省略該語句時,對所有變量做統(tǒng)計計算。2、變量名列表可以使用省略的形式,如x1-x3

例:PROCMEANSMEANSTD;*調(diào)用MEANS過程計算均數(shù),標準差;VARX1—X3;*計算X1—X3變量的均數(shù)和標準差,如省略這個語句,將計算這個數(shù)據(jù)集中的所有變量的均數(shù)和標準差;RUN;(二)、MODEL語句功能:指定統(tǒng)計分析中的模型,該語句主要用于方差分析和回歸分析。格式:MODEL因變量=自變量列表<選擇項>;說明:選擇項隨過程名的不同而不同。例:modely=x;modely=x1—x3;*多元回歸;三、BY語句和CLASS語句(一)、BY語句功能:指定一個或幾個分組變量,根據(jù)這些分組變量值可以把觀測記錄分組,然后對每一組觀測分別進行指定的分析。語句格式:BY[DESCENDING]變量…;說明:在使用帶有BY語句的過程步之前,應先用SORT過程按BY語句指定的變量對數(shù)據(jù)集排序。例如:假設我們已經(jīng)把class數(shù)據(jù)集按性別排序,則下面PRINT過程可以把男、女生分別列出:

procprintdata=class;bysex;run;(二)、CLASS語句功能:指定調(diào)用SAS過程中的分類變量,對分類變量的不同取值分別進行處理。格式:CLASS分類變量;說明:分類變量只有少數(shù)幾個離散值或不連續(xù)值,字符型或數(shù)值型均可。作用類似于BY語句,但不需事先排序。例:PROCMEANSMEAN;*調(diào)用MEANS過程;CLASSSEX;*指定SEX為分類變量;VARAGE;*按CLASS指定的分類變量分別指定

AGE的數(shù)據(jù);RUN;說明:男性和女性分別計算平均年齡,此處的CLASS也可以改為BY,所不同的是BY后的所有變量都必須經(jīng)過排序,功能和CLASS語句一樣。四、FREQ語句與WEIGHT語句(一)、FREQ語句(頻數(shù)語句)功能:指定某個變量為觀測的頻數(shù)變量。格式:FREQ變量;說明:用FREQ指定的頻數(shù)變量的值必須大于等于1,如果某觀測的頻數(shù)變量的值小于1,則此觀測在分析中被忽略。例:

DATAB;INPUTSEX$AGENUMBER;CARDS;F2010F2223M2119M2216

PROCMEANS;VARAGE;

PROCMEANS;FREQNUMBER;VARAGE;RUN;(二)、WEIGHT語句(權重)功能:在過程中規(guī)定一個數(shù)值變量,并以它的值作為觀測值的權重。格式:WEIGHT變量;

例:DATAFOUR;INPUTRCF@@;CARDS;114512332114226;PROCFREQ;TABLER*C/

CHISQ;*卡方檢驗;WEIGHTF;*指定F為權重變量;RUN;FREQ和WEIGHT語句的區(qū)別

FREQ表示某變量出現(xiàn)的次數(shù),而WEIGHT給出變量觀測的權重,當每個觀測的權重都是整數(shù)時,WEIGHT語句可以用FREQ語句代替。即WEIGHT權重值可以是小數(shù)。五、OUTPUT語句用于數(shù)據(jù)步語句格式:OUTPUTSAS數(shù)據(jù)集名[關鍵詞=變量名]功能:將當前的觀測值寫入正建立的數(shù)據(jù)集中。說明:關鍵詞隨不同的過程步而變化(通常是統(tǒng)計量)output語句使用在數(shù)據(jù)步中:datamf;*建立兩個數(shù)據(jù)集;Inputsex$ageheightweight;Ifsex=‘m’thenoutputm;Ifsex=‘f’thenoutputf;Cards;M1516545f1416040m1416652;五、OUTPUT語句用于過程步語句格式:OUTPUTOUT=數(shù)據(jù)集名[統(tǒng)計關鍵字=變量名]功能:在proc步中建立一個由SAS過程中產(chǎn)生的統(tǒng)計量的數(shù)據(jù)集。說明:統(tǒng)計關鍵字指明在新的數(shù)據(jù)集中想要的統(tǒng)計項,并給包含這些統(tǒng)計項的變量起名。Output語句輸出SAS中間運算結果并非output窗口的結果output語句使用在過程步中:procmeansmeanstdn;*meanstdn三個關鍵詞;varx;outputout=statis_1mean=mstd=sn=n;/*在statis_1數(shù)據(jù)集中用m表示mean*/run;

在output語句中輸出了一個名為statis_1的數(shù)據(jù)集,該數(shù)據(jù)集包括m,s,n三個變量,分別表示了均數(shù),標準差和樣本個數(shù)。六、ID語句格式:

ID變量表;功能:在輸出數(shù)據(jù)集時,用該語句所規(guī)定的變量來識別觀測值。例:PROCPRINTDATA=A;

PROCPRINTDATA=A;

IDNAME;七、LABEL語句格式:

LABEL變量;功能:給變量賦以標記,以便把變量名的含義更明確地在輸出中表示出來。說明:當在一個過程步中使用LABEL語句時,僅在該過程步期間該標記與該變量相聯(lián)系。數(shù)據(jù)步中使用時,標記與變量的聯(lián)系一直存在所建的數(shù)據(jù)集中。八、TITLE語句格式:TITLEn‘標題內(nèi)容’;功能:規(guī)定打印到SAS輸出文件上的標題。說明:

n:規(guī)定標題所在行,1~10,缺省值為1。標題內(nèi)容長度不超過當前規(guī)定的行長。缺省的標題是“TheSASSystem”。規(guī)定的標題在以后的輸出中都有效,直至取消這一標題或為該行定義其它的標題為止。取消所有現(xiàn)存標題:TITLE;取消第n行和它后面行的標題:TITLEn;語句位置:a.上一過程步或數(shù)據(jù)步的RUN語句之后;b.如果上一步無RUN語句,則放在本過程的PROC語句之后以及下一個DATA步或PROC步或RUN語句之前。例Procprintdata=class1;Title‘titlefortwoprocedure’;Procmeansdata=class1;

Varweight;Run;Procprintdata=class1;run;Title‘titlefortwoprocedure’;Procmeansdata=class1;

Varweight;Run;九、FOOTNOTE語句格式:

FOOTNOTEn‘腳注內(nèi)容’;功能:在輸出頁的底部打印一些腳注信息說明:

n:規(guī)定腳注所在相對行,1~10,缺省值為1。帶有最高行號的腳注出現(xiàn)在最底部。腳注內(nèi)容長度不超過當前規(guī)定的行長。規(guī)定的腳注內(nèi)容在以后的輸出中都有效,直至用語句:FOOTNOTE;取消已給出的腳注。例:PROCPRINTDATA=A;TITLE1‘THISIS’;TITLE2‘ADATASET’;FOOTNOTE1'';FOOTNOTE2'END';RUN;十、OPTIONS語句輸出格式選項OPTIONS語句OPTIONS語句可以規(guī)定系統(tǒng)運行的一些通用選擇項,比如輸出是否每頁有頁號,是否有日期,輸出的行寬,輸出每一頁的高度(行數(shù)),等等。其使用例如:optionsnonumber

nodate

linesize=78pagesize=60;其中NONUMBER表示輸出不顯示頁號(改用NUMBER則規(guī)定顯示頁號),NODATE表示不在每頁顯示運行日期和時間(改用DATE則顯示),LINESIZE=78規(guī)定輸出每行最寬不超過78個字符,PAGESIZE=60規(guī)定輸出每頁為60行,不足時用空行補齊。十一、WHERE語句功能:where語句用于選擇輸入數(shù)據(jù)集的記錄子集以進行分析,在WHERE關鍵詞后指定一個邏輯條件。格式:where邏輯表達式;例:wheremath>=60andChinese>=60;指定只分析數(shù)學語文都及格的學生二、SAS服務過程

SAS服務過程不直接給出統(tǒng)計值,常被用于準備或整理統(tǒng)計資料。PRINTFORMATSORTDBFTRANSPOSESTANDARD2.1PRINT過程PRINT過程語句PROCPRINT[DATA=數(shù)據(jù)集][NOOBS];

VAR變量表;*指定變量輸出;

ID變量;

LABEL表達式;

SUM變量表;*求和;

BY變量;*分類,用BY語句前一定要先排序;

WHERE表達式;例1procprintdata=class1;

varnamechinesesex;run;例2例3:有一關于兩個不同地區(qū)在職人員與退休人員年平均收入與消費水平的調(diào)查,要求:分在職與不在職打印出每一地區(qū)兩種人員收入與消費的總和。

DATAA;INPUTNAME$15.D$W$EARNEXP@@;CARDS;

LILING A 1 5500 4700LIUHONG B2 4600 4000PROCSORT;BYDW;PROCPRINT;BYDW;SUMEARNEXP;例4:Dataone;Inputname$sex$age@@;Cards;Zhangf18wangm16lif17zhaom19;Procsortdata=one;Bysex;Procprintdata=onenoobs;*結果不顯示OBS項;varage;bysex;*用by語句一定要先排序;Sumage;*求和;Run;2.2FORMAT過程功能:對字符或數(shù)值變量定義一個用戶所需的輸出格式。兩種格式:值輸出格式:輸出值轉(zhuǎn)變成不同的值(數(shù)值字符;字符字符;連續(xù)數(shù)值離散字符)描述輸出格式:指定打印數(shù)值的模式說明:VALUE語句定義一種值輸出格式,可把某變量的值按所定義的格式輸出。可把數(shù)值變成字符或把字符轉(zhuǎn)變成另一字符。每一VALUE語句可定義一種格式,在一個FORMAT過程中,你可以使用多個VALUE語句定義多個格式。以下給出VALUE語句應用的幾個實例:VALUEABCF1=‘A’2=‘B’3=‘C’;VALUEAGEFLOW-12=‘CHILD’13-19=‘TEENS’20-HIGH=‘ADULT’;

VALUE$SEXF‘1’=‘MALE’‘2’=‘FEMALE’OTHER=‘MISCODED’;例1:

DATASCORE;LENGTHNAME$12.;INPUTNAMESEXGROUP$T1-T3@@;S=SUM(OFT1-T3);CARDS;WANGDONG11907060XUEPING22859588ZHOUHUA11778469HEYAN12957888SUNHONG23899787ZHAOBIN23669886

;PROCFORMAT;VALUESEXF1='MALE'2='FEMALE';PROCPRINTDATA=SCORE;FORMATSEXSEXF.;RUN;例2:PROCFORMAT;VALUE$SEXFMT'1'='FEMALE''2'='MALE';VALUEAGEFMTLOW-20='-20'20-45='-45'45-HIGH='45+';

DATAA;INPUTNAME$SEX$AGEV@@;

FORMATAGEAGEFM

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論