版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
統(tǒng)計(jì)軟件SAS講義教材《SAS系統(tǒng)使用手冊(cè)》高惠璇中國(guó)統(tǒng)計(jì)出版社SAS參考書(shū)一、《SAS系統(tǒng)應(yīng)用開(kāi)指南》彭昭英希望電子出版社二、《SAS應(yīng)用統(tǒng)計(jì)教程》王吉利中國(guó)統(tǒng)計(jì)出版社三、《數(shù)據(jù)分析方法》董麓東北財(cái)經(jīng)大學(xué)出版四、《現(xiàn)代統(tǒng)計(jì)與SAS應(yīng)用》胡良平軍事醫(yī)學(xué)出版五、《SAS基礎(chǔ)及統(tǒng)計(jì)實(shí)例教程》胡小平王長(zhǎng)發(fā)SAS是“統(tǒng)計(jì)分析系統(tǒng)”英語(yǔ)Statisticalanalysissystem的縮寫(xiě)。SAS統(tǒng)計(jì)軟件SAS是美國(guó)SAS軟件研究所發(fā)展為SAS軟件公司的產(chǎn)品。1966年,由美國(guó)北卡羅里那州立大學(xué)(NorthCarolinaStateUniversity)統(tǒng)計(jì)系教授開(kāi)發(fā)的統(tǒng)計(jì)軟件。1976年成立SAS研究所SAS的統(tǒng)計(jì)功能十分全面和完備。涉及的統(tǒng)計(jì)方法非常廣泛。掌握SAS軟件主要是統(tǒng)計(jì)理論與計(jì)算機(jī)知識(shí)的結(jié)合。SAS系統(tǒng)是由模塊構(gòu)成,主要模塊有:SAS/BASE模塊·BaseSAS作為SAS系統(tǒng)的核心,負(fù)責(zé)數(shù)據(jù)管理,交互應(yīng)用環(huán)境管理,進(jìn)行用戶(hù)語(yǔ)言處理,調(diào)用其它SAS模塊。BaseSAS為SAS系統(tǒng)的數(shù)據(jù)庫(kù)提供了豐富的數(shù)據(jù)管理功能,還支持標(biāo)準(zhǔn)的SQL語(yǔ)言對(duì)數(shù)據(jù)進(jìn)行操作。BaseSAS能夠制作從簡(jiǎn)單列表到比較復(fù)雜的統(tǒng)計(jì)報(bào)表。BaseSAS可進(jìn)行基本的描述性統(tǒng)計(jì)及基本相關(guān)系數(shù)的計(jì)算,進(jìn)行正態(tài)分布檢驗(yàn)等。SAS/STAT推斷統(tǒng)計(jì)與回歸分析SAS/STAT覆蓋了所有的實(shí)用數(shù)理統(tǒng)計(jì)分析方法,是國(guó)際統(tǒng)計(jì)分析領(lǐng)域的標(biāo)準(zhǔn)軟件。SAS/STAT提供了40多個(gè)過(guò)程,可進(jìn)行各種不同模型或不同特點(diǎn)數(shù)據(jù)的回歸分析,可處理的數(shù)據(jù)有實(shí)型數(shù)據(jù)、有序數(shù)據(jù)和屬性數(shù)據(jù),并能產(chǎn)生各種有用的統(tǒng)計(jì)量和診斷信息。在方差分析方面,SAS/STAT為多種試驗(yàn)設(shè)計(jì)模型提供了方差分析工具。還有處理一般線(xiàn)性模型和廣義線(xiàn)性模型的專(zhuān)用過(guò)程。在多變量統(tǒng)計(jì)方面,SAS/STAT為主成分分析、典型相關(guān)分析、判別分析和因子分析提供了許多專(zhuān)用過(guò)程。SAS/STAT還包含多種聚類(lèi)準(zhǔn)則的聚類(lèi)分析方法。SAS/QC質(zhì)量控制統(tǒng)計(jì)
SAS/QC為全面質(zhì)量管理提供了一系列工具。提供一套全屏幕菜單系統(tǒng)引導(dǎo)用戶(hù)進(jìn)行標(biāo)準(zhǔn)的統(tǒng)計(jì)過(guò)程以及試驗(yàn)設(shè)計(jì)。SAS/QC提供了多種不同類(lèi)型控制圖的制作與分析。Pareto圖(排列圖)可用于發(fā)現(xiàn)需優(yōu)先考慮的因素,Ishikawa圖(魚(yú)骨圖)可用于直觀(guān)地進(jìn)行因果分析。SAS/IML矩陣運(yùn)算·
SAS/IML提供功能強(qiáng)大的面向矩陣運(yùn)算的編程語(yǔ)言,幫助用戶(hù)研究新算法或解決SAS中沒(méi)有現(xiàn)成算法的專(zhuān)門(mén)問(wèn)題。SAS/IML中的基本數(shù)據(jù)元素是矩陣。它包含大量的數(shù)學(xué)運(yùn)算符、函數(shù)和例行程序,用戶(hù)用很少的語(yǔ)句便可執(zhí)行很復(fù)雜的計(jì)算過(guò)程。SAS/GRAPH統(tǒng)計(jì)圖形分析SAS/GHAPH可將數(shù)據(jù)及其包含著的深層信息以多種圖形生動(dòng)地呈現(xiàn)出來(lái),如直方圖、圓餅圖、星形圖、散點(diǎn)相關(guān)圖、曲線(xiàn)圖、三維曲面圖、等高線(xiàn)圖及地理圖等。SAS/GHAPH提供一個(gè)全屏幕編輯器,提供多種設(shè)備程序,支持非常廣泛的圖形輸出設(shè)備以及標(biāo)準(zhǔn)的圖形交換文件。
·SAS/ASSIST模塊
SAS/ASSIST為SAS系統(tǒng)提供了面向任務(wù)的菜單界面,借助它可以通過(guò)菜單系統(tǒng)來(lái)使用SAS系統(tǒng)其它產(chǎn)品。它自動(dòng)生成的SAS程序既可輔助有經(jīng)驗(yàn)的用戶(hù)快速編寫(xiě)SAS程序,又可幫助用戶(hù)學(xué)習(xí)SAS。·SAS/AF模塊
SAS/AF是一個(gè)應(yīng)用開(kāi)發(fā)工具。用戶(hù)使用SAS/AF可將包含眾多功能的SAS軟件作為方法庫(kù),利用SAS/AF的屏幕設(shè)計(jì)能力以及SCL語(yǔ)言的處理能力來(lái)快速開(kāi)發(fā)各種功能強(qiáng)大的應(yīng)用系統(tǒng)。SAS/AF也了采用了OOP(面向?qū)ο缶庉?技術(shù),使用戶(hù)可方便快速開(kāi)發(fā)各類(lèi)具有圖形用戶(hù)界面(GUI)的應(yīng)用系統(tǒng)。
·SAS/ETS模塊
SAS/ETS提供豐富的計(jì)量經(jīng)濟(jì)學(xué)和時(shí)間序列分析方法,是研究復(fù)雜系統(tǒng)和進(jìn)行預(yù)測(cè)的有力工具。它提供方便的模型設(shè)定手段、ARIMA模型、譜分析功能、線(xiàn)性聯(lián)立方程模型、季節(jié)調(diào)整、預(yù)測(cè)、財(cái)政數(shù)據(jù)分析等。還有多樣的參數(shù)估計(jì)方法。·SAS/OR模塊
SAS/OR提供全面的運(yùn)籌學(xué)方法,是一種強(qiáng)有力的決策支持工具。它輔助人們實(shí)現(xiàn)對(duì)人力、時(shí)間以及其它各種資源的最佳利用。SAS/OR包含通用的線(xiàn)性規(guī)劃、混合整數(shù)規(guī)劃和非線(xiàn)性規(guī)劃的求解,也為專(zhuān)門(mén)的規(guī)劃問(wèn)題提供更為直接的解決辦法,如網(wǎng)絡(luò)流問(wèn)題、運(yùn)輸問(wèn)題、分配問(wèn)題等。
·SAS/EIS模塊
SAS/EIS是決策工具,也是一個(gè)快速應(yīng)用開(kāi)發(fā)工具。SAS/EIS完全采用新興的面向?qū)ο蟮木幊棠J?OOP)。EIS以生動(dòng)直觀(guān)的方式(圖或表)將關(guān)鍵性或總結(jié)性信息呈現(xiàn)給使用者。
·SAS/ACCESS模塊為了對(duì)眾多不同格式的數(shù)據(jù)進(jìn)行查詢(xún)、訪(fǎng)問(wèn)和分析,SAS/ACCESS提供了與目前許多流行數(shù)據(jù)庫(kù)軟件的接口,利用SAS/ACCESS,可建立外部其它數(shù)據(jù)庫(kù)的一個(gè)統(tǒng)一的公共數(shù)據(jù)界面。SAS/ACCESS提供的接口是透明的和動(dòng)態(tài)的。用戶(hù)不必將此文件當(dāng)作真正存儲(chǔ)著數(shù)據(jù)的SAS數(shù)據(jù)集一樣使用,而只需在SAS中建立對(duì)外部的描述(即VIEW)文件,便可將此文件當(dāng)作真正存儲(chǔ)著數(shù)據(jù)的SAS數(shù)據(jù)集一樣使用。對(duì)一些經(jīng)常使用的外部數(shù)據(jù),可以利用SAS/ACCESS將數(shù)據(jù)真正提取進(jìn)入SAS數(shù)據(jù)庫(kù)。SAS/ACCESS提供的接口是雙向的,既可將數(shù)據(jù)讀入SAS,也可在SAS中更新外部數(shù)據(jù)或?qū)AS數(shù)據(jù)加載到外部數(shù)據(jù)庫(kù)中。編輯窗口信息記錄窗口輸出窗口SAS版本的界面,瀏覽窗口統(tǒng)計(jì)求解SAS8軟件有五個(gè)基本窗口:
1、OUTPUT顯示程序有關(guān)結(jié)果的輸出窗口
輸出窗口顯示SAS程序的文本型輸出(圖形輸出單獨(dú)有一個(gè)GRAPHICS窗口)。輸出分頁(yè)顯示。2、LOG顯示程序運(yùn)行信息記錄窗口,運(yùn)行記錄窗口記錄程序的運(yùn)行情況,運(yùn)行是成功還是出錯(cuò),運(yùn)行所用時(shí)間,如果出錯(cuò),錯(cuò)在什么地方。運(yùn)行記錄窗口中以紅色顯示的是錯(cuò)誤信息。
3、ENHANCEDEDITOR增強(qiáng)型編輯窗口
4、RESULTS結(jié)果窗口,具有索引性,提供結(jié)果目錄。
5、EXPLORER瀏覽窗口,具有索引性,提供文件庫(kù)目錄。LOG視窗用于輸出程序在運(yùn)行時(shí)的各種有關(guān)信息。主要有以下幾種內(nèi)容:程序行黑色,以系統(tǒng)給出的順序行號(hào)123...開(kāi)始。記錄執(zhí)行過(guò)的每一條語(yǔ)句。提示藍(lán)色,以NOTE開(kāi)始。提供系統(tǒng)或程序運(yùn)行的一些常規(guī)信息。警告綠色,以WARNING開(kāi)始。有時(shí)也提供內(nèi)存不足、軟件執(zhí)照即將到期等信息。錯(cuò)誤紅色,以ERROR開(kāi)始。SAS界面命令輸錯(cuò)時(shí)顯示“紅色”可以同時(shí)打開(kāi)幾個(gè)編輯窗口在下面顯示各窗口的提示假設(shè)我們有一個(gè)班學(xué)生的數(shù)學(xué)成績(jī)和語(yǔ)文成績(jī),數(shù)學(xué)滿(mǎn)分為100,語(yǔ)文滿(mǎn)分為120,希望計(jì)算學(xué)生的平均分?jǐn)?shù)(按百分制)并按此排名,可以在程序窗口輸入此程序:title‘95級(jí)1班學(xué)生成績(jī)排名’;datac9501;inputname$1-10sex$mathchinese;avg=math*0.5+chinese/120*100*0.5;cards;李明男9298張紅藝女89106
王思明男8690張聰男98109劉潁女80110;run;procprint;run;procsortdata=c9501;bydescendingavg;/*按平均成績(jī)從大到小排*/run;procprint;run;程序舉例SAS語(yǔ)法簡(jiǎn)介SAS最基本的操作是如何編寫(xiě)、高度、保存、裝載、運(yùn)行程序。SAS程序的簡(jiǎn)單舉例SAS程序一般有兩個(gè)部分組成SAS數(shù)據(jù)集與SAS過(guò)程或分成兩步:1、數(shù)據(jù)步:數(shù)據(jù)建立部分DATA2、過(guò)程步:計(jì)算程序部分proceduretitle‘95級(jí)1班學(xué)生成績(jī)排名’;datac9501;inputname$sex$mathchinese;avg=math*0.5+chinese/120*100*0.5;cards;李明男9298紅藝女89106王思明男8690張聰男98109
劉潁女80110;procprint;run;procsortdata=c9501;bydescendingavg;procprint;run;加權(quán)平均數(shù)據(jù)集名輸入數(shù)據(jù)變量名SAS程序舉例SAS的運(yùn)算符名稱(chēng)加減乘除乘方符號(hào)+-*/**運(yùn)算式中最容易丟失乘號(hào)“*”如Y=3X要寫(xiě)成Y=3*XY=X5寫(xiě)成Y=X**5名稱(chēng)等于不等于大于小于大于等于小于等于屬于符號(hào)=^=><>=<=In字母EQNEGTLTGELEIN例:X≠3寫(xiě)成X^=3或XNE3比較運(yùn)算的結(jié)果是邏輯值,真為1,假為03<5的運(yùn)算結(jié)果是1IFX<60THENN=N+1計(jì)不及格人數(shù)名稱(chēng)與或非字母ANDORNOT符號(hào)&|^邏輯運(yùn)算符運(yùn)算結(jié)果為邏輯值,真為1,假為0。><<>∣∣取小取大聯(lián)接A=3,B=5X=A><B則X=3A=3,B=5Y=A<>BY=5A=“my”,B=“SAS”M=A∣∣BM=“mySAS”操作符的執(zhí)行順序1、括號(hào)優(yōu)先2、具有較高優(yōu)先級(jí)的操作先執(zhí)行P14執(zhí)行次序按組號(hào)從小到大SAS語(yǔ)法規(guī)則:SAS語(yǔ)句可以在任一行的的任一列開(kāi)始或結(jié)束。每個(gè)SAS語(yǔ)句用分號(hào)“;”結(jié)束。幾個(gè)語(yǔ)句可寫(xiě)在一行。也可以一個(gè)語(yǔ)句寫(xiě)成多行。SAS程序中大小寫(xiě)一般不區(qū)分(字符串中要區(qū)分大小寫(xiě))SAS程序中的空格、空行一般可以任意放置,這樣我們可以安排適當(dāng)?shù)目s進(jìn)格式使得源程序結(jié)構(gòu)清楚易讀。SAS程序由兩部分構(gòu)成,數(shù)據(jù)部分,以DATA語(yǔ)句開(kāi)始。用于計(jì)算和建立數(shù)據(jù)集.過(guò)程部分,以PROC語(yǔ)句開(kāi)始。以RUN語(yǔ)句結(jié)束。用于統(tǒng)計(jì)分析.注釋?zhuān)海?)在語(yǔ)句開(kāi)頭加一個(gè)“*”號(hào),表示這一行是注釋句。(2)在命令后用/*…..*/表示注釋標(biāo)題語(yǔ)句格式TITLE“標(biāo)題內(nèi)容”字符變量名后要加$,如name$,city$,SEX$變量的標(biāo)簽(lable),是一個(gè)代替變量名的描述性標(biāo)識(shí)。缺失的數(shù)據(jù)SAS用“.”表示變量名縮寫(xiě)形式:如X1,X2,X3,X4帶有序號(hào)的變量名,可以用X1—X4表示。要求這些變量類(lèi)型必須相同。建立數(shù)據(jù)集命令格式:DATA數(shù)據(jù)集名;(建立數(shù)據(jù)集并命名)INPUT變量表;(按順序列出變量名)CARDS;(表示以下是數(shù)據(jù)區(qū))數(shù)據(jù);(;表示數(shù)據(jù)區(qū)結(jié)束)RUN;(DATA命令結(jié)束)DROP變量表;將指定變量不作為所建數(shù)據(jù)集的變量KEEP變量表;只將指定的變量作為所建數(shù)據(jù)集的變量指針控制讀取數(shù)據(jù)符號(hào)@@在INPUT語(yǔ)句未尾,表示讀一個(gè)觀(guān)測(cè)值后不換行,讀完一行數(shù)據(jù)才換行。在SAS中用賦值語(yǔ)句計(jì)算一個(gè)值并存放到變量中。賦值語(yǔ)句格式為:變量名=表達(dá)式;計(jì)算右邊的表達(dá)式再存入左邊的變量中。例如:
avg=(math+chinese/120*100)/2;賦值語(yǔ)句用一個(gè)公式計(jì)算平均分?jǐn)?shù)。OUTPUT輸出語(yǔ)句OUTPUT語(yǔ)句是一個(gè)可執(zhí)行語(yǔ)句,它使得當(dāng)前觀(guān)測(cè)被寫(xiě)到語(yǔ)句指定的數(shù)據(jù)集中。格式:OUTPUT數(shù)據(jù)集名;OUTPUT所用的數(shù)據(jù)集必須事先被定義過(guò),要先用DATA語(yǔ)句定義。不指定數(shù)據(jù)集名的OUTPUT語(yǔ)句輸出到第一個(gè)結(jié)果數(shù)據(jù)集。OUTPUT語(yǔ)句可以用來(lái)強(qiáng)行寫(xiě)入數(shù)據(jù)集而不必象我們?cè)跀?shù)據(jù)步流程圖中說(shuō)明的那樣等到數(shù)據(jù)步最后一個(gè)語(yǔ)句完成。數(shù)據(jù)步中有了OUTPUT語(yǔ)句后數(shù)據(jù)步流程中不再有自動(dòng)寫(xiě)入觀(guān)測(cè)的操作,而只能由OUTPUT語(yǔ)句指定輸出。自動(dòng)寫(xiě)入方式是在數(shù)據(jù)步程序中當(dāng)執(zhí)行完最后一個(gè)數(shù)據(jù)步語(yǔ)句時(shí),系統(tǒng)自動(dòng)將當(dāng)前觀(guān)測(cè)值送入數(shù)據(jù)集,使數(shù)據(jù)集增加一個(gè)觀(guān)測(cè)值。例:DATANEW;INPUTX1-X3;Y=X1;OUTPUT;Y=X2;OUTPUT;Y=X3;OUTPUT;CARDS;123456PROCPRINT;RUN;輸出結(jié)果:OBSX1X2X3Y112312123231233445645456564566例:DATANEW;INPUTNAME$AGESCORE@@;IFAGE<=30THENOUTPUT;CARDS;ZHANG2889WANG2579LIU5999PROCPRINT;RUN;結(jié)果:ZHANG2889WANG2579標(biāo)簽語(yǔ)句LABEL格式LABEL變量=“標(biāo)簽”用于給變量定義標(biāo)簽。例:DATASAS432;INPUTX$y@@; LABELX=“NAME”Y=“WEIGHT”; CARDS; ZHANG61LI57 PROCPRINT;LABELX=“NAME”Y=“WEIGHT”;
RUN;結(jié)果OBSNAMEWEIGHTzhang61Li57標(biāo)簽條件判斷語(yǔ)句IF條件是否滿(mǎn)足?YNTHEN后的語(yǔ)句下一語(yǔ)句棱形框,一個(gè)入口,兩個(gè)出口條件分支語(yǔ)句格式:IF條件
THEN語(yǔ)句;
如果在某條件滿(mǎn)足時(shí)執(zhí)行THEN后的操作語(yǔ)句。例如:如果X為正數(shù)則顯示“X為正數(shù)”,可以用IFx>0THENPUT'X為正數(shù)';例DATASAS441;INPUTNAME$SCORE@@;IFSCORE>80THENGRADE='A';IF60<=SCORE<=80THENGRADE='B';IFSCORE<60THENGRADE='C';CARDS;ZHANG75LI90WANG55PROC
PRINT;RUN;有時(shí)我們?cè)跅l件成立時(shí)需要進(jìn)行的操作無(wú)法用一個(gè)語(yǔ)句完成,這時(shí)可以使用SAS提供的復(fù)合語(yǔ)句功能:只要把若干個(gè)語(yǔ)句用“DO;”語(yǔ)句和“END;”語(yǔ)句包圍起來(lái),就可以把它們看作是一個(gè)語(yǔ)句,就可以用在需要指定一個(gè)語(yǔ)句的地方。格式IF條件THENDO;多個(gè)語(yǔ)句END;如果同時(shí)需要規(guī)定條件不成立時(shí)進(jìn)行什么操作,使用帶有ELSE字句的IF結(jié)構(gòu):IF條件
THEN語(yǔ)句1;ELSE語(yǔ)句2;
其中“語(yǔ)句”均可以是復(fù)合語(yǔ)句。例如,當(dāng)X為非負(fù)時(shí)將X加倍,為負(fù)時(shí)將X取絕對(duì)值,用如下程序:IFx>=0THENx=2*x;ELSEx=-x;SELECT語(yǔ)句的另一種形式為:SELECT;WHEN(條件)語(yǔ)句;WHEN(條件)語(yǔ)句;……
OTHERWISE語(yǔ)句;END;
這種SELECT語(yǔ)句沒(méi)有選擇表達(dá)式,而是在每一個(gè)WHEN語(yǔ)句指定一個(gè)條件(邏輯表達(dá)式),執(zhí)行第一個(gè)滿(mǎn)足條件的WHEN后的語(yǔ)句。如果所有條件都不滿(mǎn)足則執(zhí)行OTHERWISE后的語(yǔ)句。例如:SELECT;WHEN(age<=12)put‘少年’
;WHEN(age<35)put‘青年’
;OTHERWISEput‘中老年’
;END;循環(huán)結(jié)構(gòu)SAS數(shù)據(jù)步可以使用豐富的循環(huán)結(jié)構(gòu),主要的是兩種:計(jì)數(shù)DO循環(huán)和當(dāng)型、直到型循環(huán)。計(jì)數(shù)DO循環(huán)的寫(xiě)法是:DO計(jì)數(shù)變量=起始值
TO結(jié)束值
BY步長(zhǎng);循環(huán)體語(yǔ)句……
END;在DO和END之間可以有多個(gè)語(yǔ)句。程序先把計(jì)數(shù)變量賦值為起始值,如果此值小于等于結(jié)束值則執(zhí)行循環(huán)體語(yǔ)句,然后把計(jì)數(shù)變量加上步長(zhǎng),再判斷它是否小于等于結(jié)束值,如果是則繼續(xù)執(zhí)行循環(huán)體,直到計(jì)數(shù)變量的值大于結(jié)束值為止。結(jié)構(gòu)中“BY步長(zhǎng)”可以省略,這時(shí)步長(zhǎng)為1。如果步長(zhǎng)取負(fù)值,則繼續(xù)循環(huán)的條件是計(jì)數(shù)變量大于等于結(jié)束值。例如:data;DOi=1TO20BY2;j=i**3;puti3.j5.;END;run;
可以輸出一個(gè)1,3,5,7,…,19的立方表。在循環(huán)體中可以用LEAVE語(yǔ)句跳出循環(huán),相當(dāng)于C語(yǔ)言的break語(yǔ)句。例如在上例中的循環(huán)體最后加上這樣一句可以在立方大于1000時(shí)停止循環(huán):
ifj>1000thenLEAVE;在循環(huán)體內(nèi)用CONTINUE語(yǔ)句可以立即結(jié)束本輪循環(huán)并轉(zhuǎn)入下一輪循環(huán)的判斷與執(zhí)行。比如:data;Dox=0to3.1415926by0.01;y=sin(x);ify<0thenCONTINUE;z=cos(x);putx5.2y20.7z20.7;end;run;當(dāng)型循環(huán)的語(yǔ)法是:DOWHILE(循環(huán)繼續(xù)條件);循環(huán)體語(yǔ)句……END;程序先判斷循環(huán)繼續(xù)條件是否成立,成立時(shí)執(zhí)行循環(huán)體語(yǔ)句,再判斷循環(huán)繼續(xù)條件,如此重復(fù),直到循環(huán)繼續(xù)條件不再成立。例如,下面的程序判斷1333333是不是素?cái)?shù):data;x=1333333;i=3;DOWHILE(mod(x,i)^=0);i=i+2;END;ifi<xthenputx‘不是素?cái)?shù)’;elseputx‘是素?cái)?shù)’;run;
其中mod(x,i)表示x除以i的余數(shù)。
直到型循環(huán)的寫(xiě)法是:DOUNTIL(循環(huán)退出條件);
循環(huán)體語(yǔ)句……END;程序先執(zhí)行循環(huán)體,然后判斷循環(huán)退出條件是否成立,成立則結(jié)束循環(huán),否則繼續(xù)。注意每輪循環(huán)都是先執(zhí)行循環(huán)體再判斷是否退出。例如:data;n=0;dountil(n>=5);n+1;putn=;end;run;
可以依次輸出n=1,2,3,4,5,當(dāng)n=5時(shí)退出條件“n>=5”滿(mǎn)足,循環(huán)結(jié)束。上例中語(yǔ)句n+1是一種特殊的寫(xiě)法,叫做累加語(yǔ)句,等價(jià)于n=n+1。SAS的循環(huán)語(yǔ)句比上面所述還要靈活得多,它在DO語(yǔ)句中可以指定一個(gè)循環(huán)列表,比如:data;doi=5,7,11to17by3while(i**2<200);j=i**2;Putij;end;run;
循環(huán)變量i取5,7,11,14循環(huán)體被執(zhí)行,當(dāng)i取17時(shí)i的平方為289故循環(huán)體不被執(zhí)行,循環(huán)結(jié)束。注意WHILE條件只作用于用逗號(hào)隔開(kāi)的最后一項(xiàng)。數(shù)據(jù)集的復(fù)制與修改SET比如要把數(shù)據(jù)集WORK.C9501復(fù)制為數(shù)據(jù)集SASUSER.CLS,只要用如下程序:datasasuser.cls;setc9501;run;這樣的程序流程中也有一個(gè)隱含循環(huán),程序在數(shù)據(jù)步內(nèi)反復(fù)循環(huán),直到輸入數(shù)據(jù)集C9501最后一個(gè)觀(guān)測(cè)讀過(guò)。SAS的數(shù)據(jù)集修改。比如,我們把超過(guò)100分的語(yǔ)文成績(jī)都改為100分,就可以用如下程序:datac9501a;setc9501;ifchinese>100thenchinese=100;run;在數(shù)據(jù)步中可以用KEEP語(yǔ)句或DROP語(yǔ)句指定要保留的變量或要丟棄的變量。比如,datac9501b;Setc9501;keepnameavg;run;可以指定一個(gè)條件取出數(shù)據(jù)集的某些行組成的子集。比如,我們希望取出數(shù)學(xué)分?jǐn)?shù)90分以上,語(yǔ)文分?jǐn)?shù)100分以上的學(xué)生的觀(guān)測(cè),可以用如下的“子集IF語(yǔ)句”:datac9501c;setc9501;IFmath>=90andchinese>=100;run;注意子集IF語(yǔ)句不同于我們前面所講的分支語(yǔ)句,它沒(méi)有THEN部分,只有條件,用于取出滿(mǎn)足條件的行子集。多個(gè)數(shù)據(jù)集的縱向合并SET命令將多個(gè)結(jié)構(gòu)相同的數(shù)據(jù)集連接到一起。有四個(gè)班的學(xué)生的數(shù)據(jù)集Class1-Class4,每個(gè)數(shù)據(jù)集包含一個(gè)班學(xué)生的學(xué)號(hào)、姓名、性別信息,我們希望把這些數(shù)據(jù)集合并為一個(gè)大數(shù)據(jù)集,可以用如下程序:dataclasses;setclass1class2class3class4;run;要把若干個(gè)結(jié)構(gòu)相同的數(shù)據(jù)集合并為一個(gè)數(shù)據(jù)集,只要在DATA語(yǔ)句中指定要生成的大數(shù)據(jù)集的名字,然后在數(shù)據(jù)步中使用SET語(yǔ)句并在SET語(yǔ)句中依次列出各小數(shù)據(jù)集。數(shù)據(jù)集的橫向合并命令MERGE
兩個(gè)(或多個(gè))數(shù)據(jù)集如果包含了同樣的一些觀(guān)測(cè)的不同屬性(變量),數(shù)據(jù)集C9501U包含學(xué)生的姓名、性別,數(shù)據(jù)集C9501V包含學(xué)生的數(shù)學(xué)成績(jī),數(shù)據(jù)集C9501W包含學(xué)生的語(yǔ)文成績(jī).先按變量ID排序.MERGE語(yǔ)句的數(shù)據(jù)步把它們左右橫向合并到一個(gè)數(shù)據(jù)集NEW:datanew;mergec9501uc9501vc9501w;Byid;run;所以橫向合并一般應(yīng)該采用按關(guān)鍵字ID合并的辦法,即先把每個(gè)數(shù)據(jù)集按照相同的、能唯一區(qū)分各觀(guān)測(cè)的一個(gè)(或幾個(gè))變量排序,然后用BY語(yǔ)句和MERGE語(yǔ)句聯(lián)合使用,這樣即使原來(lái)觀(guān)測(cè)順序不一致也可以保證橫向合并的結(jié)果沒(méi)有錯(cuò)。例先把C9501數(shù)據(jù)集橫向拆分為包含姓名、性別的數(shù)據(jù)集C9501X和包含姓名、數(shù)學(xué)成績(jī)、語(yǔ)文成績(jī)的數(shù)據(jù)集C9501Y,然后按關(guān)鍵字橫向合并:其中的PROCSORT是排序過(guò)程,用來(lái)把數(shù)據(jù)集按照某個(gè)變量的次序排序(這里是按變量NAME的次序排列,用BY語(yǔ)句指定排序的變量名)。datac9501x;setc9501;keepnamesex;run;datac9501y;setc9501;keepnamemathchinese;run;
proc
sortdata=c9501x;byname;run;proc
sortdata=c9501y;byname;run;datanew;mergec9501xc9501y;byname;run;proc
print;run;
用三個(gè)doend語(yǔ)句輸入帶三個(gè)下標(biāo)的一維變量Rfmr(f=1-4;m=1-3;r=1,2)(兩因素+重復(fù))datarockey;/*注:輸入Rfmr(f=1-4;m=1-3;r=1,2)(兩因素+重復(fù))*//*順序行標(biāo)f→列標(biāo)m→重復(fù)r*/dof=1to4;dom=0to12by6;dorep=1to2;inputR@@;output;end;end;end;cards;58.252.656.241.265.360.849.142.854.150.551.648.460.158.370.973.239.240.775.871.558.25148.741.4;/*可以看到輸入數(shù)據(jù)時(shí)與表格形式一致*/run;FORMAT語(yǔ)句轉(zhuǎn)換解釋變量值dataE28;inputname$sex$agerankx1x2x3;cards;Am1211.13.83.8Bw834.5-5.7./*遺漏數(shù)據(jù)一定要加符號(hào).*/Cm484-8.2-8.29.7Aw2311.21.21.2Am2622.54524;procprint;run;procformat;/*第一個(gè)format給出轉(zhuǎn)換定義*/valueran1=優(yōu)2=良3=中4=“差”;/*將數(shù)值變量定義成文字*/valueagefmtlow-12=兒童13-19=少年20-high=“成年”;/*將數(shù)值變量范圍定義成文字*/value$name"A"="甲級(jí)""B"="乙級(jí)""C"="丙級(jí)""D"="丁級(jí)";/*將文字變量用文字變量取代*/value$sexfmt"m"=0"w"=1;/*將文字變量用數(shù)值變量取代*/dataE29;/*數(shù)據(jù)即E28,注意format轉(zhuǎn)換后數(shù)據(jù)形式改變*/inputname$sex$agerankx1x2x3;formatrankran.ageagefmt.namename.sexsexfmt.;/*第二個(gè)format將轉(zhuǎn)換定義引入數(shù)據(jù)集,注意變量對(duì):前者是DATA語(yǔ)句中變量對(duì)應(yīng)后者是format中變量(加后綴.),即使變量名不變也要有此變量對(duì)*/cards;Am1211.13.83.8Bw834.5-5.7./*遺漏數(shù)據(jù)一定要加符號(hào).否則SAS會(huì)將該行數(shù)據(jù)自行刪除*/Cm484-8.2-8.29.7Aw1611.21.21.2Am2622.54524;procprint;run;PROC過(guò)程名[DATA=數(shù)據(jù)集名][選項(xiàng)];
該過(guò)程的專(zhuān)用語(yǔ)句描述;
[VAR變量序列;]
[WHERE條件表達(dá)式...;]
[BY變量序列;]Run;過(guò)程的格式方括號(hào)里的語(yǔ)句表示可選項(xiàng)。選項(xiàng)是可選的,用來(lái)規(guī)定過(guò)程運(yùn)行的一些設(shè)置,如果有多個(gè)選項(xiàng)用空格分開(kāi)。當(dāng)所有選項(xiàng)均省略,在這時(shí)該過(guò)程按最通常的情況來(lái)處理,即:處理最新建立的SAS數(shù)據(jù)集。處理所有的變量(或?qū)σ粋€(gè)計(jì)算過(guò)程來(lái)說(shuō)處理全部數(shù)值變量)。一次處理整個(gè)數(shù)據(jù)集而不是某個(gè)子集。Print過(guò)程PRINT過(guò)程是將數(shù)據(jù)集的內(nèi)容打印出來(lái)。例:DATAh61;INPUTname$sex$mathchinese;Cards;Zhoum8996Wuf7788Zhengm6887Wangf8669;Run;Procprint;Run;obsnamesexmathchinese;1Zhoum89962Wuf77883Zhengm68874Wangf8669SAS過(guò)程步常用語(yǔ)句一、VAR語(yǔ)句VAR語(yǔ)句在很多過(guò)程中用來(lái)指定分析變量。在VAR后面給出變量列表:VAR變量名1變量名2…變量名n;例如:在上例中PRINT語(yǔ)句后加VAR。只顯示所指定的變量值。varmathchinese;變量名列表可以使用省略的形式,如X1-X3,MATH--CHINESE等。ID語(yǔ)句有些過(guò)程(如PRINT、UNIVARIATE)需要輸出觀(guān)測(cè)的代號(hào),這一般使用觀(guān)測(cè)的序號(hào)。但是,如果數(shù)據(jù)集中有一個(gè)變量可以用來(lái)區(qū)分觀(guān)測(cè)(如人名、省市名),就可以用ID語(yǔ)句指定這個(gè)變量作為觀(guān)測(cè)標(biāo)識(shí),如:idname;指定用變量NAME的值來(lái)標(biāo)識(shí)觀(guān)測(cè)。Procprint;varmathchinese;Idname;Run;namemathchinese;Zhou8996Wu7788Zheng6887Wang8669BY語(yǔ)句格式:BY變量;在使用帶有BY語(yǔ)句的過(guò)程步之前一般先用SORT過(guò)程對(duì)數(shù)據(jù)集排序。如,假設(shè)我們已經(jīng)把C9501數(shù)據(jù)集按性別排序,則下列PRINT過(guò)程可以把男、女生分別列出:分組分析procprintdata=c9501;bysex;run;排序PROCSORTDATA=c9501;
BYsex;RUN;BY語(yǔ)句在過(guò)程中一般用來(lái)指定一個(gè)或幾個(gè)分組變量,根據(jù)這些分組變量值把觀(guān)測(cè)分組,然后對(duì)每一組觀(guān)測(cè)分別進(jìn)行本過(guò)程指定的分析。
TheSASSystem23:01Tuesday,September10,20022‘性別’=fOBSNAMEMATHCHINESE1Wu77882Wang8669‘性別’=mOBSNAMEMATHCHINESE3Zhou89964Zheng6887DATAh61;INPUTname$sex$mathchinese;Cards;Zhoum8996Wuf7788Zhengm6887Wangf8669;Run;procsort;bysex;Procprintdata=h61;bysex;
Run;在一些過(guò)程(如方差分析)中,使用CLASS語(yǔ)句指定一個(gè)或幾個(gè)分類(lèi)變量,它實(shí)際相當(dāng)于因變量。而在另一些過(guò)程(如MEANS)中,CLASS語(yǔ)句:CLASS語(yǔ)句作用與BY語(yǔ)句類(lèi)似,可以指定分類(lèi)變量,把觀(guān)測(cè)按分類(lèi)變量分類(lèi)后分別進(jìn)行分析。使用CLASS時(shí)不需要先按分類(lèi)變量排序。格式:CLASS變量表;四、OUTPUT語(yǔ)句在過(guò)程步中經(jīng)常用OUTPUT語(yǔ)句指定輸出結(jié)果存放的數(shù)據(jù)集。不同過(guò)程中把輸出結(jié)果存入數(shù)據(jù)集的方法各有不同,OUTPUT語(yǔ)句是用得最多的一種。一般格式為:OUTPUTOUT=輸出數(shù)據(jù)集名[關(guān)鍵字=變量名…];其中用OUT=給出了要生成的結(jié)果數(shù)據(jù)集的名字,用“關(guān)鍵字=變量名”的方式指定了輸出哪些結(jié)果(關(guān)鍵字的例子比如MEANS過(guò)程中的MEAN,VAR,STD等等),等號(hào)后面的變量名指定了這些結(jié)果在輸出數(shù)據(jù)集中叫什么名字。DATAh61;INPUTname$sex$mathchinese;Labelname=‘姓名’sex=‘性別’math=‘?dāng)?shù)學(xué)’chinese=‘語(yǔ)文’;Cards;Zhoum8996Wuf7788Zhengm6887Wangf8669;Run;procmeansdata=h61;varmath;outputout=sasuser.resultrun;procprintdata=sasuser.result;run;
TheSASSystem23:01Tuesday,September10,20028OBS_TYPE__FREQ__STAT_MATH104N4.0000
204MIN68.0000304MAX89.0000404MEAN80.0000504STD9.4868二、MODEL語(yǔ)句MODEL語(yǔ)句在一些統(tǒng)計(jì)建模過(guò)程中用來(lái)指定模型的形式。其一般形式為
MODEL因變量=自變量表/選項(xiàng);比如model
math=chinese;即用語(yǔ)文成績(jī)預(yù)測(cè)數(shù)學(xué)成績(jī)。WEIGHT語(yǔ)句WEIGHT語(yǔ)句指定一個(gè)權(quán)重變量,在某些允許加權(quán)的過(guò)程中代表權(quán)重,其值與觀(guān)測(cè)對(duì)應(yīng)的方差的倒數(shù)成比例。身高人數(shù)比重160150.25165250.42180200.33Datah522;Inputheightnumber@@;Cards;1600.251650.421800.33;Procmean;Freqnumber;Run;
00:35Wednesday,September11,2002AnalysisVariable:HEIGHTNMeanStdDevMinimumMaximum3168.70000005.7797059160.0000000180.0000000
八、LABEL語(yǔ)句LABEL語(yǔ)句為變量指定一個(gè)標(biāo)簽,很多過(guò)程可以使用這樣的標(biāo)簽。其格式為L(zhǎng)ABEL變量名=‘標(biāo)簽’變量名=‘標(biāo)簽’
…;例如
procprintdata=sasuser.c9501
label;
idname;
varmathchinese;
labelname=‘姓名’
math=‘?dāng)?shù)學(xué)成績(jī)’
chinese=‘語(yǔ)文成績(jī)’;
run;結(jié)果顯示
姓名數(shù)學(xué)成績(jī)語(yǔ)文成績(jī)
李明9298
張紅藝89106
王思明8690
張聰98109
劉潁80110描述統(tǒng)計(jì)描述統(tǒng)計(jì)學(xué)主要用于已知總體數(shù)據(jù),求總體的平均、方差,標(biāo)準(zhǔn)差,極差、極值、等指標(biāo)。做直方圖和餅圖、線(xiàn)圖等圖形。表2.2
SAS中可以計(jì)算的描述性統(tǒng)計(jì)量關(guān)鍵字及其含義關(guān)鍵字所代表的含義n有效數(shù)據(jù)記錄數(shù)nmiss缺失數(shù)據(jù)記錄數(shù)mean均數(shù)std標(biāo)準(zhǔn)差stderr標(biāo)準(zhǔn)誤var方差median中位數(shù)mode眾數(shù)cv變異系數(shù)max最大值min最小值range全距sum總計(jì)sumwgt加權(quán)值總計(jì)css校正的離均差平方和uss未校正的離均差平方和clm可信限(上下界值)lclm可信限下側(cè)界值uclm可信限上側(cè)界值skew(skewness)偏度kurt(kurtosis)峰度t分布位置假設(shè)檢驗(yàn)之t統(tǒng)計(jì)量probt上述t統(tǒng)計(jì)量對(duì)應(yīng)的概率值q1第一四分位數(shù)q3第三四分位數(shù)qrange四分位數(shù)間距p1第一百分位數(shù)p5第五百分位數(shù)p10第十百分位數(shù)p90第九十百分位數(shù)p95第九十五百分位數(shù)p99第九十九百分位數(shù)實(shí)現(xiàn)描述性統(tǒng)計(jì)功能的幾個(gè)過(guò)程描述性統(tǒng)計(jì)指標(biāo)的計(jì)算可以用四個(gè)不同的過(guò)程來(lái)實(shí)現(xiàn),它們分別是means過(guò)程、summary過(guò)程、univariate過(guò)程以及tabulate過(guò)程。它們?cè)诠δ芊秶途唧w的操作方法上存在一定的差別,下面我們大概了解一下它們的異同點(diǎn)。相同點(diǎn):他們均可計(jì)算出均數(shù)、標(biāo)準(zhǔn)差、方差、標(biāo)準(zhǔn)誤、總和、加權(quán)值的總和、最大值、最小值、全距、校正的和未校正的離差平方和、變異系數(shù)、樣本分布位置的t檢驗(yàn)統(tǒng)計(jì)量、遺漏數(shù)據(jù)和有效數(shù)據(jù)個(gè)數(shù)等,均可應(yīng)用by語(yǔ)句將樣本分割為若干個(gè)更小的樣本,以便分別進(jìn)行分析。不同點(diǎn):(1)means過(guò)程、summary過(guò)程、univariate過(guò)程可以計(jì)算樣本的偏度(skewness)和峰度(kurtosis),而tabulate過(guò)程不計(jì)算這些統(tǒng)計(jì)量;(2)univariate過(guò)程可以計(jì)算出樣本的眾數(shù)(mode),其它三個(gè)過(guò)程不計(jì)算眾數(shù);(3)summary過(guò)程執(zhí)行后不會(huì)自動(dòng)給出分析的結(jié)果,須引用output語(yǔ)句和print過(guò)程來(lái)顯示分析結(jié)果,而其它三個(gè)過(guò)程則會(huì)自動(dòng)顯示分析的結(jié)果;(4)univariate過(guò)程具有統(tǒng)計(jì)制圖的功能,其它三個(gè)過(guò)程則沒(méi)有;(5)tabulate過(guò)程不產(chǎn)生輸出資料文件(存儲(chǔ)各種輸出數(shù)據(jù)的文件),其它三個(gè)均產(chǎn)生輸出資料文件。MEAN過(guò)程格式:PROCmeanS選擇項(xiàng);
VAR變量表;BY變量表;FREQ變量表;WEIGHT變量表;ID變量表;OUTPUTOUT=數(shù)據(jù)集;PROCMEANS[DATA=<數(shù)據(jù)集名>[選項(xiàng)]指定要分析的數(shù)據(jù)集名及一些選項(xiàng)
[統(tǒng)計(jì)量關(guān)鍵字列表]];列出需要的統(tǒng)計(jì)量
[VAR<變量名列>;要分析的變量名列
BY<變量名列>;按變量名列分組統(tǒng)計(jì),要求數(shù)據(jù)集已按變量名列排序
CLASS<變量名列>;按變量名列分組統(tǒng)計(jì),不要求數(shù)據(jù)集排序
FREQ<變量名>;表明該變量為分析變量的頻數(shù)
WEIGHT<變量名>;表明分析變量在統(tǒng)計(jì)時(shí)要按該變量權(quán)重
ID<變量名列>;輸出時(shí)加上該變量作為索引
OUTPUT<OUT=數(shù)據(jù)集名>指定統(tǒng)計(jì)量的輸出數(shù)據(jù)集名關(guān)鍵字=<新變量名列>...];指定統(tǒng)計(jì)量對(duì)應(yīng)的新變量名Procmeans語(yǔ)句后的選項(xiàng)主要用來(lái)指定所要計(jì)算的統(tǒng)計(jì)量,默認(rèn)情況下,Means過(guò)程會(huì)給出頻數(shù)、均數(shù)、標(biāo)準(zhǔn)差、最大值和最小值等,其余統(tǒng)計(jì)量的計(jì)算均需要在選項(xiàng)中指定。class語(yǔ)句所指定的分組變量用來(lái)進(jìn)行分組,而by語(yǔ)句所指定的分組變量是用來(lái)將數(shù)據(jù)分為若干個(gè)更小的樣本,以便SAS分別在各小樣本內(nèi)進(jìn)行各自獨(dú)立的處理。freq語(yǔ)句和weight語(yǔ)句分別引導(dǎo)代表記錄出現(xiàn)頻數(shù)和權(quán)重系數(shù)的數(shù)值變量。var語(yǔ)句引導(dǎo)所要進(jìn)行分析的所有變量的列表,SAS將對(duì)var語(yǔ)句所引導(dǎo)的所有變量分別進(jìn)行描述性統(tǒng)計(jì)分析。NMeanStdDevMinimumMaximum1424.64285713.477557620.000000030.0000000Dataaa;Inputage@@;Cards;2522212126252629302022212829Run;Procmeansdata=aa;varage;Run;DATAA;INPUTGRPABCSEX$AREA$;CARDS;1809070MALEA1708070MALEB1706060FEMALEA.907090MALEB.706080FEMALEA2608070MALEA2556570MALEB2908070FEMALEA;PROCSORT;BYGRP;PROCMEANSMEANSTDNMAXMINRANGE;VARABC;IDSEXAREA;BYGRP;OUTPUTOUT=MSDMEAN=MAMBMCSTD=S1-S3N=NA;PROCPRINT;RUN;輸出文件名ID后的性別與地區(qū)在輸出文件MSD中沒(méi)分組時(shí)是第一個(gè)觀(guān)測(cè)的值。
報(bào)表2.1a描述性的統(tǒng)計(jì)分析GPR=.NObsVariableN Minimum Maximum Range Mean StdDev
2A 2 70.000000090.000000020.0000000 80.0000000 14.1421356 B 2 60.000000070.000000010.0000000 65.0000000 7.0710678 C 2 80.000000090.000000010.0000000 85.0000000 7.0710678
GRP=1NObsVariableN Minimum Maximum Range Mean StdDev
3A 370.000000080.000000010.0000000 73.3333333 5.7735027 B 3 60.000000090.000000030.0000000 76.6666667 15.2752523 C 3 60.000000070.000000010.0000000 66.6666667 5.7735027
GRP=2NObsVariableN Minimum Maximum RangeMean StdDev
3A 3 55.000000090.000000035.0000000 68.3333333 18.9296945 B 3 65.000000080.000000015.0000000 75.0000000 8.6602540 C 3 70.000000070.0000000 0 70.0000000 0
報(bào)表2.1b描述性的統(tǒng)計(jì)分析(將統(tǒng)計(jì)值存入MSD檔) __ TF A YROG SR PEBR EE EQ M M M S S SNSP XA __ A B C 1 2 3C1.MALEB 0280.000065.0000 85.000014.14217.07117.07107221MALEB 0373.333376.6667 66.66675.773515.27535.77350332MALEB 0368.333375.0000 70.000018.92978.66030.000003OUTPUTOUT=MSDMEAN=MAMBMCSTD=S1-S3N=NA;語(yǔ)句的執(zhí)行結(jié)果DATAA;INPUTPRE1-PRE3POST1-POST3;DIFF1=POST1-PRE1;DIFF2=POST2-PRE2;DIFF3=POST3-PRE3;CARDS;102030153050152240183040203060253565182535203640182830152530;PROCMEANSMEANSTDSTDERRTPRT;VARDIFF1-DIFF3;RUN;STDERR標(biāo)準(zhǔn)誤差
T檢驗(yàn)均值等于0PRT顯著性P值
VariableMeanStdDevStdErrorTProb>|T|
DIFF12.40000003.28633531.46969381.63299320.1778DIFF26.20000005.63027532.51793572.46233460.0695DIFF36.00000008.21583843.67423461.63299320.1778
dataaa;dopinzh='A','B';doi=1to10;inputsuishu;output;end;end;cards;1314151718181921222316161718181818192020;procmeansnmeanmaxminrangevarstdcvmaxdec=4fw=8;varsuishu;bypinzh;run;Datanew;Inputname$sex$score1score2@@;Cards;ZhangM8099LiuF6775FengM8998HongM5072LiangF8889WangF4367FangF8779MaF5656JiangF7778luM7682;procstandardout=new1mean=0std=1;varscore1score2;procprintdata=new1;run;Procmeanstprt;run;變量標(biāo)準(zhǔn)化命令描述統(tǒng)計(jì)過(guò)程
univariate過(guò)程的一般格式procunivariate選項(xiàng)列表;
by變量名稱(chēng)(分組變量);
ID變量名稱(chēng)(分組變量);
freq變量名稱(chēng)(數(shù)值變量,用以表示相應(yīng)記錄出現(xiàn)的頻數(shù))
weight變量名稱(chēng)(數(shù)值變量,用以表示相應(yīng)記錄的權(quán)重系數(shù))
histogram變量名稱(chēng)/選項(xiàng)列表
output<out=數(shù)據(jù)集名><統(tǒng)計(jì)量關(guān)鍵字=自定義變量名>
var變量名稱(chēng)(待分析的數(shù)值變量);univariate過(guò)程和其它兩個(gè)過(guò)程的格式非常相似,相同的語(yǔ)句和選項(xiàng)其含義也相同,所不同的是某些統(tǒng)計(jì)量只能在univariate過(guò)程中計(jì)算(如眾數(shù)),以及univariate過(guò)程中所具有的繪圖功能。histogram語(yǔ)句即用來(lái)指示SAS對(duì)其后所指定的變量繪制直方圖,其后的選項(xiàng)用來(lái)指示SAS添加不同類(lèi)型的擬合圖形(如正態(tài)分布的分布密度曲線(xiàn))。語(yǔ)句選項(xiàng)列表:DATA=數(shù)據(jù)集NOPRINT不打印報(bào)表PLOT做圖NOMAL設(shè)為正態(tài)數(shù)據(jù),并給出檢驗(yàn)PCDLDEF=1/2/3/4/5在5種百分?jǐn)?shù)計(jì)算方法中選一個(gè)缺省為4VARDEF=DF/N/WEIGHT選一種自由度計(jì)算方法BOXplot盒式圖下限上限Q3Q1Q1中位*1.5(Q3-Q1)1.5(Q3-Q1)最小最大異常Datanew;Inputname$sex$score1score2@@;Cards;ZhangM8099LiuF6775FengM8998HongM5072LiangF8889WangF4367FangF8779MaF5656JiangF7778luM7682procstandardout=new1mean=0std=1;varscore1score2;run;Procunivariatedata=new1plotnormal;varscore1score2;run;DATAA;INPUTIDCNT@@;CARDS;4005204006344205534028544523554008654009654010664011674050684055694112604222614444644422654007664114664056674118704224714312714048724060744023744002754213784125884333994001120;PROCUNIVARIATEFREQNORMALPLOT;VARCNT;IDID;RUN;PROCFREQ過(guò)程,用于統(tǒng)計(jì)頻數(shù)和百分?jǐn)?shù)。格式:PROCFREQDATA=數(shù)據(jù)集名;
TABLES變量名列;
RUN;Procfreqdata=aa;Tablessexage;Run;例:Dataaa;Inputnumsex$age@@;Cards;101F23102M25107M22110F21109F21111M26;Run;Dataaa;Inputnumsex$age@@;Cards;101F23102M25107M22110F21109F21111M26;Run;Procfreqdata=aa;Tablessex*age;Run;兩個(gè)變量交叉頻數(shù)統(tǒng)計(jì)
TABLEOFSEXBYAGESEXAGEFrequencyPercentRowPctColPct2122232526TotalF20100333.330.0016.670.000.0050.0066.670.0033.330.000.00100.000.00100.000.000.00M0101130.0016.670.0016.6716.6750.000.0033.330.0033.3333.330.00100.000.00100.00100.00Total21111633.3316.6716.6716.6716.67100.00Format格式Procformat選擇項(xiàng);
Value格式名范圍=被輸出值;
Invalue格式名范圍=被輸入值;作用:定義一種輸出格式,可把某變量的值按所定義的格式輸出。Dataaa;Inputage@@;Cards;2522212126252629302022212829Run;procformat;valueagegrplow-<21='--21'21-<25='22--25'25-<28='26--28'28-high='29';run;Procfreqdata=aa;Tablesage;formatageagegrp.;Run;
CumulativeCumulativeAGEFrequencyPercentFrequencyPercent--2117.117.122--25535.7642.926--28428.61071.429428.614100.0運(yùn)行結(jié)果統(tǒng)計(jì)量樣本容量N均值MEAN標(biāo)準(zhǔn)差STD方差VAR變異系數(shù)CV偏度SKEWNSS峰度KURTOSIS總和SUM標(biāo)準(zhǔn)誤未校正平方和校正平方和中位數(shù)MEDIAN眾數(shù)MODEdatasale;inputname$salesregion$type$@@;cards;wanhua9664eastsmliming22969eastsmwanying27253eastsmzhangxi86432eastcwuying99210eastcliulan38928westczhaohua21531westsmliuxiao79345westcmali18523westsmdinghi32915westsmyuzhen42109westsmandong94320westcchenyi25718southsmlimei64700southcchenmin27634southsmlili32719northsmwanzhi38712northsmyanghui97214northcrun;procprint;run;procfreq;tablestype*region;run;procsort;bytype;procmeans;bytype;run;
tabulate過(guò)程的一般格式proctabulate選項(xiàng)列表;
by變量名稱(chēng)(分組變量);
class變量名稱(chēng)(分組變量);
freq變量名稱(chēng)(數(shù)值變量,用以表示相應(yīng)記錄出現(xiàn)的頻數(shù))
weight變量名稱(chēng)(數(shù)值變量,用以表示相應(yīng)記錄的權(quán)重系數(shù))
table<<頁(yè)變量表達(dá)式>,<行變量表達(dá)式>,<列變量表達(dá)式>></表格選項(xiàng)>
var變量名稱(chēng)(待分析的數(shù)值變量,統(tǒng)計(jì)量列入相應(yīng)的表單元格);run;tabulate過(guò)程和上述幾個(gè)過(guò)程的格式也基本相似,相同的語(yǔ)句和選項(xiàng)也代表相同的含義。最大的不同也是tabulate過(guò)程中最為重要的是table語(yǔ)句,他用來(lái)定義表格的具體格式以及表格中所要包括的統(tǒng)計(jì)量。TABLE語(yǔ)句是TABULATE過(guò)程的核心??梢远x三個(gè)表格表達(dá)式。這三個(gè)表達(dá)式分別表達(dá)了輸出表格的頁(yè)、行列的有關(guān)規(guī)定。表達(dá)式的運(yùn)算符:“*”表示包含,空格表示并列,()表示分組,“,”表示相鄰兩個(gè)向量的分界<>表示分母項(xiàng),等號(hào)=表示解釋或輸出格式。例:Datanew;Inputname$sex$score1score2@@;Cards;ZhangM8099LiuF6775FengM8998HongM5072LiangF8889WangF4367FangF8779MaF5656JiangF7778luM7682;procprint;Proctabulateformchar='|-+-+|||+-+';Classsex;Varscore1;Tablesexscore1*(Nmeanstd);Run;
++|SEX||||||F|M|SCORE1||||||N|N|N|MEAN|STD||||||||6.00|4.00|10.00|71.30|16.59|++運(yùn)行結(jié)果:如果改成Tablesex*score1*(Nmeanstd);結(jié)果如何?
++|SEX||||F|M|||||SCORE1|SCORE1|||||N|MEAN|STD|N|MEAN|STD|||||||||6.00|69.67|17.86|4.00|73.75|16.74|++若改為:Tablesex*score1;若改為Varscore1score2;Tablesex*(score1score2);Varscore1score2;Tablesex*(score1*(nmean)score2*(nmean));Ta
溫馨提示
- 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025云南昆明市呈貢區(qū)城市投資集團(tuán)有限公司及下屬子公司第二批員工崗招聘11人模擬筆試試題及答案解析
- 2025海南??谑薪逃侄靖案咝C嫦?026應(yīng)屆畢業(yè)生招聘教師(第一號(hào))備考考試題庫(kù)及答案解析
- 2025四川內(nèi)江市隆昌市石碾鎮(zhèn)中心學(xué)校招聘2人參考考試題庫(kù)及答案解析
- 2026新疆昆玉職業(yè)技術(shù)學(xué)院引進(jìn)高層次人才28人備考考試題庫(kù)及答案解析
- 2025遼寧鞍山市立山區(qū)事業(yè)單位公開(kāi)招聘博士研究生3人考試備考題庫(kù)及答案解析
- 2025廣西南寧賓陽(yáng)縣“點(diǎn)對(duì)點(diǎn)”送工和鄉(xiāng)村公崗專(zhuān)管員招聘1人考試備考題庫(kù)及答案解析
- 網(wǎng)建設(shè)維護(hù)協(xié)議書(shū)
- 網(wǎng)絡(luò)鋪線(xiàn)協(xié)議書(shū)
- 職業(yè)簽約合同范本
- 職工轉(zhuǎn)社保協(xié)議書(shū)
- DRG支付改革下臨床科室績(jī)效優(yōu)化策略
- 2026中央紀(jì)委國(guó)家監(jiān)委機(jī)關(guān)直屬單位招聘24人筆試備考題庫(kù)含答案解析(奪冠)
- 平面包裝設(shè)計(jì)創(chuàng)新創(chuàng)業(yè)
- 中國(guó)與東盟貿(mào)易合作深化路徑與實(shí)踐
- 煙酒店委托合同范本
- 加盟2025年房地產(chǎn)經(jīng)紀(jì)協(xié)議合同
- 2025-2026學(xué)年上海市浦東新區(qū)九年級(jí)(上)期中語(yǔ)文試卷
- 2025至2030中國(guó)商業(yè)攝影行業(yè)市場(chǎng)發(fā)展分析及發(fā)展前景預(yù)測(cè)與投資風(fēng)險(xiǎn)報(bào)告
- 地球系統(tǒng)多源數(shù)據(jù)融合-洞察及研究
- 雨課堂在線(xiàn)學(xué)堂《醫(yī)學(xué)實(shí)驗(yàn)技術(shù)與方法新進(jìn)展》單元考核測(cè)試答案
- 香水銷(xiāo)售知識(shí)培訓(xùn)內(nèi)容課件
評(píng)論
0/150
提交評(píng)論