第2章 數(shù)學(xué)基礎(chǔ)和sas軟件基礎(chǔ)_第1頁
第2章 數(shù)學(xué)基礎(chǔ)和sas軟件基礎(chǔ)_第2頁
第2章 數(shù)學(xué)基礎(chǔ)和sas軟件基礎(chǔ)_第3頁
第2章 數(shù)學(xué)基礎(chǔ)和sas軟件基礎(chǔ)_第4頁
第2章 數(shù)學(xué)基礎(chǔ)和sas軟件基礎(chǔ)_第5頁
已閱讀5頁,還剩37頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

1、第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),2.1統(tǒng)計學(xué)與概率論基礎(chǔ)知識1.隨機(jī)變量隨機(jī)變量的含義離散型連續(xù)型密度函數(shù)分布函數(shù)隨機(jī)變量在某個區(qū)間上的取值的概率也可以表示為。,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),2.隨機(jī)變量的數(shù)值特征期望值常用表示期望值的概念方差標(biāo)準(zhǔn)差,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),協(xié)方差:測算兩個隨機(jī)變量之間相互關(guān)系的統(tǒng)計指標(biāo)相關(guān)系數(shù)a.完全正相關(guān)b.完全負(fù)相關(guān)c.完全不相關(guān),第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),偏度:衡量隨機(jī)變量的概率分布圍繞其均值是否對稱,公式定義為正偏態(tài):負(fù)偏態(tài):偏度系數(shù):峰度:反映的是隨機(jī)變量概率密度函數(shù)尾部的厚尾(或稱為寬度)的統(tǒng)計量,通常用于判斷某個隨機(jī)變量

2、是否服從正態(tài)分布,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),峰度系數(shù):若隨機(jī)變量服從正態(tài)分布,則峰度近似等于3.若峰度顯著大于3,則概率分布的尾部要比正態(tài)分布的尾部厚,分布密度曲線在距均值較遠(yuǎn)地方位于正態(tài)分布曲線的上方,稱為尖峰厚尾現(xiàn)象,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),3.概率分布正態(tài)分布記作:密度函數(shù):的正態(tài)分布稱為標(biāo)準(zhǔn)正態(tài)分布,記作累計概率分布函數(shù):正態(tài)分布,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),若隨機(jī)變量服從均值為、標(biāo)準(zhǔn)差為的正態(tài)分布,則其值在區(qū)間內(nèi)的概率為95%。即:一般正態(tài)分布的接收域和拒絕域,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),分布:若,則下標(biāo)k為的自由度,分布只取正值,并且是偏斜分布。偏度取

3、決于自由度的大小,自由度越小越右偏,隨著自由度的增多,分布逐漸對稱,接近正態(tài)分布。當(dāng)N無限大時,近似存在:分布隨自由度的變化情況,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),t分布:若Z是一個變量,而變量X獨(dú)立于Z,且X服從自由度為k的分布,則服從自由度為k的t分布對稱性期望值為0方差為t分布的尾部比正態(tài)分布的尾部更厚自由度較大時,t分布趨從于標(biāo)準(zhǔn)正態(tài)分布,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),F分布:若兩個服從分布的隨機(jī)變量相互獨(dú)立,其自由度分別為和,則服從自由度為的t分布。不同自由度的F分布密度函數(shù),第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),二項式分布:如果進(jìn)行n次貝努里試驗,取得成功次數(shù)為的概率可用下面的二項

4、分布概率公式來描述n為獨(dú)立的貝努里試驗次數(shù),為成功的概率,(1-)為失敗的概率,X為在次貝努里試驗中出現(xiàn)成功的次數(shù),表示在n次試驗中X出現(xiàn)的各種組合情況,在此稱為二項系數(shù)。記為:,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),2.2SAS軟件基礎(chǔ)1.常用金融計量軟件網(wǎng)址軟件名稱網(wǎng)址SASSPSSEMSPLUSSS,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),2.SAS簡介模塊:BASESAS為基本模塊SAS的系統(tǒng)核心SAS/ETSSAS/GRAPHSAS/QCSAS/ETSSAS/FSPSAS/AF等特點:統(tǒng)計功能強(qiáng)大簡捷具有功能強(qiáng)大的宏功能將數(shù)據(jù)處理與統(tǒng)計分析融為一體適應(yīng)性強(qiáng)應(yīng)用面廣3.SAS中的幾個基本概念窗口

5、和文件類型:編輯器工作日志輸出數(shù)據(jù)瀏覽器結(jié)果窗口,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),邏輯庫:將電腦硬盤中的“f:fe”目錄定義為SAS中的邏輯庫“data”.libnamedataf:fe;SAS數(shù)據(jù)文件的命名方式臨時性文件:一級文件名datareturn;永久性文件:兩極文件名Datadata.size長方形的SAS數(shù)據(jù)結(jié)構(gòu):SAS的基本要素有觀測、變量、變量值變量名,建議數(shù)據(jù)文件整理成長方形結(jié)構(gòu),更易于數(shù)據(jù)的處理和分析SAS程序的可控分段運(yùn)行:將需要運(yùn)行的程序段選黑,然后點擊運(yùn)行按鈕,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),如圖:分段執(zhí)行SAS程序,“運(yùn)行”命令按鈕,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件

6、基礎(chǔ),日志文件中的信息閱讀:原數(shù)據(jù)文件出錯的程序datadata.p;infilef:fechap2-2-1p.csvdelimiter=,MISSOVERDSDlrecl=32767;inputdate$p;run;/*此段程序的文件名有誤,系統(tǒng)將報錯,請在執(zhí)行此段程序后觀察日志文件*/在這段程序運(yùn)行后,在日志文件中出現(xiàn)這樣的信息:ERROR:物理文件f:fechap2-2-1p.csv不存在。NOTE:SAS系統(tǒng)由于錯誤而停止了該步的處理。WARNING:數(shù)據(jù)集DATA.P可能不完整。該步停止時,共有0個觀測和2個變量。NOTE:“DATA語句”所用時間(總處理時間):實際時間0.04秒C

7、PU時間0.01秒,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),根據(jù)錯誤進(jìn)行修改后再次執(zhí)行,得到下面日志信息NOTE:從Infilef:fechap2-2-1p.csv中讀取了403條記錄。最小記錄長度是10。最大記錄長度是14。NOTE:數(shù)據(jù)集DATA.P有403個觀測和2個變量。NOTE:“DATA語句”所用時間(總處理時間):實際時間0.10秒CPU時間0.00秒數(shù)據(jù)文件的瀏覽和直接編輯:雙擊文件,則可以打開數(shù)據(jù)文件瀏覽4.SAS語句:由SAS關(guān)鍵詞、用戶提供信息構(gòu)成,SAS語句以分號(;)結(jié)束,如:inputxy;,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),5.SAS中的data步和proc步data步

8、:將外部數(shù)據(jù)轉(zhuǎn)化為SAS數(shù)據(jù)文件對原SAS文件進(jìn)行修改,包括長生新變量、選擇觀測和選擇變量合并兩個或多個已有的數(shù)據(jù)集合,產(chǎn)生新的數(shù)據(jù)集將SAS數(shù)據(jù)集轉(zhuǎn)化為外部數(shù)據(jù)例:將外部數(shù)據(jù)f:fechap2-2-1p.csv轉(zhuǎn)化為SAS數(shù)據(jù)文件,該數(shù)據(jù)文件在邏輯庫data中,根據(jù)”libname”語句的定義,邏輯庫data和電腦文件目錄f:fe是對應(yīng)的libnamedataf:fe;datadata.p;infilef:fechap2-2-1p.csvdelimiter=,MISSOVERDSDlrecl=32767;inputdate$p;run;,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),產(chǎn)生一個新的數(shù)據(jù)文件

9、data.r,根據(jù)原始價格計算對數(shù)收益率r,剔出不需要的變量和觀測。lag函數(shù)是取一階時滯函數(shù),lag(p)表示上一期的價格。由于第一個觀測(即2006年1月4日這個觀測)沒有上一期的數(shù)值,SAS系統(tǒng)對這個觀測的r給出了空值“.”。在數(shù)據(jù)處理上,可以將這個觀測剔除。datadata.r;setdata.p;r=log(p)-log(lag(p);/*addavariable*/keepdater;/*choosevariables*/ifr=.thendelete;/*chooseobservations*/run;datadata.rm;setdata.index;rm=log(index)

10、-log(lag(index);/*addavariable*/dropindex;/*choosevariables*/ifrm=.thendelete;/*chooseobservations*/run;,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),將兩個數(shù)據(jù)data.r和data.rm按照時間進(jìn)行合并,由merge語句來完成,by變量date的功能是將兩個原數(shù)據(jù)文件中date相同的觀測合并到新數(shù)據(jù)data.co中的同一觀測中。datadata.co;mergedata.rmdata.r;bydate;/*byvariables*/run;SAS內(nèi)部數(shù)據(jù)也可輸出為外部數(shù)據(jù)data_null_;set

11、data.co;filef:feco.txt;putdater1rm;run;,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),proc步:對已有數(shù)據(jù)文件進(jìn)行統(tǒng)計分析,并輸出結(jié)果,最常見的是排序、打印和求單變量的統(tǒng)計量等下面對文件data.co執(zhí)行排序,排序的關(guān)鍵變量為dateProcsortdatadata.co;bydate;Run;SAS程序包括:(1)將外部數(shù)據(jù)集合變成SAS數(shù)據(jù)集;(2)執(zhí)行data步,對于數(shù)據(jù)集進(jìn)行一定的變換、刪除等預(yù)處理,將同一時間、同一對象的自變量和應(yīng)變量放入到同一個觀測中。(3)執(zhí)行proc步(回歸、時間序列等),生成結(jié)果;(4)對結(jié)果進(jìn)行分析,提取有用信息,形成最后的報表

12、。,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),6.主要BASESAS程序排序過程sort:將數(shù)據(jù)按照一個或者多個變量排序,排序后的數(shù)據(jù)替代原數(shù)據(jù),例如將數(shù)據(jù)return按照date和code排序procsortdata=return;bydatecode;/*第一排序變量date,第二排序變量code*/run;反向排序變量后加入“descending”選項procsortdata=return;bydatedescendingcode;run;將排序后的數(shù)據(jù)寫入新數(shù)據(jù)集合procsortdata=returnout=return1;bydatedescendingcode;run;,第二章.數(shù)學(xué)基礎(chǔ)

13、和SAS軟件基礎(chǔ),單變量過程UNIVARIATE:對上例中變量rm畫直方圖,并填充顏色。在左上角插入正態(tài)性檢驗結(jié)果,添加擬合曲線,在右上角加入均值和標(biāo)準(zhǔn)差的圖標(biāo)。procunivariatedata=demo.rm;varrm;histogramrm/cfill=ltgraynormal(color=yelloww=3percents=20406080midpercents);insetmeanstd=StdDev/pos=neformat=6.3cfill=ywh;insetnnormal(ksdpval)/pos=nwformat=6.3;run;輸出結(jié)果如下:rm的直方圖和擬合曲線的輸出

14、結(jié)果,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),在上面的收益率數(shù)據(jù)中,需要按月輸出日收益率的均值,標(biāo)準(zhǔn)差和t統(tǒng)計量(均值=0)。程序如下:datadata.rm_month;setdata.rm;month=substr(date,1,6);run;procunivariatedata=data.rm_month;varrm;bymonth;outputout=data.rm_statmean=rm_meanstd=rm_stdt=test;run;相關(guān)性過程CORR:計算變量的描述性統(tǒng)計量和兩個變量之間的Pearson相關(guān)系數(shù)。也可以計算三個非參數(shù)相關(guān)系數(shù),秩序相關(guān)系數(shù),偏相關(guān)系數(shù)和Cronbach

15、系數(shù)alpha.,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),例:計算股票和指數(shù)的收益率的相關(guān)性O(shè)dshtml;proccorrdata=data.cooutp=data.corr_stat;/*定義了輸入數(shù)據(jù)集和結(jié)果輸出數(shù)據(jù)集*/VARrmr1;run;odshtmlclose;結(jié)果輸出:CORR過程的運(yùn)行結(jié)果簡單統(tǒng)計量變量N均值標(biāo)準(zhǔn)偏差總和最小值最大值rm4020.004060.018631.63067-0.099490.06039r14020.004870.030691.95964-0.104620.20122Pearson相關(guān)系數(shù),N=402當(dāng)H0:Rho=0時,Prob|r|Rmr1rm1.0

16、00000.65666.0001r10.65666.00011.00000,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),秩序過程RANK:對數(shù)據(jù)集中的原變量進(jìn)行秩序分析,并據(jù)需求產(chǎn)生一個新的秩序變量,該變量把數(shù)值從小到大排序,給最小值賦予1,給第二小值賦予2,直到最大值n。rank語句以“procrank”引導(dǎo),并跟隨ranks、var和by三個一般語句。var語句后跟隨的變量(var變量)通常是原變量ranks語句后則跟隨導(dǎo)出數(shù)據(jù)集中的秩序變量例:sashelp.class數(shù)據(jù)為班級學(xué)生的性別、身高和體重。下面先按性別分組,對男生和女生的身高產(chǎn)生秩序變量rank_height,得rank1;然后再按照

17、性別和rank_height分組,得到體重的秩序變量rank_weightprocsortdata=sashelp.class;bysexheight;run;procrankdata=sashelp.classout=rank1groups=2;ranksrank_height;varheight;bysex;run;,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),procsortdata=rank1;bysexrank_height;run;procrankdata=rank1out=rank2groups=3;ranksrank_weight;varweight;bysexrank_height;r

18、un;例:數(shù)據(jù)data.u中包含了A-H兩地上市公司股票的A股市場的每月平均溢價率數(shù)據(jù)。希望對每月根據(jù)溢價率大小將股票分為等分的五組procrankdata=data.uout=data.urankgroups=5;/*定義輸入數(shù)據(jù)和輸出數(shù)據(jù)以及分組個數(shù)*/ranksrk;/*產(chǎn)生的新秩序變量*/varu;/*原變量*/bymth;/*分組變量*/run;,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),分組前后的數(shù)據(jù)集分別為:溢價率數(shù)據(jù)集秩序過程產(chǎn)生的新數(shù)據(jù)集data.urank,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),非參數(shù)檢驗NPAR1WAY過程:基于Wilcoxon得分的簡單線性秩統(tǒng)計量可用于檢驗一個變量

19、的分布在不同的組中是否具有相同的位置參數(shù)。主語句以“procnpar1waywilcoxon”引導(dǎo),并跟隨by、class、var三個一般語句。例:procsortdata=sashelp.class;byage;procnpar1waywilcoxondata=sashelp.class;byage;classsex;varheightweight;outputout=npar1way;data_null_;setnpar1way;filec:npar1way.csvdelimiter=,;putage_var_z_wilp2_wilpt2_wil_kw_p_kw;run;,第二章.數(shù)學(xué)基礎(chǔ)

20、和SAS軟件基礎(chǔ),畫圖過程GPLOT和GCHART:下面三個程序分別繪制了收益率的折線圖、直方圖和餅狀圖procgplotdata=data.co;/*繪制折線圖*/symboli=join;plotrm*date/vref=0;run;procgchartdata=data.co;/*繪制直方圖*/vbarr;run;procgchartdata=data.co;/*繪制餅狀圖*/pier/type=percent;run;輸出結(jié)果分別是:,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),2.3SAS宏功能基礎(chǔ):核心就是通過對文字或程序段進(jìn)行迭代,簡化程序1.宏變量:用于

21、迭代文字或程序段內(nèi)容的變量介紹最簡單的迭代:%letCity1=Shanghai;%letCity2=Beijing;%put在這段程序中,宏變量City1和City2分別在前兩個語句中被賦值,而第三個語句中,%put用于顯示宏變量City1所代替的內(nèi)容。其中,宏變量City1前的%letCity1=Shanghai;%letCity1=Shanghai;因此,若需對以空格開頭或結(jié)尾的文字進(jìn)行引用,則需用到函數(shù)%str()%letCity1=%str(Shanghai);%putIlove得到的是IloveShanghai,其中l(wèi)ove和Shanghai中的空格來自于宏變量City1的第一個字

22、符。如果在宏變量后直接相連文字,則SAS對其解析就將遇到麻煩:如%letb=%eval(10.0+20.0);/*INCORRECT*/%letc=%sysevalf(5/3);%letd=%sysevalf(10.0+20.0);%lete=2.5+3;%put%sysevalf(下面介紹對宏變量的二次及多次引用。在下面的程序中,以宏變量n代表數(shù)字1,而以宏變量var代表字符City,執(zhí)行最后三個語句的結(jié)果是相同的。兩個相連的連字符%letCity2=Beijing;%letn=1;%letvar=city;%put,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),其中,MAC為用戶自定義的宏參數(shù)名。而在調(diào)用宏的過程中,只需在宏前面加上百分號%,如:“%MAC;”。在下例中,名為fund的宏中包含code1、code2、maturity和scales四個參數(shù)。首先定義數(shù)據(jù)集data1_,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟件基礎(chǔ),scale=,第二章.數(shù)學(xué)基礎(chǔ)和SAS軟

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論