版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
4數(shù)據(jù)文件讀取及金融數(shù)據(jù)統(tǒng)計(jì) 文本文件讀要4數(shù)據(jù)文件讀取及金融數(shù)據(jù)統(tǒng)計(jì) 文本文件讀要大量金融數(shù)據(jù)來估計(jì)或標(biāo)定其中的參數(shù)。比如:資本資產(chǎn)定價(jià)模型(CAPM)中β值的估計(jì);期權(quán)定價(jià)中標(biāo)的資產(chǎn)收益率的波動(dòng)率窗口直接輸入和利用xlsread、textread、fopen等函數(shù)直接讀取數(shù)據(jù)兩種方式。在主窗經(jīng)常面臨大量的金融數(shù)據(jù),利用MATLABEXCEL和文本文件的輸出格式。前面我們已經(jīng)介紹了如何利用xlsread和xlswrite來讀取和文件,本節(jié)主要介紹如何利用fprintf函數(shù)寫入數(shù)有時(shí)需要將數(shù)據(jù)內(nèi)容寫入文本文件中,Matlabfprintf調(diào)用方式:count=fprintf(fid,format,Afid:由fopen命令成功返回的文件標(biāo)識(shí)符,也可以是12,1表示寫入到命令窗口,2format:輸出格式控制,變量 是一個(gè)字符串,用法類似C語言格式,主要是控制號、排序、字符寬度等。例如%12.5e,其中%表示開始讀入數(shù)據(jù),-表示左對齊,12入的寬度,5表示小數(shù)位數(shù),e標(biāo)記(flag)flag內(nèi)-%-+%00eflag內(nèi)-%-+%00e采用指數(shù)格式輸出,采用大寫字母E%e及%f的更緊湊的格式,不顯示數(shù)字中無效的A:表示需要寫入的變量例4.1在屏幕上顯A:表示需要寫入的變量例4.1在屏幕上顯示’Thisprofessorgradeshard.’在命令窗口輸入:fprintf(1,'Thisprofessorgrades則顯示內(nèi)容為:Thisprofessorgrades4.2如果變量是矩陣,則每列分別輸出到屏幕上在命令窗口輸入:B=[7.7; fprintf(1,'Xis%6.2fmetersor%8.3fmm\n',9.9,9900,Xis9.90metersor9900.000Xis8.80metersor8800.000Xis7.70metersor7700.000例4.3Matlab變量內(nèi)容寫入到文本文myexp.txtmyexp.txt的內(nèi)容,在命令窗口輸入:type1)打開文fopen式。fopenfid=fopen(文件名,‘打開方式1)打開文fopen式。fopenfid=fopen(文件名,‘打開方式fid0'r':只讀方式打開文件(默認(rèn)的方式)'r+':讀寫方式打開文件,打開后先讀后寫。該文件必須已存在。'w''w+':讀寫方式打開文件。先讀后寫。該文件已存在則更新;不存在則創(chuàng)建。'a''a+':打開文件后,先讀入數(shù)據(jù)再添加數(shù)據(jù)。文件不存在則創(chuàng)建。另外,在這些字符串后添加一個(gè)“t”,如‘rt’或‘wt+’加的是“b”fopen2)關(guān)閉文fclosefid所表示的文件。sta0,否則返回-1。如果要關(guān)閉所有已打開的文件用fclose(‘a(chǎn)ll’)fscanf函數(shù)讀出數(shù)A=fscanf(fid,[A,count]=fscanf(fid,format,fid:跟fprintf中A=fscanf(fid,[A,count]=fscanf(fid,format,fid:跟fprintf中一format:跟fprintfsize:決定讀取多少數(shù)據(jù),有如下三種形式nninf[m,n]:讀取的元素填滿mn列的矩陣,n可以取inf,但m不m+12mAA:數(shù)據(jù)變量AAAASCII4.4讀取文本myexp.txt的內(nèi)將其內(nèi)容存到變a中。例創(chuàng)建一個(gè)字符矩陣并存入磁盤文件,再讀出賦值給另一個(gè)矩陣從文文件中讀入格式化數(shù)1、 函數(shù)讀取從文文件中讀入格式化數(shù)1、 函數(shù)讀取文本文[A,B,C,...]=[A,B,C,...]=[...]=Filename:需要讀取的數(shù)據(jù)文件Format:每行各個(gè)數(shù)據(jù)格為A'時(shí)間'開盤價(jià)'最高價(jià)headerlines2始whitespace,可取值delimiterA,B,Cmatlabtest3.txt>>typeA,B,Cmatlabtest3.txt>>typeQ11Q23>>[a1a2a3]=textread('c:\test3.txt','%s%fa1a213a324test3.txta1、a2、a3例4.6在matlab工作目錄下有文本文件shzh.txt,該數(shù)據(jù)文件包含了19901219到1991年1月28日上證綜合指數(shù)行情,有7列數(shù)據(jù),分別為時(shí)間、開盤價(jià)、最高價(jià)、最低價(jià)、收盤價(jià)、成交量和成交額,請將7列數(shù)據(jù)分別matlab的7個(gè)變量其中上述命令中的輸出變量x0,x1,x2,x3,x4,x5,x6分中,shzh.txt'表示文件名;%s%f入部分中%s%f%f%f%f%其中上述命令中的輸出變量x0,x1,x2,x3,x4,x5,x6分中,shzh.txt'表示文件名;%s%f入部分中%s%f%f%f%f%f%f'是與輸出x0,x1,x2,x3,x4,x5,x6一一對應(yīng)的;另外這里文件名的后綴.txt不能省略,否則MATLAB會(huì)給出不能找到該文件的提醒。2函數(shù)讀取文本文C=textscan(fid,C=textscan(fid,'format',C=textscan(fid,'format',param,value,C=textscan(fid,'format',N,param,value,fopen是一個(gè)字符串變量,表示讀取數(shù)據(jù)及數(shù)據(jù)轉(zhuǎn)換的規(guī)則。formatformat內(nèi)容說Textscan 支持的數(shù)據(jù)讀入格Textscan 支持的數(shù)據(jù)讀入格時(shí)停止。例如%[mus]把summer讀成summ時(shí)停止。例如%[^mus]把summer讀成er例4.6(續(xù))利textscan函數(shù)讀入上證指數(shù)例4.6(續(xù))利textscan函數(shù)讀入上證指數(shù)數(shù)據(jù)。MATLAB %s%s%s%s%s%s例4.7建立新12即文2行是串,后2行是數(shù)組,將前兩行存到變bb中后兩行存到>>typeNN個(gè)數(shù)字或者遇到的分隔符,例如%5f32473.238ND位數(shù),例如%7.2f會(huì)把473.238讀為473.2312>>bb=textscan(fid,'%s>>cc=textscan(fid,'%s>>>>ans112>>bb=textscan(fid,'%s>>cc=textscan(fid,'%s>>>>ans12>>type ,1,32, ,>>>>var=textscan(tt,'%f%f%f','delimiter',',') %忽略>>aa11234>>textreadtextscan(1)當(dāng)數(shù)據(jù)文件比較大時(shí),textscantextread>>textreadtextscan(1)當(dāng)數(shù)據(jù)文件比較大時(shí),textscantextread>>>>>> %s%s%s%s%s%s>>(3)fopentextscantextread(4)textscantextread4.1.4帶有間隔符的文本數(shù)據(jù)讀寫1dlmreadM=M=dlmread('filename',M=dlmread('filename',delimiter,R,M=dlmread('filename',delimiter,注意如果數(shù)據(jù)文件沒有間隔符,delimiter可以用例M=dlmread('filename',delimiter,注意如果數(shù)據(jù)文件沒有間隔符,delimiter可以用例4.8myfile.txt文件是3階的魔方陣內(nèi)容將其MATLABM矩陣2saveascii文件時(shí),常常是文件里都是實(shí)型格式的數(shù)據(jù)(0,看著很不方便)dlmwritedlmwrite('filename',M,dlmwrite('filename',M,'D',R,dlmwrite('filename',M,attribute1,value1,attribute2,value2,dlmwrite('filename',M,'-dlmwrite('filename',M,'-append',attribute-valueMD分割數(shù)據(jù),“\t”tab分割,“,”RC數(shù)據(jù)起始的列,R=0,dlmwrite('filename',M,'-dlmwrite('filename',M,'-append',attribute-valueMD分割數(shù)據(jù),“\t”tab分割,“,”RC數(shù)據(jù)起始的列,R=0,C=011'-1dlmwrite函數(shù)屬性的內(nèi)a=[123;456;78dlmwrite('test.txt',test.txt4.93階隨機(jī)矩陣寫入文myfile.txt中,要求用‘,’分隔,精度為64.103階魔方4.93階隨機(jī)矩陣寫入文myfile.txt中,要求用‘,’分隔,精度為64.103階魔方陣寫入文myfile.txt,并且在數(shù)據(jù)后繼續(xù)追加3階魔方陣>>>>dlmwrite('myfile.txt',M,'delimiter','\t','precision',>>816357492>>dlmwrite('myfile.txt',M,'delimiter','\t','roffset',1,'->>!type8163574928163574922>>dlmwrite('myfile.txt',M,'delimiter',',','precision',>>type4.2MATLAB金融數(shù)據(jù)統(tǒng)計(jì)4.2.1常用分matlab命令常見的幾種分布的命令字>>type4.2MATLAB金融數(shù)據(jù)統(tǒng)計(jì)4.2.1常用分matlab命令常見的幾種分布的命令字符為betax^2tF工具箱對每一種分布都提供五類函數(shù),其命令字符為1、隨機(jī)數(shù)的生(1)均勻隨機(jī)數(shù)的生1~NR=unidrndR=unidrnd(N,R=unidrnd(N,m,N1~NmRnRR=unidrnd(N,m,N1~NmRnRunifrnd(a,b):產(chǎn)生一個(gè)[a,b]unifrnda,b,m,n)m×n階[a,b]U(a,b)(2)、正態(tài)隨機(jī)數(shù)的生normrndu,sigma:只產(chǎn)生一個(gè)正態(tài)隨機(jī)normrndusigma,m,n)m×nusigma陣mvnrnd(mu,sigma)musigmamvnrnd(mu,sigma,n)nmusigma 4.2.1:生成多元正態(tài)分布的例plot(mr(:,1),mr(:,2),'r*');%從散點(diǎn)圖可以看出有無相關(guān)(3)其他分布的隨機(jī)數(shù)生betarndbinorndchi2rndexprnd(3)其他分布的隨機(jī)數(shù)生betarndbinorndchi2rndexprndfrndf分布的隨機(jī)數(shù)生成gamrndgeorndncfrndfnctrndtncx2rndnormrnd正態(tài)(高斯)分布的隨機(jī)數(shù)生成poissrnd泊松分布的隨機(jī)數(shù)生成raylrnd瑞利分布的隨機(jī)數(shù)生成trndtunidrndunifrndweibrnd2、概率密度函(1)通用函數(shù)計(jì)算概率密度函數(shù)函數(shù)格式說明返回在X=K處、參數(shù)為(1)通用函數(shù)計(jì)算概率密度函數(shù)函數(shù)格式說明返回在X=K處、參數(shù)為A、B、C的概率密度值,對于不同的分布,參數(shù)個(gè)數(shù)是不為分布函數(shù)名,其取值如下表4-1(2)專用函數(shù)計(jì)算概率密度函name Beta F 'Negative 'NoncentralF 'Noncentralt 'NoncentralChi- T 'Discrete Weibull命令二項(xiàng)分布的概率值函數(shù)%等同于pdfbinoKn,格式binopdfk,n,pA泊松分布的概率%等同于pdf(pois命令二項(xiàng)分布的概率值函數(shù)%等同于pdfbinoKn,格式binopdfk,n,pA泊松分布的概率%等同于pdf(poissKLamdapoisspdf(k,正態(tài)分布的概率計(jì)算參數(shù)為μ=mu,σ=sigmaK4-2 unifpdf(x,a,[a,b]上均勻分布(連續(xù))概率密度在X=xexppdf(x, chi2pdf(x,ntpdf(x,ntfpdf(x,n1,n1,第二自由度為n2F分布概率密度gampdf(x,a,a,b的betapdf(x,a,a,b的 mu,sigmanbinpdf(x,R, nctpdf(x,n,ncx2pdf(x,n,raylpdf(x,b計(jì)算正態(tài)N(01)的隨機(jī)X在點(diǎn)0.6578的密度函數(shù)自由度8的卡方分布,在2.18計(jì)算正態(tài)N(01)的隨機(jī)X在點(diǎn)0.6578的密度函數(shù)自由度8的卡方分布,在2.18處的密度函數(shù)值。畫出正態(tài)分N(0,1)N(0,2^2)的概率密度函數(shù)圖形15在同一幅圖中繪制卡方分布密度函數(shù)在自由度分別的圖形答案見則圖形為圖4-13、累積分布函(1)通用函數(shù)計(jì)算累積概率cdfcdf(‘name’,K,cdf(‘name’,K,A,cdf(‘name’,K,A,nameX≤K的概率值,name4-1表求標(biāo)準(zhǔn)正態(tài)分布隨機(jī)變X落在(-∞0.4)weibpdf(x,a,a,bn,p參數(shù)為pM,K,N求自由度16的卡方分布隨機(jī)變量[06.91](2)專用函數(shù)計(jì)算累積概求自由度16的卡方分布隨機(jī)變量[06.91](2)專用函數(shù)計(jì)算累積概率值(隨機(jī)變XK的概函數(shù)格式binocdf(k,n,%n為試驗(yàn)總次數(shù),p為每次試驗(yàn)事件A發(fā)生的概率,k為nAnAk函數(shù)x%返回 p(t)dt的值,mu、sigma為正態(tài)分布的格式normcdf(x,mu,計(jì)算標(biāo)準(zhǔn)正態(tài)分布的概P{-命令為:P=normcdf(1)-normcdf(-結(jié)果為:P=專用函數(shù)計(jì)算累積概率值函數(shù)列表如表4-3表4- 專用函數(shù)的累積概率值函數(shù) unifcdf(x,a,[a,b]上均勻分布(連續(xù))累積分布函數(shù)值均勻分布(離散)累積分布函數(shù)值expcdf(x,參數(shù)為Lambda的指數(shù)分布累積分布函數(shù)值 參數(shù)為musigma的正態(tài)分布累積分布函數(shù)值chi2cdf(x,ntcdf(x,ntfcdf(x,n1,n1, 參數(shù)為musigma的正態(tài)分布累積分布函數(shù)值chi2cdf(x,ntcdf(x,ntfcdf(x,n1,n1,n2F分布累積分布gamcdf(x,a,a,b的betacdf(x,a,a,b的 mu,sigmanbincdf(x,R,參數(shù)為RP的負(fù)二項(xiàng)式分布概累積分布函數(shù)值ncfcdf(x,n1, n1,n2,deltaFnctcdf(x,n,參數(shù)為n,delta的非中心t分布累積分布函數(shù)值ncx2cdf(x,n,raylcdf(x,bweibcdf(x,a,a,b說明F(x)=P{X≤x}x4、逆累積分布函MATLABF(x)=P{X≤x}x(1)通用函數(shù)計(jì)說明F(x)=P{X≤x}x4、逆累積分布函MATLABF(x)=P{X≤x}x(1)通用函數(shù)計(jì)算逆累積分布函數(shù)命令icdf(‘name’,P,a1,a2,說明返回分布為namea1a2a3P的臨界值,這里nameP=cdf(‘name’,x,a1,a2,a3)x=icdf(‘name’,P,a1,a2,a3)例 在標(biāo)準(zhǔn)正態(tài)分布表中,若已知(x)=0.975,x答案見例 在2分布表中,若自由度為10,=0.975,求臨界值LambdaP{2>}=,而逆累積分布函數(shù)icdf求滿足P{2<}=。所以,這里的0.025答案見例 在假設(shè)檢驗(yàn)中,求臨界值問題參數(shù)為n,p的二項(xiàng)分布的累積分布函數(shù)參數(shù)為pM,K,N參數(shù)為Lambda的泊松分布的累積分布函數(shù)值已知:=0.0510t答案見(2)專用-計(jì)算逆累積分布函函數(shù)格式%p為累積概率值,mu為均值,sigma為標(biāo)準(zhǔn)差,X界值,滿足:p=P{X≤x}X~N(3,4)c使得已知:=0.0510t答案見(2)專用-計(jì)算逆累積分布函函數(shù)格式%p為累積概率值,mu為均值,sigma為標(biāo)準(zhǔn)差,X界值,滿足:p=P{X≤x}X~N(3,4)c使得P{X>c}=P{X<c}答案見關(guān)于常用臨界值函數(shù)可查下表4-4表4- 常用臨界值函數(shù) x=unifinv(p,a,x=unidinv均勻分布(離散)逆累積分布函數(shù),xx=expinv(p,x=chi2inv(x,x=tinv(x,tx=finv(x,n1,Fx=gaminv(x,a,x=betainv(x,a,分布逆累積分布函數(shù) x=nbininv(x,R, n1,n2,Fx=nctinv(x,n,tx=ncx2inv(x,n,x=raylinv(x,x=weibinv(x,a,x=binoinv4.2.13算自由度分別為16t分布99%的分位數(shù)答案見例公共汽車門的高度是按成年4.2.13算自由度分別為16t分布99%的分位數(shù)答案見例公共汽車門的高度是按成年男子與車頂碰的機(jī)會(huì)不超過1%設(shè)計(jì)的。設(shè)男子身 X(單位:cm)服從正態(tài)分N(17536)答案見卡方分布的逆累積分布函數(shù)的應(yīng)結(jié)果顯示如圖4-25、常用分布的均值和方差函4-命令均勻分布(連續(xù))的期望和方差[M,V]=BM、V>>a=1:6;b=>>[M,V]=MVx=geoinvx=hygeinvx=poissinv命 正態(tài)分布的期望和方函數(shù)[M,V]=%MU、M=MU,V=SIGMA2>>>>M1234246836命 正態(tài)分布的期望和方函數(shù)[M,V]=%MU、M=MU,V=SIGMA2>>>>M1234246836948V14949命令二項(xiàng)分布的均值和方差函數(shù)格式[M,V]=%N,P>>n=n>>[M,V]=M11111V>>[m,v]=m5v1.0e+04常見分布的期望和方差見下表4-54->>n=n>>[M,V]=M11111V>>[m,v]=m5v1.0e+04常見分布的期望和方差見下表4-54-注[M,V]=unifstat(a,均勻分布(連續(xù))的期望和方差,M為期望,V[M,V]=unidstat[M,V]=expstat(p,[M,V]=chi2stat(x,[M,V]=tstat(t[M,V]=fstat(n1,F6、樣本的數(shù)字特(1)計(jì)算樣本平均mean(A):默認(rèn)情況下表示每列平mean(A,dim)dim12trimmean(X,trimmean(X,6、樣本的數(shù)字特(1)計(jì)算樣本平均mean(A):默認(rèn)情況下表示每列平mean(A,dim)dim12trimmean(X,trimmean(X,percent,5%;dim12(2)計(jì)算樣本中位[M,V]=gamstat(a,[M,V]=betastat(a,分布的期望和方差 [M,V]=nbinstat(R,[M,V]=ncfstat( F[M,V]=nctstat(n,t[M,V]=ncx2stat(n,[M,V]=raylstat([M,V]=weibstat(a,[M,V]=binostat[M,V]=geostat[M,V]=hygestat[M,V]=poisstatmedian(A,例4.2.18:已知中國各省及直轄市的年工資收入,如果有人問你那個(gè)城市的年工資收入能代表中國median(A,例4.2.18:已知中國各省及直轄市的年工資收入,如果有人問你那個(gè)城市的年工資收入能代表中國的年工資收入,你該如何回答答案見(3)計(jì)算樣本方差和標(biāo)準(zhǔn)標(biāo)準(zhǔn)差:std(A,N(xixflag為0(默認(rèn)值)表示樣本方差的計(jì)算公式為var1NN(xix的計(jì)算公式為var。N(4)計(jì)算樣本的百分位prctile(X,p,X為觀察值,pp%值的數(shù),dim12求(5)計(jì)算樣本偏度與峰flag0(默認(rèn))時(shí)表示無偏估計(jì),為1時(shí)有偏估計(jì),dim1則表示每列求,若為yE(x0σxσ4,E(Xσxσ4,E(X的次數(shù)較為密集地分布在眾數(shù)的周圍,β3β<3側(cè),β3β1.8β1.8時(shí),次數(shù)分布曲線趨向(6)計(jì)算中心N(xix數(shù)理統(tǒng)計(jì)中經(jīng)常用到中心矩的概念,k階中心矩的計(jì)算公式為varNmoment(X,X為樣本觀察值,order(7)計(jì)算樣本協(xié)方差與相關(guān)系cov(x)or(7)計(jì)算樣本協(xié)方差與相關(guān)系cov(x)orcov(x,1)orXXm×nmcov(x,y)x,ycov(x(:),y(:)),1R=R=P例 :生成一個(gè)30×4的不相關(guān)的標(biāo)準(zhǔn)正態(tài)隨機(jī)矩陣x,然后把最后一列元素變?yōu)榍傲械暮汀S?jì)x的樣本相關(guān)系數(shù)p并找p值小0.05的位置4.2.20知數(shù)據(jù)宏觀年度數(shù)據(jù).xls,試計(jì)算(1)消除價(jià)格影響后的居民消費(fèi)值與可支配收入之間的相關(guān)系數(shù)。(2)畫出GDP歷年的增長率,并求平均增長率。答案見例4.2.21:計(jì)香港恒生指數(shù)2000年到2004數(shù)收益率的均值、方差、度和并求該期間的最大漲幅和最大跌幅答案見4.2.2統(tǒng)計(jì)繪matlab1正態(tài)分布概率答案見4.2.2統(tǒng)計(jì)繪matlab1正態(tài)分布概率Xh=4-2Weibull分布概率圖weibullweibull3 最小二乘擬合直lsline為當(dāng)前坐標(biāo)系中每一對象添加最小二乘擬合直線,線形‘-’,‘--’和‘.-’y=[23.45.681112.313.81618.84頻率直方n=n=n=hist(Y,[n,xout]=YYn=n=n=hist(Y,[n,xout]=YYY是一個(gè)m×p階矩陣,則對Ynxoutx=-y=寶鋼股份 600010)從2007年12月3日到2007年12月28日,每個(gè)交易日的收盤價(jià)保在變量closeprice中,在MATLAB中執(zhí)行如下代碼:>>closeprice=[20.8120.5821.0920.7821.0121.7721.9421.6620.5820.8120.3320.7021.0721.3221.7722.1122.1722.66>>>>xlabel('天數(shù)ylabel('收益率>>title('寶鋼股份600010的對數(shù)收益率直方圖>>xlabel('天數(shù)ylabel('頻率title('600010的對數(shù)收益率三維圖600010005>>ylabel('頻率xlabel('收益率>>title('寶鋼股份600010的對數(shù)收益率直方圖>>xlabel('天數(shù)ylabel('頻率title('600010的對數(shù)收益率三維圖600010005>>ylabel('頻率xlabel('收益率>>title('寶鋼股份600010的對數(shù)收益率直方圖>>r=normrnd5盒形圖boxplot(X):XX的每一列的盒圖和“須”圖,>>r=normrnd5盒形圖boxplot(X):XX的每一列的盒圖和“須”圖,“須”%notch=1時(shí),產(chǎn)生一凹盒圖,notch=0時(shí)產(chǎn)生一矩箱圖%sym表示圖形符號,默認(rèn)值為“+”vert=0時(shí),生成水平盒圖,vert=1時(shí),生成豎直盒圖(vrt=1 %參數(shù)可以取‘symbol’,‘notch’,‘colors’1/43/41.5倍時(shí)稱為野值(異常值4.2.23分析如下程4.2.3、利MATLAB進(jìn)行多元線性1、X是不相關(guān)的4.2.3、利MATLAB進(jìn)行多元線性1、X是不相關(guān)的b=[b,bint]=[b,bint,r]=[b,bint,r,rint]=[b,bint,r,rint,stats]=[b,bint,r,rint,stats]=Yn維觀測值,Xn×pX參數(shù)的置信度,alpha0.05bbintr:殘rint:殘差的置信區(qū)statsR2、F、prcoplot(r,rint)%畫出在置信度區(qū)間下誤差分 4.2.24:在鋁合金化學(xué)銑切工藝中,為了便于生產(chǎn)操作,需要對腐蝕速度進(jìn) 4.2.24:在鋁合金化學(xué)銑切工藝中,為了便于生產(chǎn)操作,需要對腐蝕速度進(jìn)行控制,因此xCxgmmmin0腐蝕液含鋁量x對腐蝕速y考察腐蝕液溫堿濃的影響,123一共做了44次實(shí)驗(yàn),所得數(shù)據(jù)如下23456789N1)求y對x1,x2,x3的線性回歸方2)給出總體2的點(diǎn)估3)分別在顯著性水平0.10、0.05和0.01下,對x1x2,x3進(jìn)行顯著性檢驗(yàn),并根據(jù)檢驗(yàn)的結(jié)果決定是否對1)所得到的回歸方程進(jìn)行修正4)對所得到的回歸方程進(jìn)行顯著性檢X080 2005)求在的點(diǎn)預(yù)測和99%的預(yù)測區(qū)間T0線性回歸方程y?-0.0987100.001516x10.000214x20.000067x3X080 2005)求在的點(diǎn)預(yù)測和99%的預(yù)測區(qū)間T0線性回歸方程y?-0.0987100.001516x10.000214x20.000067x31052的點(diǎn)估計(jì):?20.000002524032715x1,x2x3的顯著性檢自變量 20.844040 239.0823 3,40回歸方程的顯著性檢驗(yàn):FE在 80 200處y的點(diǎn)預(yù)測和99%的預(yù)測區(qū)間XT0?02X存在相即嶺ridgeb=b=k若loadxlabel('x1');ylabel('x2');gridon;axis若loadxlabel('x1');ylabel('x2');gridon;axisxlabel('x1');ylabel('x3');gridon;axisxlabel('x2');ylabel('x3');gridon;axisX=[x1x2D=D(:,1)=[];%Noconstantk=0:1e-5:5e-b=ylim([-100gridxlabel('Ridgeylabel('Standardizedtitle('{\bfRidge3、利用MATLAB進(jìn)行非線性[beta,r,J]=nlinfit(x,ygridxlabel('Ridgeylabel('Standardizedtitle('{\bfRidge3、利用MATLAB進(jìn)行非線性[beta,r,J]=nlinfit(x,y,’model’,x、yn×mn維向量,對一元非線性回歸,xnmodelm-附一、常用統(tǒng)計(jì)分1 分布:設(shè)隨機(jī)變量(randomvariable),,,相互獨(dú)立、同分布,且 nk~N0,1k1,2,,nnk2k~2n所服從的分布稱為自由度是n 分布,記~2n,那么如果隨機(jī)變量 的概率密度為:E2D2-------n=-------nE2D2-------n=-------n=00123 ~2nk1,2,,n(2分布的可加性)設(shè)隨機(jī)變22)定理4.kk~2n,那3)定理4.如果隨機(jī)變量4)定理4.3(Fisher)如果隨機(jī)變 ~2n,那2、t分布設(shè)隨機(jī)變量,相互獨(dú)立,且~N0,1~2n,則隨機(jī)變量所服從的分布稱為自由度是nt分布,記做t~tn,并稱其為自由度為n的t1)設(shè)隨機(jī)變量t~tn-------n=-------n=01)設(shè)隨機(jī)變量t~tn-------n=-------n=0 345,x2)定理4.4 設(shè)隨機(jī)變量t~tn,1elim x,t~2m~2n,則隨機(jī)變量3、F分布,相互獨(dú)立,且稱為自由度為m,nFFF~Fm,nF~Fm,n1~Fn,mFFDistribution2-------m=50,n=2001-------m=10,n=50-------m=5,n=1000 2345二、多元線性回歸理論介FDistribution2-------m=50,n=2001-------m=10,n=50-------m=5,n=1000 2345二、多元線性回歸理論介ymx1x2,xmx1x2,的取定的一組不完全相同的值x1kx2k,xmkk1,2,nn組觀察x1k,x2k,xmk,yk,k1,2,,yk是隨機(jī)變量y在x1kx2k,xmkXx,x,, mXx,x X1,x,x,, mX1,x,xk ~Xixi1,xi2,xT~1、多元線性回歸模型及其基本理論假設(shè)myb0bixiXTB~N0,T~1、多元線性回歸模型及其基本理論假設(shè)myb0bixiXTB~N0,,b,i0,1m是未知(回歸)參數(shù),bb,b,,bT2其中i m(8)為 BTk1,2,,,kkk其中k~N0,2當(dāng)利用樣本x1kx2k,xmkykk1,2,nBB?x?XTXTB的估計(jì),并稱式(10)yX的多元線性回歸方程,其圖形稱為回歸平2、多元線性回歸模型的基本特 XTBy由kkkkEyBTkBTkXTBkkkkDyDXTBD2kkkkCov,0Covy,0(不存在序列關(guān)系 yEyyXTkk y~NXB,2Tkk3、回歸參數(shù)的最小二乘估yy,y,,y XT 1XT X~~~n12X 01m T nX則B ykyEyyXTkk y~NXB,2Tkk3、回歸參數(shù)的最小二乘估yy,y,,y XT 1XT X~~~n12X 01m T nX則B ykXk minn?Ty2 BTTTQTBBBk回歸參數(shù)的最小二乘估2Ty2TB0TBT即 X0,X0 X0,X1 X0,XmX0,0 X1,X0 X,X X,XX,~b1 1 X,X ~Xm,XXm,ymb X, mmT1T~Xy,xym0kk1nn1nnxm,Txkyyx,i(17)代入(1),得X,Xnx,~nxxb nx21121m1 ~12X2,X1X2,X2X2,Xnx y,xym0kk1nn1nnxm,Txkyyx,i(17)代入(1),得X,Xnx,~nxxb nx21121m1 ~12X2,X1X2,X2X2,Xnx ~nxnx22b22m2m,X~nxnx2xm mm2m m22,ynxmy24、回歸參數(shù)的最小二乘估計(jì)的統(tǒng)計(jì)特線性性b?的線性組合;無偏性:b定義:n總偏差平方和Syy2(y的分散程度Tkkkn誤差平方 yy?2Ekkkn回歸平方 y?yRkk總偏差平方和的分解STSE1 為復(fù)可決系數(shù)(反映線性擬合程度的指標(biāo)修正的復(fù)可決(有時(shí)比復(fù)可決系數(shù)更合理些11 為復(fù)可決系數(shù)(反映線性擬合程度的指標(biāo)修正的復(fù)可決(有時(shí)比復(fù)可決系數(shù)更合理些1n SR1MS2anm1TT5、回歸效果的顯著性檢驗(yàn)與方差分析如果線性假設(shè)符合實(shí)際,則不應(yīng)為零,
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2026福建廈門市集美區(qū)雙嶺小學(xué)產(chǎn)假頂崗教師招聘1人備考題庫及一套完整答案詳解
- 平?jīng)鍪惺兄睂W(xué)校招聘2026屆協(xié)議培養(yǎng)師范生資格審核通過人員名單備考題庫及答案詳解一套
- 廣東省電信規(guī)劃設(shè)計(jì)院有限公司2026校園招聘(新疆分院)12人備考題庫及答案詳解(易錯(cuò)題)
- 2026福建龍巖市教育部組織公費(fèi)師范畢業(yè)生“雙向選擇”專項(xiàng)招聘8人備考題庫及完整答案詳解
- 青少年皮膚保濕產(chǎn)品
- 資陽市雁江區(qū)審計(jì)局2026年公開招聘編外專業(yè)人員備考題庫(2人)完整答案詳解
- 分散固體技術(shù)
- 分店介紹教學(xué)課件
- 血站培訓(xùn)班課件的
- 長春寶寶輔食添加攻略
- 2025 精神護(hù)理人員職業(yè)倦怠預(yù)防課件
- 春播行動(dòng)中藥貼敷培訓(xùn)
- 水泵維修安全知識(shí)培訓(xùn)課件
- 木材采伐安全生產(chǎn)培訓(xùn)課件
- DB1301∕T492-2023 電動(dòng)車停放充電消防安全技術(shù)規(guī)范
- 部隊(duì)裝修合同(標(biāo)準(zhǔn)版)
- 人工智能倫理規(guī)范
- 建設(shè)工程結(jié)構(gòu)評價(jià)標(biāo)準(zhǔn)市政工程
- 校園禁毒管理辦法
- 臨床開胸術(shù)后乳糜胸護(hù)理
- 飼料供應(yīng)循環(huán)管理辦法
評論
0/150
提交評論