matlab數(shù)據(jù)擬合回歸分析_第1頁(yè)
matlab數(shù)據(jù)擬合回歸分析_第2頁(yè)
matlab數(shù)據(jù)擬合回歸分析_第3頁(yè)
matlab數(shù)據(jù)擬合回歸分析_第4頁(yè)
matlab數(shù)據(jù)擬合回歸分析_第5頁(yè)
已閱讀5頁(yè),還剩41頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

內(nèi)容回歸分析線性:[b,bint,r,rint,stats]=regress(Y,X,alpha)多元二項(xiàng)式回歸:rstool(x,y,'model',alpha)逐步回歸:stepwise(x,y,inmodel,penter,premove)常用函數(shù)擬合

1、多項(xiàng)式擬合:P=polyfit(x,y,n)2、函數(shù)線性組合的曲線擬合方法

3、最小二乘曲線擬合:X=lsqcurvefit

(FUN,X0,XDATA,YDATA,LB,UB,OPTIONS)直線擬合:a=polyfit(x,y,1),b=polyfit(x,z,1),同一條直線y=0.33x+0.96(z=0.33x+0.96)從擬合到回歸x=[01234],y=[1.01.31.52.02.3](+號(hào))x=[01234],z=[0.61.950.92.851.8]〔*號(hào)〕問(wèn)題:你相信哪個(gè)擬合結(jié)果?怎樣給以定量評(píng)價(jià)?得到a=0.330.96b=0.330.96一、數(shù)學(xué)模型例1測(cè)16名成年女子的身高與腿長(zhǎng)所得數(shù)據(jù)如下:以身高x為橫坐標(biāo),以腿長(zhǎng)y為縱坐標(biāo)將這些數(shù)據(jù)點(diǎn)〔xI,yi〕在平面直角坐標(biāo)系上標(biāo)出.散點(diǎn)圖解答一元線性回歸分析的主要任務(wù)是:返回二、模型參數(shù)估計(jì)1、回歸系數(shù)的最小二乘估計(jì)

其中??====niiniiynyxnx111,1,??====niiiniiyxnxyxnx11221,1.

返回三、檢驗(yàn)、預(yù)測(cè)與控制1、回歸方程的顯著性檢驗(yàn)〔Ⅰ〕F檢驗(yàn)法〔Ⅱ〕t檢驗(yàn)法〔Ⅲ〕r檢驗(yàn)法2、回歸系數(shù)的置信區(qū)間3、預(yù)測(cè)與控制〔1〕預(yù)測(cè)〔2〕控制返回收集一組包含因變量和自變量的數(shù)據(jù);選定因變量與自變量之間的模型,利用數(shù)據(jù)按照最小二乘準(zhǔn)那么計(jì)算模型中的系數(shù);利用統(tǒng)計(jì)分析方法對(duì)不同的模型進(jìn)行比較,找出與數(shù)據(jù)擬合得最好的模型;判斷得到的模型是否適合于這組數(shù)據(jù),診斷有無(wú)不適合回歸模型的異常數(shù)據(jù);利用模型對(duì)因變量作出預(yù)測(cè)或解釋?;貧w分析的主要步驟例1:血壓與年齡、體重指數(shù)、吸煙習(xí)慣序號(hào)血壓年齡體重指數(shù)吸煙習(xí)慣序號(hào)血壓年齡體重指數(shù)吸煙習(xí)慣11443924.20211363625.0022154731.11221425026.2131384522.60231203923.50

101545619.30301756927.41體重指數(shù)=體重(kg)/身高(m)的平方吸煙習(xí)慣:0表示不吸煙,1表示吸煙建立血壓與年齡、體重指數(shù)、吸煙習(xí)慣之間的回歸模型模型建立血壓y,年齡x1,體重指數(shù)x2,吸煙習(xí)慣x3

y與x1的散點(diǎn)圖y與x2的散點(diǎn)圖線性回歸模型回歸系數(shù)

0,

1,

2,

3由數(shù)據(jù)估計(jì),

是隨機(jī)誤差多元線性回歸

b=regress(Y,X)1、確定回歸系數(shù)的點(diǎn)估計(jì)值:MATLAB統(tǒng)計(jì)工具箱常用命令(1)3、畫出殘差及其置信區(qū)間:rcoplot〔r,rint〕2、求回歸系數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)、并檢驗(yàn)回歸模型:

[b,bint,r,rint,stats]=regress(Y,X,alpha)回歸系數(shù)的區(qū)間估計(jì)殘差用于檢驗(yàn)回歸模型的統(tǒng)計(jì)量,有三個(gè)數(shù)值:相關(guān)系數(shù)r2、F值、與F對(duì)應(yīng)的概率p置信區(qū)間顯著性水平(缺省時(shí)為0.05)rcoplot(r,rint)殘差及其置信區(qū)間作圖MATLAB7.0版本s增加一個(gè)統(tǒng)計(jì)量:剩余方差s2.使用命令regress實(shí)現(xiàn)一元線性回歸模型的計(jì)算b=regress(Y,X)或

[b,bint,r,rint,stats]=regress(Y,X,alpha)回歸系數(shù)beta以及它們的置信區(qū)間殘差向量r=Y-Y及它們的置信區(qū)間相關(guān)系數(shù)R2,F(xiàn)-統(tǒng)計(jì)量和與F(1,n-2)分布大于F值的概率p,p<

時(shí)回歸模型有效.默認(rèn)值是0.05回歸系數(shù)回歸系數(shù)估計(jì)值回歸系數(shù)置信區(qū)間

045.3636[3.553787.1736]

10.3604[-0.07580.7965]

23.0906[1.05305.1281]

311.8246[-0.148223.7973]R2=0.6855F=18.8906p<0.0001s2=169.7917模型求解回歸系數(shù)回歸系數(shù)估計(jì)值回歸系數(shù)置信區(qū)間

058.5101[29.906487.1138]

10.4303[0.12730.7332]

22.3449[0.85093.8389]

310.3065[3.387817.2253]R2=0.8462F=44.0087p<0.0001s2=53.6604剔除異常點(diǎn)(第2點(diǎn)和第10點(diǎn))后例2軟件開發(fā)人員的薪金資歷~從事專業(yè)工作的年數(shù);管理~1=管理人員,0=非管理人員;教育~

1=中學(xué),2=大學(xué),3=更高程度建立模型研究薪金與資歷、管理責(zé)任、教育程度的關(guān)系分析人事策略的合理性,作為新聘用人員薪金的參考

編號(hào)薪金資歷管理教育01138761110211608103031870111304112831020511767103編號(hào)薪金資歷管理教育422783716124318838160244174831601451920717024619346200146名軟件開發(fā)人員的檔案資料

分析與假設(shè)y~薪金,x1~資歷〔年〕x2=

1~管理人員,x2=

0~非管理人員1=中學(xué)2=大學(xué)3=更高資歷每加一年薪金的增長(zhǎng)是常數(shù);管理、教育、資歷之間無(wú)交互作用

教育線性回歸模型a0,a1,…,a4是待估計(jì)的回歸系數(shù),

是隨機(jī)誤差中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0模型求解參數(shù)參數(shù)估計(jì)值置信區(qū)間a011032[1025811807]a1546[484608]a26883[62487517]a3-2994[-3826-2162]a4148[-636931]R2=0.957F=226p=0.000R2,F,p

模型整體上可用資歷增加1年薪金增長(zhǎng)546管理人員薪金多6883中學(xué)程度薪金比更高的少2994大學(xué)程度薪金比更高的多148a4置信區(qū)間包含零點(diǎn),解釋不可靠!中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0.x2=

1~管理,x2=

0~非管理x1~資歷(年)xinjindata.mxinjin.m殘差分析方法

結(jié)果分析殘差e與資歷x1的關(guān)系

e與管理—教育組合的關(guān)系

殘差全為正,或全為負(fù),管理—教育組合處理不當(dāng)

殘差大概分成3個(gè)水平,6種管理—教育組合混在一起,未正確反映

應(yīng)在模型中增加管理x2與教育x3,x4的交互項(xiàng)

組合123456管理010101教育112233管理與教育的組合進(jìn)一步的模型增加管理x2與教育x3,x4的交互項(xiàng)參數(shù)參數(shù)估計(jì)值置信區(qū)間a011204[1104411363]a1497[486508]a27048[68417255]a3-1727[-1939-1514]a4-348[-545–152]a5-3071[-3372-2769]a61836[15712101]R2=0.999F=554p=0.000R2,F有改進(jìn),所有回歸系數(shù)置信區(qū)間都不含零點(diǎn),模型完全可用消除了不正?,F(xiàn)象

異常數(shù)據(jù)(33號(hào))應(yīng)去掉

e~x1

e~組合去掉異常數(shù)據(jù)后的結(jié)果參數(shù)參數(shù)估計(jì)值置信區(qū)間a011200[1113911261]a1498[494503]a27041[69627120]a3-1737[-1818-1656]a4-356[-431–281]a5-3056[-3171–2942]a61997[18942100]R2=0.9998F=36701p=0.0000e~x1

e~組合R2:0.957

0.999

0.9998F:226

554

36701置信區(qū)間長(zhǎng)度更短殘差圖十分正常最終模型的結(jié)果可以應(yīng)用xinjindata2.mxinjin1.m模型應(yīng)用

制訂6種管理—教育組合人員的“根底”薪金(資歷為0〕組合管理教育系數(shù)“基礎(chǔ)”薪金101a0+a39463211a0+a2+a3+a513448302a0+a410844412a0+a2+a4+a619882503a011200613a0+a218241中學(xué):x3=1,x4=0;大學(xué):x3=0,x4=1;更高:x3=0,x4=0x1=

0;x2=

1~管理,x2=

0~非管理大學(xué)程度管理人員比更高程度管理人員的薪金高

大學(xué)程度非管理人員比更高程度非管理人員的薪金略低

MATLAB統(tǒng)計(jì)工具箱常用命令(2)rstool(x,y,'model',alpha)x~n×m矩陣,n是數(shù)據(jù)容量,y~n維列向量,alpha~顯著性水平多元二項(xiàng)式回歸model~從以下4個(gè)模型中選取:(設(shè)m=2)例3商品銷售量與價(jià)格

x1=[

];x2=[

];x=[x1'x2'];y=[

]';rstool(x,y,'quadratic')Export~向工作區(qū)傳送參數(shù):beta--回歸系數(shù),rmse--剩余標(biāo)準(zhǔn)差s,residuals--殘差(向量);變量選擇影響因變量的因素:自變量x1,x2,

xm及其簡(jiǎn)單函數(shù),如

將所有影響顯著的因素都納入回歸模型;最終的模型盡量簡(jiǎn)單,即包含盡量少的因素。變量選擇的標(biāo)準(zhǔn)

從候選集合S={x1,…xk}中選出一子集S1(含p

k個(gè)自變量)與因變量y構(gòu)造回歸模型,其優(yōu)劣由s2度量.影響顯著的自變量進(jìn)入模型時(shí),Q明顯下降,s減小;影響很小的自變量進(jìn)入模型時(shí),Q下降不大,p的增加會(huì)使s變大.變量選擇與逐步回歸

逐步回歸從候選集合中確定一初始子集;從子集外〔候選集合內(nèi)〕中引入一個(gè)對(duì)y影響顯著的;對(duì)集合中的變量進(jìn)行檢驗(yàn),剔除影響變得不顯著的;迭代式地進(jìn)行引入和剔除,直到不能進(jìn)行為止。選擇衡量影響顯著程度的統(tǒng)計(jì)量,通常用偏F統(tǒng)計(jì)量;適中選取引入變量的顯著性水平in和剔除變量的out。引入新的變量后原來(lái)模型內(nèi)影響顯著的變量變得不顯著,從而被剔除~自變量之間存在較強(qiáng)相關(guān)性的結(jié)果.某些自變量之間的相關(guān)性很強(qiáng)回歸系數(shù)的置信區(qū)間較大多重共線性矩陣XTX病態(tài)MATLAB統(tǒng)計(jì)工具箱常用命令(3)逐步回歸stepwise(x,y,inmodel,penter,premove)x~候選變量集合的n×k數(shù)據(jù)矩陣〔n是數(shù)據(jù)容量,k是變量數(shù)目〕;y~因變量數(shù)據(jù)向量〔n維〕;Inmodel~初始模型中包括的候選變量集合的指標(biāo)〔矩陣x的列序數(shù),缺省時(shí)設(shè)定為全部候選變量〕;penter~引入

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論