數(shù)學(xué)建模多元線性回歸分析_第1頁
數(shù)學(xué)建模多元線性回歸分析_第2頁
數(shù)學(xué)建模多元線性回歸分析_第3頁
數(shù)學(xué)建模多元線性回歸分析_第4頁
數(shù)學(xué)建模多元線性回歸分析_第5頁
已閱讀5頁,還剩45頁未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第十五章多元(duōyuán)線性回歸分析

(MultipleLinear

Regression)第一頁,共50頁。1MultiplelinearregressionChoiceofindependentvariableApplicationContent第二頁,共50頁。2講述內(nèi)容(nèiróng)第一節(jié)多元線性回歸第二節(jié)自變量選擇方法第三節(jié)多元線性回歸的應(yīng)用及其本卷須知第三頁,共50頁。3目的(mùdì):作出以多個(gè)自變量估計(jì)因變量的多元線性回歸方程。資料:因變量為定量指標(biāo);自變量全部或大局部為定量指標(biāo),假設(shè)有少量定性或等級指標(biāo)需作轉(zhuǎn)換。用途:解釋和預(yù)報(bào)。意義:由于事物間的聯(lián)系常常是多方面的,一個(gè)應(yīng)變量的變化可能受到其它多個(gè)自變量的影響,如糖尿病人的血糖變化可能受胰島素、糖化血紅蛋白、血清總膽固醇、甘油三脂等多種生化指標(biāo)的影響。第四頁,共50頁。4第一節(jié)

多元(duōyuán)線性回歸第五頁,共50頁。5變量:應(yīng)變量1個(gè),自變量m個(gè),共m+1個(gè)。樣本含量:n數(shù)據(jù)格式見表15-1回歸模型一般(yībān)形式:一、多元線性回歸(huíguī)模型第六頁,共50頁。6表15-1多元回歸分析(fēnxī)數(shù)據(jù)格式條件(tiáojiàn)第七頁,共50頁。7一般(yībān)步驟建立(jiànlì)回歸方程(2)檢驗(yàn)并評價(jià)回歸方程及各自變量的作用(zuòyòng)大小第八頁,共50頁。8二、多元(duōyuán)線性回歸方程的建立例15-127名糖尿病人的血清總膽固醇、甘油三脂、空腹胰島素、糖化(tánghuà)血紅蛋白、空腹血糖的測量值列于表15-2中,試建立血糖與其它幾項(xiàng)指標(biāo)關(guān)系的多元線性回歸方程。第九頁,共50頁。9表15-227名糖尿病人的血糖(xuètáng)及有關(guān)變量的測量結(jié)果第十頁,共50頁。10求偏導(dǎo)數(shù)(dǎoshù)原理最小二乘法(chéngfǎ)第十一頁,共50頁。11三、假設(shè)檢驗(yàn)及其評價(jià)(píngjià)1.方差分析法:〔一〕對回歸方程第十二頁,共50頁。12表15-4

例15-1的方差分析表

表15-3多元(duōyuán)線性回歸方差分析表第十三頁,共50頁。132.決定系數(shù)R2:第十四頁,共50頁。143.復(fù)相關(guān)系數(shù)

第十五頁,共50頁。15〔二〕對各自變量指明方程中的每一個(gè)(yīɡè)自變量對Y的影響〔即方差分析和決定系數(shù)檢驗(yàn)整體〕。1.偏回歸(huíguī)平方和第十六頁,共50頁。16第十七頁,共50頁。17表15-5對例15-1數(shù)據(jù)作回歸分析(fēnxī)的局部中間結(jié)果各自(gèzì)變量的偏回歸平方和可以通過擬合包含不同自變量的回歸方程計(jì)算得到,表15-5給出了例15-1數(shù)據(jù)分析的局部中間結(jié)果。第十八頁,共50頁。18結(jié)果第十九頁,共50頁。192.t檢驗(yàn)法是一種與偏回歸平方和檢驗(yàn)完全(wánquán)等價(jià)的一種方法。計(jì)算公式為第二十頁,共50頁。20結(jié)果結(jié)論第二十一頁,共50頁。213.標(biāo)準(zhǔn)化回歸系數(shù)

變量標(biāo)準(zhǔn)化是將原始數(shù)據(jù)減去相應(yīng)(xiāngyīng)變量的均數(shù),然后再除以該變量的標(biāo)準(zhǔn)差。計(jì)算(jìsuàn)得到的回歸方程稱作標(biāo)準(zhǔn)化回歸方程,相應(yīng)的回歸系數(shù)即為標(biāo)準(zhǔn)化回歸系數(shù)。第二十二頁,共50頁。22注意:一般回歸系數(shù)有單位,用來解釋各自變量對應(yīng)變量的影響,表示在其它自變量保持不變時(shí),增加或減少一個(gè)(yīɡè)單位時(shí)Y的平均變化量。不能用各來比較各對的影響大小。標(biāo)準(zhǔn)化回歸系數(shù)無單位,用來比較各自變量對應(yīng)變量的影響大小,越大,對的影響越大。第二十三頁,共50頁。23結(jié)論第二十四頁,共50頁。24第二節(jié)

自變量選擇(xuǎnzé)方法

目的(mùdì):使得預(yù)報(bào)和〔或〕解釋效果好第二十五頁,共50頁。25一、全局(quánjú)擇優(yōu)法目的:預(yù)報(bào)效果好意義:對自變量各種不同的組合所建立的回歸方程進(jìn)行比較(bǐjiào)擇優(yōu)。選擇方法:第二十六頁,共50頁。26第二十七頁,共50頁。27第二十八頁,共50頁。28例15-2用全局擇優(yōu)法對例15-1數(shù)據(jù)的自變量進(jìn)行(jìnxíng)選擇。第二十九頁,共50頁。29二、逐步(zhúbù)選擇法1.

1.前進(jìn)法,回歸方程中的自變量從無到有、從少到多逐個(gè)引入回歸方程。此法已根本(gēnběn)淘汰。2.

后退法,先將全部自變量選入方程,然后逐步剔除無統(tǒng)計(jì)學(xué)意義的自變量。剔除自變量的方法是在方程中選一個(gè)偏回歸平方和最小的變量,作F檢驗(yàn)決定它是否剔除,假設(shè)無統(tǒng)計(jì)學(xué)意義那么將其剔除,然后對剩余的自變量建立新的回歸方程。重復(fù)這一過程,直至方程中所有的自變量都不能剔除為止。理論上最好,建議使用采用此法。3.逐步回歸法,逐步回歸法是在前述兩種方法的根底上,進(jìn)行雙向篩選的一種方法。該方法本質(zhì)上是前進(jìn)法。第三十頁,共50頁。30第三十一頁,共50頁。31表15-7逐步回歸過程(guòchéng)第三十二頁,共50頁。32表15-8例15-3方差分析表

“最優(yōu)〞回歸方程為結(jié)果說明:血糖的變化與甘油三脂、胰島素和糖化血紅蛋白有線性回歸關(guān)系,其中與胰島素負(fù)相關(guān)。由標(biāo)準(zhǔn)化回歸系數(shù)看出(kànchū),糖化血紅蛋白對空腹血糖的影響最大。第三十三頁,共50頁。33表15-9例15-3的回歸系數(shù)的估計(jì)(gūjì)及檢驗(yàn)結(jié)果第三十四頁,共50頁。34第三節(jié)多元線性回歸(huíguī)的應(yīng)用及本卷須知第三十五頁,共50頁。35一、多元線性回歸(huíguī)的應(yīng)用第三十六頁,共50頁。361.影響因素(yīnsù)分析

例如影響高血壓的因素可能有年齡、飲食習(xí)慣、吸煙狀況、工作緊張度和家族史等,在影響高血壓的眾多可疑(kěyí)因素中,需要研究哪些因素有影響,哪些因素影響較大。第三十七頁,共50頁。37

在臨床試驗(yàn)中,那么可能由于種種原因難以保證各組的指標(biāo)基線相同,如在年齡、病情等指標(biāo)不一致出現(xiàn)混雜的情況下,如何對不同的治療(zhìliáo)方法進(jìn)行比較等。這些問題都可以利用回歸分析來處理??刂苹祀s因素(confoundingfactor)的一個(gè)簡單方法就是將其引入回歸方程中,與其他主要變量一起進(jìn)行分析第三十八頁,共50頁。382.估計(jì)(gūjì)與預(yù)測

如由兒童的心臟橫徑、心臟縱徑和心臟寬徑估計(jì)心臟的外表積;由胎兒的孕齡、頭頸、胸徑和腹徑預(yù)測出生(chūshēng)兒體重等。第三十九頁,共50頁。393.統(tǒng)計(jì)控制(kòngzhì)逆估計(jì)。例如(lìrú)采用射頻治療儀治療腦腫瘤,腦皮質(zhì)的毀損半徑與射頻溫度及照射時(shí)間有線性回歸關(guān)系,建立回歸方程后可以按預(yù)先給定的腦皮質(zhì)毀損半徑,確定最正確控制射頻溫度和照射時(shí)間。第四十頁,共50頁。40二、多元線性回歸(huíguī)應(yīng)用的本卷須知1.指標(biāo)(zhǐbiāo)的數(shù)量化分2類,可用一個(gè)(yīɡè)〔0,1〕變量。如性別分k類,k-1個(gè)〔0,1〕變量,如血型。第四十一頁,共50頁。41數(shù)據(jù)格式回歸方程

建立(jiànlì)回歸方程b1:相當(dāng)(xiāngdāng)A型相對于O型的差異b2:相當(dāng)(xiāngdāng)B型相對于O型的差異b3:相當(dāng)(xiāngdāng)AB型相對于O型的差異第四十二頁,共50頁。42〔3〕等級定量。一般(yībān)是將等級從弱到強(qiáng)轉(zhuǎn)換為〔或〕如文化程度分為小學(xué)、中學(xué)、大學(xué)、大學(xué)以上四個(gè)等級。Y為經(jīng)濟(jì)收入。解釋:b(b1)反映X〔X1〕增加1個(gè)單位,增加b個(gè)單位〔如:500元〕。表示中學(xué)(zhōngxué)文化較小學(xué)收入多500,大學(xué)較中學(xué)(zhōngxué)多500,余類推。第四十三頁,共50頁。43b1,b2,b3分別反映中學(xué)、大學(xué)、大學(xué)以上相對于小學(xué)文化程度者經(jīng)濟(jì)收入差別的大小也可將K個(gè)等級轉(zhuǎn)換為K-1個(gè)(0,1)變量第四十四頁,共50頁。442.樣本含量:n=(5~10)m。3.關(guān)于逐步回歸:對逐步回歸得到的結(jié)果不要盲目的信任,所謂的“最優(yōu)〞回歸方程并不一定是最好的,沒有選入方程的變量也未必沒有統(tǒng)計(jì)學(xué)意義。例如,例15-3中假設(shè)將選入標(biāo)準(zhǔn)和剔除標(biāo)準(zhǔn)定為和選入的變量是,而不是,結(jié)果發(fā)生(fāshēng)了改變。不同回歸方程適應(yīng)于不同用途,依專業(yè)知識定。第四十五頁,共50頁。454.多重共線性即指一些自變量之間存在較強(qiáng)的線性關(guān)系。如高血壓與年齡、吸煙年限、飲白酒年限等,這些自變量通常是高度相關(guān)的,有可能使通過最小二乘法建立回歸方程失效,引起以下一些不良后果:〔1〕參數(shù)估計(jì)值的標(biāo)準(zhǔn)誤變得很大,從而t值變得很小?!?〕回歸方程不穩(wěn)定(wěndìng),增加

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論