多元線性回歸分析實例及教程_第1頁
多元線性回歸分析實例及教程_第2頁
多元線性回歸分析實例及教程_第3頁
多元線性回歸分析實例及教程_第4頁
多元線性回歸分析實例及教程_第5頁
已閱讀5頁,還剩6頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

多元線性回歸分析預測法概述

在市場的經濟活動中,經常會遇到某一市場現(xiàn)象的發(fā)展和變化取決于幾個影晌因素的情況,

也就是一個因變量和幾個自變量有依存關系的情況。而且有時幾個影響因素主次難以區(qū)分,或者

有的因素雖屬次要,但也不能略去其作用。例如,某一商品的銷售量既與人口的增長變化有關,

也與商品價格變化有關。這時采用一元回歸分析預測法進行預測是難以奏效的,需要采用多元回

歸分析預測法。

多元回歸分析預測法,是指通過對兩上或兩個以上的自變量與一個因變量的相關分析,建

立預測模型進行預測的方法。當自變量與因變量之間存在線性關系時,稱為多元線性回歸分析。

[編輯]

多元線性回歸的計算模型⑴

?元線性回歸是個主要影響因素作為自變量來解釋因變量的變化,在現(xiàn)實問題研究中,

因變量的變化往往受幾個重要因素的影響,此時就需要用兩個或兩個以上的影響因素作為自變

品來解釋因變品的變化,這就昂多元回歸亦稱多重回歸。當多個自變品與因金吊D間是線性關系

時,所進行的回歸分析就是多元性回歸。

設y為因變量,/為自變量,并且自變量與因變量之間為線性關系時,則多元線性回歸模型為:

y=b()++b2x2H-------Fbkxk+e

其中,bO為常數(shù)項,/為回歸系數(shù),b1為/固定時,x1每增加一個單位對y的效應,即x1對y

的偏回歸系數(shù):同理.b2為/固定時,x2每增加一個單位對y的效應,即,x2對y的偏回歸系數(shù),等

等。如果兩個自變量x1,x2同一個因變量y呈線相美時,可用二元線性回歸模型描述為:

y=b()++b2x2H-------Fbkxk+e

其中,bO為常數(shù)項,/為回歸系數(shù),b1為/固定時,x2每增加一個單位對y的效應,即x2對y

的偏回歸系數(shù),等等。如果兩個自變量x1,x2同一個因變量y呈線相關時,可用二元線性回歸模

型描述為:

y=b?++biX2+e

建立多元性回歸模型時,為了保證回歸模型具有優(yōu)良的解釋能力和預測效果,應首先注意

自變量的選擇,其準則是:

(1)自變量對因變量必須有顯著的影響,并呈密切的線性相關:

(2)自變量與因變量之間的線性相關必須是真實的,而不是形式上的;

(3)自變量之彰應具有一定的互斥性,即自變量之彰的相關程度不應高于自變量與因變量之

因的相關程度;

(4)自變量應具有完整的統(tǒng)計數(shù)據,其預測值容易確定。

多元性回歸模型的參數(shù)估計,同一元線性回歸方程一樣,也是在要求誤差平方和(/)為最小的

前提下,用最小二乘法求解參數(shù)。以二線性回歸模型為例,求解回歸參數(shù)的標準方程組為

(£v=九瓦+瓦£3+慶£數(shù)

<=瓦£2+仇£#+b2^x1x2

【=瓦£+瓦£立途2+與£痣

解此方程可求得A自A的數(shù)值。亦可用下列矩陣法求得

b==(xx)~I-{xy}

-ME

X1

E2

伉二

XT1

?-

11

XSE工in

2X2

6-9rl

』EX2V-

[編輯]

多元線性回歸模型的檢驗⑴

多元性回歸模型與一元線性回歸模型一樣,在得到參數(shù)的最小二乘法的估計值之后,也需

要進行必要的檢驗與評價,以快定模型是否可以應用。

1.擬合程度的測定。

與一元線性回歸中可決系數(shù)r2相對應,多元線性回歸中也有多重可決系數(shù)r2,它是在因變

量的總變化中,由回歸方程解釋的變動(回歸平方和)所占的比重,F(xiàn)2越大,回歸方各對樣本數(shù)據

點擬合的程度越強,所有自變量與因變量的關系越密切。計算公式為:

M一歲)2

2

"£(y_y)

£)2

£(1/一3)2

£他一切2=£/—(比£y+仇£?J/+%£?2沙+…+怎£]⑻

£(y—歲產=£/_/(Eg尸

IL

2.估計標準誤差

估計標準誤差,即因變量y的實際值與回歸方程求出的估計值/之間的標準誤差,估計標準

誤差越小,回歸方程擬合程度越程。

<l^y-yY

S〃

Vk=—

y

其中,k為多元線性回歸方程中的自變量的個數(shù)。

3.回歸方程的顯著性檢驗

回歸方程的顯著性檢驗,即檢驗整個回歸方程的顯著性,或者說評價所有自變量,因變量

的線性關系是否密切。能常采用F檢驗,F統(tǒng)計量的計算公式為:

2

E(y-y)/k

E(y_討/n_k_1

I^/k

=(l-/i2)/n-fc-l

根據給定的顯著水平a,自由度(k,n-k-1)查F分布表,得到相應的臨界值Fa,若F>Fa,則回

歸方程具有顯著意義,回歸效果顯著:F<Fa,則回歸方程無顯著意義,回歸效果不顯著。

4.回歸系數(shù)的顯著性檢驗

在一元線性回歸中,回歸系數(shù)顯著性檢驗(t檢驗)與回歸方程的顯著性檢驗(F檢驗)是等價的,

但在多元線性回歸中,這個等價不成立。t檢驗是分別檢驗回歸模型中各個回歸系數(shù)是否具有顯

著性,以便使模型中只保留那些對因變量有顯著影響的因素。檢驗時先計算統(tǒng)計量ti;然后根據

給定的顯著水平a,自由度n-k-1查t分布表,得臨界值ta或ta/2,i>t-a或ta/2,則回歸系數(shù)

bi與0有顯著關異,反之,則與0無顯著差異。統(tǒng)計量t的計算公式為:

其中,Cij是多元線性回歸方程中求解回歸系數(shù)矩陣的逆矩陣(x*)-1的主對角線上的第j

個元素。對二元線性回歸而言,可用下列公式計算:

S?2

Gi=

S11S22-

Su

。22=

511522一屏2

其中,

511=£(右一西)2=£4一1(£處)2

$22=£(M一的產=ZLX2-^2)2

512=£(方-歷)(?2-土2)=S21

£方必一工(£的)(£的)

5.多重共線性判別

若某個回歸系數(shù)的t檢驗通不過,可能是這個系數(shù)相對應的自變量對因變量的影平不顯著所

致,此時,應從回歸模型中剔除這個自變量,重新建立更為簡單的回歸模型或更換自變量:。也可

能是自變量之間有共線性所致,此時應設法降低共線性的影響。

多重共線性是指在多元線性回歸方程中,自變量之彰有較強的線性關系,這種關系若超過

了因變量與自變量的線性關系,則回歸模型的穩(wěn)定性受到破壞,回歸系數(shù)估計不準確。需要指出

的是,在多元回歸模型中,多重共線性的難以避免的,只要多重共線性不太嚴重就行了。判別多

元線性回歸方程是否存在嚴懲的多重共線性,可分別計算每兩個自變量之間的可決系數(shù)「2,若

r2>R2或接近于R2,則應設法降低多重線性的影響。亦可計算自變量間的相關系數(shù)矩陣的特征

值的條件數(shù)k=X1/、p(、1為最大特征值,入p為最小特征值)k<100,則不存在多重點共線

性;若100<k<1000,則自變量間存在較強的多重共線性,若k>1000,則自變量間存在嚴重的

多重共線性。降低多重共線性的辦法主要是轉換自變量的取值,如變絕對數(shù)為相對數(shù)或平均數(shù),

或者更換其他的自變量。

6.D.W檢驗

當回歸模型是根據動態(tài)數(shù)據建立的,則誤差項e也是一個時間序列,若誤差序列諸項之間相

互獨立,則誤差序列各項之間沒有相關關系,若誤差序列之間存在密切的相關關系,則建立的回

歸模型就不能表述自變量與因變量之間的真實變動關系。D.W檢驗就是誤差序列的自相關檢驗。

檢驗的方法與一元線性回歸相同。

[編輯]

多元線性回歸分析預測法案例分析

[編輯]

案例一:公路客貨運輸量多元線性回歸預測方法探討⑶

一、背景

公路客、貨運輸量的定量預測,近幾年來在我國公路運輸領域大面積廣泛地開展起來,并有

效的促進了公路運輸經營決策的科學化和現(xiàn)代化。

關于公路客、貨運輸量的定量預測方法很多,本文主要介紹多元線性回歸方法在公路客貨運

輸量預測中的具體操作。根據筆者先后參加的部、省、市的科研課題的實踐,證明了多元線性回

歸方法是對公路客、貨運輸量預測的一種置信度較高的有效方法。

二、多元線性回歸預測

線性回歸分析法是以相關性原理為基礎的.相關性原理是預測學中的基本原理之一。由于公

路客、慶運輸量受社會經濟有關因素的綜合影響一所以,多元線怛同歸預測首先是建寺公路客、

貨運輸量與其有關影響因素之間線性關系的數(shù)學模型。然后通過對各影響因素未來值的預測推算

出公路客貨運輸量的預測值。

三、公路客、貨運輸量多元線性回歸預測方法的實施步驟

1.影響因素的確定

影響公路客貨運輸量的因素很多,主要包括以卜一些因素:

(1)客運量影響因素

人“增長量褲保有量、國民生產總值、國民收入工農業(yè)總產值,基本建設投資額城鄉(xiāng)居民儲

蓄額鐵路和水運客運量等。

(2)貨運量影響因素

人口貨車保有量(包括拖拉鞏),國民生產總值,國民收入、工農業(yè)總產值,基本建設投資額,

主要工農業(yè)產品產量,社會商品購買力,社會商品零售總額.鐵路和水運貨運量菩。

上述影響因素僅是對一般而言,在針對具體研究對象時會有所增減。因此,在建立模型時只

須列入重要的影響因素,對丁非重要因素可不列入模型中。若疏源了某些重要的影響因素,則會

造成預測結果的失真。另外,影響因素太少會造成模型的敏感性太強.反之,若將非乖要影響因

素列入模型,則會增加計算工作量,使模型的建立復雜化并增大隨機誤差。

影響因素的選擇是建立預洌模型首要的關鍵環(huán)節(jié),可采取定性和定量相結合的方法進行.

影響因素的確定可以通過專家調查法,其目的是為了充分發(fā)揮專家的聰明才智和經驗。

具體做法就是通過對長期從事該地區(qū)公路運輸企業(yè)和運輸管理部門的領導干部、專家、工作

人員和行家進行調查。可通過組織召開座談會.也可以通過采訪,填寫調查表等方法進行,從中

選出主要影響因素為了避免影響因素確定的隨意性,提高回歸模型的精度和減少預測工作量,

可通過查閱有關統(tǒng)計資料后,再對各膨響因素進行相關度(或關聯(lián)度)和共線性分析,從而再次篩

選出最主要的影響因素.所謂相關度分析就是將各影響因素的時向序列與公路客貨運量的時間

序列做相關分杯事先確定一個相關系數(shù),對相關系數(shù)小于的影響因素進行淘汰.關聯(lián)度是灰色

系統(tǒng)理論中反映事物發(fā)展變化過程中各因素之間的關聯(lián)程度,可通過建空公路客、貨運量與各影

響影響因素之間關聯(lián)系數(shù)矩陣,按一定的標準系數(shù)舍去關聯(lián)度小的影響因素.所謂共線性是指

某些影響因素之間存在著線性關系或接近于線性關系.由于公路運輸經濟自身的特點,影響公

路客,貨運輸量的諸多因素之問總是存在著?定的相關性,持別是與國民經濟有關的?些價值

型指標。

我們研究的不是有無相關性問題而定共線性的程度,如果影響因素之間的共線性程度很高,

首先會降低參數(shù)估計值的精度。其次在回歸方程建立后的統(tǒng)計檢驗中導致舍去重要的影響因素或

錯誤的地接受無顯著影響的因素,從而使整個預測工作失去實際意義。關于共線性程度的判定,

可利用逐步分析估計法的數(shù)理統(tǒng)計?理論編制il?算機程序來實現(xiàn)?;蛘咄ㄟ^比較rij和R2的大小

來判定。在預測學上,般認為當rij>R2時,共線性是嚴重的,其含義是,多元線性回歸方程中

所含的任意兩個自變量xi,xj之間的相關系數(shù)rij大于或等于該方程的樣本可決系數(shù)R2時,說明

自變量中存在著嚴重的共線性問題。

2.建立經驗線性回歸方程利用最小二乘法原理尋求使誤差平方和達到撮小的經驗線性回歸

方程:/

y—預測的客、貨運量

g——各主要影響因數(shù)

3.數(shù)據整理

對收集的歷年客、貨運輸量和各主要影響因素的統(tǒng)計資料進行審核和加工整理是為了保證預

測工作的質量。

資料整理主要包括下列內容:

(1)資料的補缺和推算。

(2)對不可竟資料加以核實調整.對查明原因的異常值加以修正。

(3)對時間序列中不可比的資料加以調整和規(guī)范化:對按當年價格計算的價值指標應折算成

按統(tǒng)。

4.多元線性回歸模型的參數(shù)估計

在經驗線性回歸模型中,/是要估計的參數(shù),可通過數(shù)理統(tǒng)計理論建立模型來確定。在實際預

測中,可利用多元線性回歸復相關分析的計算機程序來實現(xiàn)-5.本模型參數(shù)的估計值進行檢驗。

此項工作的目的在于判定估計值是否滿意、可靠。一般檢驗工作須從以下兒方面來進行。

?經濟意義檢驗

?關于經濟預測的數(shù)學模型,首先要檢臉模

型是否有經濟意義,YP若參數(shù)估計值的符號

和大小與公路運輸經濟發(fā)展以及經濟判別不

符合時,這時所估計的模型就不能或很難解釋

公路運輸經濟的一般發(fā)展規(guī)律.就應拋棄這個

模型.需要重新構造模型或重新挑選影響因素。

?統(tǒng)計檢驗

?統(tǒng)il?檢驗是數(shù)理統(tǒng)計理論的重要內容,用

于檢驗模型估計值的可靠性。通常,在公路客、

貨運量預測中應采用的統(tǒng)計檢驗是:

?擬合度檢驗

?所謂擬合度是指所建立的模型與觀察的

實際情況軌跡是否吻合、接近,接近到什么程

度。統(tǒng)計學是通過構造統(tǒng)計量R2來量度的,

R2nJ"由樣本數(shù)據計算:得出。若建立的模型愈

接近于實際,則RY愈接近于1。

PI歸方程的顯著性檢驗

?回歸方程的顯著性檢驗是通過方差分析

構造統(tǒng)計量F來進行的,統(tǒng)計量F是通過樣本

數(shù)據計算得出的。當給定某一置信度后,可以

通過查閱F表來確定回歸模型從總體效果來

看是否可以采納。

?參數(shù)估計值的標準差檢驗

估計值的標勝差是側量估計值與真實參數(shù)值的高差的一種量度。參數(shù)的標出差越大,估計值

的可靠性也就越小;反之,如果標準差越小,那么估計值的可靠性也就越大。參數(shù)值標準差的檢

驗,可以通過構造大統(tǒng)計量來進行量度。當給定某一置信度后,可以通過查表來確定模型中某個

參數(shù)估計值的可靠性。

應當強調指出.統(tǒng)計檢驗相對于經濟意義檢驗來說是第二位的。如果經濟意義檢驗不合理,

那么即使統(tǒng)計檢驗可以達到很高的置信度,也應當拋棄這種估計結果,因為用這樣的結果來進

行經濟預測是沒有意義的。

6.最優(yōu)回歸方程的確定

經過上述的經濟意義和統(tǒng)計檢驗后,挑選出的線性回歸方程往往是好幾個、為了從中優(yōu)選出

用于進行實際預測的方程,我們可以采用定性和定量相結合的辦法。

從數(shù)理統(tǒng)計的原理來講,應挑選方程的剩余均方和S-E較小為好.但作為經濟預,刪還必須

盡量考慮到方程中的影響因素更切合實際和其未來值更易把握的原則來綜合考慮。當然、有時也

可以從中挑選出好幾個較優(yōu)的回歸方程.通過預測后,分別作為不同的高、中、低方案以供決策

人員選擇。

7.模型的實際預測檢驗

在獲得模型參數(shù)估計值后,又經過了上述?系列檢驗而選出的最優(yōu)(或較優(yōu))回歸方程,還必

須對模型的預測能力加以檢驗。不難理解、最優(yōu)回歸方程對于樣本期間來說是正確的,但是對用

于實際預測是否合適呢?為此,人必須研究參數(shù)估計值的穩(wěn)定性及用對于樣本容量變化時的靈敏

度,也必須研究確定估計出來的模型是否可以用于樣本觀察值以外的范國,其具休做法是:

(1)采用把增大樣本容量以后模型估計的結果與原來的估計結果進行比較,并檢驗其差異的

顯著性。

(2)把估計出來的模型用于樣本以外某一時間的實際預測,并將這個預測值與實際的觀察值

作一比較,然后檢驗其差異的顯著性。

8.模型的應用

公路客、貨運輸量多元線性回歸預測模型的研究目的主要有以下幾個方面。

(1)進行結構分析,研究影響該地區(qū)的公路客、貨運輸量的主耍因素和各影響因素影響程度的

大小,進一步探討該地區(qū)公路運輸經濟理論。

(2)預測該地區(qū)今后年份的公路客、貨運輸量的變化,以便為公路運輸市場、公路運輸政策及

公路運輔建設項目投資作出正確決策提供理論依據。另外,還可以通過公路客.貨運輸量與公路

交通量作相關分析來對公路的飽和度發(fā)展趨勢進行預測。從而為公路的新建、擴建項目的投資提

供決策分析。

(3)模擬各種經濟政策下的經濟效果,以便對有關政策進行評價。

四、經調查分析,影響某地區(qū)旅客運輸量的因素為。

x.—國民收入

——工農業(yè)總產值

M—社會總產值

M------人口

乂——客車保存量

乂一城鄉(xiāng)居民儲蓄存款

經計算得下列相關系數(shù)表:

X1X3X4*6

Y0.94390.92870.90430.99140.S6700.7021

Z0.97360.96I40.93260.86450.93210.6678

Y—客運盈

Z——旅客周轉量

若令a=0.85,則可以舍去X6這個影響因索,也就是認為“城鄉(xiāng)居民儲蓄存款”不能作為

響旅客運輸量的主要因素。

2.經調查分析、影響某地區(qū)旅客運輸量的因素為:

.V.—國民收入

,工

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論