《統(tǒng)計學》課件-第12章 相關(guān)分析與回歸分析_第1頁
《統(tǒng)計學》課件-第12章 相關(guān)分析與回歸分析_第2頁
《統(tǒng)計學》課件-第12章 相關(guān)分析與回歸分析_第3頁
《統(tǒng)計學》課件-第12章 相關(guān)分析與回歸分析_第4頁
《統(tǒng)計學》課件-第12章 相關(guān)分析與回歸分析_第5頁
已閱讀5頁,還剩81頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

12

相關(guān)分析與回歸分析【學習目標】1.理解相關(guān)分析和回歸分析的概念、種類和特點;2.掌握相關(guān)關(guān)系的測定方法、相關(guān)系數(shù)的計算方法;3.理解相關(guān)分析與回歸分析的假設(shè)檢驗的方法;4.掌握直線回歸方程的估計方法,針對具體問題運用相關(guān)與回歸分析方法進行深入的定量、定性分析。

經(jīng)濟運行中,周期性出現(xiàn)經(jīng)濟擴張與經(jīng)濟緊縮的交替更迭、循環(huán)往復。在這個過程中,經(jīng)濟變量之間會表現(xiàn)出有規(guī)律的變動。例如,稅收收入會受到經(jīng)濟運行狀況的影響,可以認為稅收收入和GDP是兩個經(jīng)濟變量,這兩個變量會表現(xiàn)出有規(guī)律的關(guān)系,這樣的關(guān)系就是統(tǒng)計意義上的相關(guān)關(guān)系,是統(tǒng)計規(guī)律的重要表現(xiàn)形式。我們想知道的是它們的相關(guān)的形式、相關(guān)的密切程度、影響的結(jié)構(gòu)等等,這些需要運用相關(guān)分析與回歸分析。12.1相關(guān)分析1.

相關(guān)關(guān)系與相關(guān)分析(1)

函數(shù)關(guān)系

函數(shù)關(guān)系指現(xiàn)象之間存在著嚴格的依存關(guān)系,即當一個或幾個變量取一定的值時,另一個變量有確定值與之對應(yīng),變量之間這種依一定的函數(shù)形式表現(xiàn)出來的一一對應(yīng)的關(guān)系稱為函數(shù)關(guān)系。比如商品的銷售數(shù)量和銷售額之間就是函數(shù)關(guān)系。(2)相關(guān)關(guān)系

相關(guān)關(guān)系又稱統(tǒng)計關(guān)系,是指兩個變量或兩個以上的變量之間存在某種依存關(guān)系,變量

X

與變量

Y

之間并不是嚴格意義上的函數(shù)關(guān)系,但是存在有規(guī)律的、某種“確定的”的關(guān)系。例如:商品的廣告費用與銷售量之間的關(guān)系,稅收收入與GDP

之間的關(guān)系等等。這樣的關(guān)系在經(jīng)濟領(lǐng)域中普遍存在,是我們認識經(jīng)濟現(xiàn)象的重要內(nèi)容。

需要指出的是,有些時候我們在相關(guān)分析中還要考慮邏輯關(guān)系或者因果關(guān)系。例如,在稅收收入與

GDP

之間的關(guān)系中,是

GDP

影響稅收收入,所以

GDP

是“自變量”,稅收收入是“因變量”。在經(jīng)濟現(xiàn)象中還存在雙向的邏輯關(guān)系,或者說互為因果關(guān)系,例如,某一種商品的供應(yīng)量和其價格之間就是這樣的關(guān)系。

相關(guān)分析(correlation

analysis)是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度,是研究隨機變量之間的相關(guān)關(guān)系的一種統(tǒng)計方法。2.相關(guān)關(guān)系的種類

(1)按相關(guān)的程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān)

當一種現(xiàn)象的數(shù)量變化完全由另一個現(xiàn)象的數(shù)量變化所確定時,稱這兩種現(xiàn)象間的關(guān)系為完全相關(guān)。例如:在價格不變的條件下,某種商品的銷售總額與其銷售量總是成正比例關(guān)系。在這種場合,相關(guān)關(guān)系便成為函數(shù)關(guān)系。因此也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個特例。當兩個現(xiàn)象彼此互不影響,其數(shù)量變化各自獨立時,稱為不相關(guān)現(xiàn)象。

(2)按相關(guān)的方向可分為正相關(guān)和負相關(guān)

當一個現(xiàn)象的數(shù)量增加(或減少),另一個現(xiàn)象的數(shù)量也隨之增加(或減少)時,稱為正相關(guān)。例如:消費水平隨收入的增加而提高。當一個現(xiàn)象的數(shù)量增加(或減少),而另一個現(xiàn)象的數(shù)量向相反方向變動時,稱為負相關(guān)。例如商品流轉(zhuǎn)的規(guī)模愈大,流通費用水平則愈低。

(3)按相關(guān)的形式可分為線性相關(guān)和非線性相關(guān)

當兩種相關(guān)現(xiàn)象之間的關(guān)系大致呈現(xiàn)為線性關(guān)系時,稱之為線性相關(guān)。例如:人均消費水平與人均收入水平通常成線性關(guān)系。如果兩種相關(guān)現(xiàn)象之間,并不表現(xiàn)為直線的關(guān)系,而是近似于某種曲線方程的關(guān)系,則這種相關(guān)關(guān)系稱為非線性相關(guān)。例如產(chǎn)品的平均成本與產(chǎn)品總產(chǎn)量就是一種非線性相關(guān)。

(4)按所研究的變量多少可分為簡單相關(guān)和復相關(guān)

兩個變量之間的相關(guān),稱為簡單相關(guān)。當所研究的是一個變量對兩個或兩個以上其他變量的相關(guān)關(guān)系時,稱為復相關(guān)。例如:某種商品的需求與其價格水平以及收入水平之間的相關(guān)關(guān)系便是一種復相關(guān)。3.相關(guān)分析方法(1)相關(guān)表

在定性判斷的基礎(chǔ)上,把具有相關(guān)關(guān)系的兩個變量的數(shù)值按照一定順序平行排列在一張表上,以觀察它們之間的相互關(guān)系,這種表就稱為相關(guān)表。根據(jù)《中國統(tǒng)計年鑒

2018》的數(shù)據(jù),將

2000-2017年我國GDP

與稅收收入編制成相關(guān)表,見表

12-(數(shù)據(jù)1見Data12-1)。表

12-1我國稅收收入與

GDP

(單位:億元)年份GDP稅收收入年份GDP稅收收入2000100280.112581.512009349081.459521.592001110863.115301.382010413030.373210.792002121717.417636.452011489300.689738.39200313742220017.312012540367.4100614.32004161840.224165.682013595244.4110530.72005187318.928778.542014643974119175.32006219438.534804.352015689052.1124922.22007270232.345621.972016743585.5130360.72008319515.554223.792017827121.7144369.9

從表

12-1

我們可以比較直觀發(fā)現(xiàn),2001-2010

年我國稅收收入與GDP呈現(xiàn)同向增加的正相關(guān)趨勢。(2)相關(guān)圖

相關(guān)圖又稱散點圖。它是以直角坐標系的橫軸代表變量

X,縱軸代表變量

Y,通過觀察或試驗我們可以得到統(tǒng)計數(shù)據(jù),每一組對應(yīng)數(shù)據(jù)記為(Xi

,Yi)(i=1,2,…,n),將每組數(shù)據(jù)(Xi

,Yi)變量值在坐標系中用點標出來而形成的散點圖,稱為相關(guān)圖。

根據(jù)表

12-1

的資料繪制的相關(guān)圖如圖

12-1

所示。圖

12-1

稅收收入與GDP

的散點圖

(3)線性相關(guān)系數(shù)線性相關(guān)系數(shù)簡稱為相關(guān)系數(shù),或稱簡單相關(guān)系數(shù),是對兩個變量之間線性相關(guān)程度的度量,刻畫了兩個變量之間線性相關(guān)密切程度和相關(guān)方向。如果相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算的,則稱為總體相關(guān)系數(shù),通常表示為

;如果根據(jù)樣本數(shù)據(jù)計算的則稱為樣本相關(guān)系數(shù),表示為

r。相關(guān)系數(shù)通常是指樣本相關(guān)系數(shù)??傮w相關(guān)系數(shù)的計算公式為:(12-1)其中 Cov

(

X

,Y

)

—變量X

和Y

的協(xié)方差;Var

(

X

)

—變量X

的方差;Var

(Y

)

—變量Y

的方差。樣本相關(guān)系數(shù)的計算公式是:(12-2)其中

—變量X

的平均數(shù);

—變量Y

的平均數(shù)。公式(12-2)可化簡為:(12-3)其中 n—樣本容量。

需要指出的是,在測定簡單相關(guān)系數(shù)時,X

Y

兩個變量是對等的關(guān)系,即所研究的兩個變量不區(qū)分自變量和因變量;兩個變量只能算出一個相關(guān)系數(shù),其值的大小、符號反映兩變量之間的密切程度和相關(guān)類型。

在公式(12-2)中,分子和分母都是離差形式,但分母總是為正,而分子的符號會隨離差的符號發(fā)生變化,所以相關(guān)系數(shù)r

的符號取決于分子的符號。我們以

x

x

為縱軸,以

y

y

為橫軸建立新的當坐標系,分別稱重新劃分的區(qū)域按逆時針方向為第一、二、三、四區(qū)域。如果散點圖中的散點比較一致地落在第一、三區(qū)域(如圖

12-2a所示),這時分子的符號為正,為正相關(guān),且一致程度越高,相關(guān)程度的程度也越高,相關(guān)系數(shù)r

的絕對值越大;如果散點圖中的散點比較一致地落在第二、四區(qū)域(如圖

12-2b

所示),這時分子的符號為負,為負相關(guān),且一致程度越高,相關(guān)程度的程度也越高,相關(guān)系數(shù)r

的絕對值越大;如果散點圖中的散點沒有規(guī)律地分布在各區(qū)域內(nèi)(如圖

12-2c

所示),由于離差的符號不斷變化,分子會正負抵消,相關(guān)系數(shù)r

的絕對值會很小,相關(guān)程度也很低。a)正相關(guān)圖

12-2相關(guān)系數(shù)的幾何意義b)負相關(guān)

c)無明顯相關(guān)

從上面的分析可以看出,公式(12-2)的分子已經(jīng)能夠描述兩個變量的相關(guān)程度和相關(guān)類型了,為什么還要除以分母的內(nèi)容呢?我們仔細考慮一下其分子,當兩個變量表現(xiàn)出高度正相關(guān)或高度負相關(guān)時,其絕對值可能會非常大,甚至趨于無窮大,這樣我們就無法給出一個確定兩個變量相關(guān)程度的標準,或者說這個分子的絕對值大到什么程度是高度相關(guān)。此外,由于我們計算的變量是有單位的,兩個變量的單位可能不同,這時分子的計算結(jié)果無實際意義。為了解決這些問題,在計算時除以分母的內(nèi)容,其意義是將離差標準化,然后再平均,就可以很好地表達線性相關(guān)的意義了。

可以證明,經(jīng)過以上處理后,樣本相關(guān)系數(shù)

r

的取值范圍為

1

r

1

。若r

為正,則表明兩變量為正相關(guān);若r

為負,則表明兩變量為負相關(guān);如果r

=1

或–1,則表示兩個現(xiàn)象完全直線性相關(guān)。如果r

=0,則表示兩個現(xiàn)象完全不相關(guān)(不存在直線相關(guān),但不排除其他形式的相關(guān))。相關(guān)系數(shù)r

的絕對值越接近于

1,表示相關(guān)系數(shù)越強;越接近于

0,表示相關(guān)系數(shù)越弱。實踐中,我們以以下標準判斷兩變量線性相關(guān)密切程度:

12-2

線性相關(guān)系數(shù)與相關(guān)程度相關(guān)系數(shù)的取值 相關(guān)程度微弱相關(guān)或不相關(guān)低度相關(guān)中度相關(guān)高度相關(guān)完全相關(guān)

相關(guān)系數(shù)的計算過程比較復雜,我們以一個實例來說明計算方法。【例

12-1】一家以大學生為服務(wù)對象的連鎖面館,在大學校區(qū)附近開設(shè)了多家分店。面館的經(jīng)營者認為各分店的銷售額與附近大學校區(qū)的學生人數(shù)有關(guān),于是統(tǒng)計了

10

家分店一個月的相關(guān)數(shù)據(jù),如表

12-3

所示(數(shù)據(jù)見

Data12-2)。試計算學生人數(shù)與銷售額的相關(guān)系數(shù)。表

12-3學生人數(shù)與分店的銷售額序號學生人數(shù)(千人)銷售額(千元)1258261053888481185121176161377201578201699221491026202解:根據(jù)公式(12-2),相關(guān)系數(shù)的計算表如下:其中:

=14

=130。由公式(12-2)得:

由計算結(jié)果看,r=0.95012296,很接近

1,說明學生人數(shù)與銷售額存在高度的正的線性相關(guān),即學生人數(shù)越多,對應(yīng)的銷售額也越高。實際計算中,樣本相關(guān)系數(shù)的計算量較大,我們可以利用

Excel進行計算,具體步驟和方法讀者可參閱其他相關(guān)資料。【例

12-2】根據(jù)表

12-2

中數(shù)據(jù),用Excel

計算樣本相關(guān)系數(shù)。解:計算結(jié)果如下:其中列1和列2的交叉點上的數(shù)值就是相關(guān)系數(shù)。即:r=0.95012295。

列1列2列11

列20.9501229551

一般情況下,總體相關(guān)系數(shù)

是未知的,在實際的研究分析時,通常是根據(jù)樣本數(shù)據(jù)測度樣本相關(guān)系數(shù)

r作為總體相關(guān)系數(shù)

的估計值。也就是說樣本相關(guān)系數(shù)

r是統(tǒng)計量,它會隨著樣本的不同而發(fā)生變化,是一個隨機變量。這樣,我們必須回答一個問題,當樣本相關(guān)系數(shù)

r表現(xiàn)為樣本中兩個變量相關(guān)時,能否代表總體中對應(yīng)的兩個變量也相關(guān)呢?或者說這個結(jié)果是偶然的嗎?這就需要對

進行相關(guān)系數(shù)的顯著性檢驗。

作為一個隨機變量,樣本相關(guān)系數(shù)

r具有一定的概率分布。可以證明,如果兩個變量都服從正態(tài)分布,在總體相關(guān)系數(shù)

=0

的條件下,樣本相關(guān)系數(shù)

r

服從自由度為(n-2)的

t分布:(12-4)其中

r—樣本相關(guān)系數(shù);

n—樣本容量。顯著性檢驗的步驟如下:1)提出假設(shè):

H0

:

0

H

1

:

0

;2)由公式(12-4)計算檢驗統(tǒng)計量;3)確定顯著性水平,根據(jù)給定的顯著性水平和自由度(n-2)查

t分布表查構(gòu)造拒絕域;4)決策判斷:若

,拒絕

H0,

表明總體的兩個變量之間存在顯著的線性相關(guān)關(guān)系。

【例

12-3】由上例的結(jié)果,對總體相關(guān)系數(shù)是否等于零做顯著性檢驗。解:取

r=0.95。1)提出假設(shè):

H0

:

0

H

1

:

0

;2)計算檢驗統(tǒng)計量:由公式(12-3)得t=8.605305463)假

0.05

t

:t

/

2

(n

2)

t0.025

(8)

2.306

;4)由于

t=8.60530546>

t0.025

(8)

2.306

,故拒絕原假設(shè),說明總體的學生人數(shù)與銷售額之間存在相關(guān)關(guān)系12.2回歸分析

通過相關(guān)分析,如果我們得到兩個變量X

Y

之間存在某種形式的相關(guān)關(guān)系,比如線性相關(guān)關(guān)系。這時,其散點圖會表現(xiàn)出線性特征,即由(X、Y)決定的散點分布在某一條直線附近,以【例

12-1】為例繪制散點圖,就會發(fā)現(xiàn)這些散點分布在某條直線附近,如圖

12-3所示。圖

12-3

學生人數(shù)與銷售業(yè)務(wù)額的散點圖回歸分析(regression

analysis)是對兩個或兩個以上變量之間相互依賴關(guān)系進行定量分析的一種統(tǒng)計分析方法。其主要內(nèi)容和步驟是,首先根據(jù)理論和對問題的分析判斷,將變量分為自變量和因變量;其次,設(shè)法找出合適的數(shù)學方程式(即回歸方程)描述變量間的關(guān)系;由于涉及到的變量具有不確定性,接著還要對回歸模型進行統(tǒng)計檢驗;統(tǒng)計檢驗通過后,最后是利用回歸模型,根據(jù)自變量去估計、預測因變量。

回歸有不同種類。按照自變量的個數(shù)分,有一元回歸和多元回歸。只有一個自變量的稱為一元回歸,有兩個或兩個以上自變量的叫多元回歸;按照回歸曲線的形態(tài)分,有線性(直線)回歸和非線性(曲線)回歸。實際分析時應(yīng)根據(jù)客觀現(xiàn)象的性質(zhì)、特點、研究目的和任務(wù)選取回歸分析的方法。

相關(guān)分析是回歸分析的基礎(chǔ)和前提,回歸分析則是相關(guān)分析的深入和繼續(xù)。相關(guān)分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關(guān)的具體形式,而回歸分析則需要依靠相關(guān)分析來表現(xiàn)變量之間數(shù)量變化的相關(guān)程度。相關(guān)分析與回歸分析是有區(qū)別的,主要體現(xiàn)在以下三個方面:

(1)在相關(guān)分析中涉及的變量不存在自變量和因變量的劃分問題,變量之間的關(guān)系是對等的;而在回歸分析中,則必須根據(jù)研究對象的性質(zhì)和研究分析的目的,對變量進行自變量和因變量的劃分。因此,在回歸分析中,變量之間的關(guān)系是不對等的。

(2)在相關(guān)分析中所有的變量都必須是隨機變量;而在回歸分析中,自變量一般是給定的,因變量是隨機的,即將自變量的給定值代入回歸方程后,所得到的因變量的估計值不是惟一確定的,而會表現(xiàn)出一定的隨機波動性。

(3)相關(guān)分析主要是通過相關(guān)系數(shù)來反映變量之間相關(guān)程度的大小,由于變量之間是對等的,因此相關(guān)系數(shù)是惟一確定的。而在回歸分析中,對于互為因果的兩個變量

(如人的身高與體重,商品的價格與需求量),則有可能存在多個回歸方程。1.

一元線性回歸分析

在回歸分析時,我們首先要清楚識別因變量和自變量。一般是將被預測或被估計的變量(結(jié)果)作為因變量,用

Y

表示;將用來預測或解釋因變量Y

的變量都稱為自變量,以X

表示;在這里我們理解自變量和因變量之間存在因果關(guān)系,其位置不能顛倒。一般來說,我們認為因變量Y

是隨機性變量,而自變量X

是確定性變量。

在一元線性回歸分析中,我們的目的是得到回歸方程,而一元線性回歸方程是由兩個系數(shù)決定的—截距項系數(shù)和斜率項系數(shù),所以只需要確定這兩個系數(shù)就可以得到一元線性回歸方程。這兩個系數(shù)稱為一元線性回歸系數(shù)。

但是,確定這兩個系數(shù)需要數(shù)據(jù),由于數(shù)據(jù)有總體和樣本之分,所以回歸方程也有總體回歸方程和樣本回歸方程。(1)總體回歸方程

在建立總體回歸方程之前,先要引入一個概念—總體回歸模型。假如我們已知總體的自變量和因變量所有的數(shù)據(jù),并且它們存在程度較高的線性相關(guān)關(guān)系,但是它們之間并不是嚴格意義上的函數(shù)關(guān)系,數(shù)據(jù)的散點不在同一條直線,或者說散點與回歸直線之間是有誤差的,這些誤差是由隨機因素產(chǎn)生的,故稱為隨機誤差。如果考慮隨機誤差,則X

與Y

的關(guān)系可以表示為以下形式:Y

a

bX

(12-5)其中

Y—因變量;

X—自變量;

a——截距項系數(shù);b——斜率項系數(shù);

—隨機誤差項。

公式(12-5)稱為變量Y對X的一元線性理論回歸模型。

公式(12-5)表達了自變量X與因變量Y之間存在密切的線性相關(guān),但密切的程度又沒有達到由X惟一確定Y的程度(除X以外,還有其他隨機因素影響Y),所以變量Y與X之間的關(guān)系用兩個部分描述。一部分是由于X的變化引起Y線性變化的部分,即a+bx;另一部分是隨機因素引起的誤差,隨機誤差項構(gòu)成。

由于

是隨機誤差,這些誤差可以為正,也可以為負,并且出現(xiàn)正誤差和負誤差的概率是相等的,所以我們有充分的理由認為

的數(shù)學期望為

0,即E

(

)

0

這樣,我們在式(12-5)兩邊取數(shù)學期望,得到以下關(guān)系式:

E

(Y

)

a

bX(12-6)

其中E(Y

)

—Y

的數(shù)學期望。

式(12-65)稱為總體一元線性回歸方程,它表達的是

X

的變化對Y

的均值的影響。

a

是回歸直線在Y

軸上的截距,是當X=0

時Y

的期望值;

b

是直線的斜率,表示當X

變動一個單位時,

E(Y

)

的平均變動值。a

和b

在一元線性回歸分析中有著重要的意義,例如:如果

X

代表收入,Y代表消費支出,則b

表示邊際消費傾向。

由式(12-5)和(12-6)顯然有:

=Y-

E(Y

) (12-7)

(2)樣本回歸方程在實際的分析工作中,總體的數(shù)據(jù)一般是不能全部掌握的,常用的方法是用對應(yīng)的樣本數(shù)據(jù)對總體進行估計。于是我們可以設(shè)定樣本回歸模型和樣本回歸方程。

樣本回歸模型為:Yi

a?

b?Xi

ei

(12-8)其中

a?

—總體a

的估計值;

b?

—總體b

的估計值;

ei

—總體

的估計值(殘差)。樣本回歸方程為:(12-9)(12-10)——總體E(Y)的估計值。

由式(12-7)和(12-8)顯然有:

一元線性回歸分析的基本方法是,根據(jù)樣本數(shù)據(jù),運用最小二乘法得到樣本回歸方程,用樣本的a?

和b?

對總體的a

和b

進行估計。在這個過程中要注意的是,總體方程中的a

和b

是客觀存在的,是我們想要知道的參數(shù),但往往是未知的;而樣本方程中的a?和b?

是可以通過樣本數(shù)據(jù)采用最小二乘法求得的,但它們會隨著樣本的變化而發(fā)生變化,即它們是樣本統(tǒng)計量,是隨機變量。(3)最小二乘法

進行一元線性回歸分析(確定a?

和b?

)時,最為簡便的方法是最小二乘法(Ordinaryleast

square

method,簡記為OLS)。最小二乘法的基本思想是:要使估計值Y?與實際觀測值Y

的偏差最小,由公式(12-10)可知,也就是使

ei

為最?。坏怯捎趀i

是可正可負的,可以證明是等于零的。所以,我們用(殘差平方和)作為衡量和偏差程度的標準,即要求。即:(12-11)

由于樣本數(shù)據(jù)中的所有

和是已知的,所以的值取決于和。也就是說是關(guān)于和的函數(shù),記為:

(12-12)

由微積分知識可知,函數(shù)

有最小值的必要條件是對于和的兩個偏導數(shù)為零,即:

,整理得:(12-13)(12-14)其中:n—樣本容量。式(12-13)和(12-14)組成的方程組稱為正規(guī)方程組。解正規(guī)方程組可求得a?

和b?

:(12-15)(12-16)其中:n—樣本容量;X

—變量

X

的平均值;Y

—變量Y

的平均值。

可以證明,在滿足一定條件的前提下,用最小二乘法得到的估計量是最佳線性無偏估計量,這個結(jié)論稱為高斯-馬爾可夫定理?!纠?/p>

12-4】問題同【例

12-1】。用最小二乘法求樣本回歸方程。解:由式(12-14)和(12-15),可以得到如下計算表:表

12-5

最小二乘法計算表序號i

iX

YiX

22

i( X

)學生人數(shù)

X

(千人)銷售額

Y(千元)12581164--2610563036--388870464--4811894464--5121171404144--6161372192256--7201573140400--8201693380400--9221493278484--10262025252676--合計140130021040252819600平均14130------由式(12-14)得:由式(12-15)得:由此得線性回歸方程為:這個結(jié)果的意義是,當學生人數(shù)增加

1

個單位(1

千人)時,銷售額平均增加

5

個單位(5

千元)。回歸分析的計算量較大,我們可以運用

Excel

完成相關(guān)計算,具體步驟和方法讀者可參閱其他相關(guān)資料?!纠?/p>

12-4】運用Excel

進行一元線性回歸分析的結(jié)果如下:SUMMARY

OUTPUT回歸統(tǒng)計Multiple

R0.950123R

Square0.902734AdjustedR

Square0.890575標準誤差13.82932觀測值10方差分析dfSSMSFSignificance

F回歸分析1142001420074.248372.55E-05殘差81530191.25總計915730Coefficients標準誤差t

StatP-valueLower

95%Upper

95%Intercept609.2260356.5033360.00018738.7247381.27527XVariable

150.5802658.6167492.55E-053.6619066.338094Excel

輸出的回歸分析結(jié)果的解釋:第一部分是回歸分析的常用統(tǒng)計量:相關(guān)系數(shù)(Multiple)、判定系數(shù)(R

Square)、調(diào)整后的

R2(Adjusted

R

Square)、標準誤差和觀測值的個數(shù)。第二部分是方差分析:自由度(df)、平方和(SS)、回歸和殘差的均方(MS)、檢驗統(tǒng)計量(F)、F

檢驗的顯著性水平(significance)。

第三部分是參數(shù)估計:回歸方程的截距(Intercept)、斜率(X

Variable

1)、截距和斜率的標準誤差、回歸系數(shù)的

t

統(tǒng)計量(t

Stat)、P

值、截距和斜率的置信區(qū)間(Lower

95%和Upper

95%)。

通過表

12-6

Excel

輸出的回歸分析結(jié)果,得到估計的回歸方程有關(guān)結(jié)果:回歸方程的截距(Intercept)為

60,斜率(X

Variable1)為

5。

我們得到這樣的一個結(jié)果,是由樣本數(shù)據(jù)得到的結(jié)果,而樣本是隨機抽取的,所以由樣本得到的結(jié)果是隨機變量,即估計量a?

和b?是隨機就是。這樣,就要解決兩個問題,一是由樣本數(shù)據(jù)得到Y(jié)

與X

之間是線性關(guān)系,能不能推斷總體的

Y

X

之間是否也存在線性關(guān)系;二是如果能夠得到總體的

Y

與X

之間存在線性關(guān)系,那么怎樣用a?

和b?

估計總體的a

和b

。

第一個問題可以歸納為一個假設(shè)檢驗:H

0

:b

=

0

(不存在線性關(guān)系)

H1

:b

0

(存在線性關(guān)系)

做假設(shè)檢驗需要知道b?的分布,可以證明,在滿足一定條件和

b=

0

的情況下,

b?

標準化后的統(tǒng)計量服從自由度為n-2

的t

分布,于是我們用t

檢驗也時行假設(shè)檢驗。

如果經(jīng)過檢驗,得到拒絕原假設(shè)的結(jié)論,則說明總體的

Y

X之間存在線性關(guān)系,我們設(shè)定線性模型是正確的。

如果通過了假設(shè)檢驗,我們可以利用a?

和b?

對估計總體的a

和b進行區(qū)間估計,還可以利用樣本回歸方程對Y

進行預測。2.多元線性回歸分析(1)多元線性回歸方程

經(jīng)濟現(xiàn)象是非常復雜的,在運行中會受到多種因素的影響。所以,在我們有必要考慮多元的線性回歸。

與一元線性回歸分析一樣,我們可以設(shè)定總體多元線性回歸模型和方程,以及樣本多元線性回歸模型和方程??傮w多元線性模型為:Y

a

b1

X

1

b2

X

2

bk

X

k

(12-17)其中

Y—因變量;

X—自變量;

a

—截距項系數(shù);

bk

—偏回歸系數(shù);

—誤差項??傮w多元線性方程為:E(Y

)

a

b1

X

1

b2

X

2

bk

X

k

(12-18)其中 E(Y

)

—因變量Y

的數(shù)學期望。

偏回歸系數(shù)bk

的意義是:當其它自變量保持不變時,

X

k

每增加一個單位,因變量Y

的變動值。同樣,樣本多元回歸模型和方程為:(12-19)(12-20)其中

a?

——總體a

的估計值;——總體的估計值;——總體的估計值(殘差)由式(12-18)和(12-19)顯然有:(12-21)

(2)多元線性回歸方程的估計

一般情況下,我們只能已知樣本數(shù)據(jù),并利用最小二乘法得到樣本回歸方程,從而得到總體參數(shù)的估計值。多元線性回歸的最小二乘法在原理上與一元線性回歸相同,但回歸的結(jié)果在形式上比較復雜,在這里不做推導。多元線性回歸同樣可以用Excel

得到計算結(jié)果,操作過程與一元時相同,只是在輸入

X

值時,要同時將多個

X

變量的數(shù)據(jù)同時刷入;計算結(jié)果的意義與一元時也基本相同,只有兩個細微差別:一是判定系數(shù)用調(diào)整后的R2(Adjusted

R);二是多個

X

的系數(shù)分別對應(yīng)于X

Variable

i。

【例

12-5】一家銷售家用電器的網(wǎng)店的管理人員希望了解影響配送成本的因素,搜集到過去

2

年的月度配送成本(萬元)、銷售額(萬元)和訂單數(shù)的數(shù)據(jù)如表

12-7

所示(數(shù)據(jù)見Data12-3)。以這些數(shù)據(jù)建立二元線性回歸模型估計銷售額和訂單數(shù)對配送成本的影響。表

12-7

配送成本、銷售額和訂單配送成本(萬元)銷售額(萬元)訂單數(shù)(單)配送成本(萬元)銷售額(萬元)訂單數(shù)(單)5.29538.640156.29837.239777.16644.638067.2332.844288.55851.253095.89940.839646.36940.142627.93849.145827.28145.742969.44452.755826.84445.840975.97444.434505.24630.132139.0562.350797.07748.448099.32459.657358.20351.752376.93346.34

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論