應(yīng)用統(tǒng)計學(xué) 教案 第6章 相關(guān)分析與回歸分析_第1頁
應(yīng)用統(tǒng)計學(xué) 教案 第6章 相關(guān)分析與回歸分析_第2頁
應(yīng)用統(tǒng)計學(xué) 教案 第6章 相關(guān)分析與回歸分析_第3頁
應(yīng)用統(tǒng)計學(xué) 教案 第6章 相關(guān)分析與回歸分析_第4頁
應(yīng)用統(tǒng)計學(xué) 教案 第6章 相關(guān)分析與回歸分析_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費閱讀

付費下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

第6章相關(guān)分析與回歸分析

教學(xué)內(nèi)容6.1相關(guān)分析

6.2一元線性回歸分析

6.3回歸方程的預(yù)測

6.4多元線性回歸

6.5Excel在相關(guān)分析與回歸分析中的應(yīng)用

教學(xué)要求1.理解相關(guān)關(guān)系和函數(shù)關(guān)系的異同;

2.掌握相關(guān)系數(shù)的計算和分析;

3.掌握線性回歸的基本原理和參數(shù)的最小二乘估計;

4.掌握線性回歸的擬合優(yōu)度計算和分析:

5.掌握線性回歸議程的顯著性檢臉;

6.利用線性回歸議程進行估計和預(yù)測。

教學(xué)重點相關(guān)系數(shù)的計算和分析;參數(shù)的最小二來估計;線性回歸的擬合優(yōu)

度的計算和分析;線性回歸方程的估計和預(yù)測

教學(xué)難點參數(shù)的最小二乘估計

教學(xué)方法課堂講授、多媒體教學(xué)、課堂討論、上機操作C

課時數(shù)10課時(課堂講授7課時+上機操作2課時+課堂練習(xí)1課時)

導(dǎo)入案例某品牌手機電池經(jīng)過技術(shù)改進,待機時間得以提高,從該工廠抽取

一定數(shù)量的樣本,測得其平均待機時間,以此推斷該工廠生產(chǎn)的電

池的待機時間。

6.1相關(guān)分析

相關(guān)分析是研究現(xiàn)象之間相互關(guān)系的主要方式之一,通過相關(guān)分析,可以將現(xiàn)象之間的關(guān)系問題與應(yīng)用:在現(xiàn)實生

大小與方向測定出來,從而有利于指導(dǎo)下一步的行動。一般而言,現(xiàn)象之間的關(guān)系可以分為兩種

活中,許多現(xiàn)象與事物

類型:函數(shù)關(guān)系和相關(guān)關(guān)系。

之間都存在著有機聯(lián)

6.1.1函數(shù)關(guān)系和相關(guān)關(guān)系系、相互依賴并相互制

約,比如收入與支出之

1.函數(shù)關(guān)系間的關(guān)系;學(xué)習(xí)時間與

函數(shù)關(guān)系是指變量之間一一對應(yīng)的確定的數(shù)量依存關(guān)系。在這種關(guān)系中,當(dāng)其中一個變量發(fā)學(xué)習(xí)成績之間的關(guān)系

生變化時,另外變量將按照某種確定的函數(shù)形式進行變化,其變化方向和程度只能呈現(xiàn)出一種結(jié)等。在定性分析的基礎(chǔ)

果,而無其他可能。

上,計算相關(guān)系數(shù),由

若將現(xiàn)象用變量進行表示,則函數(shù)關(guān)系可表現(xiàn)為以下形式。

此可判斷變量間相關(guān)的

設(shè)有兩個變量x和九變量y隨變量x一起變化,并完全依賴于刀,當(dāng)變量x取某個數(shù)值時,y程度、方向、形態(tài)。

依確定的關(guān)系取相應(yīng)的值,則稱、'是x的函數(shù),記為)可3)。

如產(chǎn)女就是兩個變量之間的函數(shù)關(guān)系,可以用圖6.1表示。

圖6.1函數(shù)關(guān)系

2.相關(guān)關(guān)系

相關(guān)關(guān)系是指變量間的關(guān)系在數(shù)量上存在不確定的依存關(guān)系,一個變量的取值不能唯一地由

另一個變量來確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。

若將現(xiàn)象用變量進行表示,則相關(guān)關(guān)系可表現(xiàn)為以下形式。

當(dāng)變量X取某個值時,與之相關(guān)的變量)’的取值可能有若干個。

如某個班學(xué)生的身高r(cm)與體重>'(kg)之間的關(guān)系就是相關(guān)關(guān)系,如圖6.2所示。

90r-y

80-??.

70■*.?

60?

??

50■*

40-

30■

20■

10

0_______?1??1X

160165170175180185190

圖6.2相關(guān)關(guān)系

下面幾種變量之間的關(guān)系均是常見的相關(guān)關(guān)系。

居民可支配收入與支出之間的關(guān)系。

學(xué)習(xí)時間和學(xué)習(xí)成績之間的關(guān)系。

企業(yè)研發(fā)投入和研發(fā)產(chǎn)出之間的關(guān)系。

6.1.2相關(guān)關(guān)系的類型

1.按相關(guān)的程度不同劃分

按相關(guān)的程度不同,可將相關(guān)關(guān)系分為完全相關(guān)、不相關(guān)、不完全相關(guān)。在統(tǒng)計學(xué)中,相關(guān)

分析與回歸分析主要研究不完全相關(guān)現(xiàn)象。

2.按依存關(guān)系的表現(xiàn)形式不同劃分

按依存關(guān)系的表現(xiàn)形式不同,可將相關(guān)關(guān)系分為線性相關(guān)、非線性相關(guān)。線性相關(guān)是指兩種

相關(guān)現(xiàn)象之間的關(guān)系近似地表現(xiàn)為一條直線,在這種關(guān)系中,兩個變量的變動幅度近似地保持一

定的比例,如人均消費水平與人均收入水平之間的關(guān)系。非線性相關(guān)是指當(dāng)一個變量發(fā)生變動

時,另外變量的變動在數(shù)值上不是均等的。

3.按相關(guān)的方向不同劃分

按相關(guān)的方向不同,可將相關(guān)分析分為正相關(guān)、負(fù)相關(guān)。正相關(guān)是指當(dāng)一個變量的數(shù)值增加

(或減少)時,另外變量的數(shù)值也隨之增加(或減少),即同方向變化,如居民收入與支出之間的

關(guān)系。負(fù)相關(guān)是指當(dāng)一個變量的數(shù)值增加(或減少)時,而另外變量的數(shù)值相反地呈減少(或增

加)趨勢變化,即反方向變化,如利潤和成本之間的關(guān)系。

4.按研究變量的數(shù)量不同劃分

按研究變量的數(shù)量不同,可將相關(guān)關(guān)系分為單相關(guān)、復(fù)相關(guān)。單相關(guān)是指所研究的相關(guān)關(guān)系

中的變量僅有兩個,也就是研究一個變量和另外一個變量之間的關(guān)系,如收入和支出之間的關(guān)

系。復(fù)相關(guān)是指所研究的相關(guān)關(guān)系中的變量包含3個及3個以上,也就是研究一個變量和其他多

個變量之間的關(guān)系,如商品銷售量與價格水平、產(chǎn)品質(zhì)量、廣告費用、競爭程度等因素的之間的

關(guān)系。

6.1.3相關(guān)分析的主要內(nèi)容

相關(guān)分析用以分析社會經(jīng)濟現(xiàn)象間的依賴關(guān)系,其目的是從現(xiàn)象的復(fù)雜關(guān)系中消除非本質(zhì)的

偶然影響,從而找出現(xiàn)象間相互依存的形式和密切程度,在實際工作中的運用十分廣泛。相關(guān)分

析的主要內(nèi)容包含以下方面。

(1)確定現(xiàn)象之間有無關(guān)系,以及相關(guān)關(guān)系的密切程度。

(2)判斷變量之間相關(guān)關(guān)系的表現(xiàn)形式是否為線性.

(3)選擇合適的數(shù)學(xué)模型。

(4)進行相關(guān)關(guān)系的顯著性檢驗,用以反映變量回歸的效果。

6.1.4相關(guān)關(guān)系的測定

測定變量之間的相關(guān)關(guān)系,有多種方法可供選擇。

L相關(guān)圖

相關(guān)圖又稱散點圖,它是用直角坐標(biāo)系的r軸代表自變量,用軸代表因變量,將兩個變量

間相對應(yīng)的變量值用坐標(biāo)點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。

例如,將一組學(xué)生的身高x(cm)與體重V(kg)的數(shù)據(jù)用Excel制作出散點圖,便可判斷

出二者呈正相關(guān)關(guān)系,如圖6.3所示。

160165170175180185190

圖6.3正相關(guān)關(guān)系

2.相關(guān)表

相關(guān)表是指將一個變量按大小順序排序,將另外變量對應(yīng)排列而成的表格。相關(guān)表可以大致

根據(jù)變量的數(shù)值變化判斷出變量之間的相關(guān)關(guān)系。

3.相關(guān)系數(shù)

(?)相關(guān)系數(shù)的測定

相關(guān)系數(shù)r能用來反映變量之間的線性關(guān)系的密切程度,因此又稱其為線性相關(guān)系數(shù),又因

其是由英國統(tǒng)計學(xué)家皮爾遜(Pearson)提出,故也稱為Pearson積矩相關(guān)系數(shù)。

根據(jù)相關(guān)表中的變量數(shù)據(jù),相關(guān)系數(shù),?可以使用積差法進行計算。

Y(x-x)(y-y)

江(X-療皮(y-?

為了根據(jù)原始數(shù)據(jù)計算「,可由式(6.1)推導(dǎo)出下面的簡化計算公式,也稱簡捷法,該方法

較為常用。

(62)

(2)相關(guān)系數(shù)r的取值范圍及相關(guān)意義

由式(6.2)可以看出,相關(guān)系數(shù)「是一個無量綱的值,其取值范圍為bMI。

例6.1某城市6家企業(yè)的年廣告費和年利潤資料如表6.2所示。

表6.2企業(yè)年廣告費和年利潤資料

年廣告費》(萬元)■9

年利潤」(萬元)

求年利潤和年廣告費之間的相關(guān)系數(shù),并分析相關(guān)的密切程度和方向。

解:根據(jù)式(6.2)可得

殺歹一(刀)2mzy2_”

因為/^。.於,所以年利潤和年廣告費之間呈高度正相關(guān)關(guān)系。

6.2一元線性回歸分析

6.2.1一元線性回歸分析的特點

(?)在此回歸分析中,須明確區(qū)分影響因素和被影響因素,其中影響因素常稱為解釋變量或

自變星,被影響因素常稱為被解釋變量或因變量。

(2)在一些情況下,事物之間的因果關(guān)系常是相互的。

6.2.2一元線性回歸模型基本式

對于經(jīng)判斷具有線性關(guān)系的兩個變量).與X,構(gòu)造一元線性回歸模型基本式為

y=a+px+s(6.3)

在上式中,因變量y的值由如下兩部分構(gòu)成。

(1)x的線性部分,其反映了由于,的變化而引起的)'的變化。

(2)誤差項£,其反映了除X之外的隨機因素對.V的影響,是隨機變量,是不能由X和3'間

的線性關(guān)系所解釋的波動。

6.2.3一元線性回歸模型的參數(shù)估計

建立回歸模型實際上是指利用樣本觀測值(與工),,=L2,…,〃,估計未知參數(shù)〃、〃的值,其

中,。是回歸模型的常數(shù)項,b是模型的回歸系數(shù)。在線性回歸模型中,參數(shù)一般使用最小二乘法

和極大似然法進行估計。用6.6式計算回歸方程的參數(shù)。

HLX;2-(LX;)2(6.6)

a=y-bx

于是,可用最小二乘法求得一元線性回歸方程為

yc=a+bx(6.7)

例6.3某城市6家企業(yè)的年廣告費和年利潤資料如表6.6所示。

表6.6企業(yè)年廣告費與年利潤資料

年廣告費x(萬元)■a

年利潤y(萬元)O■

求月利潤和月廣告費的線性回歸方程。

解:設(shè)y「=a+反,求得

a=y-bx=3.05

故利潤和廣告費的線性回歸方程為匕=3.05+2.9Lj

6.2.4一元線性回歸的檢驗

在實際統(tǒng)計分析中,有些回歸模型雖然被建立起來,但該模型不一定通得過檢驗,那么就不

能夠利用這樣的回歸模型進行預(yù)測和決簧,否則將對實際工作產(chǎn)生反作用。

1.擬合優(yōu)度檢驗

擬合優(yōu)度是指回歸直線與各觀測點的接近程度,而擬合優(yōu)度檢驗就是檢驗回歸模型對樣本觀

測值的擬合程度。在具體操作中,首先需要構(gòu)造一個統(tǒng)計量,然后將該統(tǒng)計量值與一定的標(biāo)準(zhǔn)進

行對比,由此判斷模型的回歸效果。

擬合優(yōu)度檢驗需要計算擬合優(yōu)度系數(shù),而這需要對離差平方和進行分解,

通過運算可證明3種高差平方和具有如下關(guān)系:

之(£-y)2=f(/-乂f+(6.8)

r=lr=l/=1

也即SST=SSE+SSR0

在給定樣本中,當(dāng)SST不變時,若SSR在SST中所占的比重越大,則實際樣本點離樣本回

歸線就越近,也即表明回歸方程的擬合效果較好,因此回歸直線的擬合優(yōu)度系數(shù)可用下面的統(tǒng)計

量進行計算:

SSR.SSE“c、

Rd2=-----=1--------(6.9)

SSTSST''

其中,川是擬合優(yōu)度系數(shù),又稱為可決系數(shù)或判定系數(shù).擬合優(yōu)度系數(shù)取值范圍為ni],其

取值越接近1,表明各實際趨勢點離樣本線越近,擬合優(yōu)度越高。

在線性相關(guān)分析中,擬合優(yōu)度系數(shù)(R2)=相關(guān)系數(shù)(r)的平方,即甯=/。

2.估計標(biāo)準(zhǔn)誤差

估計標(biāo)準(zhǔn)誤差是指因變量各實際值與其估計值之間的平均差異程度,用于反映實際觀察值在

回歸直線周圍的分散狀況,也即回歸估計值對各實際觀察值代表性的強弱。其值越小,回歸方程

的代表性越強,用回歸方程估計或預(yù)測的結(jié)果越準(zhǔn)確。

估計標(biāo)準(zhǔn)誤差用S,表示,其計算公式為

S,信陛?(610)

將K=〃+瓜代入式(6.10)中,可得

喏>',一4內(nèi)(6.11)

V11-2

例6.5某地區(qū)10家企業(yè)的月營業(yè)收入和月營業(yè)支出數(shù)據(jù)如表6.8所示。

表6.8企業(yè)月營業(yè)收入和支出數(shù)據(jù)單位:百萬元

月營業(yè)收入X20303340151326383543

月營業(yè)支出,7981154810910

根據(jù)以上資料求1。家企業(yè)月營業(yè)支出關(guān)于月營業(yè)收入的線性回歸方程,并求出回歸方程的擬

合優(yōu)度系數(shù),以及估計標(biāo)準(zhǔn)誤差。

解:設(shè)y「=a+阮,求得

〃=警暹心,0.2

-(5>)

a=y-bx=2.17

故月營業(yè)支出關(guān)于月營業(yè)收入的線性回歸方程為乂=2.17+02j

將各家企業(yè)的月營業(yè)收入x代入上述回歸模型中,可求得月營業(yè)支出估計值,如表6.9所示。

表6.9各企業(yè)月支出估計值單位:百萬元

月營業(yè)收入X20303340151326383543

月營業(yè)支出估計值K10.110.7

6.178.178.776.174.777.379.779.17

77

據(jù)此可根據(jù)式(6.9)求出

/?2=—=——?0.9

SST

1=1

由于店=0.9,表明該回歸方程擬合效果較好。

2(),一工)2=q2_aZy_匝p=42992

該回歸模型的估計標(biāo)準(zhǔn)誤差為0.73,其值較小,故反映出模型回歸效果較好。

6.3回歸方程的預(yù)測

回歸方程的一個主要作用是用來進行預(yù)測,當(dāng)通過多種檢驗證明一個回歸方程的線性關(guān)系顯

著,也即擬合效果較好時,便可利用線性回歸方程X=4+版進行預(yù)測。

6.3.1y值的點估計

對于自變量x的一個給定值玲,可根據(jù)回歸方程得到因變量)’的一個估計值匕。值的點估

計可分為兩種類型:一類是y的平均值的點估計;另一類是y的個別值的點估計。問題與應(yīng)用:如果要考

(?))’的平均值的點估計是指當(dāng)給出一個不時,將得到所有個體因變量平均值的一個估計值慮一家公司的經(jīng)營收入

x,它是一個期望值。

和營業(yè)支出之間的關(guān)

(2)的個別值的點估計是指當(dāng)給出某一個體的不時,將得到該個體因變量的一個估計值

系,可用一元線性分析

%,它是一個具體值。

法,通過構(gòu)建回歸方

上述)?的點估計的兩種類型所使用的公式是一樣的,只不過所表述的意義不同。

程,判斷收入對支出的

例6.6某集團欲了解其旗下各子公司廣告費投入對企業(yè)銷售收入的影響,已知該集團旗下10

影響。

家子公司廣告費(單位:萬元)和銷售收入(單位:百萬元)的資料如表6.10所示。

表6.10企業(yè)廣告費投入與銷售收入資料

廣告費x/萬元40553364828560359575

哨售收入,/白萬兀14131218252514123825

試根據(jù)以上資料解決如下問題。

(I)判斷廣告費和銷售收入的線性相關(guān)關(guān)系.

(2)求出廣告費關(guān)于銷售收入的線性回歸方程,并計算擬合優(yōu)度系數(shù)

(3)當(dāng)廣告費投入為100萬元時,該集團旗下各子公司的平均銷售收入約為多少?

(4)若某子公司在明年的廣告費投入為100萬元,預(yù)計該子公司銷售收入約為多少?

解.(])_3戶,——.=0.91

因為,HO.91,所以銷售收入和廣告費之間呈高度正相關(guān)關(guān)系。

(2)設(shè)工=。+尿,求得

a=y-bx=-2.31

故銷售收入關(guān)于廣告費的線性回歸方程為X=-2.37M).35x。

(3)將.%=100代入上述回歸方程中,得x=-2.37+O.35xlOO=32.63。

當(dāng)廣告費投入為10。萬元時,預(yù)計該集團旗下各公司的平均銷售收入約為3263萬元。

(4)將毛=100代入上述回歸方程中,得%=-2.37+0.35x1(X)=32.63.

即若某公司在明年的廣告費投入為100萬元,預(yù)計該公司銷售收入約為3263萬元。

63.2V值的區(qū)間估計

點估計不能給出估計的精度,點估計值與實際值之間是有誤差的,因此需要進行區(qū)間估計。

對于自變量x的一個給定值小,可根據(jù)回歸方程得到因變量>'的一個估計區(qū)間,具也包括兩種類

型:一類是)’的平均值的區(qū)間估計;另一類是)'的個別值的區(qū)間估計。

1.),的平均值的區(qū)間估計

利用估計的回歸方程,對于自變量X的一個給定值天,求出因變量y的平均值及兒)的估計

區(qū)間,這一估計區(qū)間稱為置信區(qū)間。

瓜耳)在1-a置信水平下的估計區(qū)間為

3命-22JU(6.12)

I/=!

其中,K是)’的平均值的估計值;,是估計標(biāo)準(zhǔn)誤差。

2.),的個別值的區(qū)間估計

利用估計的回歸方程,對于自變量,的一個給定值天,求出因變量J的一個個別值的估計區(qū)

間。

,的個別值在1置信水平下的估計區(qū)間為

>0±%2("-2)S,I+-+.)

d〃(6.13)

其中,兒是的個別值的估計值;s,是估計標(biāo)準(zhǔn)誤差。

例6.7某行業(yè)協(xié)會欲了解該行業(yè)下10家高技術(shù)公司研發(fā)投入對新產(chǎn)品產(chǎn)出的影響。已知該

行業(yè)下10家公司研發(fā)投入工(單位:百萬元)和新產(chǎn)品產(chǎn)出-V(單位:百萬元)的資料如表6.11

所示。

表6.11企業(yè)研發(fā)投入與新產(chǎn)品產(chǎn)出資料單位:百萬元

研發(fā)投入工EI■

新產(chǎn)品產(chǎn)出),

試根據(jù)以上資料解決如下問題。

(1)求出該行業(yè)新產(chǎn)品產(chǎn)出關(guān)于研發(fā)投入的線性回歸方程,并計算擬合優(yōu)度系數(shù)。

(2)當(dāng)研發(fā)投入為8000萬元時,預(yù)計該行業(yè)下各公司的平均研發(fā)產(chǎn)出的估計區(qū)間約為多少

(?=0.05)?

(3)若某公司預(yù)計今年研發(fā)投入為8000萬元,預(yù)計該公司新產(chǎn)品產(chǎn)出的估計區(qū)間約為多少

(0=0.05)?

解:(1)設(shè)上=。+尿,可得

h=〃2所?=0.91

a=y-hx=\3.05

故新產(chǎn)品產(chǎn)出關(guān)于研發(fā)投入的線性回歸方程為得K=13.O5+O.91X。

(2)將/=80代入上述回歸方程中,>;=13.05+0.91x80=85.85

,V〃-2V10-2

之(斗一工『=2030.5

i-l

8032

yc-ta(n-2)Sf-+,9°7)=85.85-2.306x4.1xJ-L+(-jL

■J、(芭-'J2030,5754

yc+ta(n-2)Sr[+[=85.85+2.306x4.1X\^7(8O-32.5)

¥V102330.5a96.26

即當(dāng)研發(fā)投入為800()萬元時,預(yù)計該行業(yè)下各公司的平均研發(fā)產(chǎn)出的估計區(qū)間為[7545,9626]

萬兀。

(3)將為=80代入上述回歸方程中,得光=13.05+0.91x80=85.85。

y0-t(n-2)S11+—+————=85.85-2.306x4.1xjl+-+曲—22,5)

91〃V102030.5?71.79

v+1(n-2)S11+—+—^———=85.85+2.306x4.lxJ1+—+_'⑴QQQ1

91〃XU-I)2Y102030.5-99.91

若某公司預(yù)計今年研發(fā)投入為8(X)0萬元,預(yù)計該公司新產(chǎn)品產(chǎn)出的估計區(qū)間為17179.99911萬

TCo

6.4多元線性回歸分析

多元線性回歸的基本原理和一元線性回歸的完全相同,但由于自變量個數(shù)的增加,而導(dǎo)致模型

參數(shù)的估計變得較為復(fù)雜。在實際統(tǒng)計分析中,一般利用統(tǒng)計軟件對多元回歸模型進行估計,如

Eviews.SPSS、STATA、SAS等,其中,前兩種軟件對于初學(xué)者較為常用。

6.4.1多元線性回歸模型的基本式

問題與應(yīng)用:回歸

設(shè)被解釋變量為)',人個解釋變量分別為小七,…,之,則人元線性回歸模型的一般形式為

丁=鳳+川王+同占+…+月玉+£(6.14)分析的主要作用就是進

如果“個樣本觀測值為(X",2,…,,i=12…,〃,則將上述〃個樣本觀測值代入式(6-

行預(yù)測,當(dāng)回歸方程通

14)可得

y=4+??芢+所2+…+氏X”+q過檢驗,便可利用該方

>2=A+爾21+后占2+…+0kxk+e2

*2程進行預(yù)測,從而對事

???

物發(fā)展迸行控制。

乂=—+你%+⑸/2+…+0kxl1k+en

用矩陣表示為

Y=XB+E

'y\'-/V>'

y=T,x=…,B=g,E=?(6.15)

…%]LAJ[a

6.4.2多元線性回歸方程的估計

使用最小二乘法可對回歸參數(shù)片,ZV?、&進行估計,其估計原理與一元線性回歸的。

使目標(biāo)函數(shù)之十=之(,一片一用「四4一一4/達到最小值。

/=1/=1

根據(jù)求極值原理,令目標(biāo)函數(shù)對各未知參數(shù)片,片,…,月求偏導(dǎo)數(shù),并令偏導(dǎo)數(shù)為0,則可得

方程組:

.

£(州-%-0\Xi\-62七2----4/)=0

;=1

rr

Z(y-腐一44一Pixn----鳳/)-%=°

4i-l

rr

?

E(Z-/o-0陽「fi2xi2----風(fēng)4)4=。

/=1

最終解上述方程組,可得回歸參數(shù)國,々,…,A的估計值,其矩陣表示為

"A"

A

與="=(xTx)-'xTy(6.16)

Ld

6.4.3多元線性回歸模型的檢驗

1.擬合優(yōu)度檢驗

被解釋變量)'的變化可由兩部分解釋:第一,由4個解釋變量X的變化引起的)’的變化;第

二,由其他隨機因素引起的的變化。由第一部分引起的的變化的離差平方和記為SSR,稱為

回歸平方和;由第二部分隨機因素引起的卜的變化的離差平方和記為SSE,稱為殘差平方和;

SST稱為總離差平方和,有SST=SSR+SSE。

D,SSR.SSE

R=----=1-----(6.17)

SSTSST

其中,箱是擬合優(yōu)度系數(shù),又稱為可決系數(shù)或判定系數(shù)。擬合優(yōu)度系數(shù)取值范圍為[0,1],其

取值越接近1,表明各實際樣本點離趨勢線越近,擬合優(yōu)度越高。

2.尸檢驗

在多元回歸模型分析中,k個變量組合在一起是否合理、組合在一起建立的模型是否具有良

好的穩(wěn)定性,回答這些問題需要借助于方程的顯著性檢驗,也即檢驗被解釋變量與所有解釋變量

之間的線性關(guān)系是否顯著,可用線性模型來描述它們之間的關(guān)系是否恰當(dāng)。

提出如下假設(shè)。

/:氏=0'=區(qū)=…=氏=0。

乩:&(i=l,2…k)不全為0。

原假設(shè)成立則表明各個回歸系數(shù)同時與0無顯著差異。這意味著當(dāng)偏回歸系數(shù)同時為0時,

無論各個可取值如何變化都不會引起)?的線性變化,所有"均無法解釋>>的線性變化,與x的

全體不存在線性關(guān)系,不能用線性模型來描述它們之間的關(guān)系。

在原假設(shè)成立條件下,可建立如下統(tǒng)計量:

LSSR/A

SSE/5-D(619)

該統(tǒng)計量服從產(chǎn)(〃,n-k-\)分布。

由樣本指標(biāo)值可求得幾

給定顯著性水平a,杳表可得到臨界值Fa(km-k-l).

若廠>丹(生〃-*-1),則拒絕原假設(shè),認(rèn)為多元線性回歸模型總體顯著。

若尸這尼(匕〃-攵-1),則接受原假設(shè),認(rèn)為多元線性回歸模型總體不顯著。

6.5Excel在相關(guān)與回歸分析中的應(yīng)用

6.5.1一元相關(guān)分析與回歸分析

判斷變量間的一元相關(guān)關(guān)系的方法有3種:繪制散點圖、計算相關(guān)系數(shù)和計算協(xié)方差。散點

圖是對所選變量之間相關(guān)關(guān)系的一種直觀描述,可在進行兩個變量的相關(guān)分析之前繪制散點圖,

從圖中觀察兩個變量之間的相關(guān)關(guān)系;統(tǒng)計函數(shù)可以直接計算相關(guān)系數(shù)和協(xié)方差,相關(guān)系數(shù)可以

確定兩變量相關(guān)程度的方向和大小。

6.5.2實例應(yīng)用

1.實例的數(shù)據(jù)描述

例6.8為研究廣告費用與銷售額之間的關(guān)系,對某公司抽取12個月的廣告費用和銷售額數(shù)

據(jù),如表6.12所示,試計算廣告費用與銷售額之間的相關(guān)系數(shù)并對二者進行回歸分析(顯著性水

平0.051

表6.13廣告費用與銷售額數(shù)據(jù)資料

廣告費用(萬元)42807614265132561264811644102

銷售額(萬元)132166152186148176142180156168148170

2.實例的操作步驟

首先新建Excel工作簿,命名為"廣告費用與銷售額數(shù)據(jù)資料",將數(shù)據(jù)和相關(guān)文字輸入工作

表中。

利用回歸分析工具進行回歸分析。

(?)選擇回歸分析工具。單擊【數(shù)據(jù)】,選擇【數(shù)據(jù)分析】,隨即彈出【數(shù)據(jù)分析】對話框,

在“分析工具”列表框中選擇“回歸”選項,然后單擊【確定】按鈕,如圖6.17所小,出現(xiàn)【回

歸】對話框。

數(shù)期分析x

分析工具?

傅利葉分析

直方圖

移動平均

岫機敏發(fā)生at

即助⑻

瘴位與百分比撐位

抽樣

卜檢檢:平均值的&對二樽本分析

雙樣本等方

K*雙樣本片方差假設(shè)

圖5.17選擇回歸分析工具

(2)在【回歸】對話框中,在"Y值輸入?yún)^(qū)域",選取單元格BLBI3,在"X值輸入?yún)^(qū)域",

選取單元格A1:A13,勾選"標(biāo)志","置信度"默認(rèn)為95%,在"輸出選項"下選中”新工作表

組”以將輸出結(jié)果顯示在一個新的工作表上。再將"殘差""正態(tài)分布"的選項全部選中,最后單

擊【確定】按鈕,得到回歸結(jié)果,如圖6.18?圖6.23所示。

QH

8

SM14MB

XSAttSMS1UJIJ

3B戶琉什

438R0ft223S8M1

IJib5oaso744ac?

6AduwcdR083?19?2

7蚊1讀?

O一n3:8樂12

修?■工

10力4分折_______________________________________________

O尸EW

Hof5sMsF

M*12底。分析17?7912557915699Q3194B42F0!

13Mf1044876144^741

Gtitwaau.14總計:17

CoH*K?*T5tSlatP、擊<*lowU3雙?同950<tm的g

IFOTpt124475814551咨月24273432£-101130497511135901877911905135902

041816^85005530754?919€05O?17S26O(0541574-W20?175051157

圖6.18設(shè)置回歸參數(shù)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論