版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)
文檔簡介
第6章相關(guān)分析與回歸分析
教學(xué)內(nèi)容6.1相關(guān)分析
6.2一元線性回歸分析
6.3回歸方程的預(yù)測
6.4多元線性回歸
6.5Excel在相關(guān)分析與回歸分析中的應(yīng)用
教學(xué)要求1.理解相關(guān)關(guān)系和函數(shù)關(guān)系的異同;
2.掌握相關(guān)系數(shù)的計算和分析;
3.掌握線性回歸的基本原理和參數(shù)的最小二乘估計;
4.掌握線性回歸的擬合優(yōu)度計算和分析:
5.掌握線性回歸議程的顯著性檢臉;
6.利用線性回歸議程進行估計和預(yù)測。
教學(xué)重點相關(guān)系數(shù)的計算和分析;參數(shù)的最小二來估計;線性回歸的擬合優(yōu)
度的計算和分析;線性回歸方程的估計和預(yù)測
教學(xué)難點參數(shù)的最小二乘估計
教學(xué)方法課堂講授、多媒體教學(xué)、課堂討論、上機操作C
課時數(shù)10課時(課堂講授7課時+上機操作2課時+課堂練習(xí)1課時)
導(dǎo)入案例某品牌手機電池經(jīng)過技術(shù)改進,待機時間得以提高,從該工廠抽取
一定數(shù)量的樣本,測得其平均待機時間,以此推斷該工廠生產(chǎn)的電
池的待機時間。
6.1相關(guān)分析
相關(guān)分析是研究現(xiàn)象之間相互關(guān)系的主要方式之一,通過相關(guān)分析,可以將現(xiàn)象之間的關(guān)系問題與應(yīng)用:在現(xiàn)實生
大小與方向測定出來,從而有利于指導(dǎo)下一步的行動。一般而言,現(xiàn)象之間的關(guān)系可以分為兩種
活中,許多現(xiàn)象與事物
類型:函數(shù)關(guān)系和相關(guān)關(guān)系。
之間都存在著有機聯(lián)
6.1.1函數(shù)關(guān)系和相關(guān)關(guān)系系、相互依賴并相互制
約,比如收入與支出之
1.函數(shù)關(guān)系間的關(guān)系;學(xué)習(xí)時間與
函數(shù)關(guān)系是指變量之間一一對應(yīng)的確定的數(shù)量依存關(guān)系。在這種關(guān)系中,當(dāng)其中一個變量發(fā)學(xué)習(xí)成績之間的關(guān)系
生變化時,另外變量將按照某種確定的函數(shù)形式進行變化,其變化方向和程度只能呈現(xiàn)出一種結(jié)等。在定性分析的基礎(chǔ)
果,而無其他可能。
上,計算相關(guān)系數(shù),由
若將現(xiàn)象用變量進行表示,則函數(shù)關(guān)系可表現(xiàn)為以下形式。
此可判斷變量間相關(guān)的
設(shè)有兩個變量x和九變量y隨變量x一起變化,并完全依賴于刀,當(dāng)變量x取某個數(shù)值時,y程度、方向、形態(tài)。
依確定的關(guān)系取相應(yīng)的值,則稱、'是x的函數(shù),記為)可3)。
如產(chǎn)女就是兩個變量之間的函數(shù)關(guān)系,可以用圖6.1表示。
圖6.1函數(shù)關(guān)系
2.相關(guān)關(guān)系
相關(guān)關(guān)系是指變量間的關(guān)系在數(shù)量上存在不確定的依存關(guān)系,一個變量的取值不能唯一地由
另一個變量來確定,但它仍按某種規(guī)律在一定的范圍內(nèi)變化。
若將現(xiàn)象用變量進行表示,則相關(guān)關(guān)系可表現(xiàn)為以下形式。
當(dāng)變量X取某個值時,與之相關(guān)的變量)’的取值可能有若干個。
如某個班學(xué)生的身高r(cm)與體重>'(kg)之間的關(guān)系就是相關(guān)關(guān)系,如圖6.2所示。
90r-y
80-??.
70■*.?
60?
??
50■*
40-
30■
20■
10
0_______?1??1X
160165170175180185190
圖6.2相關(guān)關(guān)系
下面幾種變量之間的關(guān)系均是常見的相關(guān)關(guān)系。
居民可支配收入與支出之間的關(guān)系。
學(xué)習(xí)時間和學(xué)習(xí)成績之間的關(guān)系。
企業(yè)研發(fā)投入和研發(fā)產(chǎn)出之間的關(guān)系。
6.1.2相關(guān)關(guān)系的類型
1.按相關(guān)的程度不同劃分
按相關(guān)的程度不同,可將相關(guān)關(guān)系分為完全相關(guān)、不相關(guān)、不完全相關(guān)。在統(tǒng)計學(xué)中,相關(guān)
分析與回歸分析主要研究不完全相關(guān)現(xiàn)象。
2.按依存關(guān)系的表現(xiàn)形式不同劃分
按依存關(guān)系的表現(xiàn)形式不同,可將相關(guān)關(guān)系分為線性相關(guān)、非線性相關(guān)。線性相關(guān)是指兩種
相關(guān)現(xiàn)象之間的關(guān)系近似地表現(xiàn)為一條直線,在這種關(guān)系中,兩個變量的變動幅度近似地保持一
定的比例,如人均消費水平與人均收入水平之間的關(guān)系。非線性相關(guān)是指當(dāng)一個變量發(fā)生變動
時,另外變量的變動在數(shù)值上不是均等的。
3.按相關(guān)的方向不同劃分
按相關(guān)的方向不同,可將相關(guān)分析分為正相關(guān)、負(fù)相關(guān)。正相關(guān)是指當(dāng)一個變量的數(shù)值增加
(或減少)時,另外變量的數(shù)值也隨之增加(或減少),即同方向變化,如居民收入與支出之間的
關(guān)系。負(fù)相關(guān)是指當(dāng)一個變量的數(shù)值增加(或減少)時,而另外變量的數(shù)值相反地呈減少(或增
加)趨勢變化,即反方向變化,如利潤和成本之間的關(guān)系。
4.按研究變量的數(shù)量不同劃分
按研究變量的數(shù)量不同,可將相關(guān)關(guān)系分為單相關(guān)、復(fù)相關(guān)。單相關(guān)是指所研究的相關(guān)關(guān)系
中的變量僅有兩個,也就是研究一個變量和另外一個變量之間的關(guān)系,如收入和支出之間的關(guān)
系。復(fù)相關(guān)是指所研究的相關(guān)關(guān)系中的變量包含3個及3個以上,也就是研究一個變量和其他多
個變量之間的關(guān)系,如商品銷售量與價格水平、產(chǎn)品質(zhì)量、廣告費用、競爭程度等因素的之間的
關(guān)系。
6.1.3相關(guān)分析的主要內(nèi)容
相關(guān)分析用以分析社會經(jīng)濟現(xiàn)象間的依賴關(guān)系,其目的是從現(xiàn)象的復(fù)雜關(guān)系中消除非本質(zhì)的
偶然影響,從而找出現(xiàn)象間相互依存的形式和密切程度,在實際工作中的運用十分廣泛。相關(guān)分
析的主要內(nèi)容包含以下方面。
(1)確定現(xiàn)象之間有無關(guān)系,以及相關(guān)關(guān)系的密切程度。
(2)判斷變量之間相關(guān)關(guān)系的表現(xiàn)形式是否為線性.
(3)選擇合適的數(shù)學(xué)模型。
(4)進行相關(guān)關(guān)系的顯著性檢驗,用以反映變量回歸的效果。
6.1.4相關(guān)關(guān)系的測定
測定變量之間的相關(guān)關(guān)系,有多種方法可供選擇。
L相關(guān)圖
相關(guān)圖又稱散點圖,它是用直角坐標(biāo)系的r軸代表自變量,用軸代表因變量,將兩個變量
間相對應(yīng)的變量值用坐標(biāo)點的形式描繪出來,用以表明相關(guān)點分布狀況的圖形。
例如,將一組學(xué)生的身高x(cm)與體重V(kg)的數(shù)據(jù)用Excel制作出散點圖,便可判斷
出二者呈正相關(guān)關(guān)系,如圖6.3所示。
160165170175180185190
圖6.3正相關(guān)關(guān)系
2.相關(guān)表
相關(guān)表是指將一個變量按大小順序排序,將另外變量對應(yīng)排列而成的表格。相關(guān)表可以大致
根據(jù)變量的數(shù)值變化判斷出變量之間的相關(guān)關(guān)系。
3.相關(guān)系數(shù)
(?)相關(guān)系數(shù)的測定
相關(guān)系數(shù)r能用來反映變量之間的線性關(guān)系的密切程度,因此又稱其為線性相關(guān)系數(shù),又因
其是由英國統(tǒng)計學(xué)家皮爾遜(Pearson)提出,故也稱為Pearson積矩相關(guān)系數(shù)。
根據(jù)相關(guān)表中的變量數(shù)據(jù),相關(guān)系數(shù),?可以使用積差法進行計算。
Y(x-x)(y-y)
江(X-療皮(y-?
為了根據(jù)原始數(shù)據(jù)計算「,可由式(6.1)推導(dǎo)出下面的簡化計算公式,也稱簡捷法,該方法
較為常用。
(62)
(2)相關(guān)系數(shù)r的取值范圍及相關(guān)意義
由式(6.2)可以看出,相關(guān)系數(shù)「是一個無量綱的值,其取值范圍為bMI。
例6.1某城市6家企業(yè)的年廣告費和年利潤資料如表6.2所示。
表6.2企業(yè)年廣告費和年利潤資料
年廣告費》(萬元)■9
年利潤」(萬元)
求年利潤和年廣告費之間的相關(guān)系數(shù),并分析相關(guān)的密切程度和方向。
解:根據(jù)式(6.2)可得
殺歹一(刀)2mzy2_”
因為/^。.於,所以年利潤和年廣告費之間呈高度正相關(guān)關(guān)系。
6.2一元線性回歸分析
6.2.1一元線性回歸分析的特點
(?)在此回歸分析中,須明確區(qū)分影響因素和被影響因素,其中影響因素常稱為解釋變量或
自變星,被影響因素常稱為被解釋變量或因變量。
(2)在一些情況下,事物之間的因果關(guān)系常是相互的。
6.2.2一元線性回歸模型基本式
對于經(jīng)判斷具有線性關(guān)系的兩個變量).與X,構(gòu)造一元線性回歸模型基本式為
y=a+px+s(6.3)
在上式中,因變量y的值由如下兩部分構(gòu)成。
(1)x的線性部分,其反映了由于,的變化而引起的)'的變化。
(2)誤差項£,其反映了除X之外的隨機因素對.V的影響,是隨機變量,是不能由X和3'間
的線性關(guān)系所解釋的波動。
6.2.3一元線性回歸模型的參數(shù)估計
建立回歸模型實際上是指利用樣本觀測值(與工),,=L2,…,〃,估計未知參數(shù)〃、〃的值,其
中,。是回歸模型的常數(shù)項,b是模型的回歸系數(shù)。在線性回歸模型中,參數(shù)一般使用最小二乘法
和極大似然法進行估計。用6.6式計算回歸方程的參數(shù)。
HLX;2-(LX;)2(6.6)
a=y-bx
于是,可用最小二乘法求得一元線性回歸方程為
yc=a+bx(6.7)
例6.3某城市6家企業(yè)的年廣告費和年利潤資料如表6.6所示。
表6.6企業(yè)年廣告費與年利潤資料
年廣告費x(萬元)■a
年利潤y(萬元)O■
求月利潤和月廣告費的線性回歸方程。
解:設(shè)y「=a+反,求得
a=y-bx=3.05
故利潤和廣告費的線性回歸方程為匕=3.05+2.9Lj
6.2.4一元線性回歸的檢驗
在實際統(tǒng)計分析中,有些回歸模型雖然被建立起來,但該模型不一定通得過檢驗,那么就不
能夠利用這樣的回歸模型進行預(yù)測和決簧,否則將對實際工作產(chǎn)生反作用。
1.擬合優(yōu)度檢驗
擬合優(yōu)度是指回歸直線與各觀測點的接近程度,而擬合優(yōu)度檢驗就是檢驗回歸模型對樣本觀
測值的擬合程度。在具體操作中,首先需要構(gòu)造一個統(tǒng)計量,然后將該統(tǒng)計量值與一定的標(biāo)準(zhǔn)進
行對比,由此判斷模型的回歸效果。
擬合優(yōu)度檢驗需要計算擬合優(yōu)度系數(shù),而這需要對離差平方和進行分解,
通過運算可證明3種高差平方和具有如下關(guān)系:
之(£-y)2=f(/-乂f+(6.8)
r=lr=l/=1
也即SST=SSE+SSR0
在給定樣本中,當(dāng)SST不變時,若SSR在SST中所占的比重越大,則實際樣本點離樣本回
歸線就越近,也即表明回歸方程的擬合效果較好,因此回歸直線的擬合優(yōu)度系數(shù)可用下面的統(tǒng)計
量進行計算:
SSR.SSE“c、
Rd2=-----=1--------(6.9)
SSTSST''
其中,川是擬合優(yōu)度系數(shù),又稱為可決系數(shù)或判定系數(shù).擬合優(yōu)度系數(shù)取值范圍為ni],其
取值越接近1,表明各實際趨勢點離樣本線越近,擬合優(yōu)度越高。
在線性相關(guān)分析中,擬合優(yōu)度系數(shù)(R2)=相關(guān)系數(shù)(r)的平方,即甯=/。
2.估計標(biāo)準(zhǔn)誤差
估計標(biāo)準(zhǔn)誤差是指因變量各實際值與其估計值之間的平均差異程度,用于反映實際觀察值在
回歸直線周圍的分散狀況,也即回歸估計值對各實際觀察值代表性的強弱。其值越小,回歸方程
的代表性越強,用回歸方程估計或預(yù)測的結(jié)果越準(zhǔn)確。
估計標(biāo)準(zhǔn)誤差用S,表示,其計算公式為
S,信陛?(610)
將K=〃+瓜代入式(6.10)中,可得
喏>',一4內(nèi)(6.11)
V11-2
例6.5某地區(qū)10家企業(yè)的月營業(yè)收入和月營業(yè)支出數(shù)據(jù)如表6.8所示。
表6.8企業(yè)月營業(yè)收入和支出數(shù)據(jù)單位:百萬元
月營業(yè)收入X20303340151326383543
月營業(yè)支出,7981154810910
根據(jù)以上資料求1。家企業(yè)月營業(yè)支出關(guān)于月營業(yè)收入的線性回歸方程,并求出回歸方程的擬
合優(yōu)度系數(shù),以及估計標(biāo)準(zhǔn)誤差。
解:設(shè)y「=a+阮,求得
〃=警暹心,0.2
-(5>)
a=y-bx=2.17
故月營業(yè)支出關(guān)于月營業(yè)收入的線性回歸方程為乂=2.17+02j
將各家企業(yè)的月營業(yè)收入x代入上述回歸模型中,可求得月營業(yè)支出估計值,如表6.9所示。
表6.9各企業(yè)月支出估計值單位:百萬元
月營業(yè)收入X20303340151326383543
月營業(yè)支出估計值K10.110.7
6.178.178.776.174.777.379.779.17
77
據(jù)此可根據(jù)式(6.9)求出
/?2=—=——?0.9
SST
1=1
由于店=0.9,表明該回歸方程擬合效果較好。
2(),一工)2=q2_aZy_匝p=42992
該回歸模型的估計標(biāo)準(zhǔn)誤差為0.73,其值較小,故反映出模型回歸效果較好。
6.3回歸方程的預(yù)測
回歸方程的一個主要作用是用來進行預(yù)測,當(dāng)通過多種檢驗證明一個回歸方程的線性關(guān)系顯
著,也即擬合效果較好時,便可利用線性回歸方程X=4+版進行預(yù)測。
6.3.1y值的點估計
對于自變量x的一個給定值玲,可根據(jù)回歸方程得到因變量)’的一個估計值匕。值的點估
計可分為兩種類型:一類是y的平均值的點估計;另一類是y的個別值的點估計。問題與應(yīng)用:如果要考
(?))’的平均值的點估計是指當(dāng)給出一個不時,將得到所有個體因變量平均值的一個估計值慮一家公司的經(jīng)營收入
x,它是一個期望值。
和營業(yè)支出之間的關(guān)
(2)的個別值的點估計是指當(dāng)給出某一個體的不時,將得到該個體因變量的一個估計值
系,可用一元線性分析
%,它是一個具體值。
法,通過構(gòu)建回歸方
上述)?的點估計的兩種類型所使用的公式是一樣的,只不過所表述的意義不同。
程,判斷收入對支出的
例6.6某集團欲了解其旗下各子公司廣告費投入對企業(yè)銷售收入的影響,已知該集團旗下10
影響。
家子公司廣告費(單位:萬元)和銷售收入(單位:百萬元)的資料如表6.10所示。
表6.10企業(yè)廣告費投入與銷售收入資料
廣告費x/萬元40553364828560359575
哨售收入,/白萬兀14131218252514123825
試根據(jù)以上資料解決如下問題。
(I)判斷廣告費和銷售收入的線性相關(guān)關(guān)系.
(2)求出廣告費關(guān)于銷售收入的線性回歸方程,并計算擬合優(yōu)度系數(shù)
(3)當(dāng)廣告費投入為100萬元時,該集團旗下各子公司的平均銷售收入約為多少?
(4)若某子公司在明年的廣告費投入為100萬元,預(yù)計該子公司銷售收入約為多少?
解.(])_3戶,——.=0.91
因為,HO.91,所以銷售收入和廣告費之間呈高度正相關(guān)關(guān)系。
(2)設(shè)工=。+尿,求得
a=y-bx=-2.31
故銷售收入關(guān)于廣告費的線性回歸方程為X=-2.37M).35x。
(3)將.%=100代入上述回歸方程中,得x=-2.37+O.35xlOO=32.63。
當(dāng)廣告費投入為10。萬元時,預(yù)計該集團旗下各公司的平均銷售收入約為3263萬元。
(4)將毛=100代入上述回歸方程中,得%=-2.37+0.35x1(X)=32.63.
即若某公司在明年的廣告費投入為100萬元,預(yù)計該公司銷售收入約為3263萬元。
63.2V值的區(qū)間估計
點估計不能給出估計的精度,點估計值與實際值之間是有誤差的,因此需要進行區(qū)間估計。
對于自變量x的一個給定值小,可根據(jù)回歸方程得到因變量>'的一個估計區(qū)間,具也包括兩種類
型:一類是)’的平均值的區(qū)間估計;另一類是)'的個別值的區(qū)間估計。
1.),的平均值的區(qū)間估計
利用估計的回歸方程,對于自變量X的一個給定值天,求出因變量y的平均值及兒)的估計
區(qū)間,這一估計區(qū)間稱為置信區(qū)間。
瓜耳)在1-a置信水平下的估計區(qū)間為
3命-22JU(6.12)
I/=!
其中,K是)’的平均值的估計值;,是估計標(biāo)準(zhǔn)誤差。
2.),的個別值的區(qū)間估計
利用估計的回歸方程,對于自變量,的一個給定值天,求出因變量J的一個個別值的估計區(qū)
間。
,的個別值在1置信水平下的估計區(qū)間為
>0±%2("-2)S,I+-+.)
d〃(6.13)
其中,兒是的個別值的估計值;s,是估計標(biāo)準(zhǔn)誤差。
例6.7某行業(yè)協(xié)會欲了解該行業(yè)下10家高技術(shù)公司研發(fā)投入對新產(chǎn)品產(chǎn)出的影響。已知該
行業(yè)下10家公司研發(fā)投入工(單位:百萬元)和新產(chǎn)品產(chǎn)出-V(單位:百萬元)的資料如表6.11
所示。
表6.11企業(yè)研發(fā)投入與新產(chǎn)品產(chǎn)出資料單位:百萬元
研發(fā)投入工EI■
新產(chǎn)品產(chǎn)出),
試根據(jù)以上資料解決如下問題。
(1)求出該行業(yè)新產(chǎn)品產(chǎn)出關(guān)于研發(fā)投入的線性回歸方程,并計算擬合優(yōu)度系數(shù)。
(2)當(dāng)研發(fā)投入為8000萬元時,預(yù)計該行業(yè)下各公司的平均研發(fā)產(chǎn)出的估計區(qū)間約為多少
(?=0.05)?
(3)若某公司預(yù)計今年研發(fā)投入為8000萬元,預(yù)計該公司新產(chǎn)品產(chǎn)出的估計區(qū)間約為多少
(0=0.05)?
解:(1)設(shè)上=。+尿,可得
h=〃2所?=0.91
a=y-hx=\3.05
故新產(chǎn)品產(chǎn)出關(guān)于研發(fā)投入的線性回歸方程為得K=13.O5+O.91X。
(2)將/=80代入上述回歸方程中,>;=13.05+0.91x80=85.85
,V〃-2V10-2
之(斗一工『=2030.5
i-l
8032
yc-ta(n-2)Sf-+,9°7)=85.85-2.306x4.1xJ-L+(-jL
■J、(芭-'J2030,5754
yc+ta(n-2)Sr[+[=85.85+2.306x4.1X\^7(8O-32.5)
¥V102330.5a96.26
即當(dāng)研發(fā)投入為800()萬元時,預(yù)計該行業(yè)下各公司的平均研發(fā)產(chǎn)出的估計區(qū)間為[7545,9626]
萬兀。
(3)將為=80代入上述回歸方程中,得光=13.05+0.91x80=85.85。
y0-t(n-2)S11+—+————=85.85-2.306x4.1xjl+-+曲—22,5)
91〃V102030.5?71.79
v+1(n-2)S11+—+—^———=85.85+2.306x4.lxJ1+—+_'⑴QQQ1
91〃XU-I)2Y102030.5-99.91
若某公司預(yù)計今年研發(fā)投入為8(X)0萬元,預(yù)計該公司新產(chǎn)品產(chǎn)出的估計區(qū)間為17179.99911萬
TCo
6.4多元線性回歸分析
多元線性回歸的基本原理和一元線性回歸的完全相同,但由于自變量個數(shù)的增加,而導(dǎo)致模型
參數(shù)的估計變得較為復(fù)雜。在實際統(tǒng)計分析中,一般利用統(tǒng)計軟件對多元回歸模型進行估計,如
Eviews.SPSS、STATA、SAS等,其中,前兩種軟件對于初學(xué)者較為常用。
6.4.1多元線性回歸模型的基本式
問題與應(yīng)用:回歸
設(shè)被解釋變量為)',人個解釋變量分別為小七,…,之,則人元線性回歸模型的一般形式為
丁=鳳+川王+同占+…+月玉+£(6.14)分析的主要作用就是進
如果“個樣本觀測值為(X",2,…,,i=12…,〃,則將上述〃個樣本觀測值代入式(6-
行預(yù)測,當(dāng)回歸方程通
14)可得
y=4+??芢+所2+…+氏X”+q過檢驗,便可利用該方
>2=A+爾21+后占2+…+0kxk+e2
*2程進行預(yù)測,從而對事
???
物發(fā)展迸行控制。
乂=—+你%+⑸/2+…+0kxl1k+en
用矩陣表示為
Y=XB+E
'y\'-/V>'
y=T,x=…,B=g,E=?(6.15)
…%]LAJ[a
6.4.2多元線性回歸方程的估計
使用最小二乘法可對回歸參數(shù)片,ZV?、&進行估計,其估計原理與一元線性回歸的。
使目標(biāo)函數(shù)之十=之(,一片一用「四4一一4/達到最小值。
/=1/=1
根據(jù)求極值原理,令目標(biāo)函數(shù)對各未知參數(shù)片,片,…,月求偏導(dǎo)數(shù),并令偏導(dǎo)數(shù)為0,則可得
方程組:
.
£(州-%-0\Xi\-62七2----4/)=0
;=1
rr
Z(y-腐一44一Pixn----鳳/)-%=°
4i-l
rr
?
E(Z-/o-0陽「fi2xi2----風(fēng)4)4=。
/=1
最終解上述方程組,可得回歸參數(shù)國,々,…,A的估計值,其矩陣表示為
"A"
A
與="=(xTx)-'xTy(6.16)
Ld
6.4.3多元線性回歸模型的檢驗
1.擬合優(yōu)度檢驗
被解釋變量)'的變化可由兩部分解釋:第一,由4個解釋變量X的變化引起的)’的變化;第
二,由其他隨機因素引起的的變化。由第一部分引起的的變化的離差平方和記為SSR,稱為
回歸平方和;由第二部分隨機因素引起的卜的變化的離差平方和記為SSE,稱為殘差平方和;
SST稱為總離差平方和,有SST=SSR+SSE。
D,SSR.SSE
R=----=1-----(6.17)
SSTSST
其中,箱是擬合優(yōu)度系數(shù),又稱為可決系數(shù)或判定系數(shù)。擬合優(yōu)度系數(shù)取值范圍為[0,1],其
取值越接近1,表明各實際樣本點離趨勢線越近,擬合優(yōu)度越高。
2.尸檢驗
在多元回歸模型分析中,k個變量組合在一起是否合理、組合在一起建立的模型是否具有良
好的穩(wěn)定性,回答這些問題需要借助于方程的顯著性檢驗,也即檢驗被解釋變量與所有解釋變量
之間的線性關(guān)系是否顯著,可用線性模型來描述它們之間的關(guān)系是否恰當(dāng)。
提出如下假設(shè)。
/:氏=0'=區(qū)=…=氏=0。
乩:&(i=l,2…k)不全為0。
原假設(shè)成立則表明各個回歸系數(shù)同時與0無顯著差異。這意味著當(dāng)偏回歸系數(shù)同時為0時,
無論各個可取值如何變化都不會引起)?的線性變化,所有"均無法解釋>>的線性變化,與x的
全體不存在線性關(guān)系,不能用線性模型來描述它們之間的關(guān)系。
在原假設(shè)成立條件下,可建立如下統(tǒng)計量:
LSSR/A
SSE/5-D(619)
該統(tǒng)計量服從產(chǎn)(〃,n-k-\)分布。
由樣本指標(biāo)值可求得幾
給定顯著性水平a,杳表可得到臨界值Fa(km-k-l).
若廠>丹(生〃-*-1),則拒絕原假設(shè),認(rèn)為多元線性回歸模型總體顯著。
若尸這尼(匕〃-攵-1),則接受原假設(shè),認(rèn)為多元線性回歸模型總體不顯著。
6.5Excel在相關(guān)與回歸分析中的應(yīng)用
6.5.1一元相關(guān)分析與回歸分析
判斷變量間的一元相關(guān)關(guān)系的方法有3種:繪制散點圖、計算相關(guān)系數(shù)和計算協(xié)方差。散點
圖是對所選變量之間相關(guān)關(guān)系的一種直觀描述,可在進行兩個變量的相關(guān)分析之前繪制散點圖,
從圖中觀察兩個變量之間的相關(guān)關(guān)系;統(tǒng)計函數(shù)可以直接計算相關(guān)系數(shù)和協(xié)方差,相關(guān)系數(shù)可以
確定兩變量相關(guān)程度的方向和大小。
6.5.2實例應(yīng)用
1.實例的數(shù)據(jù)描述
例6.8為研究廣告費用與銷售額之間的關(guān)系,對某公司抽取12個月的廣告費用和銷售額數(shù)
據(jù),如表6.12所示,試計算廣告費用與銷售額之間的相關(guān)系數(shù)并對二者進行回歸分析(顯著性水
平0.051
表6.13廣告費用與銷售額數(shù)據(jù)資料
廣告費用(萬元)42807614265132561264811644102
銷售額(萬元)132166152186148176142180156168148170
2.實例的操作步驟
首先新建Excel工作簿,命名為"廣告費用與銷售額數(shù)據(jù)資料",將數(shù)據(jù)和相關(guān)文字輸入工作
表中。
利用回歸分析工具進行回歸分析。
(?)選擇回歸分析工具。單擊【數(shù)據(jù)】,選擇【數(shù)據(jù)分析】,隨即彈出【數(shù)據(jù)分析】對話框,
在“分析工具”列表框中選擇“回歸”選項,然后單擊【確定】按鈕,如圖6.17所小,出現(xiàn)【回
歸】對話框。
數(shù)期分析x
分析工具?
傅利葉分析
直方圖
移動平均
岫機敏發(fā)生at
即助⑻
瘴位與百分比撐位
抽樣
卜檢檢:平均值的&對二樽本分析
雙樣本等方
K*雙樣本片方差假設(shè)
圖5.17選擇回歸分析工具
(2)在【回歸】對話框中,在"Y值輸入?yún)^(qū)域",選取單元格BLBI3,在"X值輸入?yún)^(qū)域",
選取單元格A1:A13,勾選"標(biāo)志","置信度"默認(rèn)為95%,在"輸出選項"下選中”新工作表
組”以將輸出結(jié)果顯示在一個新的工作表上。再將"殘差""正態(tài)分布"的選項全部選中,最后單
擊【確定】按鈕,得到回歸結(jié)果,如圖6.18?圖6.23所示。
QH
8
SM14MB
XSAttSMS1UJIJ
3B戶琉什
438R0ft223S8M1
IJib5oaso744ac?
6AduwcdR083?19?2
7蚊1讀?
O一n3:8樂12
修?■工
10力4分折_______________________________________________
O尸EW
Hof5sMsF
M*12底。分析17?7912557915699Q3194B42F0!
13Mf1044876144^741
Gtitwaau.14總計:17
CoH*K?*T5tSlatP、擊<*lowU3雙?同950<tm的g
IFOTpt124475814551咨月24273432£-101130497511135901877911905135902
041816^85005530754?919€05O?17S26O(0541574-W20?175051157
圖6.18設(shè)置回歸參數(shù)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 培訓(xùn)員工如何考核制度
- 診所從業(yè)人員培訓(xùn)制度
- 培訓(xùn)器材設(shè)備管理制度
- 投標(biāo)材料準(zhǔn)備規(guī)范方案
- 團隊干部培訓(xùn)制度
- 在異地工作員工培訓(xùn)制度
- 新職工上崗前培訓(xùn)制度
- 人員運輸培訓(xùn)制度
- 腦卒中相關(guān)科室培訓(xùn)制度
- 企業(yè)中層內(nèi)外部培訓(xùn)制度
- 2025-2030無人船航運技術(shù)領(lǐng)域市場供需分析及投資評估規(guī)劃分析研究報告
- 系統(tǒng)權(quán)限規(guī)范管理制度
- 2025年CFA二級真題解析及答案
- 2025年國電南自筆試完沒有面試及答案
- 2026年遼寧醫(yī)藥職業(yè)學(xué)院單招職業(yè)技能考試參考題庫帶答案解析
- 初中英語寫作中時態(tài)誤用糾正策略的對比實驗研究課題報告教學(xué)研究課題報告
- 2026年及未來5年市場數(shù)據(jù)中國電子級氫氟酸行業(yè)競爭格局分析及投資戰(zhàn)略咨詢報告
- 2026年孝昌縣供水有限公司公開招聘正式員工備考題庫及完整答案詳解1套
- 2025年高頻莆田輔警面試試題及答案
- 醫(yī)療機構(gòu)護理員培訓(xùn)大綱
- 北師大版(2024)八年級上冊數(shù)學(xué)期末考試模擬強化訓(xùn)練試卷 3套(含答案)
評論
0/150
提交評論