市場調(diào)查與市場預(yù)測(第三版-徐陽)課件第七章 回歸分析預(yù)測_第1頁
市場調(diào)查與市場預(yù)測(第三版-徐陽)課件第七章 回歸分析預(yù)測_第2頁
市場調(diào)查與市場預(yù)測(第三版-徐陽)課件第七章 回歸分析預(yù)測_第3頁
市場調(diào)查與市場預(yù)測(第三版-徐陽)課件第七章 回歸分析預(yù)測_第4頁
市場調(diào)查與市場預(yù)測(第三版-徐陽)課件第七章 回歸分析預(yù)測_第5頁
已閱讀5頁,還剩149頁未讀, 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

第七章回歸分析預(yù)測

學(xué)習(xí)目標(biāo)1.理解回歸分析的基本原理;2.掌握一元線性回歸預(yù)測法的思路、步驟及其在經(jīng)濟(jì)活動中的應(yīng)用;3.了解多元線性回歸預(yù)測模型,知道模型檢驗方法,掌握二元線性回歸預(yù)測模型的應(yīng)用;4.會將非線性模型轉(zhuǎn)化為線性模型,并能應(yīng)用于市場現(xiàn)象的分析預(yù)測;5.知道數(shù)學(xué)軟件在回歸分析中的應(yīng)用。2概述回歸分析預(yù)測是一種常用的定量預(yù)測方法。這種方法是依據(jù)事物內(nèi)部因素變化的因果關(guān)系來預(yù)測事物未來的發(fā)展趨勢,所以,又稱為因果分析法。在因果關(guān)系的分析預(yù)測中,不僅要確定前因與后果的一般依賴關(guān)系,而且要確定前因?qū)蠊挠绊懗潭龋⒆鞒隽康墓烙?。這里涉及到較多的數(shù)理統(tǒng)計知識,我們給出了建立和檢驗數(shù)學(xué)模型的一些思路,精簡了過于繁瑣的數(shù)學(xué)證明和推理過程,著眼于運(yùn)用數(shù)學(xué)知識去分析和解決市場預(yù)測問題。3目錄1.回歸分析的的基本原理2.一元線性回歸預(yù)測法3.多元線性回歸預(yù)測法4.非線性回歸預(yù)測法47.1回歸分析的的基本原理一、回歸分析的意義 現(xiàn)實世界中,任何客觀事物都不是孤立存在,而是與另一些事物相互聯(lián)系、相互影響著的。市場的發(fā)展變化同影響其變化的各種因素之間存在一定的依存關(guān)系,一方面市場的發(fā)展變化是其影響因素影響的結(jié)果,另一方面,市場的發(fā)展變化也影響著其影響因素的發(fā)展變化。這種現(xiàn)象間存在的依存關(guān)系稱為因果關(guān)系。

5 經(jīng)濟(jì)現(xiàn)象間的因果關(guān)系與市場變量之間的關(guān)系形態(tài),大致可分為兩類:一類是變量之間存在著完全確定的關(guān)系,即一個變量能被一個或若干個其他變量按某一規(guī)律唯一確定,這種關(guān)系通常被稱為函數(shù)關(guān)系。

6例如,設(shè)某種商品的單價為a(元),銷售量為x(件),銷售收入為y(元),顯然銷售收入與銷售量之間存在確定的函數(shù)關(guān)系y=ax。7 另一類是變量之間存在著一定關(guān)系,而這種關(guān)系具有某種不確定性。 例如,商品的價格與商品銷售量之間的關(guān)系,一般來說,價格提高,銷售量就會減少;價格降低,銷售量就會增加。但是,我們不可能斷言,商品價格提高多少銷售量就一定會減少多少,有時價格提高了,銷售量反而會有所增加,這是因為影響銷售量的因素還有收入、個人愛好、季節(jié)變化等等。

8所以商品價格與銷售量之間的關(guān)系不能用一個確定的函數(shù)關(guān)系來計算。這種非確定性的關(guān)系,稱為相關(guān)關(guān)系。屬于這類相關(guān)關(guān)系的現(xiàn)象,在自然界和社會生活中都是屢見不鮮的。

例如,父母身高與子女身高的關(guān)系,居民消費(fèi)支出與居民收入的關(guān)系,人口增長與能源消耗的關(guān)系等等。9具有相關(guān)關(guān)系的變量之間雖然具有某種不確定性的關(guān)系,但是,通過對現(xiàn)象的不斷觀察可以探索出它們之間的統(tǒng)計規(guī)律,這種統(tǒng)計規(guī)律稱為回歸方程,回歸方程可以用來近似表達(dá)相關(guān)變量間的平均關(guān)系。

10有關(guān)尋求回歸方程的理論、計算和分析稱為回歸分析。表明相關(guān)變量密切程度的指標(biāo)稱為相關(guān)指標(biāo),其理論、計算和分析稱為相關(guān)性分析?;貧w分析和相關(guān)分析兩種方法往往是結(jié)合在一起使用。11二、回歸分析預(yù)測法的一般思路

回歸分析預(yù)測法在實際應(yīng)用中,一般可以分為四個步驟:

1.收集數(shù)據(jù)資料,繪制散點(diǎn)圖2.建立回歸方程3.進(jìn)行相關(guān)檢驗4.利用回歸模型進(jìn)行預(yù)測121.收集數(shù)據(jù)資料,繪制散點(diǎn)圖根據(jù)調(diào)查統(tǒng)計取得的一系列相互對應(yīng)的數(shù)據(jù),這些數(shù)據(jù)稱為觀察點(diǎn)或?qū)嶋H值,將它們編制成數(shù)據(jù)表。把預(yù)測目標(biāo)確定為因變量,而自變量就是引起預(yù)測目標(biāo)發(fā)生變化的一個或多個因素。當(dāng)數(shù)據(jù)點(diǎn)是二維數(shù)組時,在平面直角坐標(biāo)系中將每一組數(shù)據(jù)以一個點(diǎn)表示,這樣所得的圖形稱為散點(diǎn)圖。132.建立回歸方程根據(jù)散點(diǎn)的分布狀況,選擇適當(dāng)?shù)幕貧w數(shù)學(xué)模型。如果點(diǎn)的分布呈直線趨勢,則要求擬合成一條直線,作為描述散點(diǎn)分布直線趨勢的預(yù)測線,這就是一元線性回歸預(yù)測問題。如果點(diǎn)的分布不是直線趨勢,根據(jù)散點(diǎn)圖的特點(diǎn),選擇相應(yīng)的非線性回歸模型,則要求擬合成一條曲線作為預(yù)測線,這就是一元非線性回歸預(yù)測問題

142.建立回歸方程研究兩個變量之間的回歸關(guān)系,稱為一元回歸問題;研究若干個變量與另一個變量之間的回歸關(guān)系,稱為多元回歸問題。

153.進(jìn)行相關(guān)檢驗相關(guān)檢驗就是選擇恰當(dāng)?shù)南嚓P(guān)指標(biāo),去判定回歸方程變量之間關(guān)系的密切程度。相關(guān)程度越高,就表明回歸方程與實際值的偏差越小,擬合效果越好。如果回歸方程變量間的相關(guān)關(guān)系不好,在此情況下所得的回歸方程沒有什么意義。

164.利用回歸模型進(jìn)行預(yù)測如果回歸方程擬合得好,我們就可以用它來作預(yù)測。所謂預(yù)測就是根據(jù)自變量取值來估計因變量(預(yù)測目標(biāo))的值。由于回歸方程與實際值之間存在誤差,預(yù)測值不可能簡單地表為由回歸方程計算所得的確定值,而應(yīng)該是一個范圍或區(qū)間,一般要求實際值位于這個區(qū)間的可靠度應(yīng)達(dá)到95%以上,這個區(qū)間稱為預(yù)測區(qū)間或預(yù)測值的置信區(qū)間。置信區(qū)間說明回歸模型的適用范圍或精確程度。

小節(jié)完177.2一元線性回歸預(yù)測法一元線性回歸的數(shù)學(xué)模型設(shè)x為自變量,y為因變量,根據(jù)一系列數(shù)據(jù)點(diǎn)作出散點(diǎn)圖,它們的關(guān)系具有直線趨勢,則可用以下直線方程來擬合它們變量間的關(guān)系:

為y的估計值a為回歸常數(shù)b為回歸系數(shù)18式(7-1)就是一元線性回歸的數(shù)學(xué)模型。根據(jù)兩個變量x、y現(xiàn)有的統(tǒng)計數(shù)據(jù)或?qū)嶋H數(shù)據(jù)(xi,yi),(i=1,2,…,n),應(yīng)用最小二乘法估計參數(shù)a和b,是確定回歸方程的關(guān)鍵。

19我們將xi代入(7-1),則可求得估計值,

(i=1,2,…,,)實際值yi與估計值之差,稱為估計誤差或殘差,以ei

表示。

(i=1,2,…,)20為了避免誤差求和時正負(fù)抵消,通常用誤差的平方來表達(dá)誤差,用誤差平方和度量全部y與之間的偏差程度,設(shè)Q表示誤差平方和,則(7-2)21要使式(7-2)所表示的誤差平方和Q達(dá)到最小值,根據(jù)多元微分學(xué)中的極值原理,a和b須滿足下列方程組:

22經(jīng)整理得:(7-3)上式稱為正規(guī)方程組。解此線性方程組可得關(guān)于參數(shù)a和b的計算公式:

23(7-4)其中24【例1】某地區(qū)1997~2006年工業(yè)總產(chǎn)值和貨運(yùn)量的統(tǒng)計資料如表7-1所示。貨運(yùn)量工業(yè)總產(chǎn)值年份(億噸)(10億元)19971998199920002001200220032004200520062.82.93.23.23.43.23.33.73.94.225272932343635394245表7-1

貨運(yùn)量與工業(yè)總產(chǎn)值資料25根據(jù)表7-1資料作出的散點(diǎn)圖如圖7-1所示。圖7-1貨運(yùn)量與工業(yè)總產(chǎn)值散點(diǎn)圖26從散點(diǎn)圖可知,散點(diǎn)大體上有直線趨勢,因此可用回歸直線進(jìn)行擬合。建立一元線性模型:其中y表示貨運(yùn)量,x表示工業(yè)總產(chǎn)值。關(guān)于參數(shù)a、b的計算通常通過列表進(jìn)行。27表7-2

貨運(yùn)量與工業(yè)總產(chǎn)值回歸計算表序號貨運(yùn)量yi工業(yè)總產(chǎn)值xixiyi123456789102.82.93.23.23.43.23.33.73.94.2252729323438353942457078.392.8102.4115.6115.2115.5144.3163.818962572984110241156129615211225176420257.848.4110.2410.2411.5610.2410.8913.6915.2117.6433.83441186.912206

115.9628由公式(7-4)及表7-2中的數(shù)據(jù)可得

29故回歸方程為式中a=1.1464為估計的固定貨運(yùn)量,b=0.06493表示當(dāng)工業(yè)總產(chǎn)值每增加10億元,貨運(yùn)總量平均增加0.06493億噸。30二、對預(yù)測模型進(jìn)行檢驗從前面的例子中可以看到,計算回歸方程的參數(shù)和時,并不需要一定知道兩個變量是否具有線性相關(guān)性,由散點(diǎn)圖僅能作一個粗略的直觀判斷,不能作定量分析。也就是說,就方法本身而言,即使對平面上一堆完全雜亂無章的散點(diǎn),也可以由這些數(shù)據(jù)點(diǎn)計算參數(shù)a和b,從而配一個直線方程表示y和x之間的關(guān)系。31顯然,此時所配的直線是毫無意義的,因此,需要用一個數(shù)量指標(biāo)檢驗回歸方程擬合的“優(yōu)良性”。模型檢驗常用的方法有相關(guān)系數(shù)檢驗和估計標(biāo)準(zhǔn)差檢驗。其它如t檢驗法、F檢驗法在下一節(jié)作介紹。321.相關(guān)系數(shù)及顯著性檢驗相關(guān)系數(shù)是描述兩個變量間線性相關(guān)密切程度的一個數(shù)量性指標(biāo),常用字母r表示。相關(guān)系數(shù)的公式為:

33(7-5)34為簡便起見,我們令:35于是關(guān)于參數(shù)a、b的計算公式(7-4)可簡化為:

相關(guān)系數(shù)的計算公式(7-5)可以簡化為:

(7-6)36顯然,回歸系數(shù)b與相關(guān)系數(shù)r有以下關(guān)系:

可以證明,而且r的值反映了y與x之間的內(nèi)在聯(lián)系,如圖7-2所示,有以下結(jié)論:(7-7)37(1)當(dāng)r=0時,由公式(7-7)可得回歸系數(shù)b=0,故回歸直線是與x軸平行的直線,它表明y的變化與x無關(guān),此時稱y與x毫無線性關(guān)系。在通常的情況下,這時散點(diǎn)的分布是不規(guī)則的。38(2)當(dāng)0<|x|<1時,這是絕大多數(shù)的情形,即y與x存在一定的線性相關(guān)性。當(dāng)0<r<1時,有b>0,此時y隨x的增加而增加,稱y與x正相關(guān);當(dāng)-1<r<0時,有b<0,此時y隨x的增加而減少,稱y與x負(fù)相關(guān)。39當(dāng)|x|越小,接近于0時,散點(diǎn)偏離回歸直線的程度越大,即y與x的線性關(guān)系越差;當(dāng)|x|越大,接近于1時,散點(diǎn)就越靠近回歸直線,即y與x的線性關(guān)系越好。40(3)當(dāng)r=±1時,所有散點(diǎn)完全在回歸直線上。此時稱y與x完全線性相關(guān)。當(dāng)r=1時,稱完全正相關(guān);當(dāng)r=-1時,稱完全負(fù)相關(guān)。41圖7-2線性相關(guān)性示意圖42將本節(jié)例1中表7-2的數(shù)據(jù)代入公式(7-6),可得故與的線性關(guān)系是很密切的。43相關(guān)系數(shù)的值到底取多大,才可以確定y與x之間具有線性關(guān)系呢?為保證回歸方程具有最低的線性關(guān)系,人們將r的臨界值列為專門的表,要求在顯著性水平a下,相關(guān)系數(shù)r的計算值大于相應(yīng)的最低臨界值ra,這個臨界值ra就是相關(guān)檢驗的標(biāo)準(zhǔn),它與已知的統(tǒng)計數(shù)據(jù)組的數(shù)據(jù)個數(shù)n有關(guān)。44在《相關(guān)系數(shù)檢驗表》(見附表一)中,給出了對不同的n,(注意表中第一列的數(shù)字是n-2),在幾種顯著性水平下相關(guān)系數(shù)的臨界值。45例如,本節(jié)例1中n-2=10-2=8,若取顯著性水平a=0.05,查《相關(guān)系數(shù)檢驗表》可得臨界值r0.05=0.6319,而計算得r=0.9565,有r>r0.05,它表明有95%以上的概率保證兩個變量具有線性關(guān)系;若取顯著性水平a=0.01,查表可得臨界值r0.01=0.7649,亦有r>r0.01

,它表明有99%以上的概率保證兩個變量具有線性關(guān)系。46一般情況下,當(dāng)|r|≥0.8時,認(rèn)為y與x高度線性相關(guān);當(dāng)0.5<|x|<0.8時,認(rèn)為y與x中度線性相關(guān);當(dāng)0.3<|x|≤0.5時,認(rèn)為y與x低度線性相關(guān);當(dāng)|x|≤0.3時,認(rèn)為y與x不相關(guān)。472.估計標(biāo)準(zhǔn)差檢驗在回歸分析中,因變量的實際值yi與估計值之間的誤差平方和可以度量實際值與回歸直線的離散程度,再取其平均值,可以去掉求和項數(shù)對誤差平方和的影響。

48估計標(biāo)準(zhǔn)差是誤差平方和的算術(shù)平均數(shù)的平方根,計算公式為:由數(shù)理統(tǒng)計可知,是總體方差σ2的無偏估計量。(7-8)49上式計算Sy比較繁瑣,通常引入a、b,采用下式計算:(7-9)50顯然,Sy越大,實際值yi與回歸直線的離散程度越大;反之,Sy越小,實際值yi與回歸直線的離散程度越小。一般要求:51本節(jié)例1中

Sy/=0.029<15%故認(rèn)為該一元線性回歸預(yù)測模型有較好的精度。=0.135252三、一元線性回歸問題的預(yù)測回歸模型經(jīng)檢驗通過后,便可用于預(yù)測。當(dāng)x=x0時,預(yù)測對象對應(yīng)的點(diǎn)預(yù)測值為。例如,本節(jié)例1中已求得貨運(yùn)量與工業(yè)總產(chǎn)值的回歸模型那么,當(dāng)工業(yè)總產(chǎn)值x0=50(10億元)時,貨運(yùn)量的點(diǎn)預(yù)測值為53由于實際存在誤差,預(yù)測值不可能是一個確定值,而應(yīng)該是一個范圍或區(qū)間,一般要求實際值位于這個區(qū)間范圍的可靠程度應(yīng)達(dá)到95%以上。若給定可靠度1-a,可以證明的預(yù)測區(qū)間為:

(7-10)54其中:由t分布表查得x0為預(yù)測點(diǎn)x的值Sy是估計標(biāo)準(zhǔn)差,其計算公式見(7-8)xi為統(tǒng)計數(shù)據(jù)55利用(7-10)式來確定預(yù)測區(qū)間,在計算上頗為麻煩,在實際應(yīng)用中可以作一些簡化。事實上,當(dāng)n很大時,t分布趨近于正態(tài)分布,上式中S0的也趨近于估計標(biāo)準(zhǔn)差

;當(dāng)n不是很大時,由于實際過程中往往只需要獲得近似估計,在這種情況下,y的實際發(fā)生值也可以看作按正態(tài)分布的規(guī)律波動,波動的標(biāo)準(zhǔn)差為Sy

,根據(jù)正態(tài)分布的理論,可以證明:56預(yù)測值的可靠度68.3%的的預(yù)測區(qū)間為預(yù)測值的可靠度95.4%的的預(yù)測區(qū)間為預(yù)測值的可靠度99.7%的的預(yù)測區(qū)間為57預(yù)測區(qū)間的長度直接關(guān)系到預(yù)測的準(zhǔn)確性。顯然,預(yù)測區(qū)間愈長,精度愈差,反之則好。通常取可靠度為95%的的預(yù)測區(qū)間如圖7-3所示,預(yù)測值以95%的可靠度落在直線和之間。

58圖7-3預(yù)測區(qū)間示意圖59本節(jié)例1中,已求得=4.393(億噸),Sy=0.135,則預(yù)測值的可靠度為95%的預(yù)測區(qū)間是:(4.393-2×0.1354.393+2×0.135)即(4.1234.663)60四、應(yīng)用實例【例2】社會商品零售總額預(yù)測某地區(qū)居民的收入與社會商品零售總額近10年的統(tǒng)計資料如表7-3所示。年序居民收入社會商品零售總額年序居民收入社會商品零售總額164566107882706071251023776681431184827091651365927810189155表7-3

社會商品零售總額與居民收入統(tǒng)計資料單位:億元

61試討論社會商品零售總額與居民收入的關(guān)系。并以此預(yù)測下一年若居民收入達(dá)到213億元時的社會商品零售總額。解第一步,因為預(yù)測目標(biāo)是社會商品零售總額,所以令社會商品零售總額為y,居民收入為x。依據(jù)統(tǒng)計資料,作出散點(diǎn)圖。見圖7-4。62圖7-4統(tǒng)計資料散點(diǎn)圖63第二步,建立數(shù)學(xué)模型。從圖7-4可見,y與x呈直線關(guān)系,故設(shè)預(yù)測模型為

第三步,估計參數(shù)a、b。為了便于計算,列出計算表,如表7-4所示。64表7-4線性回歸計算表序號xiyixi

yixi2yi21234567891064707782921071251431651895660667078881021181361553584420050825740717694161275016874224402929540964900592967248464114491562520449272253572131363600435649006084774410404139241849624025Σ11149291165571405829666965代入公式(7-4)可得66由此,得回歸預(yù)測方程式:這個模型表明:居民的平均收入每增加到1元,平均就有約0.79元用于商品消費(fèi)。67第四步,進(jìn)行相關(guān)性檢驗。首先,求相關(guān)系數(shù):顯然,y與x具有高度線性相關(guān)性。68其次,再用估計標(biāo)準(zhǔn)差驗證。因為估計標(biāo)準(zhǔn)差

=92.9Sy/=0.01<15%所以,y與x的線性相關(guān)性是可以肯定的。69第五步作預(yù)測當(dāng)居民收入達(dá)到x0=213(億元)時,得社會商品零售總額的點(diǎn)估計值:

4.593+0.7927×213=173.438(億元)可靠度為95%的的預(yù)測區(qū)間為:(173.438-2×0.9598173.438+2×0.9598)即(171.52175.36)就是說,下一年社會商品零售總額的預(yù)測范圍在171.52~175.36億元。

70另外,在時間序列的直線趨勢模型中,因為自變量就是觀察期,為等差數(shù)列,我們可以把觀察期取成原點(diǎn)為中心,兩側(cè)對稱的整數(shù)值。具體地說,當(dāng)觀察期數(shù)n為偶數(shù)時,取ti分別為:、…、-2、-1、1、2、…、,71當(dāng)觀察期數(shù)n為奇數(shù)時,取ti分別為:、…、-2、-1、0、1、2、…、,于是有,,從而線性模型(7-1)的參數(shù)計算公式(7-4)可簡化為:72【例3】某地區(qū)1998~2006年年電冰箱銷售量由表7-5給出。預(yù)測下一年的電冰箱銷售量。年序199819992000200120022003200420052006零售量

265297333370405443474508541表7-5某地電冰箱銷售量統(tǒng)計資料單位:(千臺)73本題僅作為時間序列線性模型參數(shù)計算公式的應(yīng)用示例,故約去作散點(diǎn)圖分析及模型檢驗等步驟。假設(shè)散點(diǎn)分布近似為直線,參數(shù)計算過程如表7—6所示。74表7-6

時間序列線性模型參數(shù)計算表

年份tiyitiyiti2199819992000200120022003200420052006-4-3-2-101234265297333370405443474508541-1060-891-666-3700443948152421641694101491603636209260Σ75于是有:76所求直線趨勢的預(yù)測模型為:將ti=5代入預(yù)測模型,則2007年電冰箱銷售量的預(yù)測值為:

小節(jié)完777.3多元線性回歸預(yù)測法 一元線性回歸只是分析一個自變量對因變量的影響,而市場經(jīng)濟(jì)現(xiàn)象的變化是復(fù)雜的,預(yù)測對象的變化往往是由多個因素引起。例如,預(yù)測商品的銷售量時,需要考慮當(dāng)?shù)鼐用袢藬?shù)、居民收入狀況和商品價格等等諸因素。如果預(yù)測對象與多個因素之間具有線性相關(guān)性,一般采用多元線性回歸法進(jìn)行分析預(yù)測。

78多元線性回歸分析預(yù)測是利用回歸分析原理,尋找預(yù)測對象與多個影響因素之間的變化規(guī)律,并利用所求得的回歸模型作預(yù)測。由于多元線性回歸分析法在因素分析和計算上都是十分復(fù)雜的,故這里著重討論它的特例——二元線性回歸分析預(yù)測法。79一、二元線性回歸的數(shù)學(xué)模型如果實際問題中有兩個自變量與因變量呈線性相關(guān)性時,可用如下二元線性回歸方程描述:

(7-11)x1、x2是自變量;b0是回歸常數(shù);b1、b2分別是y對x1、x2的回歸系數(shù);是預(yù)測估計值。80二元線性回歸方程在幾何上表示一張平面,這張平面圖稱為二元線性回歸平面。實際值與回歸平面的關(guān)系如圖7-5所示。81圖7-5二元線性回歸平面示意圖82二元線性回歸預(yù)測法就是依據(jù)回歸分析的原理,利用n組已知的實際數(shù)據(jù)或稱為樣本觀察值(x11,x21,y1)、(x12,x22,y2)、…、(x1n,x2n,yn)確定參數(shù)b0

、b1、b2

、從而得到回歸預(yù)測模型。83根據(jù)最小二乘法原理,要使實際值與對應(yīng)估計值之間的誤差平方和84達(dá)到最小,參數(shù)b0

、b1、b2應(yīng)滿足的條件是:85將上式整理,得到關(guān)于b0、b1、b2的三元線性方程組,稱為二元線性回歸方程的正規(guī)方程組:

(7-12)86此方程組的解可用以下公式表示:

(7-13)87式中:88二、多元線性回歸的數(shù)學(xué)模型從二元回歸線性預(yù)測模型容易推廣到一般的元線性回歸預(yù)測模型。元線性回歸方程的一般形式為:x1、x2、…、xm是自變量;b0是回歸常數(shù);b1、b2、…、bm分別是y對x1、x2…、xm的回歸系數(shù);是預(yù)測估計值。89利用n組已知實際數(shù)據(jù)(i=1,2,…,n)來確定回歸方程的待定參數(shù)。根據(jù)最小二乘原理,要使n個實際值yi與對應(yīng)估計值之間的誤差平方和達(dá)到最小,參數(shù)b0、b1、b2

…、bm應(yīng)滿足的必要條件是:9091由上式整理得到關(guān)于參數(shù)b0、b1、b2

…、bm的線性方程組,稱為m元線性回歸方程的正規(guī)方程組:(7-15)92在多個自變量的情況下,求解此方程組是比較復(fù)雜的,一般用矩陣運(yùn)算。令93則方程組(7-15)可表示為:當(dāng)系數(shù)矩陣XTX非奇異時,待定參數(shù)的估計值可表為:

94三、多元線性回歸模型的檢驗根據(jù)實際數(shù)據(jù)計算出多元線性回歸方程的待定參數(shù),建立預(yù)測模型后,同樣要借用數(shù)理統(tǒng)計的方法進(jìn)行檢驗,從總體上確信模型具有可信度之后,才能運(yùn)用于預(yù)測。951.復(fù)相關(guān)系數(shù)檢驗——R檢驗復(fù)相關(guān)系數(shù)是度量一組自變量x1、x2

…、xm與因變量y之間線性相關(guān)程度的指標(biāo),它用以考察多元線性關(guān)系中全部自變量整體與因變量之間線性相關(guān)的密切程度,而不能確切說明各個自變量與因變量之間的線性相關(guān)程度。相對于復(fù)相關(guān)系數(shù),一元線性回歸方程中的相關(guān)系數(shù)可稱為單相關(guān)系數(shù)。96復(fù)相關(guān)系數(shù)記為R,復(fù)相關(guān)系數(shù)的計算公式為:(7-17)97上式中,實際值yi與估計值的離差平方和稱為誤差平方和,記為Q,即:實際值yi與其平均值的離差平方和稱為總偏差平方和,記為U,即:98顯然,當(dāng)實際數(shù)據(jù)給定后,總偏差平方和U是一個常數(shù)。而誤差平方和Q越小,回歸方程的擬合程度越好。由式(7-17)可見,當(dāng)R接近于1時,Q=接近于0,說明誤差平方和趨于最小;當(dāng)R接近于0時,則表明誤差平方和Q趨于最大。99復(fù)相關(guān)系數(shù)檢驗也稱R檢驗,R檢驗法的步驟為:(1)計算復(fù)相關(guān)系數(shù)R;(2)根據(jù)回歸模型的自由度n-m-1和給定的顯著性水平a值,查《相關(guān)系數(shù)檢驗表》,得臨界值ra(n-m-1);(3)作判斷:當(dāng)時r>ra(n-m-1),認(rèn)為因變量y與x1、x2

…、xm之間的多元線性相關(guān)程度顯著,否則不顯著。1002.偏相關(guān)系數(shù)檢驗偏相關(guān)系數(shù)是指在多個具有線性相關(guān)關(guān)系的變量中,固定其它自變量,只測定某一個自變量與因變量之間線性相關(guān)密切程度的指標(biāo)。偏相關(guān)系數(shù)需要用單相關(guān)系數(shù)來表達(dá),一元線性回歸方程的相關(guān)系數(shù)r是單相關(guān)系數(shù),這里記為ryx。在多元線性關(guān)系中,單相關(guān)系數(shù)是忽略其它自變量的變化來反映某一自變量與因變量的線性相關(guān)程度。

101事實上,其它自變量的變化也會影響因變量的變化,因此,單相關(guān)系數(shù)是不能真正反映多元線性關(guān)系中,某一自變量與因變量的線性相關(guān)程度,而需要用偏相關(guān)系數(shù)來反映。102以二元線性回歸方程為例,偏相關(guān)系數(shù)的計算公式為:(7-18)(7-19)103式中ryx1,x2表示固定x2后,自變量x1與因變量y的一階偏相關(guān)系數(shù);ryx2,x1表示固定x1后,自變量x2與因變量y的一階偏相關(guān)系數(shù)。ryx1表示自變量x1與因變量y的單相關(guān)系數(shù);ryx2表示自變量x2與因變量y的單相關(guān)系數(shù);rx1x2表示自變量x1與自變量x2的單相關(guān)系數(shù)。104三元線性回歸方程的回歸系數(shù)需要用二階偏相關(guān)系數(shù)來檢驗。例如用表示固定x2、x3后,x1與y的二階偏相關(guān)系數(shù),則105m元線性回歸方程的回歸系數(shù)需要用m-1階偏相關(guān)系數(shù)來檢驗。例如:式中表示固定x2至xm后,x1與y的m-1階偏相關(guān)系數(shù)。106偏相關(guān)系數(shù)的數(shù)值介于-1與+1之間,其絕對值越大,說明在固定其它變量的條件下,某一自變量與因變量的線性關(guān)系越密切,該自變量對因變量有較強(qiáng)的影響作用;其絕對值越小,說明二變量間越不相關(guān),該自變量對因變量的影響作用較小。經(jīng)檢驗,對因變量無顯著影響的自變量,應(yīng)從回歸方程中剔出,重新建立回歸方程。1073.F檢驗F檢驗是關(guān)于回歸方程的顯著性檢驗,即檢驗所有自變量作為一個整體與因變量之間是否有顯著的線性相關(guān)性。檢驗假設(shè)H0

:F統(tǒng)計量的計算公式為:108給定顯著性水平α,由F分布表查臨界值,當(dāng)F>時,認(rèn)為y與x1、x2…、xm之間有顯著的線性相關(guān)性,即認(rèn)為m元線性回歸方程(7-14)有顯著意義。反之,則認(rèn)為y與x1、x2…、xm之間不存在顯著的線性相關(guān)關(guān)系。109當(dāng)回歸方程的顯著性檢驗未通過,可能是因變量與自變量之間的關(guān)系是非線性的,也可能是選擇自變量時漏掉了重要的影響因素,應(yīng)考慮重新建立回歸模型。F檢驗也適用于一元線性回歸方程的檢驗,在F統(tǒng)計量中取m=1即得。1104.t檢驗

t檢驗是關(guān)于回歸系數(shù)的顯著性檢驗,即檢驗回歸方程中每個自變量與因變量之間的線性關(guān)系是否顯著。檢驗假設(shè)H0

t統(tǒng)計量的計算公式為:

111式中稱為回歸系數(shù)bi的標(biāo)準(zhǔn)差,其中Sy是估計標(biāo)準(zhǔn)差:cii是(7-16)式中矩陣主對角線上的第個元素。

112給定顯著性水平α,由t分布表查臨界值,當(dāng)時,認(rèn)為回歸系數(shù)bi與0有顯著差異,即自變量xi對因變量y有顯著影響;反之,接受bi=0,即自變量xi對因變量y無顯著影響,xi應(yīng)從回歸方程中剔出。113t檢驗也適用于一元線性回歸方程回歸系數(shù)的檢驗。這時,t統(tǒng)計量的計算公式為:,其中回歸系數(shù)b的標(biāo)準(zhǔn)差。114四、應(yīng)用實例【例4】某商品的人均需求量受多種因素的影響,經(jīng)分析,認(rèn)為商品價格和居民人均收入與需求量的相關(guān)程度最高,且呈線性關(guān)系,其資料如表7-7所示。試建立二元線性回歸方程,預(yù)測當(dāng)商品價格為8元,居民人均收入為1000元時的需求量。115表7-7某商品需求量及價格、居民收入統(tǒng)計資料編號需求量(公斤)價格(元)居民收入(10元)1234567891056.06.577.58910101189767654583030405060120130110100120116解1.求回歸方程設(shè)y表示需求量,x1表示價格,x2表示需求量,回歸方程為:117表7-8二元線性回歸方程參數(shù)計算表序號12345678910566.577.58910101189767654533030405060120130110100130405445.54252.5484540503315018026035045096011701100100014302402702803004207206504405003906481493649362516259900900160025003600144001690012100100001690080608004507050421039079800118從而有:由正規(guī)方程(7-12),得b0,b1,b2滿足的線性方程組:119解此線性方程組,得:則二元元線性回歸預(yù)測方程為:120預(yù)測方程中,表示若居民收入不變,價格每上漲一元,該商品的需求量將人均減少0.7188公斤;表示若商品價格不變,居民收入每增加10元該商品的需求量將人均增加0.0143公斤。1212.模型檢驗(1)復(fù)相關(guān)系數(shù)檢驗復(fù)相關(guān)系數(shù)和偏相關(guān)系數(shù)的有關(guān)數(shù)據(jù)由表7-7列出。122復(fù)相關(guān)系數(shù):結(jié)果表明,該商品價格及居民收入與商品人均需求量的線性相關(guān)程度為0.9457,即有密切的線性相關(guān)關(guān)系。123(2)偏相關(guān)系數(shù)檢驗先計算單相關(guān)系數(shù):124(2)偏相關(guān)系數(shù)檢驗125(2)偏相關(guān)系數(shù)檢驗126再計算偏相關(guān)系數(shù),根據(jù)公式(7-18)(7-19):127

,表示固定居民收入后,價格與需求量負(fù)相關(guān),線性相關(guān)程度為0.73;

,表示固定價格后,居民收入與需求量正相關(guān),線性相關(guān)程度為0.43。,說明價格與需求量的關(guān)系更為密切,價格對需求量的影響作用更大,隨著價格上升,需求量將明顯下降。1283.利用模型進(jìn)行預(yù)測當(dāng)價格x1=8元,居民收入x2=100(10元)時,代入經(jīng)檢驗合格的模型:得該商品人均需求量的估計值為=6.85(公斤)小節(jié)完1297.4非線性回歸預(yù)測法在現(xiàn)實經(jīng)濟(jì)生活中,變量之間的關(guān)系并非都是線性關(guān)系,更多的是非線性關(guān)系。如果預(yù)測對象與影響因素之間是非線性關(guān)系,再利用線性回歸模型進(jìn)行預(yù)測,就會有較大的誤差,甚至導(dǎo)致預(yù)測失敗。

130對于具有非線性關(guān)系的預(yù)測對象,我們希望像線性回歸預(yù)測那樣,利用變量的樣本觀察值,確定一條曲線,建立曲線回歸模型來表示變量之間的非線性關(guān)系,以便于預(yù)測。131非線性回歸模型有兩種類型,一類是不可線性化的模型,如:修正指數(shù)曲線模型,龔珀茲曲線模型等,我們將在下一章中介紹這類曲線;另一類是經(jīng)過某種變換能使其線性化,稱為可線性化模型。本節(jié)我們主要研究將可線性化模型轉(zhuǎn)化為線性模型,再利用線性回歸的方法求出模型參數(shù)的問題。132一、可線性化的回歸模型及其變換方式將非線性回歸模型線性化的轉(zhuǎn)換方式可分為兩類,一是直接變換法,二是對數(shù)變換法。133(一)直接變換法直接變換法是通過直接進(jìn)行變量代換將非線性模型轉(zhuǎn)化為線性模型,主要適用類型有:1.二次多項式回歸模型2.雙曲線回歸模型3.對數(shù)曲線回歸模型4.三角函數(shù)曲線回歸模型1341.二次多項式回歸模型二次多項式回歸模型的數(shù)學(xué)表達(dá)式為:

在二次多項式回歸模型中,設(shè)x1=x,x2=x2,則二次多項式回歸模型可以轉(zhuǎn)化為二元線性回歸模型1351.二次多項式回歸模型由x的實際值,求出x1、x2的數(shù)值后,利用二元線性回歸的最小二乘法,即可求得參數(shù)b0、b1、b2的估計值。1362.雙曲線回歸模型雙曲線回歸模型的數(shù)學(xué)表達(dá)式為:在雙曲線回歸模型中,設(shè),Y=y,則雙曲線回歸模型可以轉(zhuǎn)化為一元線性回歸模型:

將已知的x值轉(zhuǎn)化為X值后,利用最小二乘法即可求得參數(shù)a、b的估計值。1373.對數(shù)曲線回歸模型對數(shù)曲線回歸模型的數(shù)學(xué)表達(dá)式為:

設(shè)Y=y,X=lnx,則對數(shù)曲線回歸模型轉(zhuǎn)化為一元線性回歸模型:

將已知的x值轉(zhuǎn)化為X值后,利用最小二乘法即可求得參數(shù)a、b的估計值。1384.三角函數(shù)曲線回歸模型三角函數(shù)回歸模型的數(shù)學(xué)表達(dá)式為:或設(shè)Y=y,X=sinx或X=cosx,則三角函數(shù)曲線回歸模型可轉(zhuǎn)化為一元線性回歸模型:

將已知的x值轉(zhuǎn)化為X值后,利用最小二乘法即可求得參數(shù)a、b

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論