第七章 相關(guān)與回歸分析_第1頁
第七章 相關(guān)與回歸分析_第2頁
第七章 相關(guān)與回歸分析_第3頁
第七章 相關(guān)與回歸分析_第4頁
第七章 相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩109頁未讀 繼續(xù)免費(fèi)閱讀

付費(fèi)下載

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第七章

相關(guān)與回歸分析學(xué)習(xí)目標(biāo)

通過本章的學(xué)習(xí),熟悉相關(guān)分析和回歸分析的內(nèi)容和方法,掌握相關(guān)關(guān)系的判斷、相關(guān)系數(shù)的含義和計(jì)算,掌握一元線性回歸分析的參數(shù)估計(jì)、估計(jì)標(biāo)準(zhǔn)誤差,了解多元線性回歸分析的一般程序,能夠運(yùn)用相關(guān)分析和回歸分析對(duì)數(shù)據(jù)進(jìn)行分析處理。

根據(jù)表格所給數(shù)據(jù)思考以下問題:銷售人員序號(hào)工齡/年每年銷售額/萬元12345678910111213164468101013115157342026405056708270

銷售人員的工齡對(duì)其年銷售額有影響嗎?是工齡越長(zhǎng)銷售額就一定越高嗎?它們之間是什么關(guān)系?

第一節(jié)相關(guān)分析的概述一、相關(guān)關(guān)系的概念1.函數(shù)關(guān)系

函數(shù)關(guān)系是指事物或現(xiàn)象之間存在著嚴(yán)格的依存關(guān)系,其主要特征是它的確定性,即對(duì)一個(gè)變量的每一個(gè)值,另一個(gè)變量都具有惟一確定的值與之相對(duì)應(yīng)。變量之間的函數(shù)關(guān)系通常可以用函數(shù)式確切地表示出來。例如,圓的周長(zhǎng)C對(duì)于半徑r的依存關(guān)系就是函數(shù)關(guān)系:C=2πr。

一、相關(guān)關(guān)系的概念2.相關(guān)關(guān)系如果我們所研究的事物或現(xiàn)象之間,存在著一定的數(shù)量關(guān)系,即當(dāng)一個(gè)或幾個(gè)相互聯(lián)系的變量取一定數(shù)值時(shí),與之相對(duì)應(yīng)的另一變量的值雖然不確定,但按某種規(guī)律在一定的范圍內(nèi)變化。我們把變量之間的這種不穩(wěn)定、不精確的變化關(guān)系稱為相關(guān)關(guān)系。一、相關(guān)關(guān)系的概念相關(guān)關(guān)系反映出變量之間雖然相互影響,其特點(diǎn)表現(xiàn)為:

第一,變量之間確實(shí)存在數(shù)量上的相互依存關(guān)系,即一個(gè)變量發(fā)展數(shù)量上的變化時(shí),另一個(gè)變量也會(huì)相應(yīng)地發(fā)生數(shù)量上的變化。如人的身高和體重,一般而言,身高者體重也重。

第二,變量之間依存關(guān)系的具體數(shù)值是不確定的,如具有同一身高的人,體重卻有差異。之所以會(huì)發(fā)生這種情況,是因?yàn)橛绊懽兞堪l(fā)生變化的因素不止一個(gè),還有許多其他因素。如人的體重除了與身高有關(guān)以外,還與飲食習(xí)慣、遺傳有關(guān)。

二、相關(guān)關(guān)系的種類從不同的分類角度進(jìn)行分析,相關(guān)關(guān)系可以有多種分類。1.根據(jù)相關(guān)程度的不同,相關(guān)關(guān)系可分為完全相關(guān)、不完全相關(guān)和無相關(guān)。二、相關(guān)關(guān)系的種類

當(dāng)一種現(xiàn)象的數(shù)量變化完全由另一種現(xiàn)象的數(shù)量變化所確定,這兩種現(xiàn)象間的關(guān)系為完全相關(guān)。例如,在價(jià)格保持不變的情況下,某種商品的銷售總額與其銷售量之間的關(guān)系總是成正比。在這種情況下,相關(guān)關(guān)系就是變成了函數(shù)關(guān)系。因此我們也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的一個(gè)特例。

二、相關(guān)關(guān)系的種類如果兩個(gè)現(xiàn)象之間互不影響,其數(shù)量變化各自獨(dú)立,我們稱其為不相關(guān)現(xiàn)象。例如,一般認(rèn)為學(xué)習(xí)成績(jī)的高低與天氣變化是不相關(guān)的。

二、相關(guān)關(guān)系的種類

如果兩種現(xiàn)象之間的關(guān)系介于不相關(guān)和完全相關(guān)之間,則稱其為不完全相關(guān)。通常我們看到的相關(guān)現(xiàn)象都屬于這種不完全相關(guān)。

二、相關(guān)關(guān)系的種類2.根據(jù)變量值變動(dòng)方向的趨勢(shì),相關(guān)關(guān)系可分為正相關(guān)和負(fù)相關(guān)。

正相關(guān)是指一個(gè)變量數(shù)值增加或減少時(shí),另一個(gè)變量的數(shù)值也隨之增加或減少,兩個(gè)變量變化方向相同。例如,技能水平隨著練習(xí)次數(shù)的增加而提高。二、相關(guān)關(guān)系的種類

負(fù)相關(guān)是指兩個(gè)變量變化方向相反,即隨著一個(gè)變量數(shù)值的增加,另一個(gè)變量的數(shù)值反而減少;或隨著一個(gè)變量數(shù)值的減少,另一個(gè)變量數(shù)值反而增加。例如,練習(xí)次數(shù)與遺忘量之間的相關(guān)關(guān)系。二、相關(guān)關(guān)系的種類3.從相關(guān)關(guān)系的不同形式來看,相關(guān)關(guān)系可分為線性相關(guān)與非線性相關(guān)。

線性相關(guān)也稱為直線相關(guān),它是指相關(guān)的變量中,如果自變量變動(dòng)時(shí),因變量大致地圍繞一條直線發(fā)生變動(dòng)。

非線性相關(guān)也稱為曲線相關(guān),它是指相關(guān)的變量中,如果自變量變動(dòng)時(shí),因變量大致地圍繞一條曲線發(fā)生變動(dòng)。

二、相關(guān)關(guān)系的種類4.根據(jù)研究變量的多少,可分為單相關(guān)、復(fù)相關(guān)。所研究的只是兩個(gè)變量之間的相關(guān)關(guān)系,可稱為單相關(guān)。例如,我們研究的是學(xué)生數(shù)學(xué)成績(jī)與物理成績(jī)之間的關(guān)系,這種相關(guān)關(guān)系就是單相關(guān)。

二、相關(guān)關(guān)系的種類

如果所研究的是一個(gè)變量與兩個(gè)或兩個(gè)以上的其它變量的相關(guān)關(guān)系,稱為復(fù)相關(guān)。例如,研究人的營(yíng)養(yǎng)與人的身高、體重之間的關(guān)系,學(xué)生的學(xué)習(xí)成績(jī)與其學(xué)習(xí)動(dòng)機(jī)、方法、習(xí)慣等方面的關(guān)系,都屬于復(fù)相關(guān)。

三、相關(guān)分析的作用

相關(guān)分析在教育研究中的作用是多方面的,具體概括如下:

1.判斷變量之間有無聯(lián)系

2.確定選擇相關(guān)關(guān)系的表現(xiàn)形式及相關(guān)分析方法3.把握相關(guān)關(guān)系的方向與密切程度

三、相關(guān)分析的作用4.相關(guān)分析不但可以描述變量之間的關(guān)系狀況,而且用來進(jìn)行預(yù)測(cè)。另外,相關(guān)分析還可以用來評(píng)價(jià)測(cè)量量具的信度、效度以及項(xiàng)目的區(qū)分度等。第二節(jié)相關(guān)關(guān)系的測(cè)定方法

一、相關(guān)表

相關(guān)表是一種統(tǒng)計(jì)表。它是直接根據(jù)現(xiàn)象之間的原始資料,將一變量的若干變量值表按從小到大的順序排列,并將另一變量的值與之對(duì)應(yīng)排列形成的統(tǒng)計(jì)表。表7-1為某公司A產(chǎn)品廣告費(fèi)與銷售收入相關(guān)表。

表7-1某公司A產(chǎn)品廣告費(fèi)與銷售收入相關(guān)表年份2001200220032004200520062007200820092010年廣告費(fèi)2234566677年銷售收入50515253535455565657

從表7-1中可以直觀地看出,銷售收入隨著廣告費(fèi)得增加而增長(zhǎng),二者之間存在著一定的正相關(guān)關(guān)系。

二、相關(guān)圖

相關(guān)圖也稱相關(guān)散點(diǎn)圖或散點(diǎn)圖,是將具有相關(guān)關(guān)系的兩個(gè)變量值描繪在坐標(biāo)圖上,以橫軸表示自變量x,縱軸表示因變量y,按兩變量的對(duì)應(yīng)值標(biāo)出坐標(biāo)點(diǎn)的分布狀況的統(tǒng)計(jì)圖。通過點(diǎn)的分布狀況,可以直觀地大致判斷出兩個(gè)現(xiàn)象之間存在的關(guān)系性質(zhì)和密切程度。根據(jù)表7-1繪制相關(guān)圖,如圖7-1所示。二、相關(guān)圖圖7-1A產(chǎn)品廣告費(fèi)與銷售收入相關(guān)圖三、相關(guān)系數(shù)

(一)相關(guān)系數(shù)的概念和計(jì)算公式

相關(guān)系數(shù)是反映變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)。現(xiàn)象間的相關(guān)關(guān)系有直線相關(guān)和曲線相關(guān),現(xiàn)象之間的特征不同,其統(tǒng)計(jì)指標(biāo)的名稱也有所不同:反映兩變量間線性相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)稱為相關(guān)系數(shù);反映兩變量間曲線相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)稱為非線性相關(guān)系數(shù)、曲線指數(shù);反映多元線性相關(guān)關(guān)系的統(tǒng)計(jì)指標(biāo)稱為復(fù)相關(guān)系數(shù)。

三、相關(guān)系數(shù)

線性的單相關(guān)系數(shù),是指在直線相關(guān)條件下,用以反映兩變量向線性相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)。相關(guān)系數(shù)具有如下特點(diǎn):相關(guān)系數(shù)有正負(fù)號(hào),反映正相關(guān)或負(fù)相關(guān);兩變量為對(duì)等關(guān)系,可以不區(qū)分自變量和因變量,其相關(guān)系數(shù)只有一個(gè)值。三、相關(guān)系數(shù)

相關(guān)系數(shù)的計(jì)算方法有若干種,常用的基本方法是由英國(guó)統(tǒng)計(jì)學(xué)家皮爾遜(KarlPearson)提出的積差法。三、相關(guān)系數(shù)積差法對(duì)相關(guān)系數(shù)定義為:兩變量的協(xié)方差與兩變量各自標(biāo)準(zhǔn)差乘積之比。相關(guān)系數(shù)通常用r表示,其計(jì)算公式為:

三、相關(guān)系數(shù)上式中:

,是變量x和y之間的協(xié)方差;,是變量x的標(biāo)準(zhǔn)差;,是變量y的標(biāo)準(zhǔn)差。三、相關(guān)系數(shù)(二)相關(guān)系數(shù)的特點(diǎn)1.r的取值介于-1與1之間,r的取值范圍是[-1,1]。2.在大多數(shù)情況下,0<|r|<1,即X與Y的樣本觀測(cè)值之間存在著一定的線性關(guān)系,當(dāng)r>0時(shí),X與Y為正相關(guān),當(dāng)r<0時(shí),X與Y為負(fù)相關(guān)。

三、相關(guān)系數(shù)|r|的數(shù)值愈接近于1,表示x與y直線相關(guān)程度愈高;反之,|r|的數(shù)值愈接近于0,表示x與y直線相關(guān)程度愈低。通常判斷的標(biāo)準(zhǔn)是:|r|<0.3稱為微弱相關(guān),0.3≤|r|<0.5稱為低度相關(guān),0.5≤|r|<0.8稱為顯著、中度相關(guān),0.8≤|r|<1稱為高度相關(guān)或強(qiáng)相關(guān)。

三、相關(guān)系數(shù)3.如果|r|=1,則表明X與Y完全線性相關(guān),當(dāng)r=1時(shí),稱為完全正相關(guān),而r=-1時(shí),稱為完全負(fù)相關(guān)。4.r是對(duì)變量之間線性相關(guān)關(guān)系的度量。r=0只是表明兩個(gè)變量之間不存在線性關(guān)系,它并不意味著X與Y之間不存在其他類型的關(guān)系。四、Excel在相關(guān)分析中的運(yùn)用1.相關(guān)圖的繪制利用Excel中的圖表繪制功能繪制散點(diǎn)圖,以圖7-1為例,具體操作步驟如下:第一步,單擊Excel圖表向?qū)Вɑ騿螕舨迦耄x擇“圖表”選項(xiàng)),在“圖表類型”中選擇“XY散點(diǎn)圖”,如圖8-2所示。圖7-2XY散點(diǎn)圖對(duì)話框

四、Excel在相關(guān)分析中的運(yùn)用第二步,在“子圖表類型”中選擇第一種散點(diǎn)圖,并單擊“下一步”按鈕,按照?qǐng)D表向?qū)нM(jìn)行操作,單擊“完成”按鈕,并對(duì)圖形進(jìn)行修飾編輯,最后得到如圖8-1所示A產(chǎn)品廣告費(fèi)與銷售收入散點(diǎn)圖。

四、Excel在相關(guān)分析中的運(yùn)用2.相關(guān)系數(shù)的計(jì)算Excel中提供“CORREL”函數(shù)計(jì)算相關(guān)系數(shù)。此外,也可以利用Excel的數(shù)據(jù)分析工具。

四、Excel在相關(guān)分析中的運(yùn)用(1)“CORREL”函數(shù)以表7-1中的數(shù)據(jù)為例,介紹用“CORREL”函數(shù)計(jì)算相關(guān)系數(shù)的操作步驟如下:第一步,建立Excel數(shù)據(jù)庫。第二步,打開“CORREL”對(duì)話框。單擊“插入”選擇“函數(shù)”對(duì)話框,在類別中選擇“統(tǒng)計(jì)”,選擇“CORREL”函數(shù),打開“CORREL”對(duì)話框。

四、Excel在相關(guān)分析中的運(yùn)用第三步,對(duì)話框設(shè)置。在“Array1”和“Array2”中分別輸入廣告費(fèi)和銷售收入數(shù)據(jù),如圖8-3所示。單擊“確定”按鈕,得到廣告費(fèi)和銷售收入的相關(guān)系數(shù)為0.955,可以判斷廣告費(fèi)和銷售收入之間是高度正相關(guān)。

圖7-3“函數(shù)參數(shù)”對(duì)話框設(shè)置

四、Excel在相關(guān)分析中的運(yùn)用(2)“相關(guān)系數(shù)”數(shù)據(jù)分析工具第一步,數(shù)據(jù)庫建立。

“相關(guān)系數(shù)”數(shù)據(jù)分析工具的數(shù)據(jù)需要按列計(jì)算,所以,將廣告費(fèi)與銷售收入按列排列輸入Excel表格。第二步,打開“相關(guān)系數(shù)”對(duì)話框。打開“工具”,單擊“數(shù)據(jù)分析”,選擇“相關(guān)系數(shù)”,打開“相關(guān)系數(shù)”對(duì)話框,如圖8-4所示。圖7-4“相關(guān)系數(shù)”對(duì)話框

四、Excel在相關(guān)分析中的運(yùn)用設(shè)置對(duì)話框,輸入數(shù)據(jù)區(qū)域,在“輸出選項(xiàng)”中任選一空單元格,單擊“確定”按鈕,得到相關(guān)系數(shù),如圖8-5所示,可知廣告費(fèi)和銷售收入的相關(guān)系數(shù)為0.955,與“CORREL”工具計(jì)算結(jié)果一致。圖8-5“相關(guān)系數(shù)”數(shù)據(jù)分析工具計(jì)算結(jié)果第三節(jié)一元線性回歸分析

一、一元線性回歸分析綜述(一)回歸分析的概念與特點(diǎn)(二)回歸分析的分類(三)回歸分析的內(nèi)容(四)相關(guān)分析與回歸分析比較

(一)回歸分析的概念與特點(diǎn)1.回歸分析的概念

回歸分析是指對(duì)具有相關(guān)關(guān)系的變量,依據(jù)其關(guān)系形態(tài)、選擇一個(gè)合適的數(shù)學(xué)模型,用來近似的表示變量之間數(shù)量平均變化關(guān)系的一種統(tǒng)計(jì)方法。它可將相關(guān)現(xiàn)象間不確定的、不規(guī)則的數(shù)量關(guān)系一般化、規(guī)則化。采用的方法是擬合直線或曲線,用這種直線或曲線來代表現(xiàn)象之間的一般數(shù)量關(guān)系。

(一)回歸分析的概念與特點(diǎn)2.回歸分析的特點(diǎn)(1)回歸分析的兩個(gè)變量是非對(duì)等關(guān)系。(2)回歸分析中,因變量是隨機(jī)變量,自變量是可控變量。(二)回歸分析的分類按統(tǒng)計(jì)研究對(duì)象和目的的不同,回歸分析有不同的分類。1.一元回歸與多元回歸根據(jù)自變量的個(gè)數(shù)不同,可分為一元分析和多元回歸分析。當(dāng)只有一個(gè)自變量時(shí),稱為一元回歸分析(也稱簡(jiǎn)單回歸分析);當(dāng)自變量有兩個(gè)或多個(gè)時(shí),稱為多元回歸分析。(二)回歸分析的分類2.線性回歸分析和非線性回歸分析根據(jù)變量間相互關(guān)系的形態(tài)不同,可分線性回歸分析和非線性回歸分析。根據(jù)回歸分析的方法,得出的數(shù)學(xué)表達(dá)式稱為回歸方程(回歸模型)。它有多種形式,可以是直線方程,也可以是曲線方程。若擬合的是直線方程則為線性回歸分析;擬合曲線方程,則為非線性回歸分析。

(二)回歸分析的分類

用回歸方程來表明兩個(gè)變量之間線性相互關(guān)系的方程式,稱為一元線性回歸方程(模型),這種分析方法稱為一元線性回歸分析,也稱簡(jiǎn)單線性回歸分析。(三)回歸分析的內(nèi)容

回歸分析是指將具有相關(guān)關(guān)系現(xiàn)象的變量轉(zhuǎn)變?yōu)楹瘮?shù)關(guān)系,即通過建立變量間的熟悉模型來研究變量間相關(guān)關(guān)系的一種統(tǒng)計(jì)分析方法。具體內(nèi)容包括兩個(gè)方面:

(三)回歸分析的內(nèi)容1.確定現(xiàn)象之間相關(guān)關(guān)系的數(shù)學(xué)模型回歸方程式。2.測(cè)定數(shù)學(xué)模型的擬合精度。統(tǒng)計(jì)學(xué)上一般通過計(jì)算估計(jì)標(biāo)準(zhǔn)誤差測(cè)定所建模型的精確度。(四)相關(guān)分析與回歸分析比較相關(guān)分析:相關(guān)分析是研究現(xiàn)象之間是否存在某種依存關(guān)系,并對(duì)具體有依存關(guān)系的現(xiàn)象探討其相關(guān)方向以及相關(guān)程度。回歸分析:就是對(duì)具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上變量之間數(shù)量變化的一般關(guān)系進(jìn)行測(cè)定,確立一個(gè)相應(yīng)的數(shù)學(xué)表達(dá)式,以便從一個(gè)已知量來推測(cè)另一個(gè)未知量,為估算預(yù)測(cè)提供一個(gè)重要的方法。二者的區(qū)別主要體現(xiàn)在以下三個(gè)方面:1.在相關(guān)分析中涉及的變量不存在自變量和因變量的劃分問題,變量之間的關(guān)系是對(duì)等的;而在回歸分析中,則必須根據(jù)研究對(duì)象的性質(zhì)和研究分析的目的,對(duì)變量進(jìn)行自變量和因變量的劃分。因此,在回歸分析中,變量之間的關(guān)系是不對(duì)等的。

(四)相關(guān)分析與回歸分析比較2.在相關(guān)分析中所有的變量都必須是隨機(jī)變量;而在回歸分析中,自變量是給定的,因變量才是隨機(jī)的,即將自變量的給定值代入回歸方程后,所得到的因變量的估計(jì)值不是惟一確定的,而會(huì)表現(xiàn)出一定的隨機(jī)波動(dòng)性。(四)相關(guān)分析與回歸分析比較3.相關(guān)分析主要是通過一個(gè)指標(biāo)即相關(guān)系數(shù)來反映變量之間相關(guān)程度的大小,由于變量之間是對(duì)等的,因此相關(guān)系數(shù)是惟一確定的。而在回歸分析中,對(duì)于互為因果的兩個(gè)變量(如人的身高與體重,商品的價(jià)格與需求量),則有可能存在多個(gè)回歸方程。

(四)相關(guān)分析與回歸分析比較

需要指出的是,變量之間是否存在“真實(shí)相關(guān)”,是由變量之間的內(nèi)在聯(lián)系所決定的。相關(guān)分析和回歸分析只是定量分析的手段,通過相關(guān)分析和回歸分析,雖然可以從數(shù)量上反映變量之間的聯(lián)系形式及其密切程度,但是無法準(zhǔn)確判斷變量之間內(nèi)在聯(lián)系的存在與否,也無法判斷變量之間的因果關(guān)系。因此,在具體應(yīng)用過程中,一定要始終注意把定性分析和定量分析結(jié)合起來,在準(zhǔn)確的定性分析的基礎(chǔ)上展開定量分析。二、一元線性回歸方程的建立與應(yīng)用

(一)一元線性回歸模型(二)一元線性回歸模型的預(yù)測(cè)應(yīng)用(一)一元線性回歸模型

在相關(guān)圖中,如果自變量與因變量對(duì)應(yīng)的散布點(diǎn)近似為直線,或計(jì)算出的相關(guān)系數(shù)具有顯著的直線相關(guān)關(guān)系時(shí),都可擬合一條回歸直線。一元線性回歸分析有下列特點(diǎn):

(一)一元線性回歸模型1.兩個(gè)變量之間不是對(duì)等關(guān)系,進(jìn)行回歸分析時(shí),應(yīng)先根據(jù)研究目的,確定自變量和因變量。2.回歸方程的作用在于給出自變量的值估計(jì)推算因變量的值,回歸方程表明變量間的變動(dòng)關(guān)系。(一)一元線性回歸模型3.回歸方程中自變量的系數(shù)稱為回歸系數(shù),回歸系數(shù)有正負(fù)號(hào),正號(hào)表明回歸方程配合的是一條上升的直線,負(fù)號(hào)表明回歸方程配合的是一條下降的直線。4.回歸方程要求自變量是給定的數(shù)值,因變量是隨機(jī)變量。

假設(shè)有兩個(gè)現(xiàn)象分別表現(xiàn)為自變量x和因變量y,配合一元線性回歸方程:

式中——因變量y的理論估計(jì)值,是被解釋變量;

x——自變量x的實(shí)際值,是解釋變量;

a、b——待定參數(shù)。其幾何意義是a是直線方程的截距,b是斜率。其經(jīng)濟(jì)意義是a是當(dāng)x為零時(shí)y的估計(jì)值,b是當(dāng)x每變動(dòng)一個(gè)單位時(shí),y平均變動(dòng)的數(shù)量,b也叫回歸系數(shù)。當(dāng)b的符號(hào)為正時(shí),表示兩個(gè)變量正相關(guān),當(dāng)b的符號(hào)為負(fù)時(shí),表示兩個(gè)變量負(fù)相關(guān)。

(一)一元線性回歸模型

數(shù)學(xué)上已證明符合“離差平方和最小”的直線是最合適的。在這條直線上,據(jù)以推算的理論值,與實(shí)際值離差的平方和,比其他任何直線推算的數(shù)值都要小。這種決定直線方程的方法,稱為最小二乘法。

(一)一元線性回歸模型用表示對(duì)的離差平方

和,則:(一)一元線性回歸模型將直線方程代入上式,得:(一)一元線性回歸模型為使具有最大值,必須使其對(duì)a、b的偏導(dǎo)數(shù)等于0,令:

(一)一元線性回歸模型整理得估計(jì)參數(shù)a、b的標(biāo)準(zhǔn)方程組:

(一)一元線性回歸模型由方程可得a、b的解:

(一)一元線性回歸模型再將求出的a、b代入線性方程,就得到直線回歸分析模型:

(二)一元線性回歸模型的預(yù)測(cè)應(yīng)用【例7-1】表7-2為我國(guó)20年以來國(guó)內(nèi)生產(chǎn)總值(億元)與居民人均消費(fèi)水平(億元)的相關(guān)資料,若2007年國(guó)內(nèi)生產(chǎn)總值為24.66萬億元,試用一元線性回歸預(yù)測(cè)2007年居民人均最終消費(fèi)額。表8-2國(guó)內(nèi)生產(chǎn)總值與居民最終消費(fèi)資料年份國(guó)內(nèi)生產(chǎn)總值/億元人均最終消費(fèi)/億元1987198819891990199119921993199419951996199719981999200020012002200320042005200612058.615042.816992.318667.821781.526923.535333.948197.960793.771176.678973.084402.389677.199214.6109655.2120332.7135822.8159878.3183867.9210871.0565714788833932111613931833235527893002315933463632386941064411492554636111(二)一元線性回歸模型的預(yù)測(cè)應(yīng)用解:(1)首先列示計(jì)算表(見表7-3一元線性回歸模型參數(shù)計(jì)算表)年份國(guó)內(nèi)生產(chǎn)總值x/億元人均最終消費(fèi)y/億元xy1987198819891990199119921993199419951996199719981999200020012002200320042005200612058.615042.816992.318667.821781.526923.535333.948197.960793.771176.678973.084402.389677.199214.6109655.2120332.7135822.8159878.3183867.9210871.05657147888339321116139318332355278930023159334636323869410644114925546361116813109.0010740559.2013389932.4015550277.4020300358.0030046626.0049220122.7088346750.70143169163.50198511537.40237076946.00266626865.70300059576.60360347427.20424255968.80494086066.20599114370.80787400627.501004470337.701288632681.00

145409833.96226285831.84288738259.29348486756.84474433742.25724874852.251248484489.212323037564.413695873959.695066108387.566236734729.007123748245.298041982264.419843536853.1612024262887.0414479958689.2918447832999.8425561070810.8933807404650.4144466578641.00合計(jì)1599663.4

55342.0

6338159303.80

194574844447.63

(二)一元線性回歸模型的預(yù)測(cè)應(yīng)用(2)計(jì)算a、b的參數(shù):

=(二)一元線性回歸模型的預(yù)測(cè)應(yīng)用a=471.58(二)一元線性回歸模型的預(yù)測(cè)應(yīng)用預(yù)測(cè)模型為:

=471.58+0.0287三、一元線性回歸估計(jì)標(biāo)準(zhǔn)誤差

建立的回歸模型是對(duì)客觀情況的一般描述,而作為變化根據(jù)的自變量,很難完全解釋因變量的變動(dòng)。因此,在運(yùn)用已建立的回歸模型進(jìn)行預(yù)測(cè)時(shí),還需要測(cè)算估計(jì)標(biāo)準(zhǔn)誤差。

(一)離差總平方和的分解

在直線回歸中,因變量的估計(jì)值的大小與實(shí)際觀察值是不等的,實(shí)際觀察值y的大小圍繞其平均值上下波動(dòng),y的這種波動(dòng)現(xiàn)象稱為變差。變差產(chǎn)生的原因有兩個(gè)方面:一方面受自變量x的影響,x取值不同會(huì)引起y值的不同;另一方面受其他因素的(包括未知的因素和偶然的因素)影響。

(一)離差總平方和的分解

對(duì)每個(gè)觀察值來說,變差的大小可通過離差(-)來表示,我們要觀察的不是某一個(gè)變量值與估計(jì)值的誤差,而是整體的差別情況,則全部n個(gè)觀察值的總變差可由這些離差的平方和表示。(二)一元線性回歸模型的預(yù)測(cè)應(yīng)用(3)預(yù)測(cè):若2007年國(guó)內(nèi)生產(chǎn)總值為24.66萬億元,則

(元)(一)離差總平方和的分解假定給出變量和的樣本觀測(cè)值(,),并通過最小二乘法得出樣本回歸直線。的某個(gè)觀測(cè)值與樣本均值的總離差(-)(一)離差總平方和的分解由此推導(dǎo)出下式:

(一)離差總平方和的分解

是實(shí)際觀察值與樣本均值之差的平方和,反映樣本資料中因變量的總變差,稱為總離差平方和。是樣本回歸線上的估計(jì)值與樣本均值之差的平方和,反映因變量變異中由回歸直線解釋的部分,稱為回歸平方和或解釋平方和。

(一)離差總平方和的分解

是實(shí)際觀察值與估計(jì)值之差的平方和,反映因變量變異中不能由回歸直線解釋的部分,稱為殘差平方和。上述總變差的分解在相關(guān)與回歸分析中很重要,通過這種分解可以把各項(xiàng)影響因素的具體影響進(jìn)行估算。

(二)估計(jì)標(biāo)準(zhǔn)誤差1.估計(jì)標(biāo)準(zhǔn)誤差的概念

上述總離差中,回歸平方和反映的是樣本回歸線上的估計(jì)值與樣本均值之差的平方和,殘差平方和是實(shí)際觀測(cè)值與估計(jì)值之差的平方和。當(dāng)利用線性回歸方程和給定的自變量預(yù)測(cè)值時(shí),得到的與實(shí)際值的誤差稱為估計(jì)標(biāo)準(zhǔn)誤差,也稱回歸估計(jì)標(biāo)準(zhǔn)誤差。

(二)估計(jì)標(biāo)準(zhǔn)誤差它是衡量回歸估計(jì)精確度高低或回歸方程代表性大小的統(tǒng)計(jì)分析指標(biāo)。估計(jì)標(biāo)準(zhǔn)誤差說明理論值(回歸線)的代表性,若估計(jì)標(biāo)準(zhǔn)誤差小,表明回歸方程準(zhǔn)確性高,代表性大;反之,估計(jì)不夠準(zhǔn)確,代表性小。(二)估計(jì)標(biāo)準(zhǔn)誤差2.估計(jì)標(biāo)準(zhǔn)誤差的計(jì)算方法(1)定義公式估計(jì)標(biāo)準(zhǔn)誤差,是指因變量實(shí)際值與估計(jì)值離差的平均數(shù)。統(tǒng)計(jì)上定義殘差平方和除以自由度得到的商的平方根為估計(jì)標(biāo)準(zhǔn)誤差,公式為:

(二)估計(jì)標(biāo)準(zhǔn)誤差式中——估計(jì)標(biāo)準(zhǔn)誤差;

——自由度,因在一元線性回歸方程中,計(jì)算兩個(gè)參數(shù)a和b,受到兩個(gè)方程的約束,失去了兩個(gè)自由度。

(二)估計(jì)標(biāo)準(zhǔn)誤差(2)簡(jiǎn)化公式估計(jì)標(biāo)準(zhǔn)誤差公式的含義比較明確,其計(jì)算過程表明了估計(jì)標(biāo)準(zhǔn)誤差是用平均誤差來表示的,但計(jì)算過程比較繁瑣。如果已經(jīng)計(jì)算出回歸直線的參數(shù)、之值,可直接利用已有的數(shù)據(jù)計(jì)算。其簡(jiǎn)化公式如下:

(二)估計(jì)標(biāo)準(zhǔn)誤差現(xiàn)采用表8-3的有關(guān)資料為例,說明回歸估計(jì)誤差的計(jì)算方法。根據(jù)表8-4,按照定義公式計(jì)算標(biāo)準(zhǔn)誤差,得

(元)(二)估計(jì)標(biāo)準(zhǔn)誤差再按照簡(jiǎn)化公式已知:,,結(jié)合表8-4,得

=234.23(元)

表8-4標(biāo)準(zhǔn)誤差計(jì)算表

年份

1987198819891990199119921993199419951996199719981999200020012002200320042005200612058.615042.816992.318667.821781.526923.535333.948197.960793.771176.678973.084402.389677.199214.6109655.2120332.7135822.8159878.3183867.9210871.05657147888339321116139318332355278930023159334636323869410644114925546361118189039591007109712441486185522162514273828943045331936193925437050605749652464009357212924130276272251638486494841932175625696967022590601979696250032761168118225817961705696813109.0010740559.2013389932.4015550277.4020300358.0030046626.0049220122.7088346750.70143169163.50198511537.40237076946.00266626865.70300059576.60360347427.20424255968.80494086066.20599114370.80787400627.501004470337.701288632681.0031922550979662094469388986862412454561940449335988955460257778521901200499792811119571613191424149691611685923619456921242556252984436937344321合計(jì)

1599663.4

55342.0

55341.9

1002958

6338159303.8

208990876

(二)估計(jì)標(biāo)準(zhǔn)誤差

本例的計(jì)算中兩種方法稍有差距,屬于計(jì)算誤差。計(jì)算表明20年以來,人均最終消費(fèi)的估計(jì)值與實(shí)際值的平均誤差為236.05萬元(或234.23萬元)。由此可知,只有將回歸估計(jì)值與估計(jì)標(biāo)準(zhǔn)誤差結(jié)合起來使用才更有意義。(二)估計(jì)標(biāo)準(zhǔn)誤差3.估計(jì)標(biāo)準(zhǔn)誤差與相關(guān)系數(shù)

相關(guān)系數(shù)是說明現(xiàn)象間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo),而估計(jì)標(biāo)準(zhǔn)誤差是說明回歸估計(jì)誤差的大小及回歸方程的代表性高低的統(tǒng)計(jì)分析指標(biāo)。這兩個(gè)指標(biāo)之間存在著密切的聯(lián)系,表現(xiàn)在數(shù)量上,兩者存在相互的推算關(guān)系。

(二)估計(jì)標(biāo)準(zhǔn)誤差兩者的換算公式為:

(二)估計(jì)標(biāo)準(zhǔn)誤差

公式中與的相互換算公式的意義在于:從互相聯(lián)系的兩個(gè)公式中可以看出與的變化時(shí)相反的。當(dāng)越大時(shí),就越小,這時(shí)變量間的相關(guān)密切程度較高,回歸直線的代表性就較大;當(dāng)越小時(shí),就越大,這時(shí)變量間相關(guān)關(guān)系的密切程度就較低,回歸直線的代表性就較小。

(二)估計(jì)標(biāo)準(zhǔn)誤差

在實(shí)際的相關(guān)分析中,一般不常用這種方法計(jì)算相關(guān)系數(shù),因?yàn)檫@種計(jì)算方法存在兩個(gè)不足:其一是需要先求出回歸直線方程,計(jì)算出估計(jì)標(biāo)準(zhǔn)誤差,才能求得相關(guān)系數(shù)。從一般的認(rèn)識(shí)程序來看,只有相關(guān)關(guān)系較密切的前提下,配合回歸分析方程才有意義;如果相關(guān)關(guān)系不夠密切,回歸分析就沒有進(jìn)行的必要,因而要求先計(jì)算相關(guān)系數(shù)來判斷相關(guān)關(guān)系的密切程度。其二是以這種方法計(jì)算出的r,難以判斷是正相關(guān)還是負(fù)相關(guān)。

四、Excel在回歸分析中的運(yùn)用Excel在回歸分析中的應(yīng)用主要是利用回歸分析工具配合回歸方程,并進(jìn)行顯著性檢驗(yàn)和回歸預(yù)測(cè)。以表8-1數(shù)據(jù)為例進(jìn)行說明。第一步,在Excel中輸入數(shù)據(jù)。第二步,設(shè)置“回歸”對(duì)話框。

四、Excel在回歸分析中的運(yùn)用在“工具”菜單中選擇“數(shù)據(jù)分析”,從其對(duì)話框的“分析工具”列表中單擊“回歸”,打開“回歸”對(duì)話框。在“回歸”對(duì)話框中,輸入y值的區(qū)域“B3:B12”和x值的區(qū)域“A3:A12”。在輸出區(qū)域”任選一空單元格“C2”,如圖8-7所示。

圖8-7“回歸”對(duì)話框四、Excel在回歸分析中的運(yùn)用在“回歸”對(duì)話框中,可根據(jù)對(duì)話框中的內(nèi)容進(jìn)行選擇。(1)若要求回歸直線從原點(diǎn)(0)開始,可單擊“常數(shù)為零”復(fù)選框。(2)若要去改變概率保證程度(系數(shù)默認(rèn)為95%),可單擊“置信度”復(fù)選框,在其右側(cè)文本框中輸入指定的概率。

(3)若要求輸出殘差表盒標(biāo)準(zhǔn)殘差,可單擊“殘差”、“標(biāo)準(zhǔn)殘差”復(fù)選框。(4)單擊“殘差圖”、“線性擬合圖”、“正態(tài)概率圖”3個(gè)復(fù)選框,可輸出相應(yīng)的統(tǒng)計(jì)圖。本例

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論