《統(tǒng)計(jì)學(xué)》教案第七章 相關(guān)關(guān)系分析法_第1頁
《統(tǒng)計(jì)學(xué)》教案第七章 相關(guān)關(guān)系分析法_第2頁
《統(tǒng)計(jì)學(xué)》教案第七章 相關(guān)關(guān)系分析法_第3頁
《統(tǒng)計(jì)學(xué)》教案第七章 相關(guān)關(guān)系分析法_第4頁
《統(tǒng)計(jì)學(xué)》教案第七章 相關(guān)關(guān)系分析法_第5頁
已閱讀5頁,還剩35頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

第七章相關(guān)關(guān)系分析法

(相關(guān)與回歸)

教學(xué)內(nèi)容:

1.相關(guān)關(guān)系的概念、種類、相關(guān)關(guān)系分析的主要內(nèi)容

2.簡單線形相關(guān)分析方法

3.簡單直線回歸方程的配合方法

4.判定系數(shù).估計(jì)標(biāo)準(zhǔn)誤差的含義,計(jì)犀及其應(yīng)用

5.曲線回歸方程、多元線性回歸方程的配合方法

6.其它相關(guān)系數(shù)的含義、計(jì)算及應(yīng)用場合

教學(xué)重點(diǎn):

1.簡單線形相關(guān)分析方法

2.簡單直線回歸方程的配合方法

3.判定系數(shù)、估計(jì)標(biāo)準(zhǔn)誤差的含義、計(jì)算及其應(yīng)用

教學(xué)難點(diǎn):相關(guān)系數(shù)的計(jì)算、回歸方程的配合、估計(jì)標(biāo)準(zhǔn)誤差的計(jì)算及其應(yīng)用.

授課學(xué)時(shí):7學(xué)時(shí)

第一節(jié)相關(guān)關(guān)系分析概述

一、相關(guān)關(guān)系的的概念

現(xiàn)實(shí)中,任何現(xiàn)象的存在都不是孤立的,它們是互相聯(lián)系,彼此制約的。

例如在家庭收入和消費(fèi)支出之間,施肥量與糧食收獲量之間,廣告費(fèi)支出與商品

銷售額之間等等,無不存在著一定的關(guān)系?,F(xiàn)象之間的相互關(guān)系歸納起來可以區(qū)

分為兩種不同的類型:一種是函數(shù)關(guān)系(確定性關(guān)系),另一種是相關(guān)關(guān)系(非

確定性關(guān)系)。

函數(shù)關(guān)系:指變量之間存在著嚴(yán)格的依存關(guān)系,在這種關(guān)系中,當(dāng)自變量

取定一個(gè)數(shù)值時(shí),因變量會(huì)有一個(gè)完全確定的值和它對(duì)應(yīng)。如圖1-1所示。

或?qū)τ谀骋蛔兞康拿恳粋€(gè)數(shù)值,另一變量都會(huì)有唯一確定的值與之相對(duì)應(yīng),

并且這種關(guān)系可用一個(gè)數(shù)學(xué)表達(dá)式反映出來。

如圓的面積二圓周率X半徑2

距離二速度X時(shí)間(在勻速條件下)

銷售額=銷售量X銷售價(jià)格(價(jià)格一定時(shí))

V

圖1-1

相關(guān)關(guān)系:指現(xiàn)象之間確實(shí)存在的、但關(guān)系值不固定的相互依存關(guān)系?;颥F(xiàn)

象之間客觀存在的不確定的數(shù)量依存關(guān)系。

即變量之間確實(shí)存在著一定的相互關(guān)系,在這種關(guān)系中,當(dāng)一個(gè)現(xiàn)象發(fā)生

數(shù)量變化時(shí),另一現(xiàn)象也相應(yīng)地發(fā)生數(shù)量變化,但其關(guān)系值是不固定的(不唯一

的),一個(gè)變量取定一個(gè)值時(shí),另一個(gè)變量會(huì)有若干數(shù)值與之相對(duì)應(yīng),這些數(shù)值

之間表現(xiàn)出一定的波動(dòng)性,但又總是圍繞著它『:的平均數(shù)而上下波動(dòng)的。如圖

1-2所示。

例如,糧食畝產(chǎn)量與施肥量之間存在一定的關(guān)系,但在同樣的施肥量下,

每畝糧食產(chǎn)量可能出現(xiàn)不同的數(shù)值,并不存在嚴(yán)格的依存關(guān)系。因?yàn)閷?duì)每畝耕地

的產(chǎn)量來說,它不僅和施肥量有關(guān),而且還取決于種子的品質(zhì),密植程度,耕作

深度,工地的貧瘠程度,降雨量等,這就造成了在同樣的施肥量下,其畝產(chǎn)量也

并不完全相等。畝產(chǎn)量與施肥量的這種關(guān)系稱為相關(guān)關(guān)系。

又如,某種日用品的銷售量與當(dāng)?shù)鼐用竦娜丝跀?shù)有一定的關(guān)系,人口愈多,

銷售量越大,但不能說兩個(gè)地區(qū)的人口相等,銷售量也就相等,這里很難給出一

個(gè)確切的關(guān)系,日用品的銷售量還和居民的收入水平、消費(fèi)水平、消費(fèi)習(xí)慣等有

關(guān)。這種日用品的銷售量與居民人口數(shù)之間的關(guān)系也屬于相關(guān)關(guān)系。

身高與體重之間的關(guān)系是非常密切的,但身高1.75米的人可以表現(xiàn)為許多

不同的體重等。

廣告費(fèi)投資與商品銷售量之間有一定的關(guān)系,但是,在廣告費(fèi)投入相等的情

況下,商品銷售量不一定相等。

在各種生產(chǎn)活動(dòng)和經(jīng)濟(jì)過程中,許多經(jīng)濟(jì)的、技術(shù)的因素之間都存在著這

種相關(guān)關(guān)系。

從程度上、數(shù)量上、種類上分析現(xiàn)象之間相關(guān)關(guān)系的理論和方法就稱為相

關(guān)關(guān)系分析法。

二、相關(guān)關(guān)系的種類

現(xiàn)象之間的相互關(guān)系是很復(fù)雜的。它們各以不同的方向,不同的程度相互

作用著,并表現(xiàn)出不同的類型。

(一)按相關(guān)的程度分為:完全相關(guān)、不完全相關(guān)和不相關(guān)

完全相關(guān):兩種現(xiàn)象之間,其中一個(gè)現(xiàn)象的數(shù)量變化完全由另一個(gè)現(xiàn)象的

數(shù)量變化所確定,則這兩種現(xiàn)象之間的關(guān)系為完全相關(guān)。在這種情況下,相關(guān)關(guān)

系即成為函數(shù)關(guān)系,也可以說函數(shù)關(guān)系是相關(guān)關(guān)系的個(gè)特例。

如圓面積二n?

銷售額二銷售量X價(jià)格(價(jià)格固定)

不相關(guān):若兩種現(xiàn)象之間彼此互不影響,其數(shù)量變化各自獨(dú)立,則為不相

關(guān)?;颍阂环N現(xiàn)象的數(shù)量變化完全不受另一現(xiàn)象數(shù)量變化的影響,則稱這兩種現(xiàn)

象為不相關(guān)。如原油儲(chǔ)存量與生產(chǎn)工人的出勤率是無關(guān)的,棉紗纖維長度與工人

人數(shù)多少是無關(guān)的等。

不完全相關(guān):若兩種現(xiàn)象之間的關(guān)系介于完全相關(guān)和不相關(guān)之間,則稱其

為不完全相關(guān)。若現(xiàn)象之間的相關(guān)點(diǎn)分布遠(yuǎn)離函數(shù)關(guān)系,表明兩變量之間的相關(guān)

關(guān)系很小;若兩個(gè)變量之間的分布很接近于函數(shù)關(guān)系,就說明兩個(gè)變量之間的相

關(guān)關(guān)系很密切。

一般的相關(guān)現(xiàn)象都是指這種不完全相關(guān),它是相關(guān)關(guān)系分析的研究對(duì)象。

(二)、按變量之間相關(guān)關(guān)系的方r正相關(guān)

向分(按相關(guān)的性質(zhì)分)[負(fù)相關(guān)

正相關(guān):當(dāng)一個(gè)變量x的值增加(或減少),另一個(gè)變量y的值也隨之增加

(或減少),二者是同方向變動(dòng)的,這種相關(guān)關(guān)系成為正相關(guān)。

或:兩個(gè)相關(guān)現(xiàn)象之間,當(dāng)一種現(xiàn)象的數(shù)量由?。ù螅┳兇螅ㄐ。硪粋€(gè)

現(xiàn)象的數(shù)量也相應(yīng)地由?。ù螅┳兇螅ㄐ。瑒t稱其為正相關(guān)c

例如,家庭的消費(fèi)支出隨著收入的增加而增加;隨著技術(shù)水平的提高,產(chǎn)品

合格率也不斷提高;收入水平(y)與受教育程度(心之間的關(guān)系;商品的消費(fèi)量(y)

與居民收入(力之間的關(guān)系等。

負(fù)相關(guān):當(dāng)一個(gè)變量x的值增加(減少)時(shí),另一個(gè)變量y的值隨之減少

(增加),二者是反方向變動(dòng)的,這種相關(guān)關(guān)系成為負(fù)相關(guān)。

或當(dāng)一-種現(xiàn)象的數(shù)量由小(大)變大(小),而另一種現(xiàn)象的數(shù)量相反地由

大(小)變?。ù螅瑒t稱其為負(fù)相關(guān)。

例,商品流轉(zhuǎn)的規(guī)模越大,單位流通費(fèi)用越低;勞動(dòng)生產(chǎn)率水平提高,單位

產(chǎn)品成本隨之下降;樣本的單位數(shù)越多,抽樣誤差愈?。晃飪r(jià)越高與消費(fèi)量越少

MrMs:

-rfo

正相關(guān)、負(fù)相關(guān)若用散點(diǎn)圖表示,分別如圖1-3中的(1)、(2)o

(1)

圖1-3

直線相關(guān)

(三)按相關(guān)的形式分

曲線相關(guān)

直線相關(guān):當(dāng)一個(gè)變量發(fā)生增減變動(dòng)時(shí),另一變量隨之發(fā)生大體均等的增減

變動(dòng),在圖形上這種變動(dòng)關(guān)系近似地表現(xiàn)為一條直線(y增長量大致相同)。

或一種現(xiàn)象的一個(gè)數(shù)值和另一種現(xiàn)象相應(yīng)的數(shù)值,在平面坐標(biāo)系中確定為一

個(gè)點(diǎn),稱為散點(diǎn)(或相關(guān)點(diǎn)),若相關(guān)點(diǎn)大致分布在一條直線的周圍,則為直線

相關(guān)。如圖1-3中的(1)、(2)

曲線相關(guān):當(dāng)一個(gè)變量發(fā)生變動(dòng)時(shí),另一變量的值也隨之發(fā)生變動(dòng),但這

種變動(dòng)是不均等的,在圖形上,其觀察點(diǎn)分布在各種不同的曲線周圍?;颥F(xiàn)象相

關(guān)點(diǎn)的分布表現(xiàn)為各種不同的曲線形式,如圖1-4中(3)、(4)0

(四)按研究變量J單相關(guān)(一元相關(guān))

的多少分[復(fù)相關(guān)(多元相關(guān))

單相關(guān):兩個(gè)變量之間的相關(guān)關(guān)系為單相關(guān)。例如收入額與消費(fèi)支出額之間

的關(guān)系。

復(fù)相關(guān):三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系稱為復(fù)相關(guān)。

如:同時(shí)研究商品的銷售額、廣告費(fèi)支出、居民收入水平之間的關(guān)系;研究

某種商品的需求量與價(jià)格水平及人們的收入水平之間的關(guān)系。

實(shí)際工作中,若存在多個(gè)自變量對(duì)一個(gè)因變量的關(guān)系,可以抓住其中最主要

的因素研究其相關(guān)關(guān)系。

三、相關(guān)關(guān)系分析的主要內(nèi)容(任務(wù))

相關(guān)關(guān)系分析的目的在于研究現(xiàn)象之間相互依存關(guān)系的形式及密切程度,

并用一定的數(shù)學(xué)形式把這種關(guān)系反映出來,為統(tǒng)計(jì)估算和預(yù)測提供重要的依據(jù)和

方法。具體包括:

(一)確定經(jīng)濟(jì)現(xiàn)象之間是否存在相關(guān)關(guān)系及相關(guān)關(guān)系的種類。經(jīng)濟(jì)現(xiàn)象問

有無相關(guān)關(guān)系是能否運(yùn)用相關(guān)關(guān)系分析法的前提。確定經(jīng)濟(jì)現(xiàn)象之間有無相關(guān)關(guān)

系的方法有兩種:一是作定性判斷,它是從經(jīng)濟(jì)現(xiàn)象之間的本質(zhì)聯(lián)系著手,根據(jù)

有關(guān)的理論及實(shí)踐經(jīng)驗(yàn)進(jìn)行分析研究來判斷的;二是繪制相關(guān)圖表。

(二)確定經(jīng)濟(jì)現(xiàn)象之間相關(guān)關(guān)系的密切程度

當(dāng)經(jīng)濟(jì)現(xiàn)象之間存在相關(guān)關(guān)系時(shí),就要測定它們之間關(guān)系的密切程度,為進(jìn)

一步分析研究問題提供依據(jù)。

確定現(xiàn)象之間相關(guān)關(guān)系密切程度的方法是:繪制相關(guān)圖和計(jì)算相關(guān)系數(shù)C相

關(guān)圖對(duì)相關(guān)關(guān)系的密切程度可以得出粗略的判斷,而相關(guān)系數(shù)能從數(shù)量上對(duì)經(jīng)濟(jì)

現(xiàn)象之間的相關(guān)程度做出明確的反映。

(三)建立經(jīng)濟(jì)現(xiàn)象之間數(shù)量變動(dòng)關(guān)系的數(shù)學(xué)方程式(確定相關(guān)關(guān)系的數(shù)學(xué)

表達(dá)式)

為了測定現(xiàn)象之間數(shù)量變化上的一般關(guān)系,必須使用函數(shù)關(guān)系的數(shù)學(xué)公式作

為相關(guān)關(guān)系的數(shù)學(xué)表達(dá)式,稱為回歸方程,用以說明自變量發(fā)生變動(dòng)時(shí),因變量

平均來說會(huì)發(fā)生多大的變化。

(四)確定因變量估計(jì)值誤差的程度

根據(jù)變量之間變動(dòng)關(guān)系的數(shù)學(xué)方程式可以計(jì)算出各個(gè)因變量的估計(jì)值,這

些估計(jì)值與實(shí)際值之間肯定有差異,差異小,表示推算結(jié)果的準(zhǔn)確度高;差異大,

準(zhǔn)確度低。而準(zhǔn)確度的高低又關(guān)系到回歸方程的實(shí)用價(jià)值。所以相關(guān)分析還要測

定因變量估比值和實(shí)際值之間差異的大小,用以反映因變量估計(jì)值的準(zhǔn)確程度。

這種用來反映因變量估計(jì)值準(zhǔn)確程度的指標(biāo)叫估計(jì)標(biāo)準(zhǔn)誤差。

第二節(jié)簡單直線相關(guān)分析

,是否存在相關(guān)關(guān)系

簡單直線相關(guān)分析內(nèi)容<相關(guān)關(guān)系的種類

相關(guān)關(guān)系的密切程度

在進(jìn)行相關(guān)分析時(shí),首先對(duì)現(xiàn)象之間是否存在依存關(guān)系進(jìn)行定性分析;其次,

利用相關(guān)圖表粗略地反映相關(guān)變量之間依存關(guān)系的形式、方向;最后計(jì)算相關(guān)系

數(shù),準(zhǔn)確反映相關(guān)變量之間關(guān)系的密切程度。

一、相關(guān)表和相關(guān)圖

(一)相關(guān)表

將相關(guān)的兩個(gè)變量的對(duì)應(yīng)數(shù)值按照一定的順序或規(guī)格排列在一張表格上所

形成的統(tǒng)計(jì)表。

「簡單相關(guān)表

按照資料是否分組相關(guān)表分為Y

[分組相關(guān)表

1.簡單相關(guān)表:指資料未經(jīng)分組,只將一個(gè)變量的數(shù)值按照從小到大(或時(shí)

間)順序、并配合相應(yīng)的另一個(gè)變量的變量值一一對(duì)應(yīng)排列起來形成的表。其步

驟是:

第一、將某一變量的變量值按照一定順序排列

第二、對(duì)應(yīng)地平行列出另一變量的變量值

例1,為了研究分析機(jī)床使用年限和年維修費(fèi)用之間的關(guān)系,可從抽取的12

臺(tái)機(jī)床中取得12對(duì)數(shù)據(jù),見表2-1。

從表中可以直觀地看出,盡管在同樣的使用年限下,年維修費(fèi)用也存在著差

異。但總的來看,隨著使用年限的增加,年維修費(fèi)用也在不斷地增加,兩者之間

呈現(xiàn)出正相關(guān)的關(guān)系。

表2-1

序號(hào)機(jī)床使用年限(年)年維修費(fèi)用(元)

12400

22540

33520

44640

54740

65600

75800

86700

96760

1()6900

118840

1291080

例2,某地職工工資總額與城鎮(zhèn)儲(chǔ)蓄存款余額的相關(guān)表,見表2?2o

從表中資料可以看出,隨著該地職工工資總額的增加,城鎮(zhèn)儲(chǔ)蓄存款余額也

呈現(xiàn)出增加的趨勢,這說明兩個(gè)變量之間存在著正相關(guān)的關(guān)系。

表2-2

年份職工工資總額(億元)城鎮(zhèn)儲(chǔ)蓄存款余額(億元)

20024011.5

20034012.2

20044113.5

20054315.5

20064720.3

20075228.3

合計(jì)——

2.分組相關(guān)表:是根據(jù)分組資料繪制的相關(guān)表。

當(dāng)原始資料很多,簡單相關(guān)表編制和使用起來很不方便時(shí),這時(shí)往往對(duì)原始

資料進(jìn)行分組整理,編制成分組相關(guān)表。

根據(jù)分組的情況不同,分組相關(guān)表分為單變量分組表和雙變量分組表。

(1)單變量分組表:在具有相關(guān)關(guān)系的兩個(gè)變量中,只對(duì)一個(gè)變量(自變

量)進(jìn)行分組,并計(jì)算出每組的次數(shù),對(duì)應(yīng)的另一個(gè)變量(因變量)不分組,只

計(jì)算其平均值,這樣制成的表為單變量分組相關(guān)表,見表2-3o

單變量分組相關(guān)表可使資料簡化,從而更清析地反映出兩變量之間的相關(guān)關(guān)

系。從表2-3中可以看出,機(jī)床使用年限和年維修費(fèi)用之間存在著正相關(guān)的關(guān)系。

表2-3

使用年限(年)機(jī)床數(shù)(臺(tái))平均維修費(fèi)用(元/年)

22470

31520

42690

52700

63787

81840

911080

合計(jì)12—

(2)雙變量分組相關(guān)表:指在具有相關(guān)關(guān)系的兩個(gè)變量中,對(duì)兩個(gè)變量同

時(shí)進(jìn)行分組所形成的統(tǒng)計(jì)表。即對(duì)自變量和因變量都進(jìn)行分組所編制的分組相關(guān)

表。這種表的形狀類似棋盤,故又稱為棋盤式相關(guān)表,其編制步驟為:

①分別確定兩個(gè)變量分組的組數(shù)

②設(shè)計(jì)棋盤式表格

③計(jì)算各組的次數(shù)并放到相對(duì)應(yīng)的方格之中。

對(duì)于上例,若將機(jī)床使用年限分為7組,年維修費(fèi)用也分為7組,可設(shè)計(jì)一

個(gè)7X7的棋盤式方程表,將次數(shù)置入方格之中,便形成了雙變量分組相關(guān)表。

一般情況下,自變量的數(shù)值放在賓詞欄(上端),且數(shù)值從左到右按由小到

大的順序排列;因變量放在表的主詞欄(左端),且數(shù)值自上而下由大到小的順

序排列;最后計(jì)算各組相對(duì)應(yīng)的次數(shù),并設(shè)計(jì)兩個(gè)合計(jì)欄,分別表明各個(gè)變量分

組的次數(shù)分布情況。見表2-4。

由表2-4可以看出,兩個(gè)變量之間呈正相關(guān)的關(guān)系,即機(jī)床使用年限越長,

年平均維修費(fèi)用越多。

表2-4

年維修費(fèi)用機(jī)床使用年限(年)

合計(jì)

(元)2345689

1()00-110()11

900-100011

800-900112

700-800123

600-70()112

500-600112

400-50011

合計(jì)212231I12

(二)相關(guān)圖

相關(guān)圖又叫散點(diǎn)圖,它是在平面坐標(biāo)系中(以橫軸表示自變量x,縱軸表示

因變量y),將相關(guān)表中兩個(gè)變量對(duì)應(yīng)值用相關(guān)點(diǎn)(散點(diǎn)、坐標(biāo)點(diǎn))形式描繪出

來,通過觀察相關(guān)點(diǎn)的分布情況,大致看出兩個(gè)變量之間有無相關(guān)關(guān)系及相關(guān)的

類型、密切程度?,F(xiàn)將表21資料繪制成相關(guān)圖如圖2lo

從圖中可以看出,機(jī)床使用年限和年維修費(fèi)用之間存在著比較密切的

相關(guān)關(guān)系,而且兩者之間的變動(dòng)趨勢基本呈現(xiàn)直線型的。

圖2-1

二、相關(guān)系數(shù)

(一)相關(guān)系數(shù)的概念

根據(jù)相關(guān)圖和相關(guān)表可以初步判斷經(jīng)濟(jì)現(xiàn)象之間有無相關(guān)關(guān)系,以及相關(guān)的

趨勢和形態(tài)。但是,這種直觀的判斷是粗略的,為了準(zhǔn)確反映現(xiàn)象之間相關(guān)關(guān)系

的密切程度,需要計(jì)算相關(guān)系數(shù)。在各種相關(guān)關(guān)系中,單相關(guān)是最基本的相關(guān)關(guān)

系,它是復(fù)相關(guān)的基磯,單相關(guān)有線性相關(guān)和非線性相關(guān)兩種。而簡單線性相關(guān)

系數(shù)是最基本的,它是計(jì)算其它相關(guān)系數(shù)的基礎(chǔ)。這里所說的相關(guān)系數(shù)指簡單線

性相關(guān)系數(shù)。

相關(guān)系數(shù):是說明兩種現(xiàn)象之間直線相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)。

或:在線性相關(guān)條件下,用來說明兩個(gè)變量之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分

析指標(biāo)。

(二)相關(guān)系數(shù)的一般公式及其剖析

計(jì)算相關(guān)系數(shù)的方法很多,以英國統(tǒng)計(jì)學(xué)家皮爾遜(KarlPearson)的積差

法用得最為普遍,其它的如等級(jí)相關(guān)系數(shù)、點(diǎn)雙列相關(guān)系數(shù)、中相關(guān)系數(shù)、偏相

關(guān)系數(shù)等都是在這個(gè)相關(guān)系數(shù)的基礎(chǔ)上推導(dǎo)出來的,用以不同的場合,說明不同

的問題(后面分別介紹)。

積差法相關(guān)系數(shù):是通過兩個(gè)變量與各自平均數(shù)的離差的乘積來反映兩個(gè)

變量之間相關(guān)關(guān)系的密切程度的。

其基本公式如下:

1--

~2^(x-x)(y-y)

式中,r為相關(guān)系數(shù),嚏為x變量數(shù)列的平均值,n為變量值的項(xiàng)數(shù)

I為y變量數(shù)列的平均值,0■,為x變量數(shù)列的標(biāo)準(zhǔn)差,b、.為y變量數(shù)列的標(biāo)

準(zhǔn)差,叫=Zd)()-y)為x與y的協(xié)方差,0必(7為變量*的

nxVn

標(biāo)準(zhǔn)差,a=\Z(y-y)為變量y的標(biāo)準(zhǔn)差.

Vn

相關(guān)系數(shù)公式的剖析:

相關(guān)系數(shù)是由協(xié)方差b:、6、0、.組成的。

顯示x、y是正相關(guān)、負(fù)相關(guān)

1、協(xié)方差的作用Y

[顯示x與y之間線性相關(guān)關(guān)系的密切程度

協(xié)方差是兩個(gè)變量離差乘積的平均數(shù),用來度量x,y關(guān)系的一個(gè)重要指標(biāo),

其作用在于:

①示x與y是正相關(guān)還是負(fù)相關(guān)。在平面且標(biāo)系上以兩個(gè)變量的平均值

京7為原點(diǎn)將第一象限劃為四個(gè)象限,由于其原點(diǎn)是平均數(shù),所以各相關(guān)點(diǎn)的

位置都改由它們的離差來決定。

其原坐標(biāo)中第一對(duì)觀測值的坐標(biāo)點(diǎn)為(x-y),而在新的坐標(biāo)圖中表示為

(%-乂y-y),其余類推。

當(dāng)相關(guān)點(diǎn)分布在新坐標(biāo)系中的第一象限時(shí),為正,()」5)為正,所以

“<)(),一亍)為正數(shù);當(dāng)相關(guān)點(diǎn)分在新坐標(biāo)系中第二象限時(shí),a<)為負(fù),(y-y)

為正,(x-x)(y-y)為負(fù);當(dāng)分布在第三象限時(shí),(x-x)為負(fù),(y-y)為負(fù),則

(x-x)(y-y)為正;當(dāng)相關(guān)點(diǎn)分布在第四象限時(shí),(x-x)為正,(丁-),)為負(fù),則

(x—x)(y—y)為負(fù)。

由此看來,r的iF負(fù)號(hào)完全取決于協(xié)方差的正負(fù)號(hào):

當(dāng)為負(fù)時(shí),r為負(fù),點(diǎn)大多分布在2、4象限;

Z(x-x)(y-y)為正時(shí),r為正,點(diǎn)大多布在1、3象限。

②協(xié)方差顯示x與y相關(guān)程度的大小

A、當(dāng)相關(guān)點(diǎn)在新坐標(biāo)的四個(gè)象限散亂分布時(shí),如圖2-2,表示x與y線性

相關(guān)程度很低,這時(shí)(—5⑶-亍)的正負(fù)項(xiàng)相互抵消,Z3—7)()'一5幾乎等于

0,Z(x-方()」刊絕對(duì)很小,從而r的絕對(duì)值也很小,表明相關(guān)程度很低。

弱相關(guān)

圖2-2

B、當(dāng)相關(guān)點(diǎn)分布在),二不線上,表示y與x值的變化無關(guān);或相關(guān)點(diǎn)分布

在x=x線上,表示X與y值的變化無關(guān),這時(shí)離差乘積£(x-x)(y-y)都等于0,

從而相關(guān)系數(shù)等于0,二者不相關(guān)。見圖2-3.

圖2-3.無線性相關(guān)關(guān)系

C、當(dāng)相關(guān)點(diǎn)的分布十分靠近于一直線上,如圖2-4中所示,表示x與y線

性相關(guān)關(guān)系越密切,這時(shí)(X-])(),-y)很少或者沒有正負(fù)項(xiàng)相抵消,則積差和的

絕對(duì)值較大,從而相關(guān)系數(shù)的絕對(duì)值較大,表示x與y相關(guān)關(guān)系密切。

圖2-4

2、標(biāo)準(zhǔn)差,0川勺作用

①消除離差積乘中兩個(gè)變量原有計(jì)量單位的影響

②使r局限在-1至1之間

協(xié)方差已經(jīng)可以顯示兩個(gè)變量之間相關(guān)關(guān)系的性質(zhì)和密切程度,那么,為什

么在相關(guān)系數(shù)中還要將協(xié)方差除以標(biāo)準(zhǔn)差b/G呢?

上式可變?yōu)椤?—66,它意味著x,y與各自平均值的離差,分

n

別以各自的標(biāo)準(zhǔn)差為尺度加以標(biāo)準(zhǔn)化,然后再求標(biāo)準(zhǔn)數(shù)量的協(xié)方差。

經(jīng)過離差標(biāo)準(zhǔn)化,再求其協(xié)方差,有兩方面的作用:

①將名數(shù)轉(zhuǎn)化為大名數(shù)

不同現(xiàn)象其使用價(jià)值不同,計(jì)量單位不同,為了消除積差中兩個(gè)變量原有計(jì)

量單位的影響,將兩個(gè)變量的離差除以變量數(shù)列的標(biāo)準(zhǔn)差(平均離差),使之成

為相對(duì)積差,(」)?(=),然后將它們的乘積加總除以項(xiàng)數(shù),標(biāo)準(zhǔn)化結(jié)果將

(7<6

名數(shù)表示的協(xié)方差化為不名數(shù),這樣的相關(guān)系數(shù)可以比較不同現(xiàn)象之間相關(guān)程度

的高低。如土地面積和施肥量、糧食畝產(chǎn)和耕作深度,某地消費(fèi)量與居民人數(shù)等,

計(jì)量單位是不同的。

②將相關(guān)系數(shù)的值局限在?1到+1之間。

不同的量,協(xié)方差的數(shù)值大小不同,不便于說明問題,將離差標(biāo)準(zhǔn)化的結(jié)果

使r的絕對(duì)值不超過1,相關(guān)系數(shù)在-1與+1之間變動(dòng),這就便于比較和說明問題。

證明:

2,二.(二

2/=--------——^―

n

=1X(U+U)2」X(W)2」X(U)2

〃66〃6〃6

vly(^i+ZzI)2>0

〃56

〃6〃6

同理:-y(^)2=i

???2r+220r^-1

苞(fW

同理:根據(jù)-2r=--------生_

n

可得2r+220運(yùn)1

則?W+1

當(dāng)川=1時(shí),x與y完全線性相關(guān)。

吊=()時(shí),x與y無線性相關(guān)關(guān)系

卜|越接近于1,表明x與y的相關(guān)程度越高。

例如,現(xiàn)有兩項(xiàng)資料,其協(xié)相關(guān)相等,但相關(guān)的程度卻有很大的差異(舉例

說明協(xié)方差必須標(biāo)準(zhǔn)化),見表2-5、表2-6。

資料2?5中,x=3,不=2協(xié)方差計(jì)算過程見表2-5。

22(—)()」亍)5,

6"H

表2?5

22

Xyx-3(x-3)y-21(y-2)(x-3)(y-2)

11-24-1i2

21.5-11-0.50.250.5

3200000

42.5110.50.250.5

5324112

151001000.255

資料2-6x=3"y=2其協(xié)方差計(jì)算過程見表2-6。

2_1>-6(),_亍)_5

———1

表2-6

XYx-3(x-3)2y-2(y-2)2(x-3)(y-2)

11.2524().750.56251.5

21-11111

3200000

4310111

52.75240.750.56251.5

15100100301255

兩種資料雖然協(xié)方差都等于1,但是相關(guān)的程度是不同的,資料2-5所有相

關(guān)點(diǎn)落在直線y=0.5+0.5x上,具有完全線性相關(guān)的關(guān)系,即函數(shù)關(guān)系(增長量

均等);而資料2-6的相關(guān)點(diǎn)只在直線y=0.5+0.5x周圍波動(dòng);它們的相關(guān)關(guān)系并

不那么密切,這是因?yàn)閮身?xiàng)資料的變異情況不同(增長量不均等),所以不能用

協(xié)方差來比較它們相關(guān)的密切程度(計(jì)量單位x與y也不等)。

若對(duì)協(xié)方差分別以它們的。來除,求得相關(guān)系數(shù)就可以相互比較

這表明資料2-5的相關(guān)程度比資料2-6的相關(guān)程度高,這個(gè)結(jié)論是符合實(shí)

際情況的。

(三)相關(guān)系數(shù)的簡化式

利用前面相關(guān)系數(shù)公式,計(jì)算相當(dāng)繁瑣,我們可以利用代數(shù)推演的方法得到

相關(guān)系數(shù)的簡化式。

簡化式的主要目的是直接利用原始數(shù)值或已有的計(jì)算指標(biāo)來計(jì)算相關(guān)系

數(shù)。演變過程如下:

由于Z(x-x)(y-),)=-》+xy)

=Z孫一y_)W%+nxy

22

Z(x-1)2=2L(X-2A-X+X)

二Z%-2^x-x+nx2

nn

二歹-衿)2=心

同理Z(y-7)2=Z),-i(£y)2=Lyy

則有Lxy

岳2TzXT也丁—Z?XML

n^xy'-^x^y

一(£x)2JWy2一(£?

若資料分組時(shí),

"¥'EfZ/

了=2一

孫-£T

則公式轉(zhuǎn)化為:

£*2Jzy2f_(Z方

例如:某工廠機(jī)床使用年限和年維修費(fèi)資料如表2-7。試計(jì)算相關(guān)系數(shù),

表2-7

機(jī)床使用年限年維修費(fèi)

合計(jì)X2Y2xy

(X)(元)

124004160000800

2254042916001080

3352092704001560

44640164096002560

54740165476002960

65600253600003000

7580()2564000()4000

86700366900004200

96760365776004560

106900368100005400

118840647056006720

1291080811166409720

合計(jì)60852035.2642880046560

解:根據(jù)資料『12,2>=60,W>=8520,由簡化公式計(jì)算相關(guān)系數(shù)

需要計(jì)算X,y2,xy見表2-7。

_______________________________12x46560-60x8520

_①用2y2_(Zy)22X352-602712X6428800-85202

=0.8913

表明機(jī)床使用年限和年維修費(fèi)用之間存在著高度的正線性相關(guān)關(guān)系。

判斷相關(guān)關(guān)系密切程度的標(biāo)準(zhǔn)為:

1Y1<0.3微弱相關(guān)

0.3WI丫I<0.5低度相關(guān)

0.5W1Y1<0.8顯著相關(guān)

0.8^Iy|<1高度相關(guān)

三、簡單直線相關(guān)分析的特點(diǎn)

1.用于相關(guān)分析的兩個(gè)變量是對(duì)等的關(guān)系,不分自變量和因變量;

2.只能計(jì)算出一個(gè)相關(guān)系數(shù);

3.相關(guān)系數(shù)r的有正負(fù)號(hào)。分別表示正相關(guān),負(fù)相關(guān);

4.用于相關(guān)分析的兩個(gè)變量均為隨機(jī)變量。

?四、時(shí)間數(shù)列自身相關(guān)

(一)意義

前面研究了兩個(gè)變量之間相關(guān)關(guān)系的理論及方法,其主要特征是:當(dāng)一個(gè)變

量發(fā)生變動(dòng)時(shí),另一個(gè)變量將隨著作相同方向或相反方向的變動(dòng),它是從靜態(tài)上

和現(xiàn)象截面上來研究的。除此之外,還有另一種相關(guān)關(guān)系,即時(shí)間數(shù)列的自相關(guān),

它是從動(dòng)態(tài)上來研究的。

時(shí)間數(shù)列的自相關(guān):是就一個(gè)變量自身來考察的,隨著時(shí)間的不同,一個(gè)

變量在其前后期的數(shù)值之間所表現(xiàn)出一定的依存關(guān)系,這種關(guān)系叫時(shí)間數(shù)列的自

身相關(guān),簡稱自相關(guān)C

研究時(shí)間數(shù)列的芻相關(guān)對(duì)于分析社會(huì)經(jīng)濟(jì)現(xiàn)象的規(guī)律性及進(jìn)行經(jīng)濟(jì)預(yù)測都

有很重要的意義。如各年生豬上市量與其前一年二市量之間,某地區(qū)歷年糧食總

產(chǎn)量之間,歷年鐵路貨運(yùn)量之間,,己形成的工業(yè)生產(chǎn)水平將會(huì)影響明年或后年

的工業(yè)生產(chǎn)水平等。

(二)自相關(guān)系數(shù)的測定

前面相關(guān)系數(shù)Y反映X、y兩個(gè)變量之間線性關(guān)系的密切程度。

設(shè)丫1、,2、乂…%是一個(gè)時(shí)間數(shù)列,共有I1項(xiàng),用工表示各項(xiàng)水平,t=l>

2^…n

若將),,逐期向后移動(dòng)一個(gè)間隔時(shí)期,得到y(tǒng)門數(shù)列,稱為移后一期的時(shí)間數(shù)

列;若將時(shí)間數(shù)列其逐期向后移動(dòng)兩期而ym,稱為移后兩期的時(shí)間數(shù)列…這樣

得到的系列新的時(shí)間數(shù)列統(tǒng)稱為時(shí)間移后動(dòng)態(tài)數(shù)列。如表2-8。

表2-8

112345???n

???

yiY2y4ys%

—???

yt-iyiY2Y3y4yn-i

y(-2——y1y2y3???Yn-2

由于原時(shí)間數(shù)列),,的水平項(xiàng)數(shù)是有限的,而每次組成的新數(shù)列都是將原數(shù)列

逐期后移而得,因此y“的項(xiàng)數(shù)比上少一項(xiàng),)仁2比上少兩項(xiàng),、_£比上少k項(xiàng)。

下面以k表示移后的期數(shù),月一表示移后期為k的時(shí)間數(shù)列(對(duì)應(yīng)值的項(xiàng)數(shù)是新

數(shù)列的項(xiàng)數(shù))。

當(dāng)K=1時(shí),則新數(shù)列為

首先可以把上和yn看成是由兩個(gè)不同變量組成的時(shí)間數(shù)列,并計(jì)算其相關(guān)

系數(shù),來研究、和yc之間的關(guān)系。

時(shí)間數(shù)列自相關(guān)中的力相當(dāng)于y,而yc相當(dāng)于自變量x,二者的關(guān)系表示

本期與前期的相關(guān)關(guān)系,則

-九產(chǎn)店(y-上了

V,=2Vf=2

“1

----立力)

②釬-----------------------------

因「百〉,屋4-=0,)2

__±yt

同理可計(jì)算上和兩個(gè)數(shù)列的自相關(guān)系數(shù)為

刀_

Z(y.22)(y-凹)

①4:下且---------p----------

心(九2-兀尸@(y-

力3廣白汽小、

②弓=?金〃\

也嫣一七(Z席市律一力Zy)2

G是本期和移后兩期的時(shí)間數(shù)列之間的相關(guān)系數(shù),同理/表示/和移后期為

k的時(shí)間數(shù)列%k之間的相關(guān)系數(shù)。

£(%-加)()0)

r=£+l

移后K期,對(duì)應(yīng)項(xiàng)數(shù)就為K項(xiàng),所以應(yīng)從k+1開始。一般最常研究的是本

期和前期的自相關(guān)關(guān)系(舉例)。

例如,某地區(qū)歷年工農(nóng)業(yè)總產(chǎn)值資料如表2-9,試計(jì)算自相關(guān)系數(shù)。

表2-8單位:萬元

產(chǎn)值上年產(chǎn)值

2A

年度yh)'/

yt

1995(218)

19963002189000()4752465400313.86

199736030012060090000108000381.80

1998460360211600129600165600430.26

1999520460270400211600239200454.35

200()58()520336400270400301600598.85

2001620580384400336400359600652.36

2002640620409600384400396800688.02

2003600640360000409600384000705.86

200462060038440036000()372000670.19

2005680620464200384400421600688.20

2006670680448900462400455600741.53

2007710670504100448900475700732.61

合計(jì)67606268399180035352243745100—

解:根據(jù)自相關(guān)系數(shù)計(jì)算公式的要求,需計(jì)算)/、My”,見表2?9。

根據(jù)表中資料,相關(guān)系數(shù)4為:

3745100--(6760x6268)

?12=0.9775

399180()--X67602J3535220--x62682

12V12

計(jì)算結(jié)果說明該地區(qū)各年工農(nóng)業(yè)總產(chǎn)值與上年工農(nóng)業(yè)總產(chǎn)值之間存在著高

度的正相關(guān)關(guān)系。判明這種關(guān)系后,可配合自身回歸方程,根據(jù)當(dāng)年的工農(nóng)業(yè)總

產(chǎn)值就可預(yù)測下年的工農(nóng)業(yè)總產(chǎn)值少。(回歸部分講)

第三節(jié)簡單直線回歸分析

一、回歸分析的意義

就一般意義而言,相關(guān)關(guān)系分析包括相關(guān)分析和回歸分析兩方面的內(nèi)容,因

為相關(guān)與回歸都是研究兩個(gè)變量相關(guān)關(guān)系的分析方法。

但就具體問題解決的方法而言,回歸分析和相關(guān)分析是有明顯差別的。

相關(guān)分析:分析現(xiàn)象之產(chǎn)是否存在相關(guān)關(guān)系及相關(guān)關(guān)系的種類(形式、性質(zhì)),

并且利用相關(guān)系數(shù)說明在直線相關(guān)的條件下,兩種現(xiàn)象之間相關(guān)關(guān)系的方向,密

切程度,但不能說明兩種現(xiàn)象之間因果變動(dòng)的數(shù)量關(guān)系,即無法從一個(gè)變量的變

化來推測另一個(gè)變量大致變動(dòng)多少。

回歸分析法:指對(duì)具有相關(guān)關(guān)系的兩個(gè)或兩個(gè)以上的變量之間數(shù)量變化的一

般關(guān)系進(jìn)行測定,確立一個(gè)相應(yīng)的數(shù)學(xué)表達(dá)式,以便從一個(gè)已知的量來推測另一

個(gè)未知量。

或:用數(shù)學(xué)方程式來反映經(jīng)濟(jì)現(xiàn)象之間數(shù)量變化的一般關(guān)系的方法叫回歸分

析法。這里的數(shù)學(xué)表達(dá)式叫回歸方程,一般用的較多的是直線回歸方程,即用一

條直線來表明具有相關(guān)關(guān)系的變量之間的一般數(shù)量關(guān)系。

簡單直線回歸分析的特點(diǎn):

1、在兩個(gè)變量之間必須根據(jù)研究的目的確定哪個(gè)是自變量,哪個(gè)是因變量。

如),=〃+",即因果關(guān)系。

相關(guān)分析的兩個(gè)變量之間是對(duì)等的關(guān)系,不必確定哪個(gè)是自變量,哪個(gè)是

因變量;而回歸分析的兩個(gè)變量之間一個(gè)是自變量,一個(gè)是因變量,二者不是對(duì)

等的關(guān)系,而是因果關(guān)系。

2、在沒有明顯因果關(guān)系的兩個(gè)變量中,可配合兩個(gè)回歸方程。

相關(guān)分析中,相關(guān)系數(shù)只有一個(gè),而在回歸分析中,若兩個(gè)變量之間無明顯

的因果關(guān)系,可配合兩個(gè)回歸方程,一個(gè)是y依x的回歸方程(x為自變量),

另一個(gè)是x依y的回歸方程(y是自變量)。如身高與體重的兩個(gè)變量,可以以

身高為自變量,體重為因變量,說明身高變化時(shí)體重變化的影響;也可以以體重

為自變量,身高為因變量,說明體重變化對(duì)身高的影響。

值得注意的是,若兩個(gè)變量存在明顯的因果關(guān)系時(shí),只能配合一條回歸宜線,

另一條配合出來也沒意義。如施肥量與農(nóng)作物畝產(chǎn)量之間,只能以施肥量為自變

量,畝產(chǎn)量為因變量,分析施肥量的變動(dòng)對(duì)畝產(chǎn)量的影響。而反過來分析畝產(chǎn)量

的變動(dòng)對(duì)施肥量的影響,那是毫無意義的。

3、回歸方程的作用在于給出自變量的數(shù)值來估計(jì)因變量的可能值。

一種回歸方程只能作一種推算,即給出自變量的值,推斷因變量平均變動(dòng)的

數(shù)值,推算的結(jié)果表明變量之間具體的數(shù)量變動(dòng)關(guān)系,它不是抽象的系數(shù)關(guān)系。

4、直線回歸方程中,自變量的系數(shù)b稱為回歸系數(shù)?;貧w系數(shù)的符號(hào)為正

時(shí)表示正相關(guān),為負(fù)表示負(fù)相關(guān)。(與相關(guān)系數(shù)的正負(fù)號(hào)一致)

5、回歸分析中,因變量是隨機(jī)的,而把自變量當(dāng)作研究時(shí)可以控制的量。

即在給定不同自變量的數(shù)值下,觀察對(duì)應(yīng)的因變量數(shù)值的變化情況。

回歸分析有一元問歸和多元問歸之分,有線性和非線性之分,線性回歸是基

本的,這里只介紹一元線線性回歸。

二、直線回歸方程的建立和求解

配合直線回歸方程的前提條件是:兩個(gè)變量之間確實(shí)存在線性相關(guān)關(guān)系,而

且其相關(guān)的緊密程度至少是顯著的。若變量之間無真正的線性相關(guān)關(guān)系,配合直

線回歸方程就亳無意義。

(一)回歸方程的建立

配合直線回歸方程的意思是要找到一條直線,用直線上的點(diǎn)來代表所有的相

關(guān)點(diǎn)。但是為代表所有的相關(guān)點(diǎn),可以畫出無數(shù)條直線,哪一條直線是最理想的

呢?符合“離差平方和為最小值”這個(gè)條件的直線最理想。

離差是指因變量的實(shí)際值和直線上的估計(jì)值(理論值)的差距。每個(gè)相關(guān)點(diǎn)

和直線上的對(duì)應(yīng)點(diǎn)都有一個(gè)離差,離差有正有負(fù),有大有小,離差之和為零。把

所有的離差加以平方全成為正數(shù),可表明其絕對(duì)距離。若條直線它和實(shí)際相關(guān)

點(diǎn)的離差平方和為最小值,則這條直線是最合理的。

根據(jù)Z(y—5)2=最小值這個(gè)條件所配合的方程叫最小平方法。

簡單直線方程為:y=a+hx

令s=二最小值

則S=Z(y-a-〃x)?=最小值

根據(jù)極值原理

逆=0即-a^(y-a-bx)=0

act

迎=0

即-ax(y-a-bx)2=0整理得

ab

^y=na+b^x

聯(lián)立求解得:

a=y-bx

£?duì)t-衿)2L

例如,前面表2-7資料,試配合直線回歸方程。

解:要計(jì)算b,需求出/、勾,

Vxy—VxVy46560--x60x8520

b=----------------=---------------------=>6.15元

Vx2--(Yx)2352―x602

nn

—.~8520,_60_nc—

a=y-bx=------76.15x—=3o29n.25兀

1212

則y=329.25+76.15x

這個(gè)方程中的數(shù)值與符號(hào)表示:

a=329.25這是維修費(fèi)用的起點(diǎn)值,在相關(guān)圖上表現(xiàn)為x=0時(shí),y的值為329.2

元(即截距);b=76.15元,指機(jī)床使用年限增加一年(一個(gè)單位)時(shí),維修費(fèi)用

的平均增加值為76.15元,其正負(fù)號(hào)表示正相關(guān),負(fù)相關(guān),說明使用年限和維修

費(fèi)用之間存在著正相關(guān)關(guān)系。

將x代進(jìn)方程,可得出§,,§,是根據(jù)表3-1中資料有規(guī)則的變動(dòng)而推算出來

的直線》=329.25+76.15x上的估計(jì)值(理論值)。見表3-1。

表3-1

序機(jī)床使用年維修費(fèi)用A

X2孫y

號(hào)(年)X(元)y

124004800481.55

2254041080481.55

3352()91560557.20

44640162560633.85

54740162960633.85

65600253000710.00

7580()254000710.00

86700364200786.15

96760364560786.15

106900365400786.15

118840646720938.45

12910808197201014.6

合計(jì)608520352465608520.00

(二)回歸系數(shù)b和相關(guān)系數(shù)r之間的關(guān)系

回歸系數(shù)b和相關(guān)系數(shù)r之間存在著密切的數(shù)量關(guān)系,在計(jì)算中,可以利用

己知的一個(gè)推算出另一個(gè)。其關(guān)系如下:

分子分母同乘71二得

yjLxxLyy

r_L,(Jx

LxxylLyyO'y

<yx

三、估計(jì)標(biāo)準(zhǔn)誤差

(一)估計(jì)標(biāo)準(zhǔn)誤差的含義

回歸方程的一個(gè)重要意義在于根據(jù)自變量的已知值推算因變量的可能值。

理論值和實(shí)際值有時(shí)可能一致,有時(shí)不一致,這就產(chǎn)生了估計(jì)值的代表性問

題,當(dāng)理論值夕與實(shí)際值y一致時(shí),表明推斷準(zhǔn)確,§,的代表性強(qiáng);不一致表明

的代表性差。

回歸直線的代表性如何,一般是通過估計(jì)標(biāo)準(zhǔn)誤差指標(biāo)加以檢驗(yàn)的。它是用

來說明回歸直線代表性大小的統(tǒng)計(jì)指標(biāo),其原理與前面講過的衡量平均數(shù)的代表

性的原理相同,不同的是,前面說明平均數(shù)的代表性,而這里說明的是平均線或

趨勢線的代表性。

(二)估計(jì)標(biāo)準(zhǔn)誤差的計(jì)算方法

1.根據(jù)因變量的實(shí)際值和估計(jì)值的離差計(jì)算

s—估計(jì)標(biāo)準(zhǔn)誤差

n-2v

S).越小,則所有的y值都靠近$,,即關(guān)系越密切;5V越大,則所有的實(shí)際

值都遠(yuǎn)離關(guān)系越不密切。

公式中分母用的是n-2。n表示變量值可以自由變動(dòng)的個(gè)數(shù)。從n中減去2,

是因?yàn)檫@里根據(jù)實(shí)際資料已計(jì)算了a、b兩個(gè)參數(shù)值,當(dāng)再用這些點(diǎn)估計(jì)回歸直

線時(shí),y就已經(jīng)失去了兩個(gè)自由度,這兩個(gè)單位的變量值必須受a、b值和其余

n-2個(gè)單位的數(shù)值制約,所以誤差應(yīng)除以n-2。

若大樣本n很大時(shí),2可忽略不計(jì),

例如,根據(jù)表3-1的資料計(jì)算估計(jì)標(biāo)準(zhǔn)誤差,相關(guān)資料計(jì)算見表3-2。

表3?2

機(jī)床使用年限維修費(fèi)(元)A

yy-y(y-y)2

(年)Xy

2400481.55-81.556650.40

2540481.5558.453116.40

3520557.70-37.701421.29

4640633.856.1537.82

4740633.85106.1511267.82

5600710.00-110.0012100.00

5800710.0090.008100.00

6700786.15-86.157121.82

6760786.15-26.15683.82

6900786.15113.8512961.82

8840938.45

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論