統(tǒng)計學第7章相關(guān)與回歸分析_第1頁
統(tǒng)計學第7章相關(guān)與回歸分析_第2頁
統(tǒng)計學第7章相關(guān)與回歸分析_第3頁
統(tǒng)計學第7章相關(guān)與回歸分析_第4頁
統(tǒng)計學第7章相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩48頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)

文檔簡介

統(tǒng)計學第7章相關(guān)與回歸分析學習目標知識目標理解相關(guān)與回歸分析的基本概念及其區(qū)別與聯(lián)系掌握相關(guān)系數(shù)的計算與檢驗掌握一元線性回歸和多元線性回歸的模型、估計及檢驗理解復相關(guān)系數(shù)和偏相關(guān)系數(shù)及其與單相關(guān)系數(shù)的區(qū)別應用Excel軟件進行相關(guān)與回歸分析能力目標能夠正確區(qū)分相關(guān)與回歸分析的區(qū)別與聯(lián)系;能夠熟練運用相關(guān)與回歸分析的方法進行統(tǒng)計分析,解決社會經(jīng)濟問題;能夠熟練應用Excel軟件進行相關(guān)與回歸分析。導入案例根據(jù)2007年的統(tǒng)計數(shù)據(jù),首都機場全年出港航班正常率為86.28%,其中,衡量航班起飛情況的航班放行正常率高達94.49%。中國民航總局代局長李家祥表示,我國航空公司的正點率在世界上處于中等略微偏上的水平。但是,近兩年因航班延誤造成的旅客與航空公司激烈沖突接連不斷,甚至出現(xiàn)旅客霸機、沖擊機場停機坪等極端事件。日前,中國消費者協(xié)會和中國民用航空局運輸局共同發(fā)布的2011年航空服務消費者調(diào)查報告顯示,最令消費者滿意的航空服務是客艙服務,而最不滿意的航空服務為航班正點率及延誤后續(xù)服務。這一結(jié)果表明,提高航班正點率已成為改進航空服務的首要任務。民航總局于2004年出臺了《國內(nèi)航空公司航班延誤補償意見》,要求航空公司對航班延誤給顧客造成的損失給予補償。調(diào)查顯示,如果按航班延誤每客補償200元計,僅南航一家2007年就要付出1.6億元的巨額賠款,這對于國內(nèi)很多航空公司而言是難以承受的,其結(jié)果必然導致企業(yè)為減少成本而降低服務,引發(fā)惡性競爭。為此,對于航空公司航班正點率和顧客投訴率之間關(guān)系的研究就顯得至關(guān)重要。那么,究竟應該如何分析航空公司航班正點率和顧客投訴率之間的關(guān)系呢?相關(guān)和回歸分析是非常有用的工具。通過本章的學習,可以找到問題的答案。

7.17.27.3相關(guān)與回歸分析概述簡單線性相關(guān)與一元線性回歸分析多元線性回歸分析7.47.1相關(guān)與回歸分析概述7.1.1函數(shù)關(guān)系與相關(guān)關(guān)系1.函數(shù)關(guān)系

2.相關(guān)關(guān)系7.1.2函數(shù)關(guān)系與相關(guān)關(guān)系1.按照變量多少劃分

2.按照相關(guān)方向劃分3.按照相關(guān)密切程度劃分4.按照相關(guān)表現(xiàn)形式劃分7.1.3相關(guān)分析的內(nèi)容1.確定變量之間有無相關(guān)關(guān)系2.判定相關(guān)關(guān)系的表現(xiàn)形式3.判定相關(guān)關(guān)系的密切程度4.選擇數(shù)學模型5.測定變量估計值的準確程度6.顯著性檢驗7.1相關(guān)與回歸分析概述7.1.4回歸分析的內(nèi)容及種類1.回歸分析的內(nèi)容

確定變量之間相關(guān)關(guān)系的數(shù)學模型

測定數(shù)學模型的擬合優(yōu)度2.回歸分析的種類

按照具有相關(guān)關(guān)系的變量個數(shù)劃分按照回歸的表現(xiàn)形式劃分7.1相關(guān)與回歸分析概述7.1.5相關(guān)分析的內(nèi)容

1.相關(guān)分析與回歸分析的聯(lián)系相關(guān)分析是回歸分析的基礎和前提回歸分析則是相關(guān)分析的深入和繼續(xù)2.相關(guān)分析與回歸分析的區(qū)別相關(guān)分析主要通過相關(guān)系數(shù)來判斷兩個變量之間是否存在相關(guān)關(guān)系及其關(guān)系的密切程度,其前提條件是兩個變量都是隨機變量,且變量之間不必區(qū)別自變量和因變量。而回歸分析研究一個隨機變量與一個非隨機變量之間的相互關(guān)系,且變量之間必須區(qū)別自變量和因變量。相關(guān)系數(shù)只能表明變量之間相關(guān)關(guān)系的密切程度和方向,不能估計推算其具體數(shù)值。而回歸分析則可以根據(jù)回歸方程,用自變量的數(shù)值推算因變量的估計值?;橐蚬P(guān)系的兩個變量,可以擬合兩個回歸方程,且互相獨立、不能互相替換。而相關(guān)系數(shù)只有一個,即當自變量與因變量互換時相關(guān)系數(shù)不變。7.1相關(guān)與回歸分析概述7.2.1相關(guān)圖與相關(guān)表1.相關(guān)表:相關(guān)表是一種反映變量之間相關(guān)關(guān)系的統(tǒng)計表。

【例7-1】通過對10家航空公司最近一年的航班正點率和顧客投訴次數(shù)進行調(diào)查所得到的原始數(shù)據(jù)如表7.1所示,試根據(jù)原始數(shù)據(jù)編制相關(guān)表。7.2簡單線性相關(guān)與一元線性回歸分析根據(jù)以上原始資料,將航班正點率按照從低到高的順序排列,可以編制相關(guān)表如表7.2所示。根據(jù)表7.2可以看出,隨著航班正點率的提高,顧客投訴次數(shù)從總體上呈現(xiàn)出下降的趨勢。因此,市場顧客投訴次數(shù)與航班正點率之間存在一定的負相關(guān)關(guān)系。7.2簡單線性相關(guān)與一元線性回歸分析7.2.1相關(guān)圖與相關(guān)表

2.相關(guān)圖:相關(guān)圖也稱相關(guān)散點圖,簡稱散點圖,是指根據(jù)相關(guān)表中的觀測數(shù)據(jù)在直角坐標系中繪制的點狀圖形。

【例7-2】根據(jù)表7.2所示的航空公司航班正點率與顧客投訴次數(shù)相關(guān)表,試繪制相關(guān)圖,并分析航空公司顧客投訴次數(shù)與航班正點率之間的關(guān)系。7.2簡單線性相關(guān)與一元線性回歸分析根據(jù)以上原始資料,將航班正點率按照從低到高的順序排列,可以編制相關(guān)表如表7.2所示。根據(jù)表7.2可以看出,隨著航班正點率的提高,顧客投訴次數(shù)從總體上呈現(xiàn)出下降的趨勢。因此,市場顧客投訴次數(shù)與航班正點率之間存在一定的負相關(guān)關(guān)系。7.2簡單線性相關(guān)與一元線性回歸分析根據(jù)表7.2中的數(shù)據(jù)繪制散點圖,就可以比較直觀地看出兩個變量之間的關(guān)系,如圖8.2所示。

由圖7.2可以明顯看出,航空公司的航班正點率與顧客投訴次數(shù)之間總體呈現(xiàn)出負線性相關(guān)關(guān)系。7.2簡單線性相關(guān)與一元線性回歸分析7.2.2相關(guān)系數(shù)及檢驗1.相關(guān)系數(shù)的定義相關(guān)系數(shù)是指在直線相關(guān)條件下,兩個變量之間相關(guān)關(guān)系密切程度和方向的統(tǒng)計分析指標。總體相關(guān)系數(shù)的定義公式是:樣本相關(guān)系數(shù)的定義公式是:7.2簡單線性相關(guān)與一元線性回歸分析相關(guān)系數(shù)的特點:(1)相關(guān)系數(shù)的取值于-1與1之間。(2)相關(guān)系數(shù)的絕對值越接近于1,表明兩個變量之間的相關(guān)關(guān)系越密切;的絕對值越接近于0,表明相關(guān)關(guān)系越不密切。(3)相關(guān)系數(shù)為1或-1,表明兩個變量完全線性相關(guān),即函數(shù)關(guān)系。(4)相關(guān)系數(shù)等于0,表明兩個變量無直線相關(guān)關(guān)系。(5)相關(guān)系數(shù)大于0,表明兩個變量呈正線性相關(guān);相關(guān)系數(shù)小于0,表明兩變量呈負線性相關(guān)。7.2簡單線性相關(guān)與一元線性回歸分析7.2.2相關(guān)系數(shù)及檢驗2.相關(guān)系數(shù)的計算根據(jù)資料的分組情況,相關(guān)系數(shù)的計算既可采用定義公式,也可采用簡捷公式。分別見【例7-3】和【例7-4】

7.2簡單線性相關(guān)與一元線性回歸分析7.2.2相關(guān)系數(shù)及檢驗3.相關(guān)系數(shù)的檢驗相關(guān)系數(shù)的顯著性檢驗問題可以分為兩類:一類是對總體相關(guān)系數(shù)是否等于0進行檢驗;另一類是對總體相關(guān)系數(shù)是否等于某一個給定的不為0的數(shù)值進行檢驗。本書只介紹如何對總體相關(guān)系數(shù)是否等于0進行檢驗。7.2簡單線性相關(guān)與一元線性回歸分析檢驗基本步驟(1)原假設:。備擇假設:;(2)計算檢驗統(tǒng)計量:,其中為自由度;(3)根據(jù)給定的顯著性水平和自由度,查找t分布表中相應的臨界值;(4)若,則拒絕原假設,接受備擇假設,即認為樣本的相關(guān)系數(shù)r在統(tǒng)計上是顯著的,可以說明總體兩個變量間存在著線性相關(guān)關(guān)系。若,則表明樣本的相關(guān)系數(shù)r在統(tǒng)計上是不顯著的。7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

1.一元線性回歸模型(1)總體回歸函數(shù)進行回歸分析通常要設定一定的數(shù)學模型。一元線性回歸分析的主要任務是在唯一的自變量x和因變量y之間建立一個直線函數(shù),即一元線性回歸模型。該模型假定因變量主要受自變量的影響,它們之間存在著近似的線性函數(shù)關(guān)系,其表現(xiàn)形式為:

7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

1.一元線性回歸模型(2)樣本回歸函數(shù)根據(jù)樣本數(shù)據(jù)擬合的直線稱為樣本回歸直線。一元線性回歸模型的樣本回歸線可表示為:7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

1.一元線性回歸模型(3)誤差項的標準假定因為,隨機誤差項是無法直接觀測的。所以,在進行回歸分析時,通常需要對其概率分布提出一些假定。德國數(shù)學家高斯最早提出了相關(guān)的假定,因此也稱為高斯假定或標準假定。7.2簡單線性相關(guān)與一元線性回歸分析這些假定有:假定1:誤差項的期望值為0,即假定2:誤差項的方差為常數(shù),即假定3:誤差項之間不存在序列相關(guān)關(guān)系,其協(xié)方差為零,即當時有

假定4:自變量是給定的變量,與隨機誤差項線性無關(guān)。假定5:隨機誤差項服從正態(tài)分布。滿足以上標準假定的一元線性模型,稱為標準的一元線性回歸模型。7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

2.一元線性回歸模型的估計(1)回歸系數(shù)的估計回歸分析的主要任務就是建立能夠近似反映真實總體回歸函數(shù)的樣本回歸函數(shù)。也就是是確定樣本回歸函數(shù)中的系數(shù)。通過使殘差平方和為最小來估計回歸系數(shù),也就是所謂的最小二乘法。7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

2.一元線性回歸模型的估計(1)回歸系數(shù)的估計回歸分析的主要任務就是建立能夠近似反映真實總體回歸函數(shù)的樣本回歸函數(shù)。也就是是確定樣本回歸函數(shù)中的系數(shù)。通過使殘差平方和為最小來估計回歸系數(shù),也就是所謂的最小二乘法。7.2簡單線性相關(guān)與一元線性回歸分析殘差平方和將對和求偏導數(shù),并令其等于零7.2簡單線性相關(guān)與一元線性回歸分析整理可得求解該方程組可得:7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

2.一元線性回歸模型的估計(2)總體方差的估計總體隨機誤差項的方差的無偏估計為一般采用以下的公式計算殘差平方和7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

3.一元線性回歸模型的檢驗(1)回歸模型檢驗的種類回歸模型的檢驗包括理論意義檢驗、一級檢驗和二級檢驗。(2)擬合優(yōu)度評價擬合優(yōu)度是指樣本回歸直線對觀測數(shù)據(jù)擬合的優(yōu)劣程度,即樣本觀測值聚集在樣本回歸線周圍的緊密程度。判斷回歸模型擬合程度優(yōu)劣最常用的數(shù)量尺度是樣本判定系數(shù)。7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

3.一元線性回歸模型的檢驗(1)回歸模型檢驗的種類回歸模型的檢驗包括理論意義檢驗、一級檢驗和二級檢驗。(2)擬合優(yōu)度評價擬合優(yōu)度是指樣本回歸直線對觀測數(shù)據(jù)擬合的優(yōu)劣程度,即樣本觀測值聚集在樣本回歸線周圍的緊密程度。判斷回歸模型擬合程度優(yōu)劣最常用的數(shù)量尺度是樣本判定系數(shù)。(3)假設檢驗7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

4.一元線性回歸模型的預測(1)點預測一元線性回歸預測的基本公式如下:【例7.10】7.2簡單線性相關(guān)與一元線性回歸分析7.2.3一元線性回歸分析

4.一元線性回歸模型的預測(2)區(qū)間預測用表示預測標準誤差的估計值,則按照確定置信區(qū)間的方法,可以得出的的置信區(qū)間為:【例7.11】7.2簡單線性相關(guān)與一元線性回歸分析7.3.1多元線性回歸模型及估計

1.多元線性回歸模型多元線性回歸模型總體回歸函數(shù)的一般形式:多元線性回歸模型的樣本回歸函數(shù)如下:7.3多元線性回歸分析7.3.1多元線性回歸模型及估計

2.多元線性回歸模型的參數(shù)估計(1)回歸系數(shù)的估計多元線性回歸方程中的系數(shù)仍然是采用最小二乘法求得。(2)總體方差的估計多元線性回歸模型中方差的也是利用殘差平方和除以其自由度來估計的,即7.3多元線性回歸分析7.3.2多元線性回歸模型及估計

1.擬合優(yōu)度評價判定系數(shù)作為評價多元線性模型擬合程度的一項指標。修正的判定系數(shù)【例7.12】

7.3多元線性回歸分析7.3.2多元線性回歸模型及估計

2.假設檢驗(1)回歸系數(shù)的顯著性檢驗(2)回歸方程的顯著性檢驗7.3多元線性回歸分析7.3.3復相關(guān)系數(shù)和偏相關(guān)系數(shù)

1.復相關(guān)系數(shù)

復相關(guān)系數(shù)是反映因變量與多個自變量之間的線性相關(guān)程度的指標。7.3多元線性回歸分析7.3.3復相關(guān)系數(shù)和偏相關(guān)系數(shù)

2.偏相關(guān)系數(shù)

偏相關(guān)系數(shù)是指多元線性回歸分析中,在消除其他變量影響的條件下,所計算的某兩個變量之間的相關(guān)系數(shù)。7.3多元線性回歸分析7.4.1利用Excel進行相關(guān)分析

1.利用Excel中函數(shù)計算相關(guān)系數(shù)在Excel中,提供了計算兩個變量之間相關(guān)系數(shù)的CORREL函數(shù)和PERSON函數(shù),這兩個函數(shù)是等價的。

2.利用宏計算相關(guān)系數(shù)Excel還具有“數(shù)據(jù)分析”功能,其中包含相關(guān)系數(shù)計算模塊。具體操作步驟見【例7.13】7.4Excel中的線性回歸分析

7.4.2利用Excel進行回歸分析

1.利用Excel進行一元線性回歸分析(1)應用散點圖和趨勢線進行一元線性回歸分析(2)應用回歸分析宏進行一元線性回歸分析具體操作步驟見【例7.14】

.利用Excel進行多元線性回歸分析具體操作步驟見【例7.15】7.4Excel中的線性回歸分析

本章小結(jié)

1.客觀現(xiàn)象之間存在著兩種不同類型的數(shù)量聯(lián)系:一種是確定型的函數(shù)關(guān)系;另一種是非確定型的相關(guān)關(guān)系。兩者之間既存在密切的聯(lián)系,又有著明顯的區(qū)別。2.相關(guān)關(guān)系可以按不同的標志進行劃分。按照相關(guān)關(guān)系所涉及變量多少可分為單相關(guān)、復相關(guān)和偏相關(guān);按照相關(guān)關(guān)系的方向可分為正相關(guān)和負相關(guān);按照相關(guān)關(guān)系的密切程度可分為完全相關(guān)、不完全相關(guān)和不相關(guān);按照相關(guān)關(guān)系的表現(xiàn)形式可分為線性相關(guān)和非線性相關(guān)。本章小結(jié)

5.進行一元線性回歸分析的程序是:首先建立回歸模型,然后估計回歸模型的參數(shù),再后進行擬合優(yōu)度檢驗,最后進行顯著性檢驗。6.在多元回歸分析中,利用修正自由度的判定系數(shù)作為綜合評價方程擬合程度的指標。多元線性回歸模型中回歸系數(shù)的顯著性檢驗仍然采用檢驗。7.復相關(guān)系數(shù)是反映因變量與多個自變量之間的線性相關(guān)程度的指標;偏相關(guān)系數(shù)是指多元線性回歸分析中,在消除其他變量影響的條件下所計算的某兩個變量之間的相關(guān)系數(shù)。8.利用Excel的相關(guān)函數(shù)和“數(shù)據(jù)分析”功能,可以進行相關(guān)和回歸分析。本章關(guān)鍵術(shù)語相關(guān)分析回歸分析相關(guān)系數(shù)一元線性回歸多元線性回歸復相關(guān)系數(shù)偏相關(guān)系數(shù)思考與練習一、簡答題1.相關(guān)關(guān)系與函數(shù)關(guān)系有什么區(qū)別?2.什么是相關(guān)分析?什么是回歸分析?它們之間的聯(lián)系和區(qū)別是什么?3.簡述回歸分析的概念與特點。4.什么叫估計標準誤差?它有什么作用?

思考與練習二、計算題1.某地區(qū)2003—2010年人均收入和耐用消費品銷售額資料如表7.9所示。要求:根據(jù)以上簡單相關(guān)表的資料,繪制相關(guān)散點圖,并判斷相關(guān)關(guān)系的表現(xiàn)形式和方向。

思考與練習二、計算題2.有某行業(yè)10個企業(yè)的生產(chǎn)性固定資產(chǎn)年平均價值和工業(yè)總產(chǎn)值的數(shù)據(jù)資料如表7.10所示。根據(jù)表7.10中的數(shù)據(jù),求解下列各題。(1)計算相關(guān)系數(shù);(2)建立回歸直線方程;(3)計算估計標準誤差;(4)估計生產(chǎn)性固定資產(chǎn)(自變量)為1100萬元時的工業(yè)總產(chǎn)值。

思考與練習二、計算題3.某地高校教育經(jīng)費與高校學生數(shù)連續(xù)6年的統(tǒng)計資料如表7.11所示。根據(jù)表7.11中的數(shù)據(jù)求解下列各題:(1)建立回歸直線方程,估

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論