版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
1、第八章 相關(guān)與回歸分析 學(xué)習(xí)目的: 1. 理解現(xiàn)象之間存在的相關(guān)關(guān)系; 2. 能利用相關(guān)系數(shù)對相關(guān)關(guān)系進(jìn)行測定分析; 3. 明確相關(guān)分析與回歸分析的主要內(nèi)容以及它們各自的特點(diǎn); 4. 掌握一元線性回歸的基本原理和參數(shù)的最小二乘估計(jì); 5. 能夠?qū)貧w方程的顯著性進(jìn)行檢驗(yàn),并利用回歸方程進(jìn)行估計(jì)和預(yù)測。8-1第1頁,共24頁。第一節(jié) 相關(guān)分析一、變量間的關(guān)系 函數(shù)關(guān)系 是變量之間一種完全確定的關(guān)系。如,圓的面積與圓半徑之間的關(guān)系 即函數(shù)關(guān)系。 相關(guān)關(guān)系(correlation) 指變量之間的數(shù)量變化受隨機(jī)因素的影響而不能惟一確定的相互依存關(guān)系,其一般數(shù)學(xué)表達(dá)式為 ,其中 代表隨機(jī)因素。如,居民受
2、教育程度與收入的關(guān)系及相關(guān)關(guān)系。 由于客觀上常會出現(xiàn)觀察或測量上的誤差等原因,函數(shù)關(guān)系在實(shí)際工作中往往通過相關(guān)關(guān)系表現(xiàn)出來。而在研究相關(guān)關(guān)系時(shí),為了找出變量之間數(shù)量關(guān)系的內(nèi)在聯(lián)系和表現(xiàn)形式,又常常需要借助函數(shù)關(guān)系的形式加以描述。 8-2互動地帶第2頁,共24頁。第一節(jié) 相關(guān)分析二、相關(guān)關(guān)系的種類 根據(jù)相關(guān)變量之間的密切程度不同,可分為不相關(guān)、完全相關(guān)和不完全相關(guān)。 根據(jù)相關(guān)變量的變化方向劃分,可分為正相關(guān)和負(fù)相關(guān) 根據(jù)相關(guān)變量的多少劃分,可分為單相關(guān)和復(fù)相關(guān)。 根據(jù)變量間依存關(guān)系的形式劃分,可分為直線相關(guān)和曲線相關(guān)。三、相關(guān)關(guān)系的描述與測度 散點(diǎn)圖(scatter diagram) 用直角坐標(biāo)
3、的橫軸表示變量x的值,縱軸表示變量y的值,每組數(shù)據(jù)在直角坐標(biāo)系中用一個(gè)點(diǎn)表示,n組數(shù)據(jù)在直角坐標(biāo)系中形成的n個(gè)數(shù)據(jù)點(diǎn)稱為散布點(diǎn)或散點(diǎn),由坐標(biāo)及其散點(diǎn)形成的二維數(shù)據(jù)圖 。 8-3第3頁,共24頁。第一節(jié) 相關(guān)分析 散點(diǎn)圖與相關(guān)的類型8-4互動地帶第4頁,共24頁。第一節(jié) 相關(guān)分析相關(guān)系數(shù)(correlation coefficient) 是測度變量之間相關(guān)關(guān)系密切程度和相關(guān)方向的代表性指標(biāo)。對兩個(gè)變量之間線性相關(guān)程度的度量稱為簡單相關(guān)系數(shù)。若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計(jì)算的,稱為總體相關(guān)系數(shù),記為 ;若是根據(jù)樣本數(shù)據(jù)計(jì)算的,則稱為樣本相關(guān)系數(shù),記為 。兩個(gè)變量的線性相關(guān)系數(shù) 或8-5例8.1第5
4、頁,共24頁。第一節(jié) 相關(guān)分析 相關(guān)系數(shù)的取值范圍在-1和+1之間,即:1 1。 若0 1,表明和之間存在正線性相關(guān)關(guān)系; 若-1 0,表明和之間存在負(fù)線性相關(guān)關(guān)系; 若 =1,表明和之間是完全正線性相關(guān)關(guān)系; 若 = -1,表明和之間是完全負(fù)線性相關(guān)關(guān)系。 =0只表示兩個(gè)變量之間不存在線性相關(guān)關(guān)系,并不說明變量之間沒有任何關(guān)系,比如它們之間可能存在非線性相關(guān)關(guān)系。通常認(rèn)為,當(dāng)n較大時(shí):00.3為微弱相關(guān);0.30.5為低度相關(guān);0.50.8為顯著相關(guān);0.81為高度相關(guān)。相關(guān)系數(shù)的顯著性檢驗(yàn) ; 統(tǒng)計(jì)量 服從自由度為n-2的t分布8-6互動地帶第6頁,共24頁。 例8.2 根據(jù)對25家銀行的
5、調(diào)查數(shù)據(jù)計(jì)算不良貸款額與貸款余額的相關(guān)系數(shù)為0.8436。試檢驗(yàn)不良貸款額與貸款余額之間的相關(guān)系數(shù)是否顯著。 解:(1)提出原假設(shè)和備擇假設(shè) ; (2)取顯著性水平 =0.05,根據(jù)自由度 ,查 分布表得:臨界值 (3)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量 (4)由于 ,所以拒絕 ,表明不良貸款與貸款余額之間存在顯著的正線性相關(guān)關(guān)系。8-7互動地帶附表6第7頁,共24頁。第二節(jié) 一元線性回歸分析自變量與因變量 在回歸分析中,通常把被解釋(預(yù)測)變量稱為因變量(dependent variable),也叫響應(yīng)變量(response variable),一般假設(shè)為隨機(jī)變量; 把用來解釋(預(yù)測)的一個(gè)或多個(gè)變量稱為自變
6、量(independent variable),也稱為回歸變量(regressor),它可以是隨機(jī)變量,也可以是非隨機(jī)變量?;貧w的類型 如果回歸分析時(shí)只有一個(gè)自變量,則稱為一元回歸;含有兩個(gè)或兩個(gè)以上回歸變量時(shí)稱為多元回歸。 若響應(yīng)變量與回歸變量之間為線性關(guān)系就稱為線性回歸分析,否則稱為非線性回歸分析。 回歸模型(regression model) 描述響應(yīng)變量與回歸變量和誤差項(xiàng)之間的因果關(guān)系的數(shù)學(xué)表達(dá)式稱為回歸模型。 8-8第8頁,共24頁。第二節(jié) 一元線性回歸分析一、一元線性回歸模型理論回歸模型 式中A和B是未知常數(shù),稱作回歸系數(shù)(coefficient);回歸變量可以是隨機(jī)變量,也可以是
7、可以控制其取值的非隨機(jī)的普通變量; 是不可觀測的隨機(jī)變量,表示 和 的關(guān)系中不確定因素的影響,我們稱之為隨機(jī)誤差;響應(yīng)變量 為隨機(jī)變量。模型的三個(gè)假定 1. 隨機(jī)誤差 的期望值為0,即 2. 對于所有的 值, 的方差都相同 ; 3. 隨機(jī)誤差 是一個(gè)服從正態(tài)分布的隨機(jī)變量,且各次觀測的隨機(jī)誤差 相互獨(dú)立?;貧w方程 8-9第9頁,共24頁。第二節(jié) 一元線性回歸分析估計(jì)的回歸方程 總體回歸參數(shù)A和B是未知的,我們必須利用樣本數(shù)據(jù)去估計(jì)它們。用樣本統(tǒng)計(jì)量 和 代替回歸方程中的未知參數(shù)A和B,可以得出估計(jì)的一元線性回歸方程式: 式中, 是估計(jì)的回歸直線在 軸上的截距; 是直線的斜率; 是 的 估計(jì)值,
8、也稱 為 的回歸值(regressand value)或擬合值(fitted value)。 為 每變動一個(gè)單位時(shí), 的平均變動值。二、參數(shù)的最小二乘估計(jì) 在根據(jù)散布點(diǎn)去擬合回歸直線時(shí),應(yīng)使得直線 所代表的估計(jì)值 和與其對應(yīng)的實(shí)際觀測值 之間的差為最小,即殘差(residual)最小。 即:8-10互動地帶第10頁,共24頁。第二節(jié) 一元線性回歸分析 利用數(shù)學(xué)求極值的方法,由條件 且 可得關(guān)于參數(shù)和的方程組(稱為標(biāo)準(zhǔn)方程組或正規(guī)方程組): 解得: 8-11第11頁,共24頁。 例8.3 根據(jù)表的數(shù)據(jù),求不良貸款對貸款余額的回歸方程。分行編號 各項(xiàng)貸款余額(觀測值) 不良貸款額(觀測值) 不良貸
9、款額(估計(jì)值) 殘差 -1234567891011121314151617181920212223242567.3111.3173.080.8199.716.2107.4185.496.172.864.2132.258.6174.6263.579.314.873.524.7139.4368.295.7109.6196.2102.20.91.14.83.27.82.71.612.51.02.60.34.00.83.510.23.00.20.41.06.811.61.61.27.23.21.7208 3.3882 5.7263 2.2324 6.7381 -0.2156 3.2404 6.1962
10、 2.8122 1.9292 1.6033 4.1802 1.3911 5.7869 9.1557 2.1755 -0.2687 1.9557 0.1065 4.4530 13.1233 2.7970 3.3237 6.6054 3.0433 -0.8208 -2.2882 -0.9263 0.9676 1.0619 2.9156 -1.6404 6.3038 -1.8122 0.6708 -1.3033 -0.1802 -0.5911 -2.2869 1.0443 0.8245 0.4687 -1.5557 0.8935 2.3470 -1.5233 -1.1970 -2.1237 0.59
11、46 0.1567 8-12第12頁,共24頁。 解: 作散點(diǎn)圖判斷回歸類型為直線回歸。代入公式求回歸系數(shù) 其回歸方程為: 這表明:銀行貸款余額越多,則不良貸款額越高;貸款余額每增加1億元,不良貸款平均增加0.0378947億元。8-13互動地帶第13頁,共24頁。第二節(jié) 一元線性回歸分析三、一元線性回歸模型的檢驗(yàn)離差平方和的分解 總平方和等于回歸平方和與殘差平方和之和。 即: SST=SSR+SSE 式中,回歸效果的顯著性檢驗(yàn) 1、判定系數(shù) 對于一元回歸, 越接近于 1,表明回歸直線與各觀測點(diǎn)越接近,回歸直線的擬合程度就越好; 越接近于 0,表明回歸方程的擬合程度越差。 8-14第14頁,共
12、24頁。第二節(jié) 一元線性回歸分析 2.估計(jì)標(biāo)準(zhǔn)誤差(standard error of estimate) 估計(jì)標(biāo)準(zhǔn)誤差 越小,說明各觀測點(diǎn)越靠近直線,回歸直線對各觀測點(diǎn)的代表性就越好,用于預(yù)測的可靠性越高。 3、回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn)) 檢驗(yàn)提出的假設(shè): 檢驗(yàn)使用的統(tǒng)計(jì)量: 其中, 若 ,則拒絕H0,回歸系數(shù)等于零的可能性小于,說明兩個(gè)變量之間存在顯著的線性關(guān)系;若 ,則不拒絕H0,回歸系數(shù)有可能為零,不能證明兩個(gè)變量之間存在顯著的線性關(guān)系。 8-15互動地帶互動地帶第15頁,共24頁。第二節(jié) 一元線性回歸分析4、回歸方程的顯著性檢驗(yàn)(F檢驗(yàn)) 檢驗(yàn)提出的假設(shè): 兩個(gè)變量間的線性關(guān)系不
13、顯著 兩個(gè)變量間的線性關(guān)系顯著 檢驗(yàn)所用的統(tǒng)計(jì)量: 若 ,則拒絕H0,說明兩個(gè)變量之間的線性關(guān)系是顯著的;若 ,則不拒絕H0,不能證明兩個(gè)變量之間存在顯著的線性關(guān)系。 例8.4 根據(jù)例8.1的數(shù)據(jù),求利潤總額對銷售收入回歸的判定系數(shù),并對回歸系數(shù)進(jìn)行檢驗(yàn)。 解: 由于 , 均說明了不良貸款與貸款余額之間的線性關(guān)系是顯著的。 8-16互動地帶第16頁,共24頁。第二節(jié) 一元線性回歸分析 四、一元線性回歸模型預(yù)測 點(diǎn)預(yù)測 利用估計(jì)的回歸模型 ,對于給定的變量 的任一值,用回歸值 作為變量 的預(yù)測(估計(jì))值 。區(qū)間預(yù)測 1、 的平均值的置信區(qū)間估計(jì) 對于給定的 , 在給定置信水平 條件下的預(yù)測區(qū)間為
14、: 2、 的個(gè)別值的預(yù)測區(qū)間估計(jì) 當(dāng)給定置信水平 時(shí), 值的預(yù)測區(qū)間為: 8-17第17頁,共24頁。 例8.7 根據(jù)例8.3的估計(jì)回歸方程,求出(1)貸款余額為100億元時(shí),不良貸款95%的置信區(qū)間;(2)貸款余額為80.8億元那個(gè)分行不良貸款的預(yù)測區(qū)間 。 解:已知: , 查表得 (1) 當(dāng) 時(shí),不良貸款的點(diǎn)估計(jì)值為: 的置信區(qū)間為: (2)貸款余額為80.8億元那個(gè)分行不良貸款的預(yù)測區(qū)間 為: 8-18第18頁,共24頁。第三節(jié) 多元線性回歸分析多元線性回歸分析是研究一個(gè)因變量(被解釋變量)與兩個(gè)或兩個(gè)以上自變量(解釋變量)之間相依關(guān)系的統(tǒng)計(jì)分析方法。一、多元線性回歸模型多元回歸模型(m
15、ultiple regression model ) 其中,隨即誤差 相應(yīng)滿足: (1)隨機(jī)誤差的期望值為0,即 (觀測無系統(tǒng)誤差); (2)對于解釋變量 的所有值, 的方差都相同; (3)各次觀測的隨機(jī)誤差 相互獨(dú)立,因而 也相互獨(dú)立。估計(jì)(樣本)回歸方程 其中的 稱為偏回歸系數(shù)。 表示當(dāng) 不變時(shí), 每變動一個(gè)單位因變量 的平均變動量。 8-19第19頁,共24頁。第三節(jié) 多元線性回歸分析二、多元參數(shù)的最小二乘估計(jì) 設(shè) 對其求極值得: 解此方程組即得各偏回歸系數(shù)。多元回歸系數(shù)一般使用計(jì)算機(jī)軟件求得。三、多元線性回歸模型的檢驗(yàn) 1、多重判定系數(shù)。 越接近1,說明回歸效果越顯著。為避免增加自變量
16、 被高估,可計(jì)算修正的多重判定系數(shù): 的平方根 稱為復(fù)相關(guān)系數(shù),也稱多重相關(guān)系數(shù)。 8-20第20頁,共24頁。第三節(jié) 多元線性回歸分析 2、估計(jì)標(biāo)準(zhǔn)誤差回歸系數(shù)的顯著性檢驗(yàn) 1. F檢驗(yàn) 檢驗(yàn)的假設(shè): : ; :至少有一個(gè)回歸參數(shù)不為零 檢驗(yàn)使用的統(tǒng)計(jì)量: 若 ,則認(rèn)為模型的總體回歸效果顯著; 若 ,則認(rèn)為模型總體的回歸效果不顯著。 2. t檢驗(yàn) : ; : 若 ,則拒絕 ,回歸系數(shù) 等于零的可能性小于,得出的結(jié)論,說明變量 的作用顯著;若 ,則不拒絕 。說明變量 的作用不顯著,可從模型中剔除。 8-21第21頁,共24頁。 例8.9 某地區(qū)管理部門,為了分析商業(yè)零售企業(yè)利潤額與商品銷售額、流通費(fèi)用額的相關(guān)關(guān)系,隨機(jī)抽取了10個(gè)商業(yè)零售企業(yè),調(diào)查某月的商品銷售額、流通費(fèi)用額和利潤額情況,其數(shù)據(jù)資料如表8.3所示。 表8.3 利潤額與商品銷售額、流通費(fèi)用額數(shù)據(jù)資料單位:萬元求利潤額以商品銷售額和流通費(fèi)用率的回歸方程,并對其進(jìn)行統(tǒng)計(jì)檢驗(yàn)。序號 利潤額 商品銷售額 流通費(fèi)用額 123456789103.64.04.23.83.84.24.44.85.05.2404348424145475052564.8 4.9 5.7 5.0 4.8 5.0 5.7 5.7 6.1 6.5 合計(jì)43.04
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 中國美術(shù)專業(yè)高校招生情況分析
- 2026年橋梁動態(tài)特性分析與耐久性評估的方法
- 2026年《基于BIM的結(jié)構(gòu)分析與設(shè)計(jì)示例》
- 2026年房地產(chǎn)行業(yè)的人工智能人才培養(yǎng)
- 2026年消防系統(tǒng)聯(lián)動設(shè)計(jì)與電氣配合
- 2026年新市場環(huán)境對電氣生產(chǎn)的影響
- 基于區(qū)塊鏈的跨境支付創(chuàng)新研究-洞察及研究
- 2026年橋梁耐久性評估的深度學(xué)習(xí)技術(shù)應(yīng)用
- 2026年電氣設(shè)備運(yùn)行時(shí)的監(jiān)控指標(biāo)
- 高分辨率線光源干涉技術(shù)研究-洞察及研究
- 斜弱視眼科學(xué)
- 電商平臺需求規(guī)格說明書-通用版本
- GB/T 3372-2010拖拉機(jī)和農(nóng)業(yè)、林業(yè)機(jī)械用輪輞系列
- 北京城市旅游故宮紅色中國風(fēng)PPT模板
- 經(jīng)濟(jì)學(xué)原理 第一章課件
- 安川伺服說明書
- 社會組織管理概論全套ppt課件(完整版)
- 酒精度檢測原始記錄
- 冷渣機(jī)檢修工藝
- 建筑風(fēng)水學(xué)培訓(xùn)
- SAP成本月結(jié)操作及標(biāo)準(zhǔn)成本估算
評論
0/150
提交評論