回歸分析和回歸方程、變量相互關系分析..ppt_第1頁
回歸分析和回歸方程、變量相互關系分析..ppt_第2頁
回歸分析和回歸方程、變量相互關系分析..ppt_第3頁
回歸分析和回歸方程、變量相互關系分析..ppt_第4頁
回歸分析和回歸方程、變量相互關系分析..ppt_第5頁
免費預覽已結束,剩余91頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、相關與回歸分析,第一節(jié) 變量間關系的度量 第二節(jié) 一元線性回歸分析 第三節(jié) 利用回歸方程進行估計和預測,第一節(jié) 變量間關系的度量,一、變量間的函數關系與相關關系 二、相關關系的描述與測度 三、相關系數的顯著性檢驗,一、變量間的函數關系與相關關系,客觀現象之間是普遍聯系相互依存的。 客觀現象之間的數量聯系可分為兩類: 確定性關系(函數關系) 非確定性關系(相關關系),函數關系,一個或幾個變量取一定值時另一個變量有確定值與之對應,這種變量間一一對應的確定性關系稱為函數關系。 例如,設有兩個變量 x 和 y ,變量 y 隨變量 x 變化,并完全依賴于 x ,當變量 x 取某個數值時, y 依確定的關

2、系取相應的值,則稱 y 是 x 的函數,記為 y = f (x),其中 x 稱為自變量,y 稱為因變量。,兩變量函數關系在圖形上表現為各觀測點落在一條線上, 函數關系舉例,某種商品的銷售額(y)與銷售量(x)之間的關系可表示為 y = p x (p 為單價) 圓的面積(S)與半徑(R)之間的關系可表示為S = R2 企業(yè)原材料消耗額(y)與產品產量(x1) 、單位產量原材料消耗量(x2) 、原材料價格(x3)之間的關系可表示為y = x1 x2 x3,相關關系,一個或幾個相互聯系的變量取一定值時,與之對應的另一個變量的值雖然不確定,但它按某種規(guī)律在一定范圍內變化,這種變量間的不確定性對應關系稱

3、為相關關系。 例如,設有兩個變量 x 和 y ,變量 y 隨變量 x 一起變化,但不完全依賴于 x ,當變量 x 取某個值時,變量 y 的取值可能有幾個,但取值范圍變化有一定規(guī)律,則稱 y 與 x 之間有相關關系。,兩變量相關關系在圖形上表現為各觀測點分布在線的周圍, 相關關系舉例,商品的消費量(y)與居民收入(x)之間的關系 商品銷售額(y)與廣告費支出(x)之間的關系 糧食畝產量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關系 收入水平(y)與受教育程度(x)之間的關系 父親身高(y)與子女身高(x)之間的關系,相關關系,相關關系比因果關系包括的范圍更廣泛。具有相關關系的

4、某些現象的數量可表現為因果關系,即自變量與因變量的關系,但有時不存在明顯的因果關系或互為因果關系,如人的身高和體重、商品的供求與價格等。 變量間的函數關系與相關關系在一定條件下可以相互轉化。當存在測量誤差或隨機因素的干擾時,函數關系可表現為相關關系;當我們對變量內在聯系有規(guī)律性認識時,相關關系可能轉化為函數關系或用函數關系來描述。,相關分析,現象的函數關系可以用數學分析方法研究和測度,現象的相關關系需用統(tǒng)計學的相關與回歸分析方法研究和測度。 相關分析是描述和測度變量間相關關系類型和相關程度的分析方法。在相關分析中,所有變量都假定是隨機變量,它們之間不存在解釋變量和被解釋變量的關系,即不考慮因果

5、關系。,相關關系的種類,1按相關因素的多少分 單相關 復相關 2按相關關系的形式分 線性相關(直線相關) 非線性相關(曲線相關) 3按相關關系的方向分 正相關 負相關 4按相關關系的程度分 完全相關 不完全相關 不相關,相關關系的種類,簡單相關和多元相關(多重相關、復相關) 簡單相關指兩個變量之間的相關關系;多元相關指三個或三個以上變量之間的相關關系。 線性相關和非線性相關 如果散點圖上的所有的點幾乎接近一條直線,可以認為變量之間是線性相關的;如果散點圖上的所有點幾乎接近一條曲線,可以認為變量之間是非線性相關的。,相關關系的種類,正相關和負相關 如果相關變量之間同增或同減,稱這種相關關系是正相

6、關。如果相關變量間一個變量值增加時另一個變量值減少,稱這種相關關系是負相關。 完全相關、不完全相關和不相關 如果一個變量的變化完全由另一個變量的變化所確定,則稱兩變量的關系為完全相關,即為函數關系;如果兩個變量間的關系很弱或看不出任何關系,則稱之為不相關(或零相關)。兩變量的關系介于完全相關和不相關之間稱為不完全相關。,二、相關關系的描述與測度,判斷現象之間有無相關關系,應先進行定性分析,即依據理論知識、實踐經驗對現象之間是否存在相關關系及相關關系的類型作出判斷。然后在此基礎上進行定量分析,即運用相關圖、相關表和相關系數等方法對現象之間的相關關系進行描述與測度。 相關表 相關關系的圖示 相關系

7、數,相關表,簡單相關表 例:居民消費支出和收入的相關表 (單位:百元) 根據以上資料繪制坐標圖便得到相關圖,單變量分組表,例:30家企業(yè)按產品產量分組的平均單位產品成本,雙變量分組表例:30家企業(yè)按產品產量和單位產品成本分組,相關關系的圖示(散點圖scatter diagram),如何制作散點圖?Minitab教您怎么制作散點圖(scatter diagram) /thread-4292-1-1.html Minitab制作3D散點圖(3D Scatterplot)的方法,如何制作3D散點圖教程 /thread-4

8、639-1-1.html,散點圖(例題分析),【例9.1】一家大型商業(yè)銀行在多個地區(qū)設有分行,其業(yè)務主要是進行基礎設施建設、國家重點項目建設、固定資產投資等項目的貸款。近年該銀行貸款額平穩(wěn)增長,但不良貸款額也有較大提高,給銀行業(yè)務發(fā)展帶來較大壓力。為弄清不良貸款形成的原因,以便找出控制不良貸款的辦法,現利用銀行有關業(yè)務數據進行相關分析。下面是該銀行所屬25家分行2002年的有關業(yè)務數據。,散點圖(例題分析),散點圖(例題分析),相關系數,相關系數是對變量之間關系密切程度的度量 對兩個變量之間線性相關程度的度量稱為簡單相關系數(簡稱相關系數) 若相關系數是根據總體全部數據計算的,稱為總體相關系數

9、,記為 若相關系數是根據樣本數據計算的,則稱為樣本相關系數,記為 r 在此僅討論兩變量間相關關系問題。對于隨機變量x和y,總體相關系數一般是未知的,只能根據樣本觀測值給出一個估計量即樣本相關系數r。,樣本相關系數r的計算公式,或化簡為,相關系數取值及其意義,r 的取值范圍是 -1,1 |r|=1,表明x與y完全線性相關 r =1,為完全正線性相關 r =-1,為完全負線性相關 r = 0,表明x與y不存在線性相關關系 -1r0,為負線性相關 0r1,為正線性相關 |r|越趨于1表示x與y線性關系越密切;|r|越趨于0表示x與y線性關系越不密切,相關系數(取值及其意義),r,樣本容量適中時相關關

10、系程度一般判斷標準,無相關或微弱相關 低度相關 中度相關(顯著相關) 高度相關 這種判斷必須建立在對相關系數進行顯著性檢驗的基礎上。,相關系數計算例,【例9.2】在我國居民消費水平研究中,將人均消費額記為y,人均國民收入記為x。收集到19811993年的樣本數據(xi ,yi,i =1,2,,13)見下表,計算相關系數。,相關系數計算例表,例計算結果,相關系數 相關系數為 0.9987,顯示人均國民收入與人均消費金額之間高度正相關。,相關系數計算例 【例】用例9.1數據計算出該商業(yè)銀行不良貸款、貸款余額、應收貸款、貸款項目、固定資產投資額之間的相關系數如下:,可以看出,不良貸款與貸款余額的相關

11、系數最大,與固定資產投資額的相關系數最小。,三、相關系數的顯著性檢驗,根據樣本計算的相關系數r能否代表總體相關系數,只有對其檢驗以后才能下結論。因其具有一定的隨機性,樣本容量越小其可信程度越差。 相關系數的顯著性檢驗問題可分為兩類: 一是對總體相關系數是否等于0進行檢驗; 二是對總體相關系數是否等于某一給定的不為0的數值進行檢驗。 這里只介紹第一類檢驗。,相關系數的顯著性檢驗(方法與步驟),數學上可以證明,在X與Y都服從正態(tài)分布且 的條件下,可以采用t 檢驗來確定r 的顯著性。檢驗統(tǒng)計量t 服從自由度為n-2的t 分布,即 檢驗的步驟為: 提出假設:假設樣本是從一個不相關的總體中抽出的,即 H

12、0: ;H1: 0 計算檢驗統(tǒng)計量: 根據給定的顯著性水平和自由度df=n-2查t分布表得t(n-2)的臨界值,并作出決策: 若tt(n-2),拒絕H0,表明r在統(tǒng)計上是顯著的,兩變量之間存在顯著線性關系;若tt(n-2),接受H0,表明r在統(tǒng)計上是不顯著的。,相關系數的顯著性檢驗(例題分析),【例】 對前述用例9.2數據計算的人均消費額與人均國民收入相關系數進行顯著性檢(0.05) 提出假設:H0: ;H1: 0 計算檢驗統(tǒng)計量,根據顯著性水平0.05,查t分布表得臨界值 t(n-2)=t0.025(13-2)=2.201 由于t=64.9809t0.025(13-2)=2.201,所以拒絕

13、H0,接受H1,即說明人均消費金額與人均國民收入之間的相關關系顯著。,相關系數的顯著性檢驗(例題分析),【例】對前述用例9.1數據計算的某大型商業(yè)銀行例不良貸款與貸款余額之間的相關系數進行顯著性檢(0.05) 提出假設:H0: ;H1: 0 計算檢驗的統(tǒng)計量,3.根據顯著性水平=0.05和自由度df=n-2=25-2=23查t分布表得t0.025(23)=2.0687 由于t=7.5344t0.05(23)=2.0687,所以拒絕H0,說明不良貸款與貸款余額之間存在顯著正線性相關關系,相關系數的顯著性檢驗(例題分析),對前述9.1例某大型商業(yè)銀行各相關系數計算檢驗統(tǒng)計量數據如下,同學們可以自行

14、檢驗和分析,第二節(jié) 一元線性回歸分析,一、回歸分析的含義 二、一元線性回歸模型及其參數的估計 三、回歸直線擬合程度的評價 四、一元線性回歸模型的檢驗,一個用Minitab做的回歸方程Regression equation案例: 判斷標準P0.05 /thread-7745-1-1.html 什么是回歸方程(Regression equation)? 如何用Minitab制作回歸方程 /thread-4643-1-1.html Minitab做回歸方程分析時:線性一次Liner, 二次Quadratic, 三次立方C

15、ubic的選擇 /thread-8238-1-1.html,一、回歸分析的含義,什么是回歸 回歸是由英國著名統(tǒng)計學家Francis Galton在19世紀末期研究孩子及其父母的身高時提出來的。Galton發(fā)現身材高的父母,他們的孩子也高。但這些孩子平均起來并不像他們父母那樣高。比較矮的父母情形也類似:他們的孩子比較矮,但這些孩子的平均身高要比他們父母的平均身高高。 Galton把這種孩子的身高向中間值靠近的趨勢稱之為一種回歸效應,而他發(fā)展的研究兩個數值變量之間數量關系的方法稱為回歸分析。 什么是回歸分析 回歸分析是對具有相關關系的變量擬合數學方程,通過一

16、個或一些變量的變化解釋另一變量變化的方法。,回歸分析的內容和步驟,根據理論和對問題的分析判斷,區(qū)分自變量(即解釋變量)和因變量(即被解釋變量); 從一組樣本數據出發(fā),設法確定合適的數學方程式(即回歸模型regression model)描述變量間的關系; 對數學方程式(回歸模型)的可信程度進行統(tǒng)計檢驗,并從影響某一特定變量的諸多變量中找出哪些變量的影響顯著,哪些不顯著; 利用數學方程式(回歸模型),根據一個或幾個自變量的取值來估計或預測因變量的取值,并給出這種估計或預測的精確程度。,回歸分析與相關分析的區(qū)別,相關分析中,變量 x 與 y 處于平等地位;回歸分析中具有相關關系的變量之間地位是非對

17、等的,變量 y 稱為因變量,處在被解釋的地位,x 稱為自變量,用于預測因變量的變化 相關分析中所涉及的變量 x 和 y 都是隨機變量;回歸分析中,因變量 y 是隨機變量,自變量 x 可以是隨機變量,也可以是非隨機的確定變量 相關分析主要描述變量之間相關關系的密切程度;回歸分析不僅可以揭示變量 x 對變量 y 的影響大小,還可以由回歸方程進行估計和預測,回歸模型的類型,按涉及變量多少分為:一元回歸和多元回歸 按變量相關的形式分:線性回歸和非線性回歸 (本節(jié)僅討論一元回歸分析問題),二、一元線性回歸模型及其參數的估計 一元線性回歸模型的設定,對于只涉及一個自變量的回歸分析,若因變量y與自變量x之間

18、為線性關系,可以用一個線性方程來表示二者之間的關系,此方程為一元線性回歸模型。 通常先要收集若干(n)組樣本數據(xi ,yi,i=1,2,n),然后將數據繪制散點圖,若圖中顯示x和y之間大致呈線性關系,就可以用一元線性回歸方程來描述這種關系。,一元線性回歸模型(理論模型),一元線性回歸模型可表示為 y = b0 + b1 x + e 此模型將變量y與x間的關系用兩部分描述。一部分是由x的變化引起y線性變化的部分,即: 另一部分是由其他隨機因素引起y線性變化的部分,記為。該回歸模型表達了變量x與y之間密切相關、但還沒有到y(tǒng)由x唯一確定的密切程度的關系。 模型中,一般稱y為被解釋變量(因變量),

19、x為解釋變量(自變量)。0和1為模型的參數,又稱回歸系數。為隨機誤差項,又稱隨機干擾項,表示除能用 x 和 y 之間線性關系解釋的因素外的其他隨機因素對 y 的影響。,一元線性回歸模型(理論模型的基本假定),誤差項是一個不可觀測的且期望值為0的隨機變量,即E()=0。對于一個給定的x值,y的期望值為 E ( y ) = 0+ 1 x 對于所有的 x 值,的方差2都相同。 誤差項是一個服從正態(tài)分布的隨機變量,且相互獨立,即N( 0 ,2 ) 獨立性意味著對于一個特定的 x 值,它所對應的與其他 x 值所對應的不相關 對于一個特定的 x 值,它所對應的 y 值與其他 x 所對應的 y 值也不相關,

20、一元線性回歸模型(應用模型) (估計的回歸方程estimated regression equation ),由于為隨機因素不可觀測,其期望值為0,所以通常用y的數學期望E ( y ) 作為y的估計,即 E( y ) = 0+ 1 x 由于總體回歸參數0和1是未知的,必須利用樣本數據估計,所以用樣本統(tǒng)計量 和 代替回歸方程中的未知參數0和1,就得到了應用的估計一元線性回歸方程 式中: 是y的估計值,表示對于一個給定的x值,估計的y的期望值, 是估計的回歸直線在y軸上的截距,是當 x=0 時 y的期望值, 是直線的斜率,表示x每變動一個單位時,y的平均變動值,一元線性回歸模型參數的估計,用來估計

21、一元線性回歸模型參數0和1的方法是最小二乘法,其要點為: 它是使因變量的觀察值與估計值之間的離差平方和達到最小來求得 和 的方法。即 用此法擬合的直線來代表x與y之間的關系與實際數據的誤差比其他任何直線都小,最小二乘法(圖示),最小二乘法( 和 的計算公式), 根據最小二乘法的要求,可得求解 和 的標準方程如下,從 的計算公式可以看出其分母大于0。 的正負取決于分子,且分子與相關系數r的分子相同。 0時,表示x每增加一個單位y值平均增加的數量,即x與y正相關; 0時,表示x每增加一個單位y值平均減少的數量,即x與y負相關。,一元線性回歸模型估計(舉例),【例】用例9.2中的數據配合人均消費金額

22、對人均國民收入的回歸方程 根據 和 的求解公式得 的含義是人均國民收入每增加1元,人均消費額平均增加約0.53元。,一元線性回歸模型估計(舉例),人均消費金額對人均國民收入的回歸方程為,y = 54.22286 + 0.52638 x,一元線性回歸模型估計(舉例),【例】對例9.1數據求某大型商業(yè)銀行不良貸款對貸款余額的回歸方程,回歸方程為:y = -0.8295 + 0.037895 x 回歸系數 =0.037895 表示,貸款余額每增加1億元,不良貸款平均增加0.037895億元。,一元線性回歸模型估計(舉例),不良貸款對貸款余額回歸方程的圖示,用Excel進行回歸分析,第1步:選擇“工具

23、”下拉菜單 第2步:選擇“數據分析”選項 第3步:在分析工具中選擇“回歸”,然后選擇“確定” 第4步:當對話框出現時 在“Y值輸入區(qū)域”方框內鍵入Y的數據區(qū)域 在“X值輸入區(qū)域”方框內鍵入X的數據區(qū)域 在“置信度”選項中給出所需的數值 在“輸出選項”中選擇輸出區(qū)域 在“殘差”分析選項中選擇所需的選項,三、回歸直線擬合程度的評價,根據估計的回歸方程由自變量的值估計因變量的值,估計精度取決于回歸方程對觀察數據的擬合程度。 回歸直線與各觀測點的接近程度稱為回歸直線對數據的擬合優(yōu)度。它可以通過判定系數和估計標準誤差來反映。 離差平方和的分解和判定系數 估計標準誤差,離差平方和的分解和判定系數 1.離差

24、平方和的分解,為說明直線的擬合程度,需要研究因變量y取值的變化規(guī)律。 因變量y取值的波動(或差異)稱為變差。變差來源于兩個方面: 由于自變量 x 的取值不同造成的 由于受自變量x以外的其他因素(如x對y的非線性影響、測量誤差等)的影響 某一項具體觀測值的變差可以用該觀測值與其均值之差 來表示。全部n項觀測值的總變差(記為SST)可由各觀測值與均值離差的平方和來表示,即:,離差平方和的分解(圖示),離差平方和的分解(三個平方和的關系),兩端平方并對所有點求離差平方和,有,從圖上看有,SST = SSR + SSE,離差平方和的分解(三個平方和的意義),總變差平方和(SST) 反映因變量的 n 個

25、觀察值與其均值的總離差 回歸離差平方和(SSR) 反映自變量x的變化對因變量y取值變化的影響,或者說是由于x與y之間的線性關系引起的y的取值變化,也稱為可解釋的變差平方和 殘差平方和(SSE) 反映除x以外的其他因素對y取值的影響,也稱為不可解釋的變差平方和或剩余變差平方和 從上圖可以看出,在總變差平方和(SST)中回歸離差平方和(SSR)的比例越大,回歸直線擬合越好。,2.判定系數 r2 (coefficient of determination),將回歸離差平方和(SSR)在總變差平方和(SST)中的比例定義為判定系數,或稱樣本決定系數、可決系數,記為r2。它有以下要點: 是回歸離差平方和

26、占總變差平方和的比例,基本公式: 反映回歸直線的擬合程度 取值范圍在 0,1 之間 判定系數r2越接近于1,說明回歸方程擬合越好;判定系數r2越接近于0,說明回歸方程擬合越差 判定系數等于相關系數的平方,即r2(r)2,判定系數r2 (舉例),【例】對例9.2數據計算人均消費額與人均國民收入相關關系判定系數為 r2(0.9987)20.9974 說明在人均消費額的總變差中有99.74可以由人均國民收入與人均消費額之間的線性關系來解釋,或者說在人均消費額取值的變動中,有99.74%是由人均國民收入所決定的。說明二者之間有較強的線性關系。,判定系數r2 (舉例),【例】對例9.1數據計算某大型商業(yè)

27、銀行不良貸款額對貸款余額回歸的判定系數 意義:在不良貸款額的變差中有71.16%可以由不良貸款與貸款余額之間的線性關系來解釋,或者說在不良貸款額的變動中,有71.16%是由貸款余額所決定的??梢姴涣假J款與貸款余額之間有較強的線性關系 。,估計標準誤差 Sy (standard error of estimate),估計標準誤差是對回歸模型隨機誤差項的標準差的估計,即觀察值與回歸估計值離差平方和的均方根,是在排除了x對y的線性影響后對因變量y隨機波動大小的一個估計量。 反映觀察值在回歸直線周圍的分散程度和回歸方程對因變量代表性的大小,其數值越大說明代表性越小。也反映用估計的回歸方程預測y時預測誤

28、差的大小,其數值越大說明預測誤差越大。 可從另一個角度說明回歸直線的擬合程度。 計算公式為,估計標準誤差 Sy (舉例),【例】對例9.2數據計算人均消費額對人均國民收入回歸模型的估計標準誤差Sy 計算結果:Sy14.9497 說明利用回歸模型根據人均國民收入預測人均消費額時,平均預測誤差為14.95元。 【例】對例9.1數據計算某大型商業(yè)銀行不良貸款對貸款余額回歸模型的估計標準誤差Sy 計算結果:Sy1.9799 說明利用回歸模型根據貸款余額預測不良貸款額時,平均預測誤差為1.9799億元。,估計標準誤差與相關系數的關系,可以看出估計標準誤差Sy與相關系數r有相反的數量關系,|r|越大,Sy

29、越小。 如果Sy0,則|r|1。此時x與y完全相關。 因此估計標準誤差可以從另一個角度說明x與y相關關系的密切程度。但估計標準誤差所表現的關系密切程度不很明顯,且不能反映相關關系的正負方向。,四、一元線性回歸模型的檢驗,在根據樣本數據擬合回歸方程時,首先假設變量x和y之間存在線性關系,這種假設是否成立必須經過檢驗才能證實。 回歸分析中的顯著性檢驗包括兩方面內容: 回歸方程線性關系的顯著性檢驗 回歸系數的顯著性檢驗,回歸方程線性關系的顯著性檢驗,是檢驗自變量與因變量之間線性關系是否顯著。 方法是將回歸均方(MSR)同殘差均方(MSE)加以比較,應用F檢驗分析二者之間的差別是否顯著 回歸均方(MS

30、R):回歸離差平方和(SSR)除以相應的自由度(自變量的個數p) 殘差均方(MSE):殘差平方和(SSE)除以相應的自由度(n-p-1) 如果差別顯著,兩個變量之間存在線性關系 如果差別不顯著,兩個變量之間不存在線性關系,回歸方程線性關系的顯著性檢驗(檢驗的步驟),1.提出假設:H0:兩變量之間的線性關系不顯著 H1:兩變量之間的線性關系顯著 2.計算檢驗統(tǒng)計量F,其中,F(1,n-2)表示第一自由度為1,第二自由度為n-2的F分布。 3. 確定顯著性水平,并根據分子自由度1和分母自由度n-2查F分布表找出臨界值F 4. 作出決策:若FF ,拒絕H0;若FF ,接受H0,回歸方程線性關系的顯著

31、性檢驗(舉例),【例】對例9.1數據建立的不良貸款對貸款余額的回歸方程,進行回歸方程線性關系的顯著性檢驗。給定顯著性水平0.05。 提出假設 H0:1=0 即不良貸款與貸款余額之間的線性關系不顯著 計算檢驗統(tǒng)計量F 查F分布表得臨界值: F(1,n-2)=F0.05(1,25-2)=4.28 F=56.75F0.05(1,25-2)=4.84 拒絕H0,說明貸款余額x與不良貸款y之間存在顯著的線性關系,即回歸方程線性關系顯著。,線性關系的顯著性檢驗 (方差分析表),Excel 輸出的方差分析表,平方和,均方,回歸系數的顯著性檢驗,是檢驗自變量x對因變量y的影響是否顯著。 方法是檢驗回歸系數1是

32、否為0,如果1為0,回歸直線為一條水平線,表明兩變量之間沒有線性關系,反之,如果1不為0,表明x對y的影響是顯著的,兩變量之間存在線性關系。 檢驗的理論基礎是回歸系數 的抽樣分布,即假定其抽樣分布服從正態(tài)分布。 在一元線性回歸中,自變量只有一個,回歸系數的顯著性檢驗(t檢驗)等價于回歸方程線性關系的顯著性檢驗(F檢驗),如果t檢驗顯著,F檢驗結果也一定顯著。但在多元回歸分析中兩種檢驗的意義不同。,回歸系數的顯著性檢驗(樣本統(tǒng)計量 的分布),是根據最小二乘法求出的樣本統(tǒng)計量,有自己的分布,其分布具有如下性質 分布形式:正態(tài)分布 數學期望: 標準差: 由于總體未知,需用其估計量Sy 來代替得到 的

33、估計的標準差,回歸系數的顯著性檢驗(步驟),提出假設 H0: b1 = 0 (沒有線性關系) H1: b1 0 (有線性關系) 計算檢驗的統(tǒng)計量,確定顯著性水平,并進行決策 tt (n-2) ,拒絕H0; tt (n-2) ,接受H0,回歸系數的顯著性檢驗(例題分析),【例】對例9.1數據建立的回歸方程的回歸系數進行顯著性檢驗(0.05) 提出假設 H0:b1 = 0 H1:b1 0 計算檢驗的統(tǒng)計量,t=7.533797t (n-2)=t0.025(25-2)=2.0687,拒絕H0,表明不良貸款與貸款余額之間有線性關系,回歸系數的顯著性檢驗(例題分析),P 值的應用,P=0.000000=

34、0.05,拒絕原假設,不良貸款與貸 款余額之間有線性關系,第三節(jié) 利用回歸模型進行估計預測,一、點估計 二、區(qū)間估計,利用回歸方程進行估計和預測,回歸方程通過檢驗就可以根據自變量 x 的取值估計或預測因變量 y的取值。 估計或預測的類型: 點估計 y 的平均值的點估計 y 的個別值的點估計 區(qū)間估計 y 的平均值的置信區(qū)間估計 y 的個別值的預測區(qū)間估計,一、點估計,點估計是對于自變量 x 的一個給定值x0 ,根據回歸方程得到因變量 y 的一個估計值 2. 點估計值有 y 的平均值的點估計 y 的個別值的點估計 3. 在點估計條件下,平均值的點估計和個別值的的點估計是一樣的,但在區(qū)間估計中則不

35、同,y 的平均值的點估計,利用估計的回歸方程,對于自變量 x 的一個給定值 x0 ,求出因變量 y 的平均值的一個估計值E(y0) ,就是平均值的點估計 在前面某大型商業(yè)銀行的例子中,假如要估計貸款余額為100億元時所有分行不良貸款的平均值,就是平均值的點估計。根據估計的回歸方程得,y 的個別值的點估計,利用估計的回歸方程,對于自變量x的一個給定值 x0 ,求出因變量 y 的一個個別值的估計值 ,就是個別值的點估計 比如,在前面某大型商業(yè)銀行的例子中,如果只是想知道貸款余額為72.8億元的那個分行(這里是編號為10的那個分行)的不良貸款是多少,則屬于個別值的點估計。根據估計的回歸方程得,二、區(qū)

36、間估計,點估計不能給出估計的精度,點估計值與實際值之間是有誤差的,因此需要進行區(qū)間估計。 區(qū)間估計是對于自變量x 的一個給定值 x0,根據回歸方程得到因變量 y 的一個估計區(qū)間。 區(qū)間估計有兩種類型 置信區(qū)間估計(confidence interval estimate) 預測區(qū)間估計(prediction interval estimate),置信區(qū)間估計,利用估計的回歸方程,對于自變量 x 的一個給定值 x0 ,求出因變量 y 的平均值E(y0)的估計區(qū)間 ,這一估計區(qū)間稱為置信區(qū)間(confidence interval) E(y0) 在1-置信水平下的置信區(qū)間為,式中:sy為估計標準誤

37、差,置信區(qū)間估計(例題分析),【例】在前面某大型商業(yè)銀行的例子中,求出貸款余額為100億元時,不良貸款95%的置信區(qū)間 解:根據前面的計算結果,已知n=25,sy=1.9799,t(25-2)=2.0687,貸款余額為100億元時不良貸款平均值的點估計值為2.96,置信區(qū)間為,即當貸款余額為100億元時,所有分行不良貸款的平均值在2.1141億元到3.8059億元之間。,預測區(qū)間估計,利用估計的回歸方程,對于自變量 x 的一個給定值 x0 ,求出因變量 y 的一個個別值的估計區(qū)間,這一區(qū)間稱為預測區(qū)間(prediction interval) y0在1-置信水平下的預測區(qū)間為,預測區(qū)間估計(例題分析),【例】在前面某大型商業(yè)銀行的例子中,求出貸款余額為72.8億元的那個分行不良貸款 95%的預測區(qū)間 解:根據前面的計算結果,已知n=25,sy=1.9799, t(25-2)=2.0687,貸款余額為72.8億元時不良貸款點估計值為1.93,預測區(qū)間為,即貸款余額為72.8億元的那個分行不良貸款的預測區(qū)間在-2.2766億元到6.1366億元之間。,影響區(qū)間寬度的因素,1.置信水平 (1 - ) 區(qū)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論