實用回歸分析_第1頁
實用回歸分析_第2頁
實用回歸分析_第3頁
實用回歸分析_第4頁
實用回歸分析_第5頁
已閱讀5頁,還剩30頁未讀 繼續(xù)免費閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認(rèn)領(lǐng)

文檔簡介

1、.,第2章 回歸分析概述,2.1 變量間的相關(guān)關(guān)系 2.2 回歸方程與回歸名稱的由來 2.3 回歸分析的主要內(nèi)容及其一般模型 2.4 建立實際問題回歸模型的過程 2.5 回歸分析應(yīng)用與發(fā)展述評,.,2.1 變量間的相關(guān)關(guān)系,第2章 回歸分析概述,統(tǒng)計分析的目的:如何根據(jù)統(tǒng)計數(shù)據(jù)確定變量之間的關(guān)系形態(tài)及其關(guān)聯(lián)程度,并探索出其內(nèi)在的數(shù)量規(guī)律性. 變量之間的關(guān)系: 確定性(函數(shù)關(guān)系)和非確定性(相關(guān)關(guān)系). 確定性:存在某種函數(shù)關(guān)系; 相關(guān)關(guān)系:變量之間表現(xiàn)出某種不確定性,這種既有 關(guān)聯(lián)、又不存在確定性的關(guān)系,稱為相關(guān)關(guān)系. 現(xiàn)代統(tǒng)計學(xué)關(guān)于統(tǒng)計(相關(guān))關(guān)系的研究已經(jīng)形成了兩個重要的分支:相關(guān)分析和回

2、歸分析,.,2.1 變量間的相關(guān)關(guān)系,第2章 回歸分析概述,1.確定性關(guān)系(函數(shù)關(guān)系) 函數(shù)關(guān)系:能夠用確定的函數(shù)關(guān)系表達式表達變量之間的關(guān)系. 嚴(yán)格的、確定的相互依存關(guān)系 作為影響因素的變量稱為自變量;發(fā)生對應(yīng)變化的變量稱為因變量 可以用函數(shù)式表示 變量y與P個變量x1,x2,xp之間存在某種函數(shù)關(guān)系,可以表示為 y=f(x1,x2,xp),.,2.1 變量間的相關(guān)關(guān)系,第2章 回歸分析概述,1.確定性關(guān)系(函數(shù)關(guān)系) 例: 原材料消耗額 y 與產(chǎn)量(x1) 、單位產(chǎn)量消耗(x2) 、原材料價格(x3)之間的關(guān)系 y = x1 x2 x3 商品的銷售額 y 與銷售量 x 之間的關(guān)系 y =

3、px 其中p為銷售價格.,.,2.1 變量間的相關(guān)關(guān)系,第2章 回歸分析概述,2. 相關(guān)關(guān)系 1)相關(guān)關(guān)系含義:是指變量之間具有密切關(guān)聯(lián),而又不能由某一個或某一些變量唯一確定另外一個變量的關(guān)系。 數(shù)量關(guān)系不嚴(yán)格、不確定的依存關(guān)系 用相關(guān)與回歸分析方法去分析 一般不能用函數(shù)式去準(zhǔn)確表示 例: 子女身高 (y)與父母身高(x)之間的關(guān)系 收入水平(y)與受教育程度(x)之間的關(guān)系 商品的消費量(y)與居民收入(x)之間的關(guān)系,.,2.1 變量間的相關(guān)關(guān)系,第2章 回歸分析概述,2) 相關(guān)關(guān)系的類型根據(jù)變量之間的影響方向和影響程度,可以分為不同類型. 按相關(guān)的方向分為:正相關(guān),負相關(guān) 按相關(guān)的程度分

4、為: 完全相關(guān)變量之間的函數(shù)關(guān)系; 不相關(guān)現(xiàn)象之間彼此互不影響,其數(shù)量變化各自獨立; 不完全相關(guān)界于前兩者之間(一般的相關(guān)關(guān)系指的都是不完全相關(guān)) 按相關(guān)形式分為: 線性相關(guān)變量之間近似表現(xiàn)為一條直線 非線性相關(guān)變量之間近似表現(xiàn)為一條曲線 研究變量的個數(shù)分為: 單相關(guān)兩個變量的相關(guān)關(guān)系 復(fù)相關(guān)一個變量對兩個或兩個以上變量的相關(guān)關(guān)系 偏相關(guān)研究多個變量之間的相關(guān)關(guān)系時,假設(shè)其他變量不變,只研究其中兩個變量的相關(guān)關(guān)系.,.,2.1 變量間的相關(guān)關(guān)系,變量間的關(guān)系,變量關(guān)系,確定性關(guān)系:,相關(guān)關(guān)系,可用確定的函數(shù)表達式表達,相關(guān)方向,正相關(guān),負相關(guān),相關(guān)程度,完全相關(guān),完全不相關(guān),不完全相關(guān),相關(guān)形

5、式,線性相關(guān),非線性相關(guān),變量的個數(shù):,單相關(guān)/,復(fù)相關(guān)/,偏相關(guān),.,2.1 變量間的相關(guān)關(guān)系,3.相關(guān)分析(Correlation Analysis) 是根據(jù)實際觀察的數(shù)據(jù)資料,在具有相關(guān)關(guān)系的變量之間,對現(xiàn)象之間的依存關(guān)系的表現(xiàn)形式和密切程度的研究,它處理的是一種相互關(guān)系。,兩種方法,散點圖:,相關(guān)系數(shù):,比較直觀 詳細的定量分析之前,對變量之間 存在的相關(guān)關(guān)系的方向、形式和密 切程度進行大致判斷,定量分析,.,2.1 變量間的相關(guān)關(guān)系,散點圖反映變量之間相關(guān)關(guān)系的圖形 以直角坐標(biāo)系的橫軸代表變量X,縱軸代表變量Y,將兩個變量間相對應(yīng)的變量值用坐標(biāo)點的形式描繪出來,.,2.1 變量間的相

6、關(guān)關(guān)系,3.相關(guān)分析(Correlation Analysis) 相關(guān)系數(shù)(Correlation coefficient):又稱Pearson 相關(guān)系數(shù),是根據(jù)樣本數(shù)據(jù)計算的對兩個變量之間線性關(guān)系強弱的度量值,用r表示. 若相關(guān)系數(shù)是根據(jù)總體全部數(shù)據(jù)計算出來的,則稱為總體相關(guān)系數(shù),記為,.,樣本相關(guān)系數(shù)的計算公式,設(shè)(xi,yi)(i=1,2,n)是來自總體(X,Y)的樣本,則樣本 相關(guān)系數(shù)的計算公式為:,式中,,.,相關(guān)系數(shù)的意義:,r無單位,-1r1 0r1表示兩個變量間存在正線性相關(guān)關(guān)系。 -1r0表示兩個變量間存在負線性相關(guān)關(guān)系。 r=0表示兩個變量間不存在線性相關(guān)關(guān)系。 |r|=1

7、表示兩個變量間存在完全線性相關(guān)關(guān)系。 |r|越接近于0,表示兩變量間線性相關(guān)程度越低。 |r|越接近于1,表示兩變量間線性相關(guān)程度越高。,.,相關(guān)系數(shù)的意義:,.,相關(guān)系數(shù)等級劃分表,相關(guān)系數(shù)是無量綱的量,可以進行比較。 兩個變量相關(guān)程度的高低取決于|r|的大小,而不是r數(shù)值的大小。 相關(guān)系數(shù)是一種對稱測量,因此相關(guān)關(guān)系因果關(guān)系 計算相關(guān)系數(shù)要求樣本容量n要大一些,否則不易做出正確判斷;另外,極端值也可能影響相關(guān)系數(shù)。 相關(guān)系數(shù)只度量變量間的線性關(guān)系。因此,當(dāng)r=0或很小時,只能說明線性相關(guān)關(guān)系較弱,并不能說明變量之間沒有任何關(guān)系,比如可能存在非線性相關(guān)關(guān)系。,注意:,.,相關(guān)系數(shù)的檢驗,由于

8、存在抽樣的隨機性和樣本數(shù)量較少等原因,通常 導(dǎo)致推斷的可信程度不高。因此需要通過假設(shè)檢驗的方 式對樣本來自的兩個總體是否存在顯著的線性相關(guān)進行 統(tǒng)計推斷。相關(guān)系數(shù)檢驗的步驟如下:,(1) 提出假設(shè): H0:0 H1:0,(2) 構(gòu)造檢驗統(tǒng)計量。 在H0成立時,檢驗統(tǒng)計量t,(3) 給定顯著性水平,查表確定臨界點,(4) 確定拒絕域:,(5) 做統(tǒng)計決策:若拒絕H0,說明兩總體之間線性關(guān)系 顯著;否則,認(rèn)為兩總體之間線性關(guān)系不顯著。,.,例.五位同學(xué)統(tǒng)計學(xué)的學(xué)習(xí)時間與成績分?jǐn)?shù)見 下表,由此計算出學(xué)習(xí)時數(shù)與學(xué)習(xí)成績之間的相關(guān) 系數(shù)并在顯著程度為0.05時,檢驗相關(guān)系數(shù)是否顯著,.,.,提出假設(shè):

9、H0:0 H1:0,拒絕H0,兩總體之間線性關(guān)系顯著,.,2.1 變量間的相關(guān)關(guān)系,第2章 回歸分析概述,4 相關(guān)分析與回歸分析 回歸分析和相關(guān)分析都是研究變量間關(guān)系的統(tǒng)計學(xué)課題 相關(guān)分析是指研究一個變量與另一個變量或另一組變量之間相關(guān)方向和相關(guān)密切程度的統(tǒng)計分析方法。 回歸分析是指根據(jù)相關(guān)關(guān)系的具體形態(tài),選擇一個合適的數(shù)學(xué)模型來近似地表達變量間平均變化關(guān)系的統(tǒng)計分析方法。 相關(guān)分析與回歸分析的共同點: 有共同的研究對象 具體應(yīng)用時常常必須互相補充(相關(guān)分析需要依靠回歸分析來表明現(xiàn)象數(shù)量相關(guān)的具體形式;回歸分析需要依靠相關(guān)分析來表明現(xiàn)象數(shù)量變化的相關(guān)程度),.,2.1 變量間的相關(guān)關(guān)系,相關(guān)分

10、析與回歸分析的區(qū)別: 相關(guān)分析中,變量x與變量y處于平等地位,不需要區(qū)分自變量和因變量;回歸分析中,變量y稱為因變量,處在被解釋的特殊地位。變量x稱為自變量,可以通過x的變化來解釋y的變化。 相關(guān)分析中所涉及的變量y與x全是隨機變量。而回歸分析中,因變量y是隨機變量,自變量x 可以是隨機變量,也可以是非隨機的確定變量(通常的回歸模型中,總假定x是非隨機的固定變量)。 相關(guān)分析的研究主要是刻畫兩類變量間線性相關(guān)的密切程度。而回歸分析不僅可以揭示變量x對變量y的影響大小,還可以由回歸方程進行預(yù)測和控制。,.,2.2 回歸方程與回歸名稱的由來,回歸分析(Regression Analysis),是在

11、分析變量之間相關(guān)關(guān)系的基礎(chǔ)上,進一步考察變量之間的數(shù)量變化規(guī)律,并通過回歸方程的形式加以描述和反映變量之間的關(guān)系,幫助人們準(zhǔn)確把握變量受其他一個或多個變量影響的程度,進而為控制和預(yù)測提供依據(jù)。,.,2.2 回歸方程與回歸名稱的由來,給定x的值,y的值不能確定,只能通過一定的概率分布來描述. 于是稱給定x時y的條件數(shù)學(xué)期望 為隨機變量y對x的回歸函數(shù),或稱y 對x均值回歸函數(shù). 從平均意義上刻畫了x,y之間的統(tǒng)計規(guī)律. x,y分別為自變量和因變量,.,2.2 回歸方程與回歸名稱的由來,由x預(yù)測y, 即用x,y的觀測值, (x1,y1),(xn,yn) 來建立模型,當(dāng)給定x值后,帶入模型得到y(tǒng)的一

12、個值,稱該值為y的預(yù)測值. 若散點圖觀察樣本點幾乎在一條直線周圍,考慮用線性函數(shù)描述,.,利用樣本數(shù)據(jù)估計 的值,2.2 回歸方程與回歸名稱的由來,.,“回歸”名稱的由來,回歸名稱的由來要歸功于英國統(tǒng)計學(xué)F高爾頓(FGalton:18221911)。高爾頓和他的學(xué)生、現(xiàn)代統(tǒng)計學(xué)的奠基者之一K皮爾遜(KPearson:18561936)在研究父母身高與其子女身高的遺傳問題時,在觀察了1078對夫婦后,以父親身高作為x,取他們的一個成年兒子的身高為y,將結(jié)果繪成散點圖后發(fā)現(xiàn)成一條直線。計算出回歸方程為,.,這種趨勢說明父親身高x每增加一個單位,其成年兒子的平均身高增加0.516個單位。該結(jié)果表明:

13、 高個子父親確實有生高個子兒子的趨勢。 子代人的身高有回歸到同齡人平均身高的趨勢。 此例形象的說明了生物學(xué)物種的穩(wěn)定性。,.,一、 回歸分析的主要內(nèi)容 回歸分析構(gòu)成計量經(jīng)濟學(xué)的方法論基礎(chǔ),其主要內(nèi)容包括: (1)根據(jù)樣本觀察值對經(jīng)濟計量模型參數(shù)進行估計,求得回歸方程; (2)對回歸方程、參數(shù)估計值進行顯著性檢驗; (3)利用回歸方程進行分析、評價及預(yù)測。,2.3 回歸分析的主要內(nèi)容及其一般模型,.,一、 回歸分析的主要內(nèi)容,.,2.3 回歸分析的主要內(nèi)容及其一般模型,二、回歸模型的一般形式 如果自變量 與隨機變量 之間存在相關(guān)關(guān)系,通常意味著每當(dāng)取定值 后, 便有相應(yīng)的概率分布與之對應(yīng)。概率模

14、型為: 其中:隨機變量 稱為因變量或被解釋變量, 稱為解釋變量或自變量。 為隨機誤差項。,第2章 回歸分析概述,.,2.3 回歸分析的主要內(nèi)容及其一般模型,隨機誤差項主要包括下列因素的影響: 在解釋變量中被忽略的因素的影響; 變量觀測值的觀測誤差的影響; 模型關(guān)系的設(shè)定誤差的影響; 其他隨機因素的影響.,第2章 回歸分析概述,.,2.3 回歸分析的主要內(nèi)容及其一般模型,回歸函數(shù)是線性函數(shù)時,即,第2章 回歸分析概述,.,2.3 回歸分析的主要內(nèi)容及其一般模型,古典線性回歸模型通常應(yīng)滿足以下幾個基本假設(shè): 1.解釋變量x是非隨機變量,觀測值x1,x2,xp是常數(shù).,第2章 回歸分析概述,.,2.3 回歸分析的主要內(nèi)容及其一般模型,古典線性回歸模型通常應(yīng)滿足以下幾個基本假設(shè): 4. np樣本容量的個數(shù)要多于解釋變量的個數(shù).,第2章 回歸分析概述,.,2.3 回歸分析的主要內(nèi)容及其一般模

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論