《相關(guān)與回歸分析》PPT課件.ppt_第1頁(yè)
《相關(guān)與回歸分析》PPT課件.ppt_第2頁(yè)
《相關(guān)與回歸分析》PPT課件.ppt_第3頁(yè)
《相關(guān)與回歸分析》PPT課件.ppt_第4頁(yè)
《相關(guān)與回歸分析》PPT課件.ppt_第5頁(yè)
已閱讀5頁(yè),還剩43頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶(hù)提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、2020年9月10日6時(shí)20分,1,第九章 相關(guān)與回歸分析,第一節(jié) 相關(guān)分析的一般問(wèn)題 第二節(jié) 相關(guān)關(guān)系的判斷 第三節(jié) 回歸分析的一般問(wèn)題 第四節(jié) 回歸模型的建立與檢測(cè),2020年9月10日6時(shí)20分,2,第一節(jié) 相關(guān)分析,一、相關(guān)分析的意義 二、相關(guān)關(guān)系的測(cè)定,2020年9月10日6時(shí)20分,3,變量間的關(guān)系,變量間的關(guān)系有兩種類(lèi)型:函數(shù)關(guān)系和相關(guān)關(guān)系。 函數(shù)關(guān)系 是一一對(duì)應(yīng)的確定關(guān)系。 設(shè)有兩個(gè)變量 x 和 y ,變量 y 完全依賴(lài)于 x ,則稱(chēng) y 是 x 的函數(shù),記為 y = f (x),其中 x 稱(chēng)為自變量,y 稱(chēng)為因變量。 例如: 圓的面積(S)與半徑之間的關(guān)系可表示為S = R2

2、 ; 某種商品的銷(xiāo)售額(y)與銷(xiāo)售量(x)之間的關(guān)系可表示為 y = p x (p 為單價(jià)),2020年9月10日6時(shí)20分,4,相關(guān)關(guān)系,變量間確實(shí)存在、但數(shù)量上不固定的相互依存。這種關(guān)系不能用函數(shù)關(guān)系精確表達(dá); 一個(gè)變量的取值不能由另一個(gè)變量惟一地確定;當(dāng)變量 x 取某個(gè)值時(shí),與之相關(guān)的變量 y 的取值可能有若干個(gè); 各觀測(cè)點(diǎn)分布在一條直線(xiàn)或曲線(xiàn)周?chē)?,2020年9月10日6時(shí)20分,5,相關(guān)關(guān)系的例子,商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系 商品銷(xiāo)售額(y)與廣告費(fèi)支出(x)之間的關(guān)系 糧食畝產(chǎn)量(y)與施肥量(x1) 、降雨量(x2) 、溫度(x3)之間的關(guān)系 收入水平(y)與受

3、教育程度之間的關(guān)系(x) 父親身高(y)與子女身高(x)之間的關(guān)系 ,2020年9月10日6時(shí)20分,6,相關(guān)關(guān)系的特點(diǎn)(見(jiàn)154頁(yè)),相關(guān)關(guān)系和函數(shù)關(guān)系,既有聯(lián)系又有區(qū)別。在實(shí)際工作中,對(duì)表現(xiàn)為函數(shù)關(guān)系的現(xiàn)象的測(cè)量由于種種原因,每次觀測(cè)值都不可能完全相同,這時(shí)函數(shù)關(guān)系就表現(xiàn)為相關(guān)關(guān)系。在研究相關(guān)關(guān)系時(shí),又常常要用函數(shù)形式來(lái)表現(xiàn),以便得到相關(guān)關(guān)系的一般數(shù)量表達(dá)式形式。因此,相關(guān)關(guān)系是相關(guān)分析的研究對(duì)象,函數(shù)關(guān)系是相關(guān)分析的必要工具。,2020年9月10日6時(shí)20分,7,相關(guān)關(guān)系的類(lèi)型,1、按相關(guān)關(guān)系涉及的因素多少分為: 單相關(guān)一元相關(guān),兩變量間的相關(guān)關(guān)系; 復(fù)相關(guān)多元相關(guān),三個(gè)(或以上)變量間

4、的相關(guān)關(guān)系; 2、按相關(guān)的表現(xiàn)形態(tài)分為: 直線(xiàn)相關(guān)觀察點(diǎn)的分布大致呈現(xiàn)為一條直線(xiàn); 曲線(xiàn)相關(guān)觀察點(diǎn)的分布大致呈現(xiàn)為一條曲線(xiàn),2020年9月10日6時(shí)20分,8,3、按相關(guān)方向分為: 正相關(guān)兩變量大體上呈同方向變化; 負(fù)相關(guān)兩變量大體上呈反方向變化。 4、按相關(guān)密切程度分: 完全相關(guān)兩變量間有確定函數(shù)關(guān)系。 不完全相關(guān)兩變量不存在嚴(yán)格函數(shù)關(guān)系。 不相關(guān)當(dāng)一個(gè)變量變化,另一個(gè)變量不變化或呈不規(guī)則變化或沒(méi)有依存關(guān)系。,2020年9月10日6時(shí)20分,9,二、相關(guān)關(guān)系的測(cè)定,進(jìn)行相關(guān)分析的一般程序:,定性分析 定量分析 相關(guān)表和相關(guān)圖 計(jì)算相關(guān)系數(shù)與判定系數(shù),2020年9月10日6時(shí)20分,10,(一

5、)相關(guān)表和相關(guān)圖,相關(guān)表將一個(gè)變量按大小順序排序,另一個(gè)變量對(duì)應(yīng)排列而成的表格。(見(jiàn)P156表91) 相關(guān)圖也稱(chēng)為散點(diǎn)圖。一對(duì)數(shù)據(jù)對(duì)應(yīng)坐標(biāo)圖上一個(gè)點(diǎn),將成對(duì)的觀察數(shù)據(jù)表現(xiàn)為坐標(biāo)圖的散點(diǎn)而形成的圖。(見(jiàn)P158圖91) 編制相關(guān)表、圖的意義有助于分析者判斷 相關(guān)的有無(wú)、方向、形態(tài)、密切程度。,2020年9月10日6時(shí)20分,11,相關(guān)關(guān)系的圖示,2020年9月10日6時(shí)20分,12,(二)相關(guān)系數(shù)和判定系數(shù),都是對(duì)變量之間關(guān)系密切程度的度量; 判定系數(shù)=相關(guān)系數(shù)的平方; 不同類(lèi)型的相關(guān),相關(guān)系數(shù)的計(jì)算方法也不同. 對(duì)兩個(gè)變量之間線(xiàn)性相關(guān)程度的度量稱(chēng)為簡(jiǎn)單相關(guān)系數(shù)(也稱(chēng)直線(xiàn)相關(guān)系數(shù)),常簡(jiǎn)稱(chēng)相關(guān)系

6、數(shù). 此外還有復(fù)相關(guān)系數(shù)、非線(xiàn)性相關(guān)系數(shù)、偏相關(guān)系數(shù) 3. 有總體相關(guān)系數(shù)與樣本相關(guān)系數(shù)之分: 總體相關(guān)系數(shù)根據(jù)總體數(shù)據(jù)計(jì)算的, 樣本相關(guān)系數(shù) r 根據(jù)樣本數(shù)據(jù)計(jì)算的。,2020年9月10日6時(shí)20分,13,相關(guān)關(guān)系的計(jì)算公式,或化簡(jiǎn)為,見(jiàn)P161公式92,2020年9月10日6時(shí)20分,14,相關(guān)系數(shù)取值及其意義,r 的取值范圍是 -1,1 |r|=1,為完全相關(guān); r =1,為完全正相關(guān) r =-1,為完全負(fù)相關(guān) r = 0,不存在線(xiàn)性相關(guān)關(guān)系相關(guān); -1r 0,為負(fù)相關(guān);0r 1,為正相關(guān),2020年9月10日6時(shí)20分,15,|r|越趨于1表示關(guān)系越密切;|r|越趨于0表示關(guān)系越不密切

7、。 相關(guān)程度的三級(jí)劃分法: |r|0.3, 微相關(guān)或不相關(guān) 0.3|r|0.5, 低度相關(guān) 0.5|r|0.8, 顯著相關(guān) r的絕對(duì)值在0.8以上的為高度相關(guān) 一般情況下,只有r的絕對(duì)值在0.5以上,才進(jìn)一步進(jìn)行相關(guān)分析。,2020年9月10日6時(shí)20分,16,第三節(jié) 回歸分析的一般問(wèn)題,一. 回歸分析的意義 一元線(xiàn)性回歸方程的確定 回歸估計(jì)的標(biāo)準(zhǔn)差,2020年9月10日6時(shí)20分,17,一、回歸分析的意義,從一組樣本數(shù)據(jù)出發(fā),確定變量之間的數(shù)學(xué)關(guān)系式建立回歸模型; 借助于數(shù)學(xué)模型來(lái)表達(dá)變量之間的平均數(shù)量關(guān)系 對(duì)這些關(guān)系式的可信程度進(jìn)行各種統(tǒng)計(jì)檢驗(yàn)并從某一特定變量的諸多影響因素(變量)中找出哪

8、些變量的影響顯著,哪些不顯著; 利用所求的關(guān)系式,根據(jù)一個(gè)或幾個(gè)變量的取值來(lái)預(yù)測(cè)或控制另一個(gè)特定變量的取值,并給出這種預(yù)測(cè)或控制的精確程度。,2020年9月10日6時(shí)20分,18,回歸分析與相關(guān)分析的區(qū)別,相關(guān)分析中,變量 x、 變量 y 處于平等地位。 回歸分析中, y 為因變量,處在被解釋的地位;x 為自變量,用于解釋和預(yù)測(cè)因變量的變化。 2. 相關(guān)分析中所涉及的變量 x 和 y 都是隨機(jī)變量;回歸分析中,因變量y 是隨機(jī)變量,自變量 x 可以是隨機(jī)變量,也可以是非隨機(jī)的確定變量。 3. 相關(guān)分析主要描述兩個(gè)變量之間相關(guān)關(guān)系的密切程度;回歸分析揭示變量之間數(shù)量變動(dòng)的統(tǒng)計(jì)規(guī)律性(不僅可以由回

9、歸方程揭示變量 x 對(duì)變量 y 的平均影響大小,還可以進(jìn)行預(yù)測(cè)和控制 )。,2020年9月10日6時(shí)20分,19,回歸模型的類(lèi)型,回歸模型(方程)來(lái)表達(dá)變量之間的平均數(shù)量關(guān)系的數(shù)學(xué)模型。該模型中包含: 1 個(gè)因變量(被解釋變量,通常為數(shù)值型的) 1 個(gè)或多個(gè)自變量 (解釋變量,通常為數(shù)值型的或分類(lèi)的) 包含一個(gè)自變量的回歸模型稱(chēng)為一元回歸模型; 包含多個(gè)自變量的回歸模型稱(chēng)為多元回歸模型。 按模型形態(tài)分,有線(xiàn)性回歸和非線(xiàn)性回歸。,2020年9月10日6時(shí)20分,20,二、一元線(xiàn)性回歸方程的確定,具有線(xiàn)性相關(guān)關(guān)系的兩個(gè)變量的關(guān)系可表示為: y = + b x 線(xiàn)性部分反映了由于 x 的變化而引起的

10、 y 的變化. 和 稱(chēng)為模型的兩個(gè)待定參數(shù)。,2020年9月10日6時(shí)20分,21,(總體)回歸方程,描述 y 的平均值或期望值如何依賴(lài)于 x 的方程稱(chēng)為(總體的)回歸方程; 一元線(xiàn)性(總體)回歸方程的形式如下: E( y ) = + x,方程的圖示是一條直線(xiàn),因此也稱(chēng)為直線(xiàn)回歸方程 是回歸直線(xiàn)在 y 軸上的截距,是當(dāng) x=0 時(shí) y 的期望值,是回歸直線(xiàn)是起始值; 是直線(xiàn)的斜率,表示當(dāng) x 每變動(dòng)一個(gè)單位時(shí),y 的平均變動(dòng)值。,2020年9月10日6時(shí)20分,22,樣本(估計(jì)的、經(jīng)驗(yàn)的)回歸方程,總體回歸參數(shù)和 是未知的,我們必須利用樣本數(shù)據(jù)去估計(jì)它們; 用樣本統(tǒng)計(jì)量 a、b代替回歸方程中的

11、未知參數(shù)和,就得到了樣本回歸方程(估計(jì)的回歸方程):,擬合估計(jì)方程,就是要估計(jì)方程的參數(shù)a、b,2020年9月10日6時(shí)20分,23,估計(jì)參數(shù)的最小二乘法最小平方法(L S ),可用于直線(xiàn)回歸,也可用于曲線(xiàn)回歸。 用最小平方法擬合的直線(xiàn)來(lái)代表x與y之間的關(guān)系,所產(chǎn)生的估計(jì)值與實(shí)際值的誤差要比其他任何直線(xiàn)的誤差都小。,1. 最小平方法使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小來(lái)求得 a和b的方法,即:,2020年9月10日6時(shí)20分,24,a 和 b 的計(jì)算公式,根據(jù)最小平方法的原則,利用微分求解極值(最優(yōu)值)的原理,可得求解 a 和 b 的標(biāo)準(zhǔn)方程組如下:,2020年9月10日6時(shí)20分

12、,25,三、回歸估計(jì)標(biāo)準(zhǔn)誤差,(一)回歸估計(jì)標(biāo)準(zhǔn)誤差的概念 實(shí)際觀察值y與估計(jì)值 之間差異的平均程度,是用來(lái)說(shuō)明回歸方程推算結(jié)果 的準(zhǔn)確程度或可靠性的分析指標(biāo),用 表 示 計(jì)算公式為(P166頁(yè)9-8)和(P166頁(yè)9-9):,2020年9月10日6時(shí)20分,26,回歸估計(jì)標(biāo)準(zhǔn)差的作用,回歸估計(jì)標(biāo)準(zhǔn)差反映的是因變量各實(shí)際值與其回歸估計(jì)值之間的平均差異程度; 表明其估計(jì)值對(duì)各實(shí)際值的代表性的強(qiáng)弱,其值越小,估計(jì)值(或回歸方程)的代表性越強(qiáng),用回歸方程估計(jì)或預(yù)測(cè)的結(jié)果越準(zhǔn)確。,說(shuō)明了回歸直線(xiàn)的擬合程度(衡量回歸方程的代表性,測(cè)定回歸估計(jì)的精度); 反映實(shí)際觀察值在回歸直線(xiàn)周?chē)姆稚顩r;,2020

13、年9月10日6時(shí)20分,27,回歸估計(jì)標(biāo)準(zhǔn)誤差 與一般的標(biāo)準(zhǔn)差的異同,從計(jì)算公式可見(jiàn): 同:都是離差的平方的平均數(shù)的 平方根; 反映平均差異程度; 衡量代表性大小。 主要區(qū)別:與什么的離差、差異; 衡量誰(shuí)的代表性。,2020年9月10日6時(shí)20分,28,回歸估計(jì)標(biāo)準(zhǔn)差與相關(guān)系數(shù)的關(guān)系,大樣本條件下,近似地: 或:,見(jiàn)P167公式911,2020年9月10日6時(shí)20分,29,相關(guān)系數(shù)與回歸系數(shù)的關(guān)系,見(jiàn)167頁(yè)例93,2020年9月10日6時(shí)20分,30,第三節(jié) 線(xiàn)性相關(guān)的顯著性檢驗(yàn),檢驗(yàn)兩個(gè)變量之間是否存在線(xiàn)性相關(guān)關(guān)系,包括兩個(gè)方面的檢驗(yàn): 1. 對(duì)相關(guān)系數(shù) r 的顯著性檢驗(yàn); 對(duì)回歸系數(shù) b

14、 的顯著性檢驗(yàn); 對(duì)于一元線(xiàn)性相關(guān)而言,二者等價(jià)。,2020年9月10日6時(shí)20分,31,例,根據(jù)下表提供的資料確定直線(xiàn)回歸方程,計(jì)算估計(jì)標(biāo)準(zhǔn)誤差。,2020年9月10日6時(shí)20分,32,解,第1步:應(yīng)先確定自變量和因變量。按本題所述,生產(chǎn)性固定資產(chǎn)價(jià)值為自變量,總產(chǎn)值為因變量。 第2步:對(duì)數(shù)據(jù)進(jìn)行下列計(jì)算:,2020年9月10日6時(shí)20分,33,(續(xù)),回歸參數(shù)中:,2020年9月10日6時(shí)20分,34,(續(xù)),第3步:計(jì)算估計(jì)標(biāo)準(zhǔn)誤差。用公式:,2020年9月10日6時(shí)20分,35,練習(xí)題,一、判斷題 1、在計(jì)算相關(guān)系數(shù)時(shí),要求兩個(gè)變量都是隨機(jī)的;在回歸分析中,要求因變量是隨機(jī)的,自變量是

15、非隨機(jī)的。( ) 2、變量X和變量Y之間存在相關(guān)關(guān)系,當(dāng)X按固定數(shù)額增加時(shí),相應(yīng)地,變量Y按大致固定的數(shù)額減小,說(shuō)明兩變量之間存在著負(fù)直線(xiàn)相關(guān)關(guān)系。( ),2020年9月10日6時(shí)20分,36,(續(xù)),3、相關(guān)系數(shù)的數(shù)值越大;說(shuō)明相關(guān)程度越高,相關(guān)系數(shù)的數(shù)值越小,說(shuō)明相關(guān)程度越低。( ) 4、變量之間相關(guān)關(guān)系的形式可能是多種多樣的,變量間線(xiàn)性相關(guān)系數(shù)的大小,只能說(shuō)明變量間直線(xiàn)相關(guān)的方向和程度。 ( ) 5.估計(jì)標(biāo)準(zhǔn)誤差的大小與因變量的方差無(wú)關(guān)。( ),2020年9月10日6時(shí)20分,37,二、單項(xiàng)選擇題,1、當(dāng)變量X按一定數(shù)額變化時(shí),變量Y也隨之近似地按一定數(shù)額變化,這時(shí),變量X和Y之間存在著

16、( )關(guān)系。 A、正相關(guān) B、負(fù)相關(guān) C、直線(xiàn)相關(guān) D、曲線(xiàn)相關(guān) 2、若變量X增加時(shí),變量Y的值也增加,那么變量X和Y之間存在著( )關(guān)系。 A、正相關(guān) B、負(fù)相關(guān) C、直線(xiàn)相關(guān) D、曲線(xiàn)相關(guān),C,A,2020年9月10日6時(shí)20分,38,(續(xù)),3、如果兩變量之間的相關(guān)系數(shù)為1,說(shuō)明兩變量之間存在( )關(guān)系。 A、無(wú)相關(guān) B、低度相關(guān) C、高度相關(guān) D、完全相關(guān) 4、在回歸分析中,自變量同因變量地位不同,兩變量X與Y中,Y倚X回歸同X倚Y回歸是( ) A、同一個(gè)問(wèn)題 B、有聯(lián)系但意義不同的問(wèn)題 C、一般情況下是相同的問(wèn)題 D、是否相同,視兩相關(guān)變量的具體內(nèi)容而定。,D,B,2020年9月10

17、日6時(shí)20分,39,(續(xù)),5、已知某企業(yè)棉大衣產(chǎn)量和生產(chǎn)成本有直接關(guān)系,具體說(shuō)來(lái),是直接相關(guān)關(guān)系,當(dāng)產(chǎn)量為1000件時(shí),其生產(chǎn)成本為30000元,其中不變成本為6000元。該企業(yè)總生產(chǎn)成本倚產(chǎn)量的回歸方程應(yīng)是( )。,A,2020年9月10日6時(shí)20分,40,2020年9月10日6時(shí)20分,41,第四節(jié) 可線(xiàn)性化的曲線(xiàn)回歸方程(非線(xiàn)性回歸),一、配合回歸曲線(xiàn)的問(wèn)題 通過(guò)定性分析或散點(diǎn)圖判斷變量之間的曲線(xiàn)相關(guān)形態(tài),選擇曲線(xiàn)模型; 2.可通過(guò)變量代換將曲線(xiàn)模型轉(zhuǎn)換成線(xiàn)性形式; 用最小二乘法求出線(xiàn)性模型中參數(shù)的估計(jì)值,再轉(zhuǎn)換為原曲線(xiàn)模型的參數(shù)的估計(jì)值。 (注:并非所有的非線(xiàn)性模型都可以化為線(xiàn)性模型

18、),2020年9月10日6時(shí)20分,42,可線(xiàn)性化的常用曲線(xiàn)模型,線(xiàn)性化方法:令:y = 1/y,x= 1/x, 則有y = + x,(一 )雙曲線(xiàn) 1.基本形式: 1/y= + /x,圖,2020年9月10日6時(shí)20分,43,線(xiàn)性化方法:兩端取對(duì)數(shù) lg y = lg + lg x 令:y = lgy,x= lg x,則y = lg + x,(二)冪函數(shù) 基本形式:,圖,2020年9月10日6時(shí)20分,44,(三) 指數(shù)函數(shù),線(xiàn)性化方法:兩端取對(duì)數(shù)得 lny = ln + x 令:y = lny,則有 y = ln + x,基本形式:,圖,2020年9月10日6時(shí)20分,45,線(xiàn)性化方法 令:y = 1/y,x= e-x, 則有y = + x,(四)S型曲線(xiàn) 基本形式:,圖,2020年9月10日6時(shí)20分,46,三、非線(xiàn)性判定系數(shù)與相關(guān)系數(shù),(一)非線(xiàn)性判定系數(shù) R2 值域:(0,1),越接近1表示非線(xiàn)性相關(guān)程度越強(qiáng),所配合的曲線(xiàn)回歸模型擬合效果越好

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶(hù)所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶(hù)上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶(hù)因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論