相關(guān)與回歸分析(61).ppt_第1頁
相關(guān)與回歸分析(61).ppt_第2頁
相關(guān)與回歸分析(61).ppt_第3頁
相關(guān)與回歸分析(61).ppt_第4頁
相關(guān)與回歸分析(61).ppt_第5頁
已閱讀5頁,還剩8頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、統(tǒng)計(jì)數(shù)據(jù)分析基礎(chǔ)教程基于SPSS和Excel的調(diào)查數(shù)據(jù)分析,第10章 相關(guān)與回歸分析,本章內(nèi)容,10.1 問題的提出 10.2 定量變量的線性相關(guān)分析 10.3 利用SPSS實(shí)現(xiàn)線性相關(guān)分析 10.4 定量變量的線性回歸分析 10.5 利用SPSS實(shí)現(xiàn)線性回歸分析 10.6 利用Excel圖表實(shí)現(xiàn)一元線性回歸分析 10.7 利用Excel回歸分析工具實(shí)現(xiàn)多元線性回歸分析,相關(guān)分析與回歸分析,相關(guān)分析是分析客觀事物之間關(guān)系的數(shù)量分析方法。客觀事物之間的關(guān)系大致可歸納為兩大類關(guān)系,分別是函數(shù)關(guān)系和統(tǒng)計(jì)關(guān)系。相關(guān)分析是用來分析事物之間統(tǒng)計(jì)關(guān)系的方法。 回歸分析是一種應(yīng)用極為廣泛的數(shù)量分析方法。它用于

2、分析事物之間的統(tǒng)計(jì)關(guān)系,側(cè)重考察變量之間的數(shù)量變化規(guī)律,并通過回歸方程的形式描述和反映這種關(guān)系,幫助人們準(zhǔn)確把握變量受其他一個(gè)或多個(gè)變量影響的程度,進(jìn)而為預(yù)測提供科學(xué)依據(jù)。,10.1 問題的提出,發(fā)現(xiàn)變量之間的統(tǒng)計(jì)關(guān)系,并且用此規(guī)律來幫助人們進(jìn)行決策才是統(tǒng)計(jì)實(shí)踐的最終目的。 一般來說,統(tǒng)計(jì)可以根據(jù)目前所擁有的信息(數(shù)據(jù))來建立人們所關(guān)心的變量和其他有關(guān)變量的關(guān)系。這種關(guān)系一般稱為模型(Model)。 假如用Y表示感興趣的變量,用X表示其他可能與Y有關(guān)的變量(X也可能是若干變量組成的向量),則所需要的是建立一個(gè)函數(shù)關(guān)系Yf(X)。 這里Y稱為因變量或響應(yīng)變量(Dependent Variable

3、,Response Variable),而X稱為自變量,也稱為解釋變量或協(xié)變量(Independent Variable,Explanatory Variable,Covariate)。 建立這種關(guān)系的過程就叫做回歸(Regression)。,10.1 問題的提出,例10-1 有美國60個(gè)著名商學(xué)院的數(shù)據(jù),包括的變量有GMAT分?jǐn)?shù)、學(xué)費(fèi)、進(jìn)入MBA前后的工資等。 進(jìn)入MBA前后工資的散點(diǎn)圖。可以看出,進(jìn)入MBA前工資高的,畢業(yè)后工資也高。 希望能夠建立一個(gè)模型描述這個(gè)關(guān)系。,10.2 定量變量的線性相關(guān)分析,如果兩個(gè)定量變量沒有關(guān)系,就談不上建立模型或進(jìn)行回歸。但怎樣才能發(fā)現(xiàn)兩個(gè)定量變量有沒有

4、關(guān)系呢?最簡單的直觀辦法就是畫出它們的散點(diǎn)圖。 散點(diǎn)圖很直觀,但如何在數(shù)量上描述相關(guān)呢?這里介紹一種對相關(guān)程度的度量: Pearson相關(guān)系數(shù)(Pearsons Correlation Coefficient)。 Pearson相關(guān)系數(shù)又稱相關(guān)系數(shù)或線性相關(guān)系數(shù)。它是由兩個(gè)變量的樣本取值得到,是一個(gè)描述線性相關(guān)強(qiáng)度的量,一般用字母r表示。取值在-1和+1之間。當(dāng)兩個(gè)變量有很強(qiáng)的線性相關(guān)時(shí),相關(guān)系數(shù)接近于+1(正相關(guān))或-1(負(fù)相關(guān)),而當(dāng)兩個(gè)變量線性相關(guān)程度較弱時(shí),相關(guān)系數(shù)就接近0。,10.3 利用SPSS實(shí)現(xiàn)線性相關(guān)分析,對于例10-1,利用SPSS可以很容易得到進(jìn)入MBA前后工資之間的線性

5、相關(guān)系數(shù)。 菜單:“Analyze”-“Correlate” -“Bivariate” 結(jié)果:進(jìn)入MBA前后工資的線性相關(guān)系數(shù)r=0.924,且檢驗(yàn)的p值為0.000,說明這兩個(gè)變量線性相關(guān),因此可以考慮建立線性回歸模型。,10.4 定量變量的線性回歸分析,回歸分析是研究變量間相關(guān)關(guān)系的最重要、最常用的統(tǒng)計(jì)方法,它在工農(nóng)業(yè)生產(chǎn)、金融保險(xiǎn)、商業(yè)與科研管理、氣象地質(zhì)等方面都有極其廣泛的應(yīng)用,為解決實(shí)際中的預(yù)測、控制等問題提供了強(qiáng)有力的工具。 最小二乘回歸(Least Squares Regression)。古漢語“二乘”是平方的意思。 最小二乘法就是尋找一條直線,使得所有點(diǎn)到該直線的豎直距離(即按

6、因變量方向的距離)的平方和最小。這樣的直線很容易通過計(jì)算機(jī)得到。用數(shù)據(jù)尋找一條直線的過程也叫做擬合(Fit)一條直線。,10.5 利用SPSS實(shí)現(xiàn)線性回歸分析,對于例10-1,關(guān)心的是Salary Post MBA(y)和什么有關(guān)。 利用逐步回歸進(jìn)行選擇。 通過SPSS軟件得到三個(gè)自變量: Salary Pre MBA(x1) Five Year Gain(x2) Years To Payback(x3) 菜單:“Analyze”-“Regression” -“Linear”,10.5 利用SPSS實(shí)現(xiàn)線性回歸分析,對于例10-1,關(guān)心的是Salary Post MBA(y)和什么有關(guān)。 利用

7、求得的多元線性回歸方程可知: (1)三個(gè)自變量都正向影響Salary Post MBA(y); (2)Salary Pre MBA(x1)對Salary Post MBA(y)的影響程度:在Five Year Gain(x2)和Years To Payback(x3)不變的條件下,Salary Pre MBA(x1)每增加(或減少)1個(gè)單位,Salary Post MBA平均增加(或減少)1.055個(gè)單位。 (3)Five Year Gain(x2)對Salary Post MBA(y)的影響程度:在Salary Pre MBA(x1)和Years To Payback(x3)不變的條件下,F(xiàn)

8、ive Year Gain(x2)每增加(或減少)1個(gè)單位,Salary Post MBA平均增加(或減少)0.883個(gè)單位。 (4)Years To Payback(x3)對Salary Post MBA(y)的影響程度:在Salary Pre MBA(x1)和Five Year Gain(x2)不變的條件下,Years To Payback(x3)每增加(或減少)1個(gè)單位,Salary Post MBA平均增加(或減少)32.442個(gè)單位。,10.6 利用Excel圖表實(shí)現(xiàn)一元線性回歸分析,例10-2 近年來國家教育部決定將各高校的后勤社會(huì)化。某從事飲食業(yè)的企業(yè)家認(rèn)為這是一個(gè)很好的投資機(jī)會(huì)

9、,他得到10組高校學(xué)生人數(shù)與周邊飯店的季營業(yè)額的數(shù)據(jù),并想根據(jù)高校的學(xué)生人數(shù)決策其投資規(guī)模。,10.7 利用Excel回歸分析工具實(shí)現(xiàn)多元線性回歸分析,例10-3 某大學(xué)教務(wù)處對學(xué)生的動(dòng)手能力頗感興趣。在研究中發(fā)現(xiàn)學(xué)生的學(xué)習(xí)成績特別是統(tǒng)計(jì)成績同計(jì)算機(jī)有關(guān)。他們將學(xué)生分成兩組,一組是利用計(jì)算機(jī)學(xué)習(xí)統(tǒng)計(jì),另一組是不用計(jì)算機(jī)學(xué)習(xí)統(tǒng)計(jì)。現(xiàn)隨機(jī)從利用計(jì)算機(jī)與不用計(jì)算機(jī)的學(xué)生中抽取兩個(gè)樣本,包括統(tǒng)計(jì)成績和過去的績分點(diǎn)。在顯著性水平為0.05時(shí),能否確定使用計(jì)算機(jī)學(xué)生的統(tǒng)計(jì)成績高于不使用計(jì)算機(jī)學(xué)生的統(tǒng)計(jì)成績? 菜單:“工具”-“數(shù)據(jù)分析”,選擇“回歸”,10.7 利用Excel回歸分析工具實(shí)現(xiàn)多元線性回歸分析,例10-3 某大學(xué)教務(wù)處對學(xué)生的動(dòng)手能力頗感興趣。 利用求得的多元線性回歸方程可知: (1)績分點(diǎn)(x1)對統(tǒng)計(jì)成績(y)的影響方向:績分點(diǎn)(x1)正向影響統(tǒng)計(jì)成績(y),績分點(diǎn)(x1)越高,統(tǒng)計(jì)成績(y)也越高; (2)績分點(diǎn)(x1)對統(tǒng)計(jì)成績(y)的影響程度:在使用計(jì)算機(jī)(x2)相同的條件下,績分點(diǎn)(x1)每增長(或減少)1點(diǎn),統(tǒng)計(jì)成績(y)平均增長(或減少)10.89分; (3)使用計(jì)算機(jī)(x2)對統(tǒng)計(jì)成績(y)的影響方向:使用計(jì)算機(jī)(x2)正向影響統(tǒng)計(jì)成績(y),使用計(jì)算機(jī)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論