第7章:相關(guān)分析和回歸分析教材_第1頁(yè)
第7章:相關(guān)分析和回歸分析教材_第2頁(yè)
第7章:相關(guān)分析和回歸分析教材_第3頁(yè)
第7章:相關(guān)分析和回歸分析教材_第4頁(yè)
第7章:相關(guān)分析和回歸分析教材_第5頁(yè)
已閱讀5頁(yè),還剩24頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、SPSS統(tǒng)計(jì)分析方法及應(yīng)用第七章第七章 相關(guān)分析與回歸分析相關(guān)分析與回歸分析 7.1 7.1 相關(guān)分析和回歸分析概述相關(guān)分析和回歸分析概述7.2 7.2 相關(guān)分析相關(guān)分析7.3 7.3 偏相關(guān)分析偏相關(guān)分析7.4 7.4 線性回歸分析線性回歸分析1. 相關(guān)分析和回歸分析概述相關(guān)分析和回歸分析概述 客觀事物之間的關(guān)系大致可歸納為兩大類,即客觀事物之間的關(guān)系大致可歸納為兩大類,即l函數(shù)關(guān)系:函數(shù)關(guān)系:指兩事物之間的一種一一對(duì)應(yīng)的關(guān)系,指兩事物之間的一種一一對(duì)應(yīng)的關(guān)系,如商品的銷(xiāo)售額和銷(xiāo)售量之間的關(guān)系。如商品的銷(xiāo)售額和銷(xiāo)售量之間的關(guān)系。l相關(guān)關(guān)系(統(tǒng)計(jì)關(guān)系):相關(guān)關(guān)系(統(tǒng)計(jì)關(guān)系):指兩事物之間的一種

2、非一指兩事物之間的一種非一一對(duì)應(yīng)的關(guān)系,例如家庭收入和支出、子女身高和一對(duì)應(yīng)的關(guān)系,例如家庭收入和支出、子女身高和父母身高之間的關(guān)系等。相關(guān)關(guān)系又分為線性相關(guān)父母身高之間的關(guān)系等。相關(guān)關(guān)系又分為線性相關(guān)和非線性相關(guān)。和非線性相關(guān)。 相關(guān)分析和回歸分析都是分析客觀事物之間相相關(guān)分析和回歸分析都是分析客觀事物之間相關(guān)關(guān)系的數(shù)量分析方法關(guān)關(guān)系的數(shù)量分析方法。2. 相關(guān)分析相關(guān)分析 相關(guān)分析通過(guò)相關(guān)分析通過(guò)圖形和數(shù)值圖形和數(shù)值兩種方式,有效地揭示事物之兩種方式,有效地揭示事物之間相關(guān)關(guān)系的強(qiáng)弱程度和形式。間相關(guān)關(guān)系的強(qiáng)弱程度和形式。(1 1)散點(diǎn)圖)散點(diǎn)圖 它將數(shù)據(jù)以點(diǎn)的的形式畫(huà)在直角坐標(biāo)系上,通過(guò)觀

3、察散它將數(shù)據(jù)以點(diǎn)的的形式畫(huà)在直角坐標(biāo)系上,通過(guò)觀察散點(diǎn)圖能夠直觀的發(fā)現(xiàn)變量間的相關(guān)關(guān)系及他們的強(qiáng)弱程度和點(diǎn)圖能夠直觀的發(fā)現(xiàn)變量間的相關(guān)關(guān)系及他們的強(qiáng)弱程度和方向方向。(2 2)相關(guān)系數(shù))相關(guān)系數(shù) 利用相關(guān)系數(shù)進(jìn)行變量間線性關(guān)系的分析通常需要完成以利用相關(guān)系數(shù)進(jìn)行變量間線性關(guān)系的分析通常需要完成以下兩個(gè)步驟:下兩個(gè)步驟: 第一,計(jì)算樣本相關(guān)系數(shù)第一,計(jì)算樣本相關(guān)系數(shù)r r;u相關(guān)系數(shù)相關(guān)系數(shù)r r的取值在的取值在-1-1+1+1之間之間uR0R0表示兩變量存在正的線性相關(guān)關(guān)系;表示兩變量存在正的線性相關(guān)關(guān)系;r0r0.8|r|0.8表示兩變量有較強(qiáng)的線性關(guān)系;表示兩變量有較強(qiáng)的線性關(guān)系; |r|

4、0.3|r|0.3表示兩變表示兩變量之間的線性關(guān)系較弱量之間的線性關(guān)系較弱第二,對(duì)樣本來(lái)自的兩總體是否存在顯著的線性關(guān)系進(jìn)行推第二,對(duì)樣本來(lái)自的兩總體是否存在顯著的線性關(guān)系進(jìn)行推斷。斷。 對(duì)不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來(lái)度量,常用對(duì)不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來(lái)度量,常用的相關(guān)系數(shù)主要有的相關(guān)系數(shù)主要有PearsonPearson簡(jiǎn)單相關(guān)系數(shù)、簡(jiǎn)單相關(guān)系數(shù)、SpearmanSpearman等級(jí)相等級(jí)相關(guān)系數(shù)和關(guān)系數(shù)和Kendall Kendall 相關(guān)系數(shù)等。相關(guān)系數(shù)等。lPearsonPearson簡(jiǎn)單相關(guān)系數(shù)(簡(jiǎn)單相關(guān)系數(shù)(適用于兩個(gè)變量都是數(shù)值型的數(shù)適用于兩個(gè)變量都是數(shù)值型的

5、數(shù)據(jù)據(jù))。)。lSpearmanSpearman等級(jí)相關(guān)系數(shù)用來(lái)度量等級(jí)相關(guān)系數(shù)用來(lái)度量定序變量間的線性相關(guān)關(guān)定序變量間的線性相關(guān)關(guān)系系。(3) 計(jì)算相關(guān)系數(shù)的基本操作計(jì)算相關(guān)系數(shù)的基本操作 【分析】分析】-【相關(guān)】【相關(guān)】-【雙變量【雙變量】(4) 相關(guān)分析應(yīng)用舉例相關(guān)分析應(yīng)用舉例 為研究高等院校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)會(huì)受哪為研究高等院校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)會(huì)受哪些因素的影響,收集些因素的影響,收集19991999年年3131個(gè)省市自治區(qū)部分高校有關(guān)社個(gè)省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),研究立項(xiàng)課題數(shù)(當(dāng)年)與投入的具有科研究方面的數(shù)據(jù),研究立項(xiàng)課題數(shù)(當(dāng)年)與投入的具

6、有高級(jí)職稱的人年數(shù)(當(dāng)年)、發(fā)表的論文數(shù)(上年)之間是高級(jí)職稱的人年數(shù)(當(dāng)年)、發(fā)表的論文數(shù)(上年)之間是否具有較強(qiáng)的線性關(guān)系。否具有較強(qiáng)的線性關(guān)系。 對(duì)該問(wèn)題的研究可以采用相關(guān)分析的方法,首先可繪制對(duì)該問(wèn)題的研究可以采用相關(guān)分析的方法,首先可繪制矩陣散點(diǎn)圖;其次可以計(jì)算矩陣散點(diǎn)圖;其次可以計(jì)算PearsonPearson簡(jiǎn)單相關(guān)系數(shù)。簡(jiǎn)單相關(guān)系數(shù)。3. 偏相關(guān)分析偏相關(guān)分析 上節(jié)中的相關(guān)系數(shù)是研究?jī)勺兞块g上節(jié)中的相關(guān)系數(shù)是研究?jī)勺兞块g線性相關(guān)性線性相關(guān)性的,若還存的,若還存在其他因素影響,就相關(guān)系數(shù)本身來(lái)講,它未必是兩變量間在其他因素影響,就相關(guān)系數(shù)本身來(lái)講,它未必是兩變量間線性相關(guān)強(qiáng)弱的真

7、實(shí)體現(xiàn),往往有夸大的趨勢(shì)。線性相關(guān)強(qiáng)弱的真實(shí)體現(xiàn),往往有夸大的趨勢(shì)。 例如,在研究商品的需求量和價(jià)格、消費(fèi)者收入之間的例如,在研究商品的需求量和價(jià)格、消費(fèi)者收入之間的線性關(guān)系時(shí),需求量和價(jià)格之間的相關(guān)關(guān)系實(shí)際還包含了消線性關(guān)系時(shí),需求量和價(jià)格之間的相關(guān)關(guān)系實(shí)際還包含了消費(fèi)者收入對(duì)價(jià)格和商品需求量的影響費(fèi)者收入對(duì)價(jià)格和商品需求量的影響。在這種情況下,單純。在這種情況下,單純利用相關(guān)系數(shù)來(lái)評(píng)價(jià)變量間的相關(guān)性顯然是不準(zhǔn)確的,而需利用相關(guān)系數(shù)來(lái)評(píng)價(jià)變量間的相關(guān)性顯然是不準(zhǔn)確的,而需要在剔除其他相關(guān)因素影響的條件下計(jì)算變量間的相關(guān)。偏要在剔除其他相關(guān)因素影響的條件下計(jì)算變量間的相關(guān)。偏相關(guān)的意義就在于此

8、。相關(guān)的意義就在于此。1) 偏相關(guān)分析和偏相關(guān)系數(shù)偏相關(guān)分析和偏相關(guān)系數(shù) 偏相關(guān)分析也稱凈相關(guān)分析,它在控制其他變量的線性偏相關(guān)分析也稱凈相關(guān)分析,它在控制其他變量的線性影響的條件下分析兩變量間的線性關(guān)系,所采用的工具是偏影響的條件下分析兩變量間的線性關(guān)系,所采用的工具是偏相關(guān)系數(shù)。相關(guān)系數(shù)。 控制變量個(gè)數(shù)為控制變量個(gè)數(shù)為1 1時(shí),偏相關(guān)系數(shù)稱時(shí),偏相關(guān)系數(shù)稱一階偏相關(guān)一階偏相關(guān);當(dāng)控制;當(dāng)控制兩個(gè)變量時(shí),偏相關(guān)系數(shù)稱為兩個(gè)變量時(shí),偏相關(guān)系數(shù)稱為二階偏相關(guān)二階偏相關(guān);當(dāng)控制變量的個(gè);當(dāng)控制變量的個(gè)數(shù)為數(shù)為0 0時(shí),偏相關(guān)系數(shù)稱為時(shí),偏相關(guān)系數(shù)稱為零階偏相關(guān)零階偏相關(guān),也就是,也就是簡(jiǎn)單相關(guān)系簡(jiǎn)

9、單相關(guān)系數(shù)數(shù)。2) 偏相關(guān)分析的基本操作偏相關(guān)分析的基本操作 【分析分析】-【相關(guān)相關(guān)】-【偏相關(guān)偏相關(guān)】4. 線性回歸分析線性回歸分析線性回歸分析的內(nèi)容線性回歸分析的內(nèi)容能否找到一個(gè)線性組合來(lái)說(shuō)明一組自變量和因變量的關(guān)系能否找到一個(gè)線性組合來(lái)說(shuō)明一組自變量和因變量的關(guān)系如果能的話,這種關(guān)系的強(qiáng)度有多大,也就是利用自變量的線如果能的話,這種關(guān)系的強(qiáng)度有多大,也就是利用自變量的線性組合來(lái)預(yù)測(cè)因變量的能力有多強(qiáng)性組合來(lái)預(yù)測(cè)因變量的能力有多強(qiáng)整體解釋能力是否具有統(tǒng)計(jì)上的顯著性意義整體解釋能力是否具有統(tǒng)計(jì)上的顯著性意義在整體解釋能力顯著的情況下,哪些自變量有顯著意義在整體解釋能力顯著的情況下,哪些自變

10、量有顯著意義回歸分析的一般步驟回歸分析的一般步驟確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸方程確定回歸方程對(duì)回歸方程進(jìn)行各種檢驗(yàn)對(duì)回歸方程進(jìn)行各種檢驗(yàn)利用回歸方程進(jìn)行預(yù)測(cè)利用回歸方程進(jìn)行預(yù)測(cè)1)線性回歸分析概述線性回歸分析概述2) 線性回歸模型線性回歸模型一元線性回歸模型的數(shù)學(xué)模型:xy10 其中其中x x為自變量;為自變量;y y為因變量;為因變量; 為截距,即常量;為截距,即常量; 為回歸系數(shù),表明自變量對(duì)因變量的影響程度。為回歸系數(shù),表明自變量對(duì)因變量的影響程度。多元線性回歸模型多元線性回歸模型多元線性回歸方程

11、:多元線性回歸方程: y=y=0 0+1 1x x1 1+2 2x x2 2+.+.+k kx xk k1 1、2 2、k k為偏回歸系數(shù)。為偏回歸系數(shù)。1 1表示在其他自變量保持不變的情況下,自變量表示在其他自變量保持不變的情況下,自變量x x1 1變變動(dòng)一個(gè)單位所引起的因變量動(dòng)一個(gè)單位所引起的因變量y y的平均變動(dòng)。的平均變動(dòng)。選擇選擇【分析分析】 【回歸回歸】【線性線性】。在左側(cè)變量框中選擇。在左側(cè)變量框中選擇“課題總數(shù)課題總數(shù)”將其移動(dòng)到因變量列表中,將自變量將其移動(dòng)到因變量列表中,將自變量“移動(dòng)到移動(dòng)到自變量下的方格中,如圖所示。自變量下的方格中,如圖所示。 從下表可以看出,引入模型

12、的六個(gè)解釋變量只有一個(gè)通從下表可以看出,引入模型的六個(gè)解釋變量只有一個(gè)通過(guò)過(guò)t t檢驗(yàn)。檢驗(yàn)。模型整體顯著而單個(gè)系數(shù)大都不能通過(guò)模型整體顯著而單個(gè)系數(shù)大都不能通過(guò)t t檢驗(yàn),這檢驗(yàn),這正是解釋變量之間存過(guò)多重共線性的常見(jiàn)特征正是解釋變量之間存過(guò)多重共線性的常見(jiàn)特征。觀察表中的。觀察表中的容差和方差膨脹因子我們可以看出六個(gè)解釋變量的容差都很容差和方差膨脹因子我們可以看出六個(gè)解釋變量的容差都很小接近于小接近于0 0,但它們的,但它們的VIFVIF都很大,都很大,這進(jìn)一步證實(shí)了解釋變量這進(jìn)一步證實(shí)了解釋變量之間存在嚴(yán)重的多重共線性之間存在嚴(yán)重的多重共線性。1)1)容忍度容忍度 (Tolerance)

13、 (Tolerance) : :容忍度越小,多重共線性越嚴(yán)重。有容忍度越小,多重共線性越嚴(yán)重。有學(xué)者提出,學(xué)者提出,容忍度小于容忍度小于 0.1 0.1 時(shí),存在嚴(yán)重的多重共線性時(shí),存在嚴(yán)重的多重共線性。2)2)方差膨脹因子方差膨脹因子 (VIF): (VIF): 等于容忍度的倒數(shù)等于容忍度的倒數(shù)。顯然,。顯然,VIF VIF 越大,越大,多重共線性問(wèn)題越大。多重共線性問(wèn)題越大。一般認(rèn)為一般認(rèn)為VIFVIF不應(yīng)大于不應(yīng)大于5 5 ,對(duì)應(yīng)容忍度的,對(duì)應(yīng)容忍度的標(biāo)準(zhǔn),也可放寬至不大于標(biāo)準(zhǔn),也可放寬至不大于1010 。3)3)特征值(特征值(Eigenvalue):Eigenvalue):對(duì)模型中常

14、數(shù)項(xiàng)及所有自變量計(jì)算主對(duì)模型中常數(shù)項(xiàng)及所有自變量計(jì)算主成分,成分,如果自變量間存在較強(qiáng)的線性相關(guān)關(guān)系,則前面的幾個(gè)如果自變量間存在較強(qiáng)的線性相關(guān)關(guān)系,則前面的幾個(gè)主成分?jǐn)?shù)值較大,而后面的幾個(gè)主成分較小,甚至接近主成分?jǐn)?shù)值較大,而后面的幾個(gè)主成分較小,甚至接近0 0。4)4)條件索引條件索引(Condition Index):(Condition Index):等于最大的主成分與當(dāng)前主成等于最大的主成分與當(dāng)前主成分的比值的算術(shù)平方根。分的比值的算術(shù)平方根。所以第一個(gè)主成分相對(duì)應(yīng)的條件指數(shù)所以第一個(gè)主成分相對(duì)應(yīng)的條件指數(shù)總為總為1 1。同樣,如果幾個(gè)條件指數(shù)較大。同樣,如果幾個(gè)條件指數(shù)較大( (如

15、大于如大于30) 30) ,則提示存,則提示存在多重共線性在多重共線性。 下表給出了方程解釋變量的多重共線性診斷結(jié)果。下表給出了方程解釋變量的多重共線性診斷結(jié)果。從特征從特征根上看根上看,最大的特征根遠(yuǎn)遠(yuǎn)大于其他特征根,后,最大的特征根遠(yuǎn)遠(yuǎn)大于其他特征根,后 3 個(gè)條件指數(shù)個(gè)條件指數(shù)都大于都大于 10,說(shuō)明變量之間確實(shí)存在多重共線性問(wèn)題說(shuō)明變量之間確實(shí)存在多重共線性問(wèn)題。從方差。從方差比例上看,第比例上看,第 6個(gè)特征根解釋了人均論文數(shù)方差的個(gè)特征根解釋了人均論文數(shù)方差的 82%,同時(shí),同時(shí)解釋了投入科研事業(yè)費(fèi)方差的解釋了投入科研事業(yè)費(fèi)方差的 65%,說(shuō)明這兩個(gè)變量之間可,說(shuō)明這兩個(gè)變量之間可

16、能存在多重共線性;第能存在多重共線性;第 7 個(gè)特征根同時(shí)解釋了投入人年數(shù)方差個(gè)特征根同時(shí)解釋了投入人年數(shù)方差的的 84%、投入高級(jí)職稱的人年數(shù)方差的、投入高級(jí)職稱的人年數(shù)方差的60%,說(shuō)明這,說(shuō)明這 2個(gè)變量個(gè)變量之間可能存在多重共線性。之間可能存在多重共線性。 為了解決多重共線性帶來(lái)的問(wèn)題,可以使用為了解決多重共線性帶來(lái)的問(wèn)題,可以使用 Backward Backward 法篩選變量。得到結(jié)果如下表所示:從模型匯總可以看出方法篩選變量。得到結(jié)果如下表所示:從模型匯總可以看出方程的擬合優(yōu)度還是比較高的,程的擬合優(yōu)度還是比較高的,Backward Backward 法篩選變量的過(guò)程法篩選變量的

17、過(guò)程如下表,最后我們得到模型如下表,最后我們得到模型6.6. 在模型在模型6 6中去掉了原有的中去掉了原有的6 6個(gè)變量,剩下個(gè)變量,剩下1 1個(gè)變量不存在多個(gè)變量不存在多重共線性了,由此得到線性回歸方程為:重共線性了,由此得到線性回歸方程為:課題總數(shù)課題總數(shù)=-94.524+0.492=-94.524+0.492* *投入人年數(shù)投入人年數(shù) 變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性關(guān)系,變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性關(guān)系,非線非線性關(guān)系性關(guān)系也是極為常見(jiàn)的。變量之間的非線性關(guān)系可以劃分為也是極為常見(jiàn)的。變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系。本質(zhì)線性關(guān)系是指變量關(guān)本質(zhì)

18、線性關(guān)系和本質(zhì)非線性關(guān)系。本質(zhì)線性關(guān)系是指變量關(guān)系形式上雖然呈非線性關(guān)系,但可通過(guò)變量變換為線性關(guān)系,系形式上雖然呈非線性關(guān)系,但可通過(guò)變量變換為線性關(guān)系,并最終可通過(guò)線性回歸分析建立線性模型。本質(zhì)非線性關(guān)系并最終可通過(guò)線性回歸分析建立線性模型。本質(zhì)非線性關(guān)系是指變量關(guān)系不僅形式上呈非線性關(guān)系,而且也無(wú)法變換為是指變量關(guān)系不僅形式上呈非線性關(guān)系,而且也無(wú)法變換為線性關(guān)系。本節(jié)的曲線估計(jì)是解決本質(zhì)線性關(guān)系問(wèn)題的。線性關(guān)系。本節(jié)的曲線估計(jì)是解決本質(zhì)線性關(guān)系問(wèn)題的。5. 曲線估計(jì)曲線估計(jì)1)曲線估計(jì)概述曲線估計(jì)概述 SPSSSPSS曲線估計(jì)中,首先,在不能明確究竟哪種模型更曲線估計(jì)中,首先,在不能明確究竟哪種模型更接近樣本數(shù)據(jù)時(shí),可在多種可選擇的模型中選擇幾種模型;接近樣本數(shù)據(jù)時(shí),可在多種可選擇的模型中選擇幾種模型;然后然后SPSSSPSS自動(dòng)完成模型的參數(shù)估計(jì),并輸出回歸方程顯著性自動(dòng)完成模型的參數(shù)估計(jì),并輸出回歸方程顯著性檢驗(yàn)的檢驗(yàn)的F F值和概率值和概率p p值、判定系數(shù)值、判定系數(shù)R R2

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論