版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進行舉報或認領(lǐng)
文檔簡介
SPSS統(tǒng)計分析方法及應(yīng)用第七章
相關(guān)分析與回歸分析
1/13/202417.1相關(guān)分析和回歸分析概述7.2相關(guān)分析7.3偏相關(guān)分析7.4線性回歸分析1/13/202421.相關(guān)分析和回歸分析概述客觀事物之間的關(guān)系大致可歸納為兩大類,即函數(shù)關(guān)系:指兩事物之間的一種一一對應(yīng)的關(guān)系,如商品的銷售額和銷售量之間的關(guān)系。相關(guān)關(guān)系〔統(tǒng)計關(guān)系〕:指兩事物之間的一種非一一對應(yīng)的關(guān)系,例如家庭收入和支出、子女身高和父母身高之間的關(guān)系等。相關(guān)關(guān)系又分為線性相關(guān)和非線性相關(guān)。相關(guān)分析和回歸分析都是分析客觀事物之間相關(guān)關(guān)系的數(shù)量分析方法。1/13/202432.相關(guān)分析相關(guān)分析通過圖形和數(shù)值兩種方式,有效地揭示事物之間相關(guān)關(guān)系的強弱程度和形式?!?〕散點圖它將數(shù)據(jù)以點的的形式畫在直角坐標系上,通過觀察散點圖能夠直觀的發(fā)現(xiàn)變量間的相關(guān)關(guān)系及他們的強弱程度和方向。1/13/20244〔2〕相關(guān)系數(shù)利用相關(guān)系數(shù)進行變量間線性關(guān)系的分析通常需要完成以下兩個步驟:第一,計算樣本相關(guān)系數(shù)r;相關(guān)系數(shù)r的取值在-1~+1之間R>0表示兩變量存在正的線性相關(guān)關(guān)系;r<0表示兩變量存在負的線性相關(guān)關(guān)系R=1表示兩變量存在完全正相關(guān);r=-1表示兩變量存在完全負相關(guān);r=0表示兩變量不相關(guān)|r|>0.8表示兩變量有較強的線性關(guān)系;|r|<0.3表示兩變量之間的線性關(guān)系較弱第二,對樣本來自的兩總體是否存在顯著的線性關(guān)系進行推斷。1/13/20245對不同類型的變量應(yīng)采用不同的相關(guān)系數(shù)來度量,常用的相關(guān)系數(shù)主要有Pearson簡單相關(guān)系數(shù)、Spearman等級相關(guān)系數(shù)和Kendall相關(guān)系數(shù)等。Pearson簡單相關(guān)系數(shù)〔適用于兩個變量都是數(shù)值型的數(shù)據(jù)〕。Spearman等級相關(guān)系數(shù)用來度量定序變量間的線性相關(guān)關(guān)系。1/13/20246〔3〕計算相關(guān)系數(shù)的根本操作【分析】--【相關(guān)】--【雙變量】1/13/20247〔4〕相關(guān)分析應(yīng)用舉例為研究高等院校人文社會科學研究中立項課題數(shù)會受哪些因素的影響,收集1999年31個省市自治區(qū)局部高校有關(guān)社科研究方面的數(shù)據(jù),研究立項課題數(shù)〔當年〕與投入的具有高級職稱的人年數(shù)〔當年〕、發(fā)表的論文數(shù)〔上年〕之間是否具有較強的線性關(guān)系。對該問題的研究可以采用相關(guān)分析的方法,首先可繪制矩陣散點圖;其次可以計算Pearson簡單相關(guān)系數(shù)。1/13/202481/13/202491/13/2024103.偏相關(guān)分析上節(jié)中的相關(guān)系數(shù)是研究兩變量間線性相關(guān)性的,假設(shè)還存在其他因素影響,就相關(guān)系數(shù)本身來講,它未必是兩變量間線性相關(guān)強弱的真實表達,往往有夸大的趨勢。例如,在研究商品的需求量和價格、消費者收入之間的線性關(guān)系時,需求量和價格之間的相關(guān)關(guān)系實際還包含了消費者收入對價格和商品需求量的影響。在這種情況下,單純利用相關(guān)系數(shù)來評價變量間的相關(guān)性顯然是不準確的,而需要在剔除其他相關(guān)因素影響的條件下計算變量間的相關(guān)。偏相關(guān)的意義就在于此。1)偏相關(guān)分析和偏相關(guān)系數(shù)1/13/202411偏相關(guān)分析也稱凈相關(guān)分析,它在控制其他變量的線性影響的條件下分析兩變量間的線性關(guān)系,所采用的工具是偏相關(guān)系數(shù)??刂谱兞總€數(shù)為1時,偏相關(guān)系數(shù)稱一階偏相關(guān);當控制兩個變量時,偏相關(guān)系數(shù)稱為二階偏相關(guān);當控制變量的個數(shù)為0時,偏相關(guān)系數(shù)稱為零階偏相關(guān),也就是簡單相關(guān)系數(shù)。1/13/2024122)偏相關(guān)分析的根本操作【分析】--【相關(guān)】--【偏相關(guān)】1/13/2024131/13/2024144.線性回歸分析線性回歸分析的內(nèi)容能否找到一個線性組合來說明一組自變量和因變量的關(guān)系如果能的話,這種關(guān)系的強度有多大,也就是利用自變量的線性組合來預(yù)測因變量的能力有多強整體解釋能力是否具有統(tǒng)計上的顯著性意義在整體解釋能力顯著的情況下,哪些自變量有顯著意義回歸分析的一般步驟確定回歸方程中的解釋變量〔自變量〕和被解釋變量〔因變量〕確定回歸方程對回歸方程進行各種檢驗利用回歸方程進行預(yù)測1)線性回歸分析概述1/13/2024152)線性回歸模型一元線性回歸模型的數(shù)學模型:其中x為自變量;y為因變量;為截距,即常量;為回歸系數(shù),說明自變量對因變量的影響程度。1/13/202416多元線性回歸模型多元線性回歸方程:y=β0+β1x1+β2x2+...+βkxkβ1、β2、βk為偏回歸系數(shù)。β1表示在其他自變量保持不變的情況下,自變量x1變動一個單位所引起的因變量y的平均變動。1/13/202417選擇【分析】→【回歸】→【線性】。在左側(cè)變量框中選擇“課題總數(shù)〞將其移動到因變量列表中,將自變量“移動到自變量下的方格中,如下圖。1/13/2024181/13/2024191/13/202420
從下表可以看出,引入模型的六個解釋變量只有一個通過t檢驗。模型整體顯著而單個系數(shù)大都不能通過t檢驗,這正是解釋變量之間存過多重共線性的常見特征。觀察表中的容差和方差膨脹因子我們可以看出六個解釋變量的容差都很小接近于0,但它們的VIF都很大,這進一步證實了解釋變量之間存在嚴重的多重共線性。1/13/2024211)容忍度(Tolerance):容忍度越小,多重共線性越嚴重。有學者提出,容忍度小于0.1時,存在嚴重的多重共線性。2)方差膨脹因子(VIF):等于容忍度的倒數(shù)。顯然,VIF越大,多重共線性問題越大。一般認為VIF不應(yīng)大于5,對應(yīng)容忍度的標準,也可放寬至不大于10。3)特征值〔Eigenvalue):對模型中常數(shù)項及所有自變量計算主成分,如果自變量間存在較強的線性相關(guān)關(guān)系,那么前面的幾個主成分數(shù)值較大,而后面的幾個主成分較小,甚至接近0。4)條件索引(ConditionIndex):等于最大的主成分與當前主成分的比值的算術(shù)平方根。所以第一個主成分相對應(yīng)的條件指數(shù)總為1。同樣,如果幾個條件指數(shù)較大(如大于30),那么提示存在多重共線性。1/13/202422下表給出了方程解釋變量的多重共線性診斷結(jié)果。從特征根上看,最大的特征根遠遠大于其他特征根,后3個條件指數(shù)都大于10,說明變量之間確實存在多重共線性問題。從方差比例上看,第6個特征根解釋了人均論文數(shù)方差的82%,同時解釋了投入科研事業(yè)費方差的65%,說明這兩個變量之間可能存在多重共線性;第7個特征根同時解釋了投入人年數(shù)方差的84%、投入高級職稱的人年數(shù)方差的60%,說明這2個變量之間可能存在多重共線性。1/13/202423為了解決多重共線性帶來的問題,可以使用Backward法篩選變量。得到結(jié)果如下表所示:從模型匯總可以看出方程的擬合優(yōu)度還是比較高的,Backward法篩選變量的過程如下表,最后我們得到模型6.在模型6中去掉了原有的6個變量,剩下1個變量不存在多重共線性了,由此得到線性回歸方程為:課題總數(shù)=-94.524+0.492*投入人年數(shù)1/13/2024241/13/202425
變量間的相關(guān)關(guān)系中,并不總是表現(xiàn)出線性關(guān)系,非線性關(guān)系也是極為常見的。變量之間的非線性關(guān)系可以劃分為本質(zhì)線性關(guān)系和本質(zhì)非線性關(guān)系。本質(zhì)線性關(guān)系是指變量關(guān)系形式上雖然呈非線性關(guān)系,但可通過變量變換為線性關(guān)系,并最終可通過線性回歸分析建立線性模型。本質(zhì)非線性關(guān)系是指變量關(guān)系不僅形式上呈非線性關(guān)系,而且也無法變換為線性關(guān)系。本節(jié)的曲線估計是解決本質(zhì)線性關(guān)系問題的。5.曲線估計1)曲線估計概述1/13/202426
SPSS曲線估計中,首先,在不能明確究竟哪種模型更接近樣本數(shù)據(jù)時,可在多種可選擇的模型中選擇幾種模型;然后SPSS自動完成模型的參數(shù)估計,并輸出回歸方程顯著性檢驗的F值和概率p值、判定系數(shù)R2等統(tǒng)計量;最后,以判定系數(shù)為主要依據(jù)選擇其中的最優(yōu)模型,并進行預(yù)測分析等。1/13/202427可通過繪制并觀察樣本數(shù)據(jù)的散點圖粗略確定被解釋變量和解釋變量之間的相關(guān)關(guān)系,為曲線擬合中的模型選擇提供依據(jù)。SPSS曲線估計的根本操作步驟是:選擇菜單分析-回歸-曲線估計。2)曲線估計的根本操作1/13/202428教育支出的相
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權(quán)或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025下半年湖北宜昌市遠安縣公安局招聘輔警擬聘用人員備考題庫及答案1套
- 2025年洛陽市公安機關(guān)招聘警務(wù)輔助人員501人考試題庫附答案
- 2025年西安市經(jīng)開第三中學教師招聘參考題庫含答案
- 2025年鷹潭市公安局第二批面向社會公開招聘警務(wù)輔助人員【47人】備考題庫及答案1套
- 2025廣東清遠市英德市英紅鎮(zhèn)人民政府保安人員招聘2人備考題庫含答案
- 2026中國科學院紫金山天文臺招用人員3人備考題庫(第1期江蘇)及答案詳解(新)
- 2026年自然資源部所屬單位公開招聘634人備考題庫(第一批)及答案詳解(易錯題)
- 2025江蘇連云港市灌云縣公安局招聘40人備考題庫及答案詳解(易錯題)
- 2026內(nèi)蒙古錫林郭勒盟蘇尼特右旗應(yīng)急管理局招聘2人備考題庫(含答案詳解)
- 2025-2030武漢城市圈產(chǎn)業(yè)協(xié)同發(fā)展創(chuàng)新資源調(diào)配消費升級趨勢研究報告
- 承包團建燒烤合同范本
- 工程項目施工計劃書
- 2023-2024學年深圳市初三中考適應(yīng)性考試英語試題(含答案)
- NB-T 47013.15-2021 承壓設(shè)備無損檢測 第15部分:相控陣超聲檢測
- 人教新起點英語五上《Unit5shopping》課件-課件
- 各品牌挖掘機挖斗連接尺寸數(shù)據(jù)
- 四川省成都市八年級上學期物理期末考試試卷及答案
- GB/T 38697-2020塊菌(松露)鮮品質(zhì)量等級規(guī)格
- 三菱FX3U系列PLC編程技術(shù)與應(yīng)用-第二章課件
- RoHS培訓(xùn)資料課件
- 協(xié)調(diào)控制系統(tǒng)
評論
0/150
提交評論