版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
相關(guān)分析與回歸分析專題
(Correlation®ression)相關(guān)分析與回歸分析專題
(Correlation®相關(guān)分析
(CorrelationAnalysis)相關(guān)分析
(CorrelationAnalysis)一、相關(guān)分析的意義:研究問題過程:?jiǎn)巫兞糠治鲭p變量分析多變量分析多變量分析與單變量分析的最大不同:揭示客觀事物之間的關(guān)聯(lián)性。所以,相關(guān)分析的意義和目的在于:(1)在統(tǒng)計(jì)學(xué)中有理論與實(shí)踐意義(2)對(duì)相關(guān)關(guān)系的存在性給出判斷(3)對(duì)相關(guān)關(guān)系的強(qiáng)度給出度量和分析一、相關(guān)分析的意義:3二、相關(guān)分析的概念
變量之間的關(guān)系分為確定性關(guān)系和非確定性關(guān)系。
確定性關(guān)系:當(dāng)一個(gè)變量值(自變量)確定后,另一個(gè)變量值(因變量)也就完全確定了,確定性關(guān)系往往可以表示成一個(gè)函數(shù)的形式,比如圓的面積和半徑的關(guān)系:S=πr2
非確定性關(guān)系:給定了一個(gè)變量值后,另一個(gè)變量值可以在一定范圍內(nèi)變化,例如家庭的消費(fèi)支出和家庭收入的關(guān)系。
研究者把非確定性關(guān)系稱為相關(guān)關(guān)系。二、相關(guān)分析的概念4三.相關(guān)分析的特點(diǎn)和應(yīng)用
相關(guān)關(guān)系是普遍存在的,函數(shù)關(guān)系僅是相關(guān)關(guān)系的特例。1.相關(guān)關(guān)系的類型
相關(guān)關(guān)系多種多樣,歸納起來大致有以下6種:
強(qiáng)正相關(guān)關(guān)系,其特點(diǎn)是一變量X增加,導(dǎo)致另一變量Y明顯增加,說明X是影響Y的主要因素。
弱正相關(guān)關(guān)系,其特點(diǎn)是一變量X增加,導(dǎo)致另一變量Y增加,但增加幅度不明顯。
強(qiáng)負(fù)相關(guān)關(guān)系,其特點(diǎn)是X增加,導(dǎo)致Y明顯減少,說明X是影響Y的主要因素三.相關(guān)分析的特點(diǎn)和應(yīng)用5弱負(fù)相關(guān)關(guān)系,其特點(diǎn)是變量X增加,導(dǎo)致Y減少,但減少幅度不明顯,說明X是Y的影響因素,但不是唯一因素。
非線性相關(guān)關(guān)系,其特點(diǎn)是X、Y之間沒有明顯的線性
關(guān)系,卻存在著某種非線性關(guān)系,說明X仍是影響Y的
因素。
不相關(guān),其特點(diǎn)是X、Y不存在相關(guān)關(guān)系,說明X不是
影響Y的因素。弱負(fù)相關(guān)關(guān)系,其特點(diǎn)是變量X增加,導(dǎo)致Y減少,但62.相關(guān)分析的應(yīng)用
(1)相關(guān)分析可以在影響某個(gè)變量的諸多變量中判斷哪些是顯著的,哪些是不顯著的。而且在得到相關(guān)分析的結(jié)果后,可以用于其他分析,如回歸分析和因子分析。
(2)相關(guān)分析方法已廣泛用于心理學(xué)、教育學(xué)、醫(yī)學(xué)、經(jīng)濟(jì)學(xué)等各學(xué)科。它對(duì)試驗(yàn)數(shù)據(jù)的處理、經(jīng)驗(yàn)公式的建立、管理標(biāo)準(zhǔn)的測(cè)定、自然現(xiàn)象和經(jīng)濟(jì)現(xiàn)象的統(tǒng)計(jì)預(yù)報(bào),都是一種方便而且有效的工具。2.相關(guān)分析的應(yīng)用7四、相關(guān)系數(shù)相關(guān)分析的主要目的是研究變量之間關(guān)系的密切程度,以及根據(jù)樣本的資料推斷總體是否樣關(guān)。反映變量之間關(guān)系緊密程度的指標(biāo)主要是相關(guān)系數(shù)r。相關(guān)系數(shù)r取值在-1到+1之間,當(dāng)數(shù)值愈接近-1或+1時(shí),說明關(guān)系愈緊密,接近于0時(shí),說明關(guān)系不緊密。四、相關(guān)系數(shù)相關(guān)分析的主要目的是研究變量之間關(guān)系的密切程度,8相關(guān)系數(shù)的計(jì)算樣本的相關(guān)系數(shù)一般用r表示,總體的相關(guān)系數(shù)一般用p表示。對(duì)于不同類型的變量,相關(guān)系數(shù)的計(jì)算公式不同。在相關(guān)分析中,常用的相關(guān)系數(shù)有:
Pearson簡(jiǎn)單相關(guān)系數(shù):對(duì)定距連續(xù)變量的數(shù)據(jù)進(jìn)行計(jì)算。如測(cè)度收入和儲(chǔ)蓄,身高和體重。
Spearman等級(jí)相關(guān)系數(shù):用于度量定序變量間的線性相關(guān)關(guān)系。如軍隊(duì)教員的軍銜與職稱。Kendallr相關(guān)系數(shù):用非參數(shù)檢驗(yàn)方法來度量定序變量間的線性相關(guān)關(guān)系。計(jì)算基于數(shù)據(jù)的秩。相關(guān)系數(shù)的計(jì)算樣本的相關(guān)系數(shù)一般用r表示,總體的相關(guān)系數(shù)一般9Pearson相關(guān)系數(shù)應(yīng)用廣泛,其計(jì)算公式及其性質(zhì)如下:Pearson相關(guān)系數(shù)應(yīng)用廣泛,其計(jì)算公式及其性質(zhì)如下:10在Analyze的下拉菜單Correlate命令項(xiàng)中有三個(gè)相關(guān)分析功能子命令:
Bivariate(兩兩相關(guān)分析過程)
Partial(偏相關(guān)分析過程)
Distances(距離分析過程)五、SPSS中相關(guān)分析─Correlation菜單
在Analyze的下拉菜單Correlate命令項(xiàng)中有三個(gè)相Bivariate過程
Bivariate過程
Bivariate過程用于進(jìn)行兩個(gè)或多個(gè)變量間的參數(shù)與非參數(shù)相關(guān)分析,如為多個(gè)變量,給出兩兩相關(guān)的分析結(jié)果。這是correlate菜單中最常用的一個(gè)過程,包括自動(dòng)計(jì)算Pearson簡(jiǎn)單相關(guān)系數(shù)、T檢驗(yàn)統(tǒng)計(jì)量和對(duì)應(yīng)的概率P值。SPSS-相關(guān)分析與回歸分析專題ppt課件13舉例:對(duì)肺活量和體重做相關(guān)分析1.打開SAV數(shù)據(jù)。2.用散點(diǎn)圖初步觀察兩變量間有無相關(guān)趨勢(shì),依次單擊菜單“Graphs-ChartBuilder”打開圖形構(gòu)建器,選擇做散點(diǎn)圖(Scatter/Dot)。
舉例:對(duì)肺活量和體重做相關(guān)分析143.設(shè)置相關(guān)分析的參數(shù)。
依次單擊“Analyze-Correlate-Bivariate”執(zhí)行兩變量相關(guān)分析。其主設(shè)置面板如圖所示:待分析變量列表變量列表相關(guān)系數(shù)顯著性檢驗(yàn)選項(xiàng)3.設(shè)置相關(guān)分析的參數(shù)。待分析變量列表變量列表相關(guān)系數(shù)顯著15SPSS-相關(guān)分析與回歸分析專題ppt課件16(2)相關(guān)性輸出,“相關(guān)性”表格給出的是Pearson相關(guān)系數(shù)及其檢驗(yàn)結(jié)果:“相關(guān)系數(shù)”表格給出的是兩個(gè)非參數(shù)相關(guān)系數(shù)及其檢驗(yàn)結(jié)果??梢?,3個(gè)相關(guān)系數(shù)在0.01和0.05的顯著性水平(雙邊檢驗(yàn))上都非常顯著,從而推斷體重和肺活量之間存在著明顯的正相關(guān)關(guān)系。(1)描述性輸出,“描述性統(tǒng)計(jì)量”表格給出了兩個(gè)變量的基本統(tǒng)計(jì)信息,包括均值、標(biāo)準(zhǔn)差和頻率。(2)相關(guān)性輸出,“相關(guān)性”表格給出的是Pearson相關(guān)系17
Partial過程Partial過程偏相關(guān)分析也稱凈相關(guān)分析,它在控制其他變量的線性影響下分析兩變量間的線性相關(guān),所采用的是工具是偏相關(guān)系數(shù)(凈相關(guān)系數(shù))。運(yùn)用偏相關(guān)分析可以有效地揭示變量間的真實(shí)關(guān)系,識(shí)別干擾變量并尋找隱含的相關(guān)性。如控制年齡和工作經(jīng)驗(yàn)的影響,估計(jì)工資收入與受教育水平之間的相關(guān)關(guān)系。Partial過程,當(dāng)進(jìn)行相關(guān)分析的兩個(gè)變量的取值都受到其他變量的影響時(shí),就可以利用偏相關(guān)分析對(duì)其他變量進(jìn)行控制,輸出控制其他變量影響后的相關(guān)系數(shù)。SPSS-相關(guān)分析與回歸分析專題ppt課件19舉例:分析身高與肺活量之間的相關(guān)性,要控制體重在相關(guān)分析過程中的影響。1.設(shè)置偏相關(guān)分析的參數(shù)。
依次單擊“Analyze-Correlate-Patial”執(zhí)行偏相關(guān)分析。其主設(shè)置面板如圖所示:舉例:200階偏相關(guān)(Pearson)1階偏相關(guān)顯著相關(guān)相關(guān)不顯著0階偏相關(guān)1階偏相關(guān)顯著相關(guān)相關(guān)不顯著21(1)描述性輸出,“描述性統(tǒng)計(jì)量”表格給出了三個(gè)變量的基本統(tǒng)計(jì)信息,包括均值、標(biāo)準(zhǔn)差和頻率。(2)相關(guān)性輸出,“相關(guān)性”表格給出了所有變量的0階偏相關(guān)(Pearson簡(jiǎn)單相關(guān))系數(shù)和1階偏相關(guān)系數(shù)的計(jì)算結(jié)果果、以及它們各自的顯著性檢驗(yàn)P值。分析結(jié)果顯示:在體重不變的條件下,身高與肺活量之間不存在顯著線性相關(guān)關(guān)系。(1)描述性輸出,“描述性統(tǒng)計(jì)量”表格給出了三個(gè)變量的基本統(tǒng)22Distances過程Distances過程23距離分析:此過程可以在觀測(cè)記錄之間或者不同變量之間進(jìn)行相似性和不相似性分析。相似性分析可以用于檢測(cè)觀測(cè)值的接近程度,不相似性分析可用于考察各變量的內(nèi)在聯(lián)系和結(jié)構(gòu)。該過程一般不單獨(dú)使用,而是作為因子分析、聚類分析和多維尺度分析等的預(yù)分析過程,以幫助了解復(fù)雜數(shù)據(jù)集的內(nèi)部結(jié)構(gòu),為進(jìn)一步的分析做準(zhǔn)備。與距離分析有關(guān)的統(tǒng)計(jì)量分為相似性測(cè)度和不相似性測(cè)試兩大類。距離分析:此過程可以在觀測(cè)記錄之間或者不同變量之間進(jìn)行相似24不相似性測(cè)度a、對(duì)定距變量的測(cè)度可以使用的統(tǒng)計(jì)量有Euclid歐氏距離、平方歐氏距離、契比雪夫距離等。b、對(duì)定序變量,使用卡方不相似測(cè)度和Phi方不相似測(cè)度。c、對(duì)二值(只有兩種取值)變量,使用歐氏距離、平方歐氏距離、LaneandWilliams不相似測(cè)度。相似性測(cè)度:a、對(duì)定距變量的測(cè)度,主要有統(tǒng)計(jì)量Pearson相關(guān)或余弦距離。b、對(duì)二值變量的相似性測(cè)度主要包括簡(jiǎn)單匹配系數(shù)、Jaccard相似性指數(shù)等。在通常使用的距離中,最常用的是歐式距離。不相似性測(cè)度25案例:打開“地區(qū)經(jīng)濟(jì)發(fā)展水平指標(biāo).sav”案例:打開“地區(qū)經(jīng)濟(jì)發(fā)展水平指標(biāo).sav”26參數(shù)設(shè)置:距離的計(jì)算對(duì)象距離的測(cè)度類型分析變量例表參數(shù)設(shè)置:距離的計(jì)算對(duì)象距離的測(cè)度類型分析變量例表27結(jié)果分析:結(jié)果分析:28(1)案例處理摘要。“案例處理摘要”表格給出了數(shù)據(jù)使用的基本情況。主要是對(duì)有無缺失值的統(tǒng)計(jì)信息,可見本例的11個(gè)案例沒有缺失,全部用于分析。(2)近似矩陣?!敖凭仃嚒北砀窠o出的是各變量之間的相似矩陣,圖中以線框標(biāo)注了相關(guān)系數(shù)較大的幾對(duì)變量。它們?cè)谶M(jìn)一步的分析中應(yīng)重點(diǎn)關(guān)注,或者直接對(duì)其進(jìn)行適當(dāng)?shù)念A(yù)處理(例如變量約減)相關(guān)分析與回歸分析(1)案例處理摘要?!鞍咐幚碚北砀窠o出了數(shù)據(jù)使用的基本29相關(guān)分析與回歸分析線性回歸相關(guān)分析線性回歸30線性回歸事物關(guān)系函數(shù)關(guān)系(一一對(duì)應(yīng))統(tǒng)計(jì)關(guān)系(非一一對(duì)應(yīng))線性相關(guān)非線性相關(guān)線性回歸事物關(guān)系函數(shù)關(guān)系統(tǒng)計(jì)關(guān)系線性相關(guān)非線性相關(guān)
回歸分析(regressionanalysis)確定兩種或兩種以上變數(shù)間相互依賴的定量關(guān)系的一種統(tǒng)計(jì)分析方法。涉及的自變量的多少一元回歸分析多元回歸分析自變量和因變量之間的關(guān)系類型,線性回歸分析非線性回歸分析線性回歸
回歸分析(regressionanalysis)線性回歸32回歸分析一般步驟:確定回歸方程中的解釋變量(自變量)和被解釋變量(因變量)確定回歸模型建立回歸方程對(duì)回歸方程進(jìn)行各種檢驗(yàn)利用回歸方程進(jìn)行預(yù)測(cè)線性回歸回歸分析一般步驟:線性回歸33一元線性回歸模型是指只有一個(gè)解釋變量的線性回歸模型,用于揭示被解釋變量與另一個(gè)解釋變量之間的線性關(guān)系。一元線性回歸數(shù)學(xué)模型:其中β0和β1是未知參數(shù),分別稱為回歸常數(shù)和回歸系數(shù),ε稱為隨機(jī)誤差,是一個(gè)隨機(jī)變量,且應(yīng)該滿足兩個(gè)前提條件:E(ε)=0var(ε)=σ2線性回歸模型線性回歸一元線性回歸模型是指只有一個(gè)解釋變量的線性回歸模型,用于揭示34多元線性回歸模型是指有多個(gè)解釋變量的線性回歸模型,用于揭示被解釋變量與其他多個(gè)解釋變量之間的線性關(guān)系。多元線性回歸數(shù)學(xué)模型:其中β0、β1、…βp都是未知參數(shù),分別稱為回歸常數(shù)和偏回歸系數(shù),ε稱為隨機(jī)誤差,是一個(gè)隨機(jī)變量,且同樣滿足兩個(gè)前提條件:E(ε)=0var(ε)=σ2線性回歸線性回歸模型多元線性回歸模型是指有多個(gè)解釋變量的線性回歸模型,用于揭示被35回歸參數(shù)的普通最小二乘估計(jì)(OLSE)線性回歸方程確定后的任務(wù)是利用已經(jīng)收集到的樣本數(shù)據(jù),根據(jù)一定的統(tǒng)計(jì)擬合準(zhǔn)則,對(duì)方程中的各參數(shù)進(jìn)行估計(jì)。普通最小二乘就是一種最為常見的統(tǒng)計(jì)擬合準(zhǔn)則。最小二乘法將偏差距離定義為離差平方和,即
(1)最小二乘估計(jì)就是尋找參數(shù)β0、β1、…βp的估計(jì)值β?0、β?1、…β?p,使式(1)達(dá)到極小。通過求極值原理(偏導(dǎo)為零)和解方程組,可求得估計(jì)值,SPSS將自動(dòng)完成。線性回歸回歸參數(shù)的普通最小二乘估計(jì)(OLSE)線性回歸36回歸方程的統(tǒng)計(jì)檢驗(yàn)回歸方程的擬合優(yōu)度檢驗(yàn)(相關(guān)系數(shù)檢驗(yàn))一元線性回歸的擬合優(yōu)度檢驗(yàn)采用R2統(tǒng)計(jì)量,稱為判定系數(shù)或決定系數(shù),數(shù)學(xué)定義為其中稱為回歸平方和(SSA)稱為總離差平方和(SST)線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)其中線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)回歸方程的擬合優(yōu)度檢驗(yàn)(相關(guān)系數(shù)檢驗(yàn))R2取值在0-1之間,R2越接近于1,說明回歸方程對(duì)樣本數(shù)據(jù)點(diǎn)的擬合優(yōu)度越高。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)38多元線性回歸的擬合優(yōu)度檢驗(yàn)采用
統(tǒng)計(jì)量,稱為調(diào)整的判定系數(shù)或調(diào)整的決定系數(shù),數(shù)學(xué)定義為式中n-p-1、n-1分別是SSE和SST的自由度。其取值范圍和意義與一元回歸方程中的R2是相同的?;貧w方程的統(tǒng)計(jì)檢驗(yàn)回歸方程的擬合優(yōu)度檢驗(yàn)(相關(guān)系數(shù)檢驗(yàn))線性回歸多元線性回歸的擬合優(yōu)度檢驗(yàn)采用統(tǒng)計(jì)量,稱為調(diào)整的判回歸方程的統(tǒng)計(jì)檢驗(yàn)回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))一元線性回歸方程顯著性檢驗(yàn)的零假設(shè)是β1=0,檢驗(yàn)采用F統(tǒng)計(jì)量,其數(shù)學(xué)定義為:即平均的SSA/平均的SSE,F(xiàn)統(tǒng)計(jì)量服從(1,n-2)個(gè)自由度的F分布。SPSS將會(huì)自動(dòng)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值以及對(duì)應(yīng)的概率p值,如果p值小于給定的顯著性水平α,則應(yīng)拒絕零假設(shè),認(rèn)為線性關(guān)系顯著。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)一元線性回歸方程顯著性檢驗(yàn)的零假設(shè)是β1=40回歸方程的統(tǒng)計(jì)檢驗(yàn)回歸方程的顯著性檢驗(yàn)(F檢驗(yàn))多元線性回歸方程顯著性檢驗(yàn)的零假設(shè)是各個(gè)偏回歸系數(shù)同時(shí)為零,檢驗(yàn)采用F統(tǒng)計(jì)量,其數(shù)學(xué)定義為:即平均的SSA/平均的SSE,F(xiàn)統(tǒng)計(jì)量服從(p,n-p-1)個(gè)自由度的F分布。SPSS將會(huì)自動(dòng)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的觀測(cè)值以及對(duì)應(yīng)的概率p值,如果p值小于給定的顯著性水平α,則應(yīng)拒絕零假設(shè),認(rèn)為y與x的全體的線性關(guān)系顯著。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)多元線性回歸方程顯著性檢驗(yàn)的零假設(shè)是各個(gè)偏41回歸方程的統(tǒng)計(jì)檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))一元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的零假設(shè)是β1=0,檢驗(yàn)采用t統(tǒng)計(jì)量,其數(shù)學(xué)定義為:t統(tǒng)計(jì)量服從n-2個(gè)自由度的t分布。SPSS將會(huì)自動(dòng)計(jì)算t統(tǒng)計(jì)量的觀測(cè)值以及對(duì)應(yīng)的概率p值,如果p值小于給定的顯著性水平α,則應(yīng)拒絕零假設(shè),認(rèn)為x對(duì)y有顯著貢獻(xiàn),線性關(guān)系顯著。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)一元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的零假42回歸方程的統(tǒng)計(jì)檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)(t檢驗(yàn))多元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的零假設(shè)是βi=0,檢驗(yàn)采用t統(tǒng)計(jì)量,其數(shù)學(xué)定義為:ti統(tǒng)計(jì)量服從n-p-1個(gè)自由度的t分布。SPSS將會(huì)自動(dòng)計(jì)算ti統(tǒng)計(jì)量的觀測(cè)值以及對(duì)應(yīng)的概率p值,如果p值小于給定的顯著性水平α,則應(yīng)拒絕零假設(shè),認(rèn)為xi對(duì)y有顯著貢獻(xiàn),應(yīng)保留在線性方程中。(i=1,2,…,p)線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)多元線性回歸方程的回歸系數(shù)顯著性檢驗(yàn)的零假43回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析所謂殘差是指由回歸方程計(jì)算所得的預(yù)測(cè)值與實(shí)際樣本值之間的差距,即它是回歸模型中的估計(jì)值。如果回歸方程能較好地反映被解釋變量的特征和變化規(guī)律,那么殘差序列中應(yīng)不包含明顯的規(guī)律性和趨勢(shì)性。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)所謂殘差是指由回歸方程計(jì)算所得的預(yù)測(cè)值與實(shí)回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析——均值為0的正態(tài)性分析殘差均值為0的正態(tài)性分析,可以通過繪制殘差圖進(jìn)行分析,如果殘差均值為0,殘差圖中的點(diǎn)應(yīng)在縱坐標(biāo)為0的橫線上下隨機(jī)散落著。正態(tài)性可以通過繪制標(biāo)準(zhǔn)化(或?qū)W生化)殘差的累計(jì)概率圖來分析線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差均值為0的正態(tài)性分析,可以通過繪制殘差45回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析——獨(dú)立性分析繪制殘差序列的序列圖以樣本期(或時(shí)間)為橫坐標(biāo),殘差為縱坐標(biāo),如果殘差隨時(shí)間的推移呈規(guī)律性變化,則存在一定的正或負(fù)相關(guān)性。計(jì)算殘差的自相關(guān)系數(shù)取值在-1到+1之間,接近于+1表明序列存在正自相關(guān)性。DW(Durbin—Watson)檢驗(yàn)DW取值在0至4之間,直觀判斷標(biāo)準(zhǔn)是DW=4,殘差序列完全負(fù)自相關(guān);DW=2,完全無自相關(guān);DW=0,完全正自相關(guān)。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)線性回歸46回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析——異方差分析繪制殘差圖如果殘差的方差隨著解釋變量值的增加呈增加(或減少)的趨勢(shì),說明出現(xiàn)了異方差現(xiàn)象。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)線性回歸47回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析——異方差分析等級(jí)相關(guān)分析得到殘差序列后首先對(duì)其取絕對(duì)值,然后計(jì)算出殘差和解釋變量的秩,最后計(jì)算Spearman等級(jí)相關(guān)系數(shù),并進(jìn)行等級(jí)相關(guān)分析。具體過程見相關(guān)分析相關(guān)章節(jié)。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)線性回歸48回歸方程的統(tǒng)計(jì)檢驗(yàn)殘差分析——探測(cè)樣本中的異常值和強(qiáng)影響點(diǎn)(對(duì)于y值)標(biāo)準(zhǔn)化殘差ZRE由于殘差是服從均值為0的正態(tài)分布,因此可以根據(jù)3σ準(zhǔn)則進(jìn)行判斷,首先對(duì)殘差進(jìn)行標(biāo)準(zhǔn)化,絕對(duì)值大于3對(duì)應(yīng)的觀察值為異常值。學(xué)生化殘差SRE剔除殘差DRE(或剔除學(xué)生化殘差SDRE)上述SRE、SDRE的直觀判斷標(biāo)準(zhǔn)同標(biāo)準(zhǔn)化殘差ZRE。線性回歸回歸方程的統(tǒng)計(jì)檢驗(yàn)線性回歸49多元回歸分析中的其他問題變量篩選問題向前篩選策略解釋變量不斷進(jìn)入回歸方程的過程,首先選擇與被解釋變量具有最高線性相關(guān)系數(shù)的變量進(jìn)入方程,并進(jìn)行各種檢驗(yàn);其次在剩余的變量中挑選與解釋變量偏相關(guān)系數(shù)最高并通過檢驗(yàn)的變量進(jìn)入回歸方程。向后篩選策略變量不斷剔除出回歸方程的過程,首先所有變量全部引入回歸方程并檢驗(yàn),然后在回歸系數(shù)顯著性檢驗(yàn)不顯著的一個(gè)或多個(gè)變量中,剔除t檢驗(yàn)值最小的變量。逐步篩選策略向前篩選與向后篩選策略的綜合線性回歸多元回歸分析中的其他問題線性回歸50多元回歸分析中的其他問題變量多重共線性問題容忍度Tol容忍度值越接近于1,表示多重共線性越弱。SPSS變量多重共線性的要求不很嚴(yán)格,只是在容忍度值太小時(shí)給出相應(yīng)警告信息。方差膨脹因子VIF膨脹因子是容忍度的倒數(shù),越接近于1,表示解釋變量間的多重共線性越弱。通常如果VIFi大于等于10,說明解釋變量xi與其余解釋變量之間有嚴(yán)重的多重共線性。特征根和方差比這里的特征根是指相關(guān)系數(shù)矩陣的特征根。如果最大特征根遠(yuǎn)遠(yuǎn)大于其他特征根的值,則說明這些解釋變量之間具有相當(dāng)多的重疊信息。條件指數(shù)ki10≤ki≤100時(shí),認(rèn)為多重共線性較強(qiáng),ki≥100時(shí),認(rèn)為多重共線性很嚴(yán)重線性回歸多元回歸分析中的其他問題線性回歸回歸分析基本操作(1)選擇菜單Analyze—Regression—Linear,出現(xiàn)如下對(duì)話框因變量自變量條件變量標(biāo)志變量篩選策略線性回歸回歸分析基本操作因變量自變量條件變量標(biāo)志變量篩選策略線性回歸52(2)將因變量選入Dependent框(3)將一個(gè)或多個(gè)自變量選入Independengt(s)框(4)在Method框中選擇回歸分析中自變量的篩選策略。其中Enter表示所選變量強(qiáng)行進(jìn)入回歸方程,是SPSS默認(rèn)策略,通常用在一元線性回歸分析中;Remove表示從回歸方程中剔除所選變量;Stepwise表示逐步篩選策略;Backward、Forward分別表示向后、向前篩選策略?;貧w分析基本操作線性回歸(2)將因變量選入Dependent框回歸分析基本操作線性回53(5)上述(3)、(4)中確定的自變量和篩選策略可放置在不同的Block中,單擊“Next”和“Previous”按鈕設(shè)置多組自變量和變量篩選策略,并放在不同Block中,SPSS將按照設(shè)置順序依次進(jìn)行分析?!癇lock”設(shè)置便于作各種探索性的回歸分析。回歸分析基本操作線性回歸(5)上述(3)、(4)中確定的自變量和篩選策略可放置在不同54(6)選擇一個(gè)變量作為條件變量到SelectionVariable框中,并單擊“Rule”按鈕給定一個(gè)判斷條件。只有變量值滿足給定條件的樣本數(shù)據(jù)才參與線性回歸分析。線性回歸回歸分析基本操作(6)選擇一個(gè)變量作為條件變量到SelectionVari55(7)在CaseLabels框中指定哪個(gè)變量作為數(shù)據(jù)樣本點(diǎn)的標(biāo)志變量,該變量的值將標(biāo)在回歸分析的輸出圖形中。(8)WLSWeight中選人權(quán)重變量,主要用于加權(quán)最小二乘法。
至此便完成了線性回歸分析的基本操作,SPSS將根據(jù)指定自動(dòng)進(jìn)行回歸分析,并將結(jié)果輸出到輸出窗口中。線性回歸回歸分析基本操作(7)在CaseLabels框中指定哪個(gè)變量作為數(shù)據(jù)樣本點(diǎn)56回歸分析的其他操作Statistics選項(xiàng)輸出與回歸系數(shù)相關(guān)的統(tǒng)計(jì)量,包括回歸系數(shù)、回歸系數(shù)標(biāo)準(zhǔn)誤、標(biāo)準(zhǔn)化回歸系數(shù)、回歸系數(shù)顯著性檢驗(yàn)的t統(tǒng)計(jì)量和概率p值,個(gè)解釋變量的容忍度。每個(gè)非標(biāo)準(zhǔn)化回歸系數(shù)的95%置信區(qū)間輸出各解釋變量間的相關(guān)系數(shù)、協(xié)方差以及各回歸系數(shù)的方差線性回歸回歸分析的其他操作Statistics選項(xiàng)輸出與回歸系數(shù)相關(guān)57輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標(biāo)準(zhǔn)誤、回歸方程顯著性檢驗(yàn)的方差分析表每個(gè)解釋變量進(jìn)入方程后引起的判定系數(shù)的變化量和F值的變化量(偏F統(tǒng)計(jì)量)輸出個(gè)解釋變量和被解釋變量的均值、標(biāo)準(zhǔn)差、相關(guān)系數(shù)矩陣及單側(cè)檢驗(yàn)概率值輸出方程中各解釋變量與被解釋變量之間的簡(jiǎn)單相關(guān)、偏相關(guān)系數(shù)和部分相關(guān)線性回歸回歸分析的其他操作Statistics選項(xiàng)輸出判定系數(shù)、調(diào)整的判定系數(shù)、回歸方程的標(biāo)準(zhǔn)誤、回歸方程顯著58多重共線性分析:輸出各解釋變量的容忍度、方差膨脹因子、特征值、條件指標(biāo)、方差比例等DW值輸出標(biāo)準(zhǔn)化殘差絕對(duì)值大于等于3(默認(rèn))的樣本數(shù)據(jù)的相關(guān)信息線性回歸回歸分析的其他操作Statistics選項(xiàng)多重共線性分析:DW值輸出標(biāo)準(zhǔn)化殘差絕對(duì)值大于等于3(默認(rèn))59Plots選項(xiàng)標(biāo)準(zhǔn)化預(yù)測(cè)值標(biāo)準(zhǔn)化殘差剔除殘差調(diào)整的預(yù)測(cè)值學(xué)生化殘差剔除學(xué)生化殘差標(biāo)準(zhǔn)化殘差序列直方圖標(biāo)準(zhǔn)化殘差序列正態(tài)分布累計(jì)概率圖依次繪制被解釋變量與各解釋變量的散點(diǎn)圖線性回歸回歸分析的其他操作Plots選項(xiàng)標(biāo)準(zhǔn)化預(yù)測(cè)值標(biāo)準(zhǔn)化殘差序列直方圖標(biāo)準(zhǔn)化殘差序列60Save選項(xiàng)該窗口將回歸分析的某些結(jié)果以SPSS變量的形式保存到數(shù)據(jù)編輯窗口中,并可同時(shí)生成XML格式的文件,便于分析結(jié)果的網(wǎng)絡(luò)發(fā)布。線性回歸回歸分析的其他操作Save選項(xiàng)該窗口將回歸分析的某些結(jié)果以SPSS變量的形式保61Save選項(xiàng)保存剔除第i個(gè)樣本后各統(tǒng)計(jì)量的變化量回歸系數(shù)變化量標(biāo)準(zhǔn)化回歸系數(shù)變化量預(yù)測(cè)值變化量標(biāo)準(zhǔn)化預(yù)測(cè)值變化量協(xié)方差比線性回歸回歸分析的其他操作Save選項(xiàng)保存剔除第i個(gè)樣本后各統(tǒng)計(jì)量的變化量回歸系數(shù)變化62Options選項(xiàng)設(shè)置多元線性回歸分析中解釋變量進(jìn)入或剔除出回歸方程的標(biāo)準(zhǔn)偏F統(tǒng)計(jì)量的概率值線性回歸回歸分析的其他操作Options選項(xiàng)設(shè)置多元線性回歸分析中解釋變量進(jìn)入或剔除出63線性回歸分析的應(yīng)用舉例為研究高校人文社會(huì)科學(xué)研究中立項(xiàng)課題數(shù)受哪些因素的影響,收集某年31個(gè)省市自治區(qū)部分高校有關(guān)社科研究方面的數(shù)據(jù),并利用線性回歸方法進(jìn)行分析。這里,被解釋變量為立項(xiàng)課題數(shù)X5,解釋變量為投入人年數(shù)(X2)、投入高級(jí)職稱的人年數(shù)(X3)、投入科研事業(yè)費(fèi)(X4)、專著數(shù)(X6)、論文數(shù)(X7)、獲獎(jiǎng)數(shù)(X8)。具體操作如前所述。分析結(jié)果如下線性回歸線性回歸分析的應(yīng)用舉例線性回歸64SPSS-相關(guān)分析與回歸分析專題ppt課件65線性回歸線性回歸66線性回歸線性回歸67線性回歸線性回歸68線性回歸線性回歸69線性回歸線性回歸70線性回歸線性回歸71線性回歸線性回歸72線性回歸線性回歸73線性回歸線性回歸74線性回歸線性回歸75線性回歸線性回歸76線性回歸線性回歸77線性回歸線性回歸78線性回歸線性回歸79線性回歸線性回歸80線性回歸線性回歸81線性回歸線性回歸82線性回歸線性回歸83線性回歸線性回歸84線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(強(qiáng)制進(jìn)入策略)(一)回歸方程的擬合優(yōu)度較高線性回歸線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(強(qiáng)制進(jìn)85線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(強(qiáng)制進(jìn)入策略)(二)SSASSESST被解釋變量與解釋變量的全體的線性關(guān)系顯著線性回歸線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(強(qiáng)制進(jìn)86線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(強(qiáng)制進(jìn)入策略)(三)偏回歸系數(shù)檢驗(yàn)只有x2的是顯著的,其他均不顯著,即與0無顯著差異各解釋變量之間存在很強(qiáng)共線性線性回歸線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(強(qiáng)制進(jìn)87線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(強(qiáng)制進(jìn)入策略)(四)由特征根的較大差異、條件指數(shù)以及方差比進(jìn)一步證實(shí)了各解釋變量之間存在嚴(yán)重的線性自相關(guān)。線性回歸線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(強(qiáng)制進(jìn)88線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(向后篩選策略)(一)由此可見,不能以一味追求高的擬合優(yōu)度為目標(biāo),還要重點(diǎn)考察解釋變量對(duì)被解釋變量的貢獻(xiàn)線性回歸線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(向后篩89線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(向后篩選策略)(二)SSASSESST線性回歸線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(向后篩90線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(向后篩選策略)(三)由此可清楚地看到變量剔除的過程線性回歸線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(向后篩91線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(向后篩選策略)(四)線性回歸線性回歸分析的應(yīng)用舉例立項(xiàng)課題數(shù)多元線性回歸分析結(jié)果(向后篩92線性回歸分析的應(yīng)用舉例通過上述回歸方程的分析以及各種檢驗(yàn),得出如下回歸方程:立項(xiàng)課題數(shù)=-94.524+0.492投入人年數(shù),意味著投入人年數(shù)每增加一個(gè)單位會(huì)使立項(xiàng)課題數(shù)平均增加0.492個(gè)單位。線性回歸線性回歸分析的應(yīng)用舉例通過上述回歸方程的分析以及各種檢驗(yàn),得93曲線估計(jì)曲線估計(jì)94曲線估計(jì)變量間相關(guān)關(guān)系的分析中,變量之間的關(guān)系并不總是表現(xiàn)出線性關(guān)系,非線性關(guān)系也極為常見。非線性又可劃分為:本質(zhì)線性關(guān)系形式上雖然呈非線性,但可通過變量轉(zhuǎn)換化為線性關(guān)系。本質(zhì)非線性關(guān)系不僅形式上呈非線性,也無法通過變量轉(zhuǎn)換化為線性關(guān)系。這里的曲線估計(jì)是解決本質(zhì)線性關(guān)系問題的。曲線估計(jì)變量間相關(guān)關(guān)系的分析中,變量之間的關(guān)系并不總是表現(xiàn)出95模型名回歸方程變量變換后的線性方程二次曲線(Quadratic)復(fù)合曲線(Compound)增長(zhǎng)曲線(Growth)對(duì)數(shù)曲線(Logarithmic)三次曲線(Cubic)S曲線(S)指數(shù)曲線(Exponential)逆函數(shù)(Inverse)冪函數(shù)(Power)邏輯函數(shù)(Logistic)常見本質(zhì)線性模型曲線估計(jì)模型名回歸方程變量變換后的線性方程二次曲線(Quadrati96在SPSS曲線估計(jì)中,首先在不能明確哪種模型更接近樣本數(shù)據(jù)時(shí)可在上述可選擇的模型中選擇幾種模型,然后,SPSS自動(dòng)完成模型的參數(shù)估計(jì)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年高職園林工程技術(shù)(園林工程施工)試題及答案
- 2025年高職曲藝表演(曲藝創(chuàng)作技巧)試題及答案
- 2025年高職物流工程(物流工程基礎(chǔ))試題及答案
- 2025年高職(中藥資源)中藥種植技術(shù)推廣試題及答案
- 連鎖藥店管理制度
- 造價(jià)咨詢企業(yè)內(nèi)部管理制度
- 養(yǎng)老院老人生活設(shè)施維修人員職業(yè)發(fā)展規(guī)劃制度
- 養(yǎng)老院老人情感慰藉制度
- 養(yǎng)老院服務(wù)質(zhì)量投訴處理制度
- 養(yǎng)老院入住老人福利待遇保障制度
- 初中英語寫作教學(xué)中生成式AI的應(yīng)用與教學(xué)效果評(píng)估教學(xué)研究課題報(bào)告
- 2025年福建江夏學(xué)院毛澤東思想和中國(guó)特色社會(huì)主義理論體系概論期末考試模擬題及答案1套
- DB32T 5132.3-2025 重點(diǎn)人群職業(yè)健康保護(hù)行動(dòng)指南 第3部分:醫(yī)療衛(wèi)生人員
- 急性左心衰課件教學(xué)
- 2025至2030中國(guó)代駕行業(yè)項(xiàng)目調(diào)研及市場(chǎng)前景預(yù)測(cè)評(píng)估報(bào)告
- 押題地理會(huì)考真題及答案
- DB44-T 2668-2025 高速公路服務(wù)區(qū)和停車區(qū)服務(wù)規(guī)范
- 2024-2025學(xué)年湖北省襄陽市襄城區(qū)九年級(jí)(上)期末數(shù)學(xué)試卷
- 2026屆安徽省合肥市42中學(xué)物理八上期末達(dá)標(biāo)檢測(cè)試題含解析
- 當(dāng)代青年社交模式“搭子”現(xiàn)象及其適應(yīng)性研究
- 發(fā)車間隔問題-小升初奧數(shù)思維之典型應(yīng)用題講義
評(píng)論
0/150
提交評(píng)論