線性相關(guān)與回歸_第1頁
線性相關(guān)與回歸_第2頁
線性相關(guān)與回歸_第3頁
線性相關(guān)與回歸_第4頁
線性相關(guān)與回歸_第5頁
已閱讀5頁,還剩40頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

線性相關(guān)與回歸第一頁,共四十五頁,編輯于2023年,星期三實(shí)例某研究者用世界衛(wèi)生組織生存質(zhì)量測定量表WHOQOL-100測定了47例哈尼族居民的生存質(zhì)量以及性別(取值為:1男,0女)、文化程度(取值為:1文盲,2小學(xué),3初中,4高中,5大專及以上)、睡眠時間(h)、有無慢性病和電視機(jī)(取值為:1有,0無)等。試對其生命質(zhì)量影響因素進(jìn)行分析。第二頁,共四十五頁,編輯于2023年,星期三年齡(歲)X1性別X2文化程度X3睡眠時間(h)X4有無慢性病X5有無電視機(jī)X6生存質(zhì)量總分Y271280194.8221280091.8242280192.1162340186.7322150085.1361330184.9591291094.0522280188.8361281090.8322280092.8191290188.0321280190.9第三頁,共四十五頁,編輯于2023年,星期三直線相關(guān)

Linearcorrelation1.直線相關(guān)的概念:散點(diǎn)圖(scatterplot)相關(guān)關(guān)系的描述:正相關(guān)(positivecorrelation)負(fù)相關(guān)(negativecorrelation)零相關(guān)(zerocorrelation)完全相關(guān)(completelycorrelation)第四頁,共四十五頁,編輯于2023年,星期三一.直線相關(guān)第五頁,共四十五頁,編輯于2023年,星期三第六頁,共四十五頁,編輯于2023年,星期三第七頁,共四十五頁,編輯于2023年,星期三一.直線相關(guān)2.Pearson相關(guān)系數(shù)r的意義:說明具有直線關(guān)系的兩個變量間,相關(guān)的密切程度及相關(guān)方向的指標(biāo)。第八頁,共四十五頁,編輯于2023年,星期三一.直線相關(guān)3.相關(guān)系數(shù)r的假設(shè)檢驗(yàn):目的:檢驗(yàn)兩變量間是否存在直線關(guān)系。方法:

(1)t檢驗(yàn):

(2)查表:第九頁,共四十五頁,編輯于2023年,星期三一.直線相關(guān)應(yīng)用的注意事項(xiàng):相關(guān)分析的實(shí)際意義直線相關(guān)的應(yīng)用條件

x、y是服從雙變量正態(tài)分布的隨機(jī)變量相關(guān)關(guān)系不一定是因果關(guān)系零相關(guān)不一定沒有關(guān)系注意異常點(diǎn)的影響第十頁,共四十五頁,編輯于2023年,星期三二、直線回歸直線回歸的概念:用直線回歸方程描述兩變量間的依存關(guān)系。直線回歸方程(Linearregressionmodel)用直線方程來描述兩變量間的關(guān)系,與兩變量間嚴(yán)格對應(yīng)的函數(shù)關(guān)系不同,特稱直線回歸方程。第十一頁,共四十五頁,編輯于2023年,星期三直線回歸方程計(jì)算a和b:最小二乘法原理第十二頁,共四十五頁,編輯于2023年,星期三回歸分析的前提條件

Assumptionsoflinearregression線性(linear)獨(dú)立性(independent)正態(tài)性(normality)方差相等(equalvariance)第十三頁,共四十五頁,編輯于2023年,星期三殘差分析

(residualanalysis)殘差(residual)殘差分析目的:方法:回歸診斷(regressiondiagnosis)第十四頁,共四十五頁,編輯于2023年,星期三回歸系數(shù)的假設(shè)檢驗(yàn)?zāi)康模簝勺兞块g的直線關(guān)系是否存在。方法:(1)方差分析:第十五頁,共四十五頁,編輯于2023年,星期三(2)t檢驗(yàn):回歸系數(shù)的假設(shè)檢驗(yàn)第十六頁,共四十五頁,編輯于2023年,星期三直線回歸方程的應(yīng)用(1)描述兩變量間的依存關(guān)系(2)利用回歸方程進(jìn)行預(yù)測(forecast)

預(yù)測即是把預(yù)報(bào)因子(自變量X)代入回歸方程對預(yù)報(bào)量(應(yīng)變量Y)進(jìn)行估計(jì)。第十七頁,共四十五頁,編輯于2023年,星期三(3)統(tǒng)計(jì)控制(control)

統(tǒng)計(jì)控制是利用回歸方程進(jìn)行逆估計(jì),要求應(yīng)變量Y在一定范圍內(nèi)波動,可通過控制X的取值實(shí)現(xiàn)。直線回歸方程的應(yīng)用第十八頁,共四十五頁,編輯于2023年,星期三直線回歸與相關(guān)的關(guān)系1.區(qū)別:(1)資料要求:直線回歸要求y服從正態(tài)分布;直線相關(guān)要求x,y服從雙變量正態(tài)分布。(2)應(yīng)用:說明兩變量間依存關(guān)系變化的數(shù)量關(guān)系用回歸;說明兩變量間的相關(guān)關(guān)系用相關(guān)。第十九頁,共四十五頁,編輯于2023年,星期三直線回歸與相關(guān)的關(guān)系2.聯(lián)系:(1)同一組數(shù)據(jù)若同時計(jì)算r與b,正負(fù)號一致;(2)r和b的假設(shè)檢驗(yàn)是等價(jià)的;(3)用回歸解釋相關(guān)。決定系數(shù)(coefficientofdetermination)第二十頁,共四十五頁,編輯于2023年,星期三作回歸分析要有實(shí)際意義。直線回歸方程的適用范圍:內(nèi)插(interpolation)外延(extrapolation)應(yīng)用回歸分析的注意事項(xiàng)第二十一頁,共四十五頁,編輯于2023年,星期三多重線性回歸與相關(guān)MultipleLinearRegressionandCorrelation第二十二頁,共四十五頁,編輯于2023年,星期三多重線性回歸的概念多重線性回歸是簡單線性回歸的推廣。它研究一個應(yīng)變量與多個自變量之間的線性依存關(guān)系。如:一個人的血壓水平受年齡、飲食結(jié)構(gòu)、遺傳特性等許多因素的影響。第二十三頁,共四十五頁,編輯于2023年,星期三多重線性回歸方程b1,b2,…,bk稱偏回歸系數(shù)(Partialregressioncoefficient),b0為截距(intercept)。第二十四頁,共四十五頁,編輯于2023年,星期三偏回歸系數(shù)(Partialregressioncoefficient):

bk是自變量xk的偏回歸系數(shù),表示當(dāng)方程中其它自變量保持不變時,自變量xk每變化一個單位,應(yīng)變量y平均變化bk個單位。偏回歸系數(shù)第二十五頁,共四十五頁,編輯于2023年,星期三標(biāo)準(zhǔn)化偏回歸系數(shù)(standardizedpartialregressioncoefficient)表示自變量對應(yīng)變量的貢獻(xiàn)大小的指標(biāo),標(biāo)準(zhǔn)化偏回歸系數(shù)越大,表示自變量對應(yīng)變量的貢獻(xiàn)越大。標(biāo)準(zhǔn)化偏回歸系數(shù)第二十六頁,共四十五頁,編輯于2023年,星期三多重回歸分析的前提條件(assumptionsofmultiplelinearregression):線性(Linearity)獨(dú)立性(Independence)正態(tài)性(Normality)等方差(Equalvariance)多重線性回歸的前提條件第二十七頁,共四十五頁,編輯于2023年,星期三殘差分析第二十八頁,共四十五頁,編輯于2023年,星期三多重線性回歸的假設(shè)檢驗(yàn)(1)多重線性回歸方程的假設(shè)檢驗(yàn):檢驗(yàn)應(yīng)變量y與k個自變量之間是否存在線性回歸關(guān)系,用方差分析。第二十九頁,共四十五頁,編輯于2023年,星期三(2)偏回歸系數(shù)的假設(shè)檢驗(yàn):為檢驗(yàn)每個自變量是否對y都有線性回歸關(guān)系,需分別對每個自變量進(jìn)行假設(shè)檢驗(yàn),以免把作用不顯著的自變量引入方程中。

t檢驗(yàn):計(jì)算一個包含k個自變量的多重線性回歸方程,再用t檢驗(yàn)法對各偏回歸系數(shù)進(jìn)行假設(shè)檢驗(yàn)。多重線性回歸的假設(shè)檢驗(yàn)第三十頁,共四十五頁,編輯于2023年,星期三復(fù)相關(guān)系數(shù)(multiplelinearcorrelationcoefficient)R:表示一個變量和一組變量間的線性相關(guān)程度的指標(biāo)。R的取值范圍:0~1R越大,表示線性關(guān)系越密切。多重線性相關(guān)第三十一頁,共四十五頁,編輯于2023年,星期三R2為決定系數(shù)(coefficientofdetermination)表示應(yīng)變量的變異中可用自變量解釋的部分。表示線性回歸方程的效果。調(diào)整的R2

(adjustedR-square):調(diào)整因自變量個數(shù)的增加導(dǎo)致的復(fù)相關(guān)系數(shù)的增大。決定系數(shù)第三十二頁,共四十五頁,編輯于2023年,星期三偏相關(guān)系數(shù)(partialcorrelationcoefficient):當(dāng)固定其它自變量后,每個自變量與應(yīng)變量之間的相關(guān)程度。取值范圍:-1~1假設(shè)檢驗(yàn):t檢驗(yàn)偏相關(guān)系數(shù)第三十三頁,共四十五頁,編輯于2023年,星期三自變量篩選在建立的多重回歸模型中,有的自變量有統(tǒng)計(jì)學(xué)意義,有的沒有。建立一個僅包含對應(yīng)變量作用有統(tǒng)計(jì)學(xué)意義的自變量,不包括無統(tǒng)計(jì)學(xué)意義的自變量的模型。多重共線性(Multi-co-linearity):自變量之間存在相似的線性關(guān)系。第三十四頁,共四十五頁,編輯于2023年,星期三篩選準(zhǔn)則:殘差平方和(SSE)縮小決定系數(shù)(R2

)增大調(diào)整決定系數(shù)(RA2

)增大篩選方法:專業(yè)篩選統(tǒng)計(jì)篩選自變量篩選第三十五頁,共四十五頁,編輯于2023年,星期三最優(yōu)子集法(thebestsubset):自變量所有可能的組合與因變量進(jìn)行回歸,選擇殘差最小的模型。強(qiáng)制法(enter):即所有自變量均進(jìn)入方程。向前法(forward):從僅有截距的方程開始,把變量逐個引入方程。自變量篩選的方法第三十六頁,共四十五頁,編輯于2023年,星期三向后法(backward):從包括所有自變量的回歸方程中逐個剔除無統(tǒng)計(jì)學(xué)意義的變量。逐步法(stepwise):在把自變量逐個引入方程的同時,剔除已在方程中的無統(tǒng)計(jì)意義的變量。自變量篩選的方法第三十七頁,共四十五頁,編輯于2023年,星期三多重線性回歸分析的應(yīng)用估計(jì)和預(yù)測制訂分層的參考值范圍輔助診斷和判別預(yù)測預(yù)報(bào)統(tǒng)計(jì)控制第三十八頁,共四十五頁,編輯于2023年,星期三應(yīng)用多重回歸與相關(guān)

的注意事項(xiàng)應(yīng)用簡單回歸與相關(guān)的注意事項(xiàng)。采用不同的方法篩選自變量得到的結(jié)果不一定完全相同。利用回歸方程進(jìn)行預(yù)測和控制時,應(yīng)用范圍不宜超出各自變量的原始實(shí)測值范圍。第三十九頁,共四十五頁,編輯于2023年,星期三利用多重回歸分析研究各自變量對因變量的直接效應(yīng)和間接效應(yīng)--通徑分析(pathanalysis)。自變量間有交互作用時,應(yīng)建立含交互作用項(xiàng)的回歸模型。應(yīng)用多重回歸與相關(guān)

的注意事項(xiàng)第四十頁,共四十五頁,編輯于2023年,星期三多重回歸與多重相關(guān)的區(qū)別和聯(lián)系多重回歸分析是分析因變量受哪些自變量的影響以及影響程度如何。要求因變量服從正態(tài)分布,自變量可以是等級資料和計(jì)數(shù)資料。多重相關(guān)是分析一個變量與一組變量的線性組合之間的相關(guān)性,各變量是平等的,沒有自變量與因變量之別,可用任何一個變量與其他變量的線性組合進(jìn)行復(fù)相關(guān)計(jì)算。要求一個變量與其他變量的線性組合都服從正態(tài)分布。應(yīng)用多重回歸與相關(guān)

的注意事項(xiàng)第四十一頁,共四十五頁,編輯于2023年,星期三多重回歸與多重相關(guān)的區(qū)別和聯(lián)系多重回歸分析的內(nèi)容比多重相關(guān)豐富。多重相關(guān)中的復(fù)相關(guān)系數(shù)以及偏相關(guān)系數(shù)通常采用多重回歸的方法來計(jì)算。其余的相關(guān)與回歸的區(qū)別和聯(lián)系。應(yīng)用多重回歸與相關(guān)

的注意事項(xiàng)第四十二頁,共四十五頁,編輯于2023年,星期三沒有進(jìn)入方程的變

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論