《回歸與相關(guān)》課件_第1頁
《回歸與相關(guān)》課件_第2頁
《回歸與相關(guān)》課件_第3頁
《回歸與相關(guān)》課件_第4頁
《回歸與相關(guān)》課件_第5頁
已閱讀5頁,還剩95頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

直線回歸與相關(guān)linearregressionandcorrelation《回歸與相關(guān)》課件1回歸分析與相關(guān)分析雙變量間關(guān)系:年齡~身高、肺活量~體重、藥物劑量與動(dòng)物死亡率等。

依存關(guān)系:應(yīng)變量(dependentvariable)Y隨自變量(independentvariable)X變化而變化?!?/p>

回歸分析

互依關(guān)系:應(yīng)變量Y與自變量X間的彼此關(guān)系

———

相關(guān)分析回歸分析與相關(guān)分析雙變量間關(guān)系:年齡~身高、肺活量~體重、藥2雙變量計(jì)量資料:每個(gè)個(gè)體有兩個(gè)變量值

總體:無限或有限對變量值樣本:從總體隨機(jī)抽取的n對變量值

(X1,Y1),(X2,Y2),…,(Xn,Yn)

目的:研究X和Y的數(shù)量關(guān)系

方法:回歸與相關(guān)簡單、基本——直線回歸、直線相關(guān)雙變量計(jì)量資料:每個(gè)個(gè)體有兩個(gè)變量值3“一因一果”,即一個(gè)自變量與一個(gè)依變量一元回歸分析; 研究“多因一果”,即多個(gè)自變量與一個(gè)依變量的回歸分析稱為多元回歸分析。 一元回歸分析又分為直線回歸分析與曲線回歸分析兩種; 多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種?!耙灰蛞还保匆粋€(gè)自變量與一個(gè)依變量一元回歸分析;4第一節(jié)直線回歸(linearregression線性回歸)1.直線回歸的概念:

直線回歸是分析兩變量間線性依存變化的數(shù)量關(guān)系?!盎貧w”的由來

英國統(tǒng)計(jì)學(xué)家F·Galton和他的學(xué)生、現(xiàn)代統(tǒng)計(jì)學(xué)的奠基者之一K·Pearson在研究父母身高與其子女身高的遺傳問題時(shí),觀察了1078對夫婦,以每對夫婦中父親的身高作為自變量X,而取他們的一個(gè)成年兒子的身高作為應(yīng)變量Y,將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)趨勢近乎一條直線。計(jì)算出的回歸直線方程為:《回歸與相關(guān)》課件5《回歸與相關(guān)》課件6兒子身高(Y,英寸)與父親身高(X,英寸)存在線性關(guān)系:。也即高個(gè)子父代的子代在成年之后的身高平均來說不是更高,而是稍矮于其父代水平,而矮個(gè)子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之“回歸”。兒子身高(Y,英寸)與父親身高(X,英寸)存在線性關(guān)系:7目前,“回歸”已成為表示變量之間某種數(shù)量依存關(guān)系的統(tǒng)計(jì)學(xué)術(shù)語,并且衍生出“回歸方程”“回歸系數(shù)”等統(tǒng)計(jì)學(xué)概念。如研究糖尿病人血糖與其胰島素水平的關(guān)系,研究兒童年齡與體重的關(guān)系等。目前,“回歸”已成為表示變量之間某種數(shù)量依存關(guān)系的統(tǒng)計(jì)學(xué)術(shù)語83.函數(shù)關(guān)系與回歸關(guān)系函數(shù)關(guān)系:確定。例如園周長與半徑:y=2πr回歸關(guān)系:不確定。例如血壓和年齡的關(guān)系,直線回歸的任務(wù)就是找出一條最能描述變量間非確定性數(shù)量關(guān)系的一條直線,此直線為回歸直線,相應(yīng)的直線方程稱為直線回歸方程(linearregressionequation)。

3.函數(shù)關(guān)系與回歸關(guān)系9對資料的要求:自變量x:正態(tài)總體中的隨機(jī)變量或指定變量因變量y:服從正態(tài)分布的隨機(jī)變量

體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖對資料的要求:自變量x:正態(tài)總體中的隨機(jī)變量或指定變量10《回歸與相關(guān)》課件11a為回歸直線在y軸上的截距0yxa>0a=0a<0aa為回歸直線在y軸上的截距0yxa>0a=0a120yxb>0b=0b<0

b為回歸系數(shù),即回歸直線的斜率;其統(tǒng)計(jì)學(xué)意義是x增加(減)一個(gè)單位,y平均變動(dòng)b個(gè)單位

b=0

0yxb>0b=0b<0 b為回歸系數(shù),即回13a:截距(intercept),直線與Y軸交點(diǎn)的縱坐標(biāo)(X=0)。b:斜率(slope),回歸系數(shù)(regressioncoefficient)。意義:X每改變一個(gè)單位,Y平均改變b個(gè)單位。

b>0,Y隨X的增大而增大(減少而減少)——斜上;

b<0,Y隨X的增大而減?。p少而增加)——斜下;

b=0,Y與X無直線關(guān)系——

水平。

|b|越大,表示Y隨X變化越快,直線越陡峭。a:截距(intercept),直線與Y軸交點(diǎn)的縱坐標(biāo)(X=145.直線回歸方程參數(shù)的計(jì)算y=a+bx

^

最小二乘法原則(leastsquaremethod):使各實(shí)際散點(diǎn)(Y)到直線()的縱向距離的平方和最小。即使(殘差或剩余值)最小。Yi(Y的估計(jì)值)

=a+bXi

Yi估計(jì)值i殘差i=Yi–估計(jì)值i5.直線回歸方程參數(shù)的計(jì)算y=a+bx15殘差(residual)或剩余值,即實(shí)測值Y與假定回歸線上的估計(jì)值的縱向距離。求解a、b實(shí)際上就是“合理地”找到一條能最好地代表數(shù)據(jù)點(diǎn)分布趨勢的直線。因?yàn)橹本€一定經(jīng)過“均數(shù)”點(diǎn)殘差(residual)或剩余值,即實(shí)測值Y與假定回歸線上的16例:用某飼料喂養(yǎng)12只大白鼠,得出大白鼠的進(jìn)食量與體重增加量結(jié)果,試作直線回歸分析。

(1).由原始數(shù)據(jù)作散點(diǎn)圖,觀察兩變量間的趨勢例:用某飼料喂養(yǎng)12只大白鼠,得出大白鼠的進(jìn)食量與體重增加量1712只大白鼠的進(jìn)食量(g)與體重增加量(g)測量結(jié)果12只大白鼠的進(jìn)食量(g)與體重增加量(g)測量結(jié)果18(2).計(jì)算X、Y的均數(shù)X、Y,離均差平方和lXX、lYY與離均差積和lXYab(3).(4).Y

=2+0.0648X

(5).按求得的直線回歸方程,在X實(shí)際范圍內(nèi)任意取兩點(diǎn)(X1,Y1),(X2,Y2),相連即得回歸直線。Y

=Y+b(x-x)

(2).計(jì)算X、Y的均數(shù)X、Y,離均差平方和lXX、lYY與196.回歸系數(shù)的假設(shè)檢驗(yàn)建立樣本直線回歸方程,只是完成了統(tǒng)計(jì)分析兩變量關(guān)系的統(tǒng)計(jì)描述,研究者還須回答它所來自的總體的直線回歸關(guān)系是否確實(shí)存在,即是否對總體有?6.回歸系數(shù)的假設(shè)檢驗(yàn)20XX21《回歸與相關(guān)》課件22《回歸與相關(guān)》課件23目的:推斷總體回歸系數(shù)是否為0,確定所求得的回歸方程是否成立。目的:推斷總體回歸系數(shù)是否為0,24|b-0|bt=————=——,=n-2SbSbSyxSb=————————,____________(x-x)2_Sb為樣本回歸系數(shù)標(biāo)準(zhǔn)誤Syx為剩余標(biāo)準(zhǔn)差方差分析法t檢驗(yàn)法|b-0|b25r-0rtr=———=——————,Sr

1-r2———n-2________=n-2

(y-y)2Syx=—————n-2?=lyy-bl

xy

(y-?)2=(y-y)2-[

(x–x)(y–y)]2(x–x)2同一組資料作直線相關(guān)與回歸時(shí)tb與tr等值tb=r-026回歸系數(shù)的標(biāo)準(zhǔn)誤b為總體回歸系數(shù)的估計(jì)值,其誤差為Sb的95%的可信區(qū)間為SyxSb=————————,____________(x-x)2_回歸系數(shù)的標(biāo)準(zhǔn)誤27決定系數(shù):回歸平方和與總平方和之比,大小反映了回歸貢獻(xiàn)的相對程度,也就是在Y的總變異中回歸關(guān)系所能解釋的百分比。決定系數(shù):回歸平方和與總平方和之比,大小反映了回歸貢獻(xiàn)的相對281.總體回歸線的95%置信帶即μ的可信區(qū)間-第二節(jié)直線回歸的應(yīng)用-第二節(jié)直線回歸的應(yīng)用29標(biāo)準(zhǔn)估計(jì)誤差各實(shí)際值Y與估計(jì)值有一定的誤差,稱為估計(jì)誤差,即各實(shí)際點(diǎn)與回歸線縱軸方向的離散程度,即標(biāo)準(zhǔn)估計(jì)誤差

標(biāo)準(zhǔn)估計(jì)誤差302.個(gè)體Yi值的范圍預(yù)測iiiiiiiii2.個(gè)體Yi值的范圍預(yù)測iiiiiiiii3195%μ的可信區(qū)間與個(gè)體Yi的預(yù)測范圍有關(guān)數(shù)據(jù)編號(hào)XYY_hat均數(shù)標(biāo)準(zhǔn)誤個(gè)值標(biāo)準(zhǔn)誤均數(shù)下限均數(shù)上限個(gè)值下限個(gè)值上限1133.543.4710.12710.23443.16023.78242.89774.04492113.013.1930.08320.21382.98923.39662.66973.7161393.092.9150.07130.20952.74013.08892.40203.4270462.482.4970.12710.23442.18582.80801.92333.0705582.562.7750.08320.21382.57162.97902.25213.29856103.363.0540.07130.20952.87933.22812.54123.56627123.183.3320.10310.22233.07993.58432.78823.8760872.652.6360.10310.22232.38392.88832.09223.180095%μ的可信區(qū)間與個(gè)體Yi的預(yù)測范圍有關(guān)數(shù)據(jù)32《回歸與相關(guān)》課件33直線回歸方程的應(yīng)用描述兩變量的依存數(shù)量關(guān)系;利用回歸方程進(jìn)行預(yù)測:由易測的變量值估算難算的變量值(由x估計(jì)y);X:汽車流量(輛/小時(shí)),y:NOx(mg/M3)y=-1.674+0.0001838x

^利用回歸方程進(jìn)行控制:即利用回歸方程進(jìn)行逆估計(jì)(由y估計(jì)x)。直線回歸方程的應(yīng)用X:汽車流量(輛/小時(shí)),y34第三節(jié)直線相關(guān)

(linearcorrelation)

簡單相關(guān)(simplecorrelation),用于雙變量正態(tài)分布資料。進(jìn)行直線相關(guān)分析的基本任務(wù)在于根據(jù)x、y的實(shí)際觀測值計(jì)算表示兩個(gè)相關(guān)變量x與y線性相關(guān)程度和性質(zhì)的統(tǒng)計(jì)指標(biāo)—相關(guān)系數(shù)r,并進(jìn)行顯著性檢驗(yàn)。第三節(jié)直線相關(guān)(linearcorrelati35

1.直線相關(guān)的概念

直線相關(guān)是研究兩變量x、y之間協(xié)同變化的線性關(guān)系

的分析方法。體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖1.直線相關(guān)的概念362.對資料的要求

x、y都是正態(tài)分布資料的隨機(jī)變量。3.相關(guān)系數(shù)

(correlationcoefficient,r)

表示方法:

-1r

1*意義:描述兩個(gè)變量直線相關(guān)的方向與密切程度的指標(biāo)。2.對資料的要求3.相關(guān)系數(shù)(correlationc37正相關(guān)負(fù)相關(guān)0<r<1-1<r<0相關(guān)系數(shù)示意:r=1r=-1完全正相關(guān)完全負(fù)相關(guān)正相關(guān)38相關(guān)系數(shù)示意r=0r=0r=0零相關(guān)零相關(guān)零相關(guān)相關(guān)系數(shù)示意r=039計(jì)算方法:__(x-x)(y-y)l

xyr=————————————=——————___________________________(x-x)2(y-y)2

l

xx·l

yy__(x)(y)l

xy=(x-x)(y-y)=xy-—————n__(x)2lxx=(x-x)2=x2-————n_(y)2lyy=(y-y)2=y2-————n_計(jì)算方法:__(x-4010名女中學(xué)生的體重(x)與肺活量(y)的直線相關(guān)計(jì)算編號(hào)XYX2Y2XY

(1)(2)(3)(4)(5)(6)1351.6012252.560056.002371.6013692.560059.203372.4013695.760088.804402.1016004.410084.005402.6016006.7600104.006422.5017646.2500105.007422.6517647.0225111.308432.7518497.5625118.259442.7519367.5625121.00452.2020254.840099.00∑40523.151650155.2875946.5510名女中學(xué)生的體重(x)與肺活量(y)的直線相關(guān)計(jì)算41___________________________(x-x)2(y-y)2

l

xx·l

yy計(jì)算:__(x-x)(y-y)l

xyr=————————————=——————__(x)(y)l

xy=(x-x)(y-y)=xy-—————n__=8.975(x)2lxx=(x-x)2=x2-————n_=98.5

(y)2lyy=(y-y)2=y2-————n_=1.69525r=8.975√98.51.69525=0.6945___________________424.相關(guān)系數(shù)的假設(shè)檢驗(yàn)?zāi)康模簷z驗(yàn)r

是否來自總體相關(guān)系數(shù)=0的 總體,推斷兩變量的相關(guān)關(guān)系是否成立。r-0rt=———=——————,Sr

1-r2———n-2________=n-2Sr為相關(guān)系數(shù)的標(biāo)準(zhǔn)誤公式:4.相關(guān)系數(shù)的假設(shè)檢驗(yàn)r-043

檢驗(yàn)假設(shè):H0:=0,H1:0,=0.05r-0rt=———=——————,Sr

1-r2———n-2________=n-2t=0.6945(1-0.69452)/(10-2)√=2.730=n–2=10–2=8P<0.05結(jié)論:可認(rèn)為該地女中學(xué)生的體重與肺活量有正相關(guān)關(guān)系檢驗(yàn)假設(shè):H0:=0,H1:0,44

區(qū)別:

1)意義 直線回歸反映兩變量的依存關(guān)系; 直線相關(guān)反映兩變量的相互關(guān)系。5、直線回歸與直線相關(guān)的聯(lián)系與區(qū)別2)對資料的要求 直線回歸:自變量是正態(tài)總體的隨機(jī)變量 或指定變量,y一定是正態(tài)總體的隨機(jī)變量; 直線相關(guān):兩變量均為正態(tài)總體的隨機(jī)變量。區(qū)別:5、直線回歸與直線相關(guān)的聯(lián)系與區(qū)別45

聯(lián)系:

1)同一組資料的r

與b的正負(fù)符號(hào)是一致 的; 2)同一組資料的r

和b的假設(shè)檢驗(yàn)結(jié)果是 一致的,即tr=tb。3)兩變量間有相關(guān)關(guān)系,不一定有因果關(guān) 系;但兩變量間有因果關(guān)系,一定有相關(guān) 關(guān)系?!痘貧w與相關(guān)》課件46

四、應(yīng)用注意事項(xiàng)

1.進(jìn)行相關(guān)與回歸時(shí)先繪制散點(diǎn)圖,還 要觀察有無異常點(diǎn)。2.回歸與相關(guān)的應(yīng)用僅限于原實(shí)測數(shù)據(jù) 的范圍內(nèi)使用。四、應(yīng)用注意事項(xiàng)47第四節(jié)

Spearman

秩相關(guān)

適用資料:⑴不服從雙變量正態(tài)分布⑵總體分布類型未知⑶原始數(shù)據(jù)用等級(jí)表示

等級(jí)相關(guān)系數(shù)rs(即SpearmanCorrelationCoefficient)——反映兩變量間相關(guān)的密切程度與方向。第四節(jié)

Spearman秩相關(guān)

適用資料:⑴不48《回歸與相關(guān)》課件49注意:相同秩次較多時(shí)應(yīng)校正rs。Tx(或TY)=Σ(t3-t)/12注意:相同秩次較多時(shí)應(yīng)校正rs。Tx(或TY)=Σ50

直線回歸與相關(guān)linearregressionandcorrelation《回歸與相關(guān)》課件51回歸分析與相關(guān)分析雙變量間關(guān)系:年齡~身高、肺活量~體重、藥物劑量與動(dòng)物死亡率等。

依存關(guān)系:應(yīng)變量(dependentvariable)Y隨自變量(independentvariable)X變化而變化。——

回歸分析

互依關(guān)系:應(yīng)變量Y與自變量X間的彼此關(guān)系

———

相關(guān)分析回歸分析與相關(guān)分析雙變量間關(guān)系:年齡~身高、肺活量~體重、藥52雙變量計(jì)量資料:每個(gè)個(gè)體有兩個(gè)變量值

總體:無限或有限對變量值樣本:從總體隨機(jī)抽取的n對變量值

(X1,Y1),(X2,Y2),…,(Xn,Yn)

目的:研究X和Y的數(shù)量關(guān)系

方法:回歸與相關(guān)簡單、基本——直線回歸、直線相關(guān)雙變量計(jì)量資料:每個(gè)個(gè)體有兩個(gè)變量值53“一因一果”,即一個(gè)自變量與一個(gè)依變量一元回歸分析; 研究“多因一果”,即多個(gè)自變量與一個(gè)依變量的回歸分析稱為多元回歸分析。 一元回歸分析又分為直線回歸分析與曲線回歸分析兩種; 多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種。“一因一果”,即一個(gè)自變量與一個(gè)依變量一元回歸分析;54第一節(jié)直線回歸(linearregression線性回歸)1.直線回歸的概念:

直線回歸是分析兩變量間線性依存變化的數(shù)量關(guān)系?!盎貧w”的由來

英國統(tǒng)計(jì)學(xué)家F·Galton和他的學(xué)生、現(xiàn)代統(tǒng)計(jì)學(xué)的奠基者之一K·Pearson在研究父母身高與其子女身高的遺傳問題時(shí),觀察了1078對夫婦,以每對夫婦中父親的身高作為自變量X,而取他們的一個(gè)成年兒子的身高作為應(yīng)變量Y,將結(jié)果在平面直角坐標(biāo)系上繪成散點(diǎn)圖,發(fā)現(xiàn)趨勢近乎一條直線。計(jì)算出的回歸直線方程為:《回歸與相關(guān)》課件55《回歸與相關(guān)》課件56兒子身高(Y,英寸)與父親身高(X,英寸)存在線性關(guān)系:。也即高個(gè)子父代的子代在成年之后的身高平均來說不是更高,而是稍矮于其父代水平,而矮個(gè)子父代的子代的平均身高不是更矮,而是稍高于其父代水平。Galton將這種趨向于種族穩(wěn)定的現(xiàn)象稱之“回歸”。兒子身高(Y,英寸)與父親身高(X,英寸)存在線性關(guān)系:57目前,“回歸”已成為表示變量之間某種數(shù)量依存關(guān)系的統(tǒng)計(jì)學(xué)術(shù)語,并且衍生出“回歸方程”“回歸系數(shù)”等統(tǒng)計(jì)學(xué)概念。如研究糖尿病人血糖與其胰島素水平的關(guān)系,研究兒童年齡與體重的關(guān)系等。目前,“回歸”已成為表示變量之間某種數(shù)量依存關(guān)系的統(tǒng)計(jì)學(xué)術(shù)語583.函數(shù)關(guān)系與回歸關(guān)系函數(shù)關(guān)系:確定。例如園周長與半徑:y=2πr回歸關(guān)系:不確定。例如血壓和年齡的關(guān)系,直線回歸的任務(wù)就是找出一條最能描述變量間非確定性數(shù)量關(guān)系的一條直線,此直線為回歸直線,相應(yīng)的直線方程稱為直線回歸方程(linearregressionequation)。

3.函數(shù)關(guān)系與回歸關(guān)系59對資料的要求:自變量x:正態(tài)總體中的隨機(jī)變量或指定變量因變量y:服從正態(tài)分布的隨機(jī)變量

體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖對資料的要求:自變量x:正態(tài)總體中的隨機(jī)變量或指定變量60《回歸與相關(guān)》課件61a為回歸直線在y軸上的截距0yxa>0a=0a<0aa為回歸直線在y軸上的截距0yxa>0a=0a620yxb>0b=0b<0

b為回歸系數(shù),即回歸直線的斜率;其統(tǒng)計(jì)學(xué)意義是x增加(減)一個(gè)單位,y平均變動(dòng)b個(gè)單位

b=0

0yxb>0b=0b<0 b為回歸系數(shù),即回63a:截距(intercept),直線與Y軸交點(diǎn)的縱坐標(biāo)(X=0)。b:斜率(slope),回歸系數(shù)(regressioncoefficient)。意義:X每改變一個(gè)單位,Y平均改變b個(gè)單位。

b>0,Y隨X的增大而增大(減少而減少)——斜上;

b<0,Y隨X的增大而減小(減少而增加)——斜下;

b=0,Y與X無直線關(guān)系——

水平。

|b|越大,表示Y隨X變化越快,直線越陡峭。a:截距(intercept),直線與Y軸交點(diǎn)的縱坐標(biāo)(X=645.直線回歸方程參數(shù)的計(jì)算y=a+bx

^

最小二乘法原則(leastsquaremethod):使各實(shí)際散點(diǎn)(Y)到直線()的縱向距離的平方和最小。即使(殘差或剩余值)最小。Yi(Y的估計(jì)值)

=a+bXi

Yi估計(jì)值i殘差i=Yi–估計(jì)值i5.直線回歸方程參數(shù)的計(jì)算y=a+bx65殘差(residual)或剩余值,即實(shí)測值Y與假定回歸線上的估計(jì)值的縱向距離。求解a、b實(shí)際上就是“合理地”找到一條能最好地代表數(shù)據(jù)點(diǎn)分布趨勢的直線。因?yàn)橹本€一定經(jīng)過“均數(shù)”點(diǎn)殘差(residual)或剩余值,即實(shí)測值Y與假定回歸線上的66例:用某飼料喂養(yǎng)12只大白鼠,得出大白鼠的進(jìn)食量與體重增加量結(jié)果,試作直線回歸分析。

(1).由原始數(shù)據(jù)作散點(diǎn)圖,觀察兩變量間的趨勢例:用某飼料喂養(yǎng)12只大白鼠,得出大白鼠的進(jìn)食量與體重增加量6712只大白鼠的進(jìn)食量(g)與體重增加量(g)測量結(jié)果12只大白鼠的進(jìn)食量(g)與體重增加量(g)測量結(jié)果68(2).計(jì)算X、Y的均數(shù)X、Y,離均差平方和lXX、lYY與離均差積和lXYab(3).(4).Y

=2+0.0648X

(5).按求得的直線回歸方程,在X實(shí)際范圍內(nèi)任意取兩點(diǎn)(X1,Y1),(X2,Y2),相連即得回歸直線。Y

=Y+b(x-x)

(2).計(jì)算X、Y的均數(shù)X、Y,離均差平方和lXX、lYY與696.回歸系數(shù)的假設(shè)檢驗(yàn)建立樣本直線回歸方程,只是完成了統(tǒng)計(jì)分析兩變量關(guān)系的統(tǒng)計(jì)描述,研究者還須回答它所來自的總體的直線回歸關(guān)系是否確實(shí)存在,即是否對總體有?6.回歸系數(shù)的假設(shè)檢驗(yàn)70XX71《回歸與相關(guān)》課件72《回歸與相關(guān)》課件73目的:推斷總體回歸系數(shù)是否為0,確定所求得的回歸方程是否成立。目的:推斷總體回歸系數(shù)是否為0,74|b-0|bt=————=——,=n-2SbSbSyxSb=————————,____________(x-x)2_Sb為樣本回歸系數(shù)標(biāo)準(zhǔn)誤Syx為剩余標(biāo)準(zhǔn)差方差分析法t檢驗(yàn)法|b-0|b75r-0rtr=———=——————,Sr

1-r2———n-2________=n-2

(y-y)2Syx=—————n-2?=lyy-bl

xy

(y-?)2=(y-y)2-[

(x–x)(y–y)]2(x–x)2同一組資料作直線相關(guān)與回歸時(shí)tb與tr等值tb=r-076回歸系數(shù)的標(biāo)準(zhǔn)誤b為總體回歸系數(shù)的估計(jì)值,其誤差為Sb的95%的可信區(qū)間為SyxSb=————————,____________(x-x)2_回歸系數(shù)的標(biāo)準(zhǔn)誤77決定系數(shù):回歸平方和與總平方和之比,大小反映了回歸貢獻(xiàn)的相對程度,也就是在Y的總變異中回歸關(guān)系所能解釋的百分比。決定系數(shù):回歸平方和與總平方和之比,大小反映了回歸貢獻(xiàn)的相對781.總體回歸線的95%置信帶即μ的可信區(qū)間-第二節(jié)直線回歸的應(yīng)用-第二節(jié)直線回歸的應(yīng)用79標(biāo)準(zhǔn)估計(jì)誤差各實(shí)際值Y與估計(jì)值有一定的誤差,稱為估計(jì)誤差,即各實(shí)際點(diǎn)與回歸線縱軸方向的離散程度,即標(biāo)準(zhǔn)估計(jì)誤差

標(biāo)準(zhǔn)估計(jì)誤差802.個(gè)體Yi值的范圍預(yù)測iiiiiiiii2.個(gè)體Yi值的范圍預(yù)測iiiiiiiii8195%μ的可信區(qū)間與個(gè)體Yi的預(yù)測范圍有關(guān)數(shù)據(jù)編號(hào)XYY_hat均數(shù)標(biāo)準(zhǔn)誤個(gè)值標(biāo)準(zhǔn)誤均數(shù)下限均數(shù)上限個(gè)值下限個(gè)值上限1133.543.4710.12710.23443.16023.78242.89774.04492113.013.1930.08320.21382.98923.39662.66973.7161393.092.9150.07130.20952.74013.08892.40203.4270462.482.4970.12710.23442.18582.80801.92333.0705582.562.7750.08320.21382.57162.97902.25213.29856103.363.0540.07130.20952.87933.22812.54123.56627123.183.3320.10310.22233.07993.58432.78823.8760872.652.6360.10310.22232.38392.88832.09223.180095%μ的可信區(qū)間與個(gè)體Yi的預(yù)測范圍有關(guān)數(shù)據(jù)82《回歸與相關(guān)》課件83直線回歸方程的應(yīng)用描述兩變量的依存數(shù)量關(guān)系;利用回歸方程進(jìn)行預(yù)測:由易測的變量值估算難算的變量值(由x估計(jì)y);X:汽車流量(輛/小時(shí)),y:NOx(mg/M3)y=-1.674+0.0001838x

^利用回歸方程進(jìn)行控制:即利用回歸方程進(jìn)行逆估計(jì)(由y估計(jì)x)。直線回歸方程的應(yīng)用X:汽車流量(輛/小時(shí)),y84第三節(jié)直線相關(guān)

(linearcorrelation)

簡單相關(guān)(simplecorrelation),用于雙變量正態(tài)分布資料。進(jìn)行直線相關(guān)分析的基本任務(wù)在于根據(jù)x、y的實(shí)際觀測值計(jì)算表示兩個(gè)相關(guān)變量x與y線性相關(guān)程度和性質(zhì)的統(tǒng)計(jì)指標(biāo)—相關(guān)系數(shù)r,并進(jìn)行顯著性檢驗(yàn)。第三節(jié)直線相關(guān)(linearcorrelati85

1.直線相關(guān)的概念

直線相關(guān)是研究兩變量x、y之間協(xié)同變化的線性關(guān)系

的分析方法。體重(kg),x肺活量(),YL十名女中學(xué)生體重與肺活量散點(diǎn)圖1.直線相關(guān)的概念862.對資料的要求

x、y都是正態(tài)分布資料的隨機(jī)變量。3.相關(guān)系數(shù)

(correlationcoefficient,r)

表示方法:

-1r

1*意義:描述兩個(gè)變量直線相關(guān)的方向與密切程度的指標(biāo)。2.對資料的要求3.相關(guān)系數(shù)(correlationc87正相關(guān)負(fù)相關(guān)0<r<1-1<r<0相關(guān)系數(shù)示意:r=1r=-1完全正相關(guān)完全負(fù)相關(guān)正相關(guān)88相關(guān)系數(shù)示意r=0r=0r=0零相關(guān)零相關(guān)零相關(guān)相關(guān)系數(shù)示意r=089計(jì)算方法:__(x-x)(y-y)l

xyr=————————————=——————___________________________(x-x)2(y-y)2

l

xx·l

yy__(x)(y)l

xy=(x-x)(y-y)=xy-—————n__(x)2lxx=(x-x)2=x2-————n_(y)2lyy=(y-y)2=y2-————n_計(jì)算方法:__(x-9010名女中學(xué)生的體重(x)與肺活量(y)的直線相關(guān)計(jì)算編號(hào)XYX2Y2XY

(1)(2)(3)(4)(5)(6)1351.6012252.560056.002371.6013692.560059.203372.4013695.760088.804402.1016004.410084.005402.6016006.7600104.006422.5017646.2500105.007422.6517647.0225111.308432.7518497.5625118.259442.7519367.5625121.00452.2020254.840099.00∑40523.151650155.2875946.5510名女中學(xué)生的體重(x)與肺活量(y)的直線相關(guān)計(jì)算91___________________________(x-x)2(y-y)2

l

xx·l

yy計(jì)算:__(x-x)(y-y)l

xyr=————————————=——————__(x)(y)l

xy=(x-x)(y-y)=xy-—————

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論