第八章直線相關(guān)與回歸分析_第1頁
第八章直線相關(guān)與回歸分析_第2頁
第八章直線相關(guān)與回歸分析_第3頁
第八章直線相關(guān)與回歸分析_第4頁
第八章直線相關(guān)與回歸分析_第5頁
已閱讀5頁,還剩12頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

ii=1第十章一元回歸與相關(guān)分析概述:許多問題需要研究多個(gè)變量之間的關(guān)系,例如生物的生長發(fā)育速度就與溫度,營養(yǎng),濕度等許多因素有關(guān)。相關(guān)關(guān)系:兩變量X,Y均為隨機(jī)變量,任一變量的每一可能值都有另一變量的一個(gè)確定分布與之對應(yīng)?;貧w關(guān)系:X是非隨機(jī)變量(如施肥)或隨機(jī)變量(如穗長),Y是隨機(jī)變量,對X的每一確定值xi都有Y的一個(gè)確定分布與之對應(yīng)。區(qū)別:1?相關(guān)中的兩個(gè)變量地位對稱,互為因果;回歸中X是自變量,Y是因變量。兩種意義不同,分析的數(shù)學(xué)概念與推導(dǎo)過程不同,但如果使用共同標(biāo)準(zhǔn)即使y的殘差平方和最?。ㄗ钚《朔ǎ傻玫较嗤膮?shù)估計(jì)式。因此主要討論X為非隨機(jī)變量(不包含有隨機(jī)誤差)的情況,所得到的參數(shù)估計(jì)式也可用于X為隨機(jī)變量的情況。2?分析目的不同?;貧w分析是建立X與Y之間的數(shù)學(xué)關(guān)系式,用于預(yù)測;而相關(guān)分析研究X與Y兩個(gè)隨機(jī)變量之間的共同變化規(guī)律,例如當(dāng)X增大時(shí)Y如何變化,以及這種共變關(guān)系的強(qiáng)弱。分類:從兩個(gè)變量間相關(guān)(或回歸)的程度分三種:(1)完全相關(guān)。一個(gè)變量的值確定后,另一個(gè)變量的值可通過公式求出(函數(shù)關(guān)系);生物學(xué)研究中不太多見。(2)不相關(guān)。變量之間完全沒有任何關(guān)系。一個(gè)變量的值不能提供另一個(gè)變量的任何信息。(3)統(tǒng)計(jì)相關(guān)(不完全相關(guān))。介于上述兩情況之間。知道一個(gè)變量的值通過某種公式就可以提供另一個(gè)變量的均值的信息。一個(gè)變量的取值不完全決定另一個(gè)變量的取值,但可或多或少地決定它的分布。科研中最常遇到。研究“一因一果”,即一個(gè)自變量與一個(gè)依變量的回歸分析稱為一元回歸分析;

研究“多因一果”,即多個(gè)自變量與一個(gè)依變量的回歸分析稱為多元回歸分析。一元回歸分析又分為直線回歸分析與曲線回歸分析兩種;多元回歸分析又分為多元線性回歸分析與多元非線性回歸分析兩種。對兩個(gè)變量間的直線關(guān)系進(jìn)行相關(guān)分析稱為直線相關(guān)分析;研究一個(gè)變量與多個(gè)變量間的線性相關(guān)稱為復(fù)相關(guān)分析;研究其余變量保持不變的情況下兩個(gè)變量間的線性相關(guān)稱為偏相關(guān)分析。注意:1.相關(guān)與回歸只是一種工具,不是不相干的數(shù)據(jù)拼湊在一起。2?除X、Y等需研究的因素外,其他的要嚴(yán)格控制一致。(身高與胸圍的關(guān)系要控制體重)對子一般在5對以上需限制自變量范圍,結(jié)果不能隨意外延。第一節(jié)一元線性回歸(一)直線回歸方程的建立對于兩個(gè)相關(guān)變量,一個(gè)變量用x表示,另一個(gè)變量用y表示,如果通過試驗(yàn)或調(diào)查獲得兩個(gè)變量的n對觀測值:(xl,yl),(x2,y2),,(xn,yn)

為直觀看出X和y間的變化趨勢,可將每一對觀測值在平面直角坐標(biāo)系描點(diǎn),作出散點(diǎn)圖例11.1對大白鼠從出生第6天起,每三天稱一次體重,直到第18天。數(shù)據(jù)見表11.1。試計(jì)算日齡X與體重Y之間的回歸方程。表11.1大白鼠6-18日齡的體重序號12345日齡X;69121518體重y;1116.5222629散點(diǎn)圖對X、Y之間的關(guān)系有直觀的、整體上的印象,但是否有某種規(guī)律性,是接近一條直線還是一條曲線等,哪一條直線或曲線可以最好地代表X,Y之間的關(guān)系,不能做出判斷。圖11.1大白鼠日齡—體重關(guān)系圖一、一元正態(tài)線性回歸統(tǒng)計(jì)模型:對于每個(gè)Y的觀察值yi來說,由于總是帶有隨機(jī)誤差,觀察值就應(yīng)該是在均值的基礎(chǔ)上再加上一個(gè)隨機(jī)誤差,即:y二a+Bx+£(11.2)iii其中8?NID(0,Q2)。隨機(jī)誤差服從正態(tài)分布。這是一元正態(tài)線性回歸的統(tǒng)計(jì)模型。i二、參數(shù)a和B的估計(jì)模型中的a和B是參數(shù),一般不知道。由于只能得到有限的觀察數(shù)據(jù),無法算出準(zhǔn)確的a與B的值,只能求出估計(jì)值a和b,并得到y(tǒng)的估計(jì)值為:iy=a+bx(11.3)iia和b應(yīng)使殘差e=y-y最小。為了避免使正負(fù)e.互相抵消,定義使殘差平方和iiii£(y-y)2達(dá)到最小的直線為回歸線,即令:iiSS=工(y—a—bx)SS=工(y—a—bx)2,且sSe對a、b的一階偏導(dǎo)數(shù)等于0eiii=1dSSdadSSedb=0=0得:整理后,得工(—2)(y-a-bx)=0ii<i=1丫(—2)x(y—a—bx)=0iiii=1an+Vab》x=藝yiii=1i=1xy11.4)i=1iiii=1i=1解此方程,得:b=》nxyii(》x)b=》nxyii(》x)-(》iy)i》nx2—(》ni=1i=1工(x—x)(y—y)ii=-工(x—x)2ii=1=y—bx這種方法稱為最小二乘法記S=工(x-x)2,稱為X的校正平方和;TOC\o"1-5"\h\zxxii=1S=工(y-y)2,稱為y的總校正平方和;yyii=1S=工(x-x)(y-y),稱為校正交叉乘積和,xyiii=1S則:b=亠(11.7)Sxxa叫樣本回歸截距,是回歸直線與y軸交點(diǎn)的縱坐標(biāo),當(dāng)x=0時(shí),y=a;b叫樣本回歸系數(shù),表示x改變一個(gè)單位,y平均改變的數(shù)量;b的符號反映了x影響y的性質(zhì),b的絕對值大小反映了x影響y的程度;

y叫做回歸估計(jì)值,是當(dāng)X在在其研究范圍內(nèi)取某一個(gè)值時(shí),y值平均數(shù)a+Bx的估計(jì)值回歸方程的基本性質(zhì):1工(y—y)2最小iii=12乙(y—y)=0iii=13.直線通過(x,y)轉(zhuǎn)化后得到回歸方程的另一種形式(中心化形式)y=y—bx+bx=y+b(x—x)在實(shí)際計(jì)算時(shí),可采用以下公式:S乏x2—1x.2,xxini=1S二丈y2—1■y.2,yyini=1S二工xy1x.y.xyiii=1n工x=60,工x2=810,104.5,工y2=2394.25,工x=60,工x2=810,104.5,工y2=2394.25,工xy=1390.5iiii=1i=1表5.1大白鼠6-18日齡的體重序號12345日齡xi69121518體重y.1116.5222629解:把數(shù)據(jù)代入上述公式,得:工y=TOC\o"1-5"\h\ziiii=1i=1i=1S=810—-(60)2=90xx5S=2394.25—-(104.5)2=210.2,yy5S=1390.5—-x60x104.5=136.5,xy5Sb=?=136.5/90=1.5167Sxxa=y—bx=104.5/5—1.5167x12=2.6996即:所求的回歸方程為:y=2.6996+1.5167x帶有統(tǒng)計(jì)功能的計(jì)算器,只需把數(shù)據(jù)依次輸入,然后按一下鍵就可得到上述結(jié)果。根據(jù)直線回歸方程可作回歸直線,并不是所有的散點(diǎn)都恰好落在回歸直線上,說明用y去估計(jì)y是有偏差的。三、直線回歸的偏離度估計(jì)偏差平方和£(y-y)2的大小表示了實(shí)測點(diǎn)與回歸直線偏離的程度,因而偏差iii=1平方和又稱為離回歸平方和。統(tǒng)計(jì)學(xué)已經(jīng)證明:在直線回歸分析中離回歸平方和的自由度為n-2。于是可求得離回歸均方為:工(y-y)2/(n-2)離回歸均方是模型中。2的估計(jì)值。S離回歸均方的平方根叫離回歸標(biāo)準(zhǔn)誤,記為yx,即S=&(y-y)2/(n-2)yxS的大小表示了回歸直線與實(shí)測點(diǎn)偏差的程度,即回歸估測值y與實(shí)際觀測值yyx偏差的程度,于是把離回歸標(biāo)準(zhǔn)誤Syx用來表示回歸方程的偏離度。以后將證明:工(y-y)2=ss-sp2/ssyxyx利用此式先計(jì)算出£(y-y)2,然后再求Syx。四、直線回歸的顯著性檢驗(yàn)x和y變量間即使不存在直線關(guān)系,但由n對觀測值(xi,yi)也可以根據(jù)上面的方法求得一個(gè)回歸方程。顯然,這樣的回歸方程所反應(yīng)的兩個(gè)變量間的直線關(guān)系是不真實(shí)的。需要判斷直線回歸方程的真實(shí)性。先探討依變量y的變異,然后再作出統(tǒng)計(jì)推斷。1、直線回歸的變異來源(y-y)的分解圖1)一元回歸的方差分析(1)無重復(fù)的情況。y的總校正平方和可進(jìn)行如下的分解:(y-y)=(y-y)+(y-y)

丫(y—丫(y—y)2=丫[(y—y)+(y—y)]2iiiii=1=丫(y—y)2+丫(y—y)2+2丫(y—y)(y—刃TOC\o"1-5"\h\ziiiiiii=1i=1i=1???丫(y—y)(y—y)=X(y—a—bx)(a+bx—a—bx)iiiiiii=1i=1=工(y—y+bx—bx)(bx—bx)iiii=1=b[丫(y—刃(x—x)—bX(x—x)2]iiii=1i=1=b(S—b-S)=0xyxx???工(y-y)2=工(y-y)2+工(y-y)2iiii=1i=1=SSe殘差平方和n-2SSR

回歸平方和1工(y-yiii=1i=1=SSe殘差平方和n-2SSR

回歸平方和1工(y-y)2反映了y的總變異程度,稱為y的總平方和,記為SSy;工(y—y)2反映了由于y與x間存在直線關(guān)系所引起的y的變異程度,稱為回歸平方和,記為SSR;乂(y—y)2反映了除y與x存在直線關(guān)系以外的原因,包括隨機(jī)誤差所引起的y的變異程度,稱為離回歸平方和或剩余平方和,記為SSe。把y的總校正平方和分解成了殘差平方和與回歸平方和。MSe可作為總體方差8的估計(jì)量,而MSr可作為回歸效果好壞的評價(jià)。如果MSr僅由隨機(jī)誤差造成的話,說明回歸失敗,X和Y沒有線性關(guān)系;否則它應(yīng)顯著偏大。因此可用統(tǒng)計(jì)量MSSSF=R=RMSSS/(n—2)ee11.10)對H0:卩=0進(jìn)行檢驗(yàn)。若F<Fa(,則接受H。,否則拒絕。簡化公式:SSr丄(y—y)2=Z[b(x—x)]2=b2工(x—x)2=b2SS=bSPSPSP2-SP=

SSxySSxySP2SS=SS—SS=SS—叫eyRySSx對例11.1作方差分析解:由以前計(jì)算結(jié)果:SSy=210.2,df=4;ySSe=3.1704,df=3,df=1SSR=210.2—3.1704=207.03,df=1207.033.1704/3=207.033.1704/3=195.90查表得F0.95(1,3)=10.13,F0.99(1,3)=34.12F>F0.99(1,3),拒絕H°,差異極顯著。即應(yīng)認(rèn)為回歸方程有效。(2)有重復(fù)的情況:設(shè)在每一個(gè)xi取值上對Y作了m次觀察,結(jié)果記為yi1,yi2,yim,則線性統(tǒng)計(jì)模型變?yōu)椋簓=a+Bx+&,i=1,2,…n,j=1,2,…mijiij估計(jì)值仍為:y二a+bxii現(xiàn)在y的總校正平方和可分解為:SS=SS+SS+SSyRLOFpe其中SS稱為失擬平方和,SS為純誤差平方和,表達(dá)式和自由度分別為:LOFpeSS=埜"(y一y..)2,df=mn-1yiji=1j=1SS=m?才(y-y..)2,df=1Ridf=n-df=n-2

df=mn-nSS=m?工(y-y)2,LOFi.ii=1SS=工》(y-y)2,peiji.i=1j=1可試證明上述分解中的三個(gè)交叉項(xiàng)均為0。統(tǒng)計(jì)檢驗(yàn)步驟為:令F=L°^,它服從F(n-2,mn-n)1MSpe若F檢驗(yàn)差異顯著,則可能的原因有:(1)除X以外還有其他變量影響Y的取值,而統(tǒng)計(jì)時(shí)沒有加以考慮;(2)模型不當(dāng),即X與Y之間不是線性關(guān)系;此時(shí)無必要再進(jìn)一步對MSr作檢驗(yàn),而應(yīng)想辦法找出原因,并把它消除后重作回歸。若差異不顯著,則把MSlof和MSpe合并,再對MSr作檢驗(yàn):MSF2=SS+RSS,它服從F(1,mn-2)LOFpedf+dfLOFpe若差異顯著,說明回歸是成功的,X,Y間確有線性關(guān)系;若差異仍不顯著,則回歸失敗,其可能的原因?yàn)椋海?)X,Y無線性關(guān)系;(2)誤差過大,掩蓋了X,Y間的線性關(guān)系。如有必要,可設(shè)法減小實(shí)驗(yàn)誤差,或增加重復(fù)數(shù)重做實(shí)驗(yàn)后再重新回歸。二)一元回歸的t—檢驗(yàn)由于MS的自由度為n-2,因此上述兩方差的自由度也均為n-2。有了a和b的方差與均e值,我們就可構(gòu)造統(tǒng)計(jì)量對它們進(jìn)行檢驗(yàn):H0:卩=0HA:卩工0(雙側(cè)檢驗(yàn))或:ha:卩>0(或卩<0)(單側(cè)檢驗(yàn))、b?歹統(tǒng)計(jì)量:t=b/S=壬bb;'MSe其中,Sb為回歸系數(shù)標(biāo)準(zhǔn)誤。當(dāng)H0成立時(shí),t~t(n-2),可查相應(yīng)分位數(shù)表進(jìn)行檢驗(yàn)。0a對例11?1中的卩作t-檢驗(yàn)H。:卩=0SSS-bSS-S2/S解:MS=l=—yy=—yyen-2n-2n-2210.2-136.52/90==1.05835—2t=b/S=b/:MS/Sbexx=1.5167^1.0583/90=1.5167/0.1084=13.99查表,t0.995(3)=5.841<t,差異極顯著,應(yīng)拒絕H0,即卩工0,或X與Y有著極顯著的線性關(guān)系。上述統(tǒng)計(jì)量還有一個(gè)用途:進(jìn)行兩個(gè)回歸方程間的比較。即檢驗(yàn)H0:卩產(chǎn)卩2和H0:w=a2o如果兩H0均被接受,則可認(rèn)為兩組數(shù)據(jù)是抽自同一總體,從而可將兩回歸方程合并,得到一個(gè)更精確的方程。例11.3兩組實(shí)驗(yàn)數(shù)據(jù)如下:X,91939496981021051081—y^6668697173788285x28082858789919555576062646771是否可從它們得到統(tǒng)一的回歸方程?解:從原始數(shù)據(jù)計(jì)算可得:組別nxSXXSvvSxvMSeba1898.37574.0257.875336.0294.00.13571.140-38.152787.062.286162.0187.429174.00.10801.074-31.15(1).首先檢驗(yàn)總體方差是否相等:H:Q2=Q2,H:Q22012A12xxxx百M(fèi)S0.135712565F=吐==1.2565MS0.1080e2查表,F(xiàn)0.975(6,百M(fèi)S0.135712565F=吐==1.2565MS0.1080e2查表,F(xiàn)0.975(6,5)=6.978>F,接受H0,可認(rèn)為兩總體方差相等。計(jì)算公共的總體方差:MSe(n-2)MS+(n-2)MS1el2e2n+n-4126x0.1357+5x0.108011沁0.1231(2).檢驗(yàn)回歸系數(shù)卩]與卩2是否相等:H0:卩]=卩2;HA:卩]工卩2b-bb-b12—=—12L+丄)Sxx20.066沁=1.8766i'110.03517■0.1231x(+)257.875162t=—.12——=—<Sb1+逬2:MS(eSxx11.140-1.074查表,得t0975(11)=2.201>t,???接受H0,可認(rèn)為兩回歸系數(shù)相等。共同總體回歸系數(shù)的估計(jì)值為:7S-b+S-bb=―xx11xx2:S+S

xx1xx2(3).再檢驗(yàn)a2是否相等:a-a12S+S—xy1xy2S+Sxx1xx225^?1.1146H0:%=a2;HA:a1豐a2a-a——12—1X21X2、1++4)nS2xx2-7=q-q-2.17021198.37528723.22556■0.1231x(—+++)87257.875162t=,12=VS2+S2a1a2:MS(+1e匕-38.15+31.15Sxx1查表,t0.975(11)=2.201,?t0975(ll)>|t|,接受H0,可認(rèn)為:w=a2若檢驗(yàn)結(jié)果為w"2,此題即可結(jié)束;但若檢驗(yàn)結(jié)果為%=d2,則需把全部原始數(shù)據(jù)放在一起,重新進(jìn)行回歸:S=902.9333,S=965.4667,S=1035.7333,x=93.067,y=68.533,xxxyyySb=牡=1.0693,Sa=y-bx=-30.9787從而得到合并的回歸方程y=-30.9787+1.0693x?,F(xiàn)在證明t檢驗(yàn)與前述的F檢驗(yàn)是一致的前已證明:SS=S—b-S,eyyxy.??SSR=S—SS=b-S,RyyexyS2S2

beSxx廠MSb-Sb2...F二R二4二二12MSS2-SS2ebxxb五、點(diǎn)估計(jì)與區(qū)間估計(jì)前邊已經(jīng)證明a和b是a和B的點(diǎn)估計(jì);但作為預(yù)測值僅給出點(diǎn)估計(jì)是不夠的,一般要求給出區(qū)間估計(jì),即給出置信區(qū)間。a和B的區(qū)間估計(jì)已經(jīng)證明a和b是a和B的點(diǎn)估計(jì),并求出了它們的方差。因此給出置信區(qū)間就很容易了:肚?t(n—2):MS/Sexx.?.B的95%置信區(qū)間為:11.13)b土t(n—2\:MS/S11.13)0.975exx同理?t(n一2)”S(丄+)nSxx.a的95%置信區(qū)間為:(11.14)1x2a+1(n一2):MS(—+—)(11.14)0.975yenSxx這與以前假設(shè)檢驗(yàn)中的置信區(qū)間求法完全一樣。若置信水平為99%,把分位數(shù)相應(yīng)換為to.995(n-2)即可。對例11.1中的a和卩給出95%置信區(qū)間。解:從前邊的計(jì)算可知:a=2.6996,b=1-5167,Sxx=90,MSe=1-0568,n=5,x二12查表,得t0.975(3)=3.182t(3),,MSe=3.182x:10568=0.34480-975S90xx1竺)=3.182xJ1.0568x(丄+空)=4.3887S590xxa的95%置信區(qū)間為:

即(-1.6891,7.0883)即(即(-1.6891,7.0883)即(1.1719,1.8615)卩的95%置信區(qū)間為:1.5167土0.3448,第二節(jié)相關(guān)分析r=—xyn-11r=—xyn-11x(x-x)(y-y)=SxSyX(x-x)(y-y)n-1_X(x-x)(y-y)_SPxy,,X(x-x)2X(y-y)2;;X(x-x)2(y-y)2V;S-SI、vxxyyin-1xy-互旦n直線相關(guān)分析是根據(jù)x、y的實(shí)際觀測值,計(jì)算表示兩個(gè)相關(guān)變量x、y間線性相關(guān)程度和性質(zhì)的統(tǒng)計(jì)量—相關(guān)系數(shù)并進(jìn)行顯著性檢驗(yàn)。一、相關(guān)系數(shù)。例:(1)X77165389311總和50Y59613194666總和52(2)X9879653311總和50Y9986654311總和52(3)X1133567189總和50Y9986654311總和52可見:(1)XY關(guān)系紊亂(2)X減小、Y也減?。?)X增大、Y減小作散點(diǎn)圖,如果再以X和飛的平均數(shù)作坐標(biāo)原點(diǎn),將原散點(diǎn)圖劃分為四個(gè)象限,如果各點(diǎn)均勻分布則X(X-x)X(y一y)=0,落在2、4象限則小于0負(fù)相關(guān),落在1、3象限則大于0――正相關(guān),為消除變異程度(n-1)和單位的影響,需除以標(biāo)準(zhǔn)差。S2bSSSSS根據(jù)以前的推導(dǎo)結(jié)果,有:r2_xy_牛_R_1-eS?SSSSxxyyyyyyyy性質(zhì):|r|<1。當(dāng)|廠|_1時(shí),從上式可看出SSe=0,即用y可以準(zhǔn)確預(yù)測y值。此時(shí)若X不是隨機(jī)變量,則Y也不是隨機(jī)變量了。當(dāng)r=0時(shí),SS=S,回歸一點(diǎn)作用也沒有,即用X的線性函數(shù)完全不能預(yù)測Y的變eyy化。但這時(shí)X與Y間還可能存在著非線性的關(guān)系。當(dāng)0<|r|<1時(shí),情況介于上述二者之間隔。X的線性函數(shù)對預(yù)測Y的變化有一定作用,但不能準(zhǔn)確預(yù)測,這說明Y還受其他一些因素,包括隨機(jī)誤差的影響。綜上,r可以作為X,Y間線性關(guān)系強(qiáng)弱的一種指標(biāo)。非常直觀,接近于1就是線性關(guān)系強(qiáng),接近于0就是線性關(guān)系弱;而其他統(tǒng)計(jì)量都需要查表后才知檢驗(yàn)結(jié)果。二、決定系數(shù)和相關(guān)系數(shù)前面已經(jīng)證明了等式:X(y-y)2(y-y)2+X(y-y)2從這個(gè)等式::與x直線回歸效果的好壞取決于回歸平方和工(y-y)2與離回歸平方和工(y-y)2的大小,或者說取決于回歸平方和在j的總平方和X(y-y)2中所占的比例的大小。這個(gè)比例越大,j與x的直線回歸效果就越好,反之則差。比值工(y-y)2/工(y-y)2叫做x對j的決定系數(shù),記為r2,即工(y-y)2r2=乙(y-y)2決定系數(shù)的大小表示了回歸方程估測可靠程度的高低,或者說表示了回歸直線擬合度的高低。顯然有OWrzWl。因?yàn)椋汗?y-刃2sp2spsp77乙(y-y)2SSSSSSSSyxxyxyxy而SPxy/SSx是以x為自變量、y為依變量時(shí)的回歸系數(shù)byx。若把y作為自變量、x作為依變量,則回歸系數(shù)bxy=SPxy/Ssy,所以決定系數(shù)r2等于y對x的回歸系數(shù)與x對y的回歸系數(shù)的乘積。即決定系數(shù)反應(yīng)了x為自變量、y為依變量和y為自變量、x為依變量時(shí)兩個(gè)相關(guān)變量x與y直線相關(guān)的信息,即決定系數(shù)表示了兩個(gè)互為因果關(guān)系的相關(guān)變量間直線相關(guān)的程度。但決定系數(shù)介于0和1之間,不能反應(yīng)直線關(guān)系的性質(zhì)——是同向增減或是異向增減。另外,r顯著即一個(gè)顯著的回歸方程并不一定具有實(shí)踐上的預(yù)測意義如一個(gè)資料x、y兩個(gè)變量間的相關(guān)系數(shù)r=0.5,在df=24時(shí),r0.01(24)=0.496,r>r0.01(24),表明相關(guān)系數(shù)極顯著。而r2=0.25,即x變量或y變量的總變異能夠通過y變量或x變量以直線回歸的關(guān)系來估計(jì)的比重只占25%,其余的75%的變異無法借助直線回歸來估計(jì)。計(jì)算相關(guān)系數(shù):根據(jù)公式三、相關(guān)系數(shù)的顯著性檢驗(yàn)在一般情況下r不是正態(tài)分布,直接檢驗(yàn)有困難。但當(dāng)總體相關(guān)系數(shù)P=0時(shí),r的分布近似于正態(tài)分布,此時(shí)用MSe代替b2,就可以對H:p=0作t檢驗(yàn)。這種檢驗(yàn)與對回歸0系數(shù)b的檢驗(yàn):H:卩=0是等價(jià)的。可證明如下:0b的t檢驗(yàn)統(tǒng)計(jì)量為:t=b/Sb。b=S/S,bxyxx

■MSS=e

bSxx■MSS=e

bSxx代入t的表達(dá)式,得:■S-bS1yy-:n-2SxxIS2='S?(1-與)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論