教育學(xué)第六章 相關(guān)與回歸分析課件_第1頁(yè)
教育學(xué)第六章 相關(guān)與回歸分析課件_第2頁(yè)
教育學(xué)第六章 相關(guān)與回歸分析課件_第3頁(yè)
教育學(xué)第六章 相關(guān)與回歸分析課件_第4頁(yè)
教育學(xué)第六章 相關(guān)與回歸分析課件_第5頁(yè)
已閱讀5頁(yè),還剩93頁(yè)未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

第六章相關(guān)與回歸分析第六章相關(guān)與回歸分析第一節(jié)相關(guān)的種類一、相關(guān)的概念現(xiàn)象之間的關(guān)系可分為兩類:一類是函數(shù)關(guān)系即現(xiàn)象之間確實(shí)存在的嚴(yán)格的依存關(guān)系在這種關(guān)系中,對(duì)于某一變量的每一個(gè)數(shù)值,都有另一個(gè)變量的確定的值與之相對(duì)應(yīng),可以用數(shù)學(xué)表達(dá)式反映出來(lái)。例如圓的周長(zhǎng)=2πR,就是函數(shù)關(guān)系。第一節(jié)相關(guān)的種類一、相關(guān)的概念1、是一一對(duì)應(yīng)的確定關(guān)系2、設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x

,當(dāng)變量x取某個(gè)數(shù)值時(shí),

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量3、各觀測(cè)點(diǎn)落在一條線上

xy函數(shù)關(guān)系1、是一一對(duì)應(yīng)的確定關(guān)系xy函數(shù)關(guān)系另一種關(guān)系是相關(guān)關(guān)系即現(xiàn)象之間確實(shí)存在的不嚴(yán)格的依存關(guān)系在相關(guān)關(guān)系中某一變量的每一個(gè)數(shù)值,另一個(gè)變量都有許多數(shù)值與之相對(duì)應(yīng),不是一一對(duì)應(yīng)關(guān)系,是不嚴(yán)格的依存關(guān)系。1、變量間關(guān)系不能用函數(shù)關(guān)系式精確表達(dá)2、一個(gè)變量的取值不能由另一個(gè)變量唯一確定3、當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)4、各觀測(cè)點(diǎn)分布在直線周圍

xy另一種關(guān)系是相關(guān)關(guān)系1、變量間關(guān)系不能用函數(shù)關(guān)系式精確表達(dá)例:1、商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系

2、商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系

3、糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系

4、收入水平(y)與受教育程度(x)之間的關(guān)系

5、父親身高(y)與子女身高(x)之間的關(guān)系例:1、商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系自變量:在相關(guān)關(guān)系中,有時(shí)存在一定的因果關(guān)系,一般把起著影響作用、主導(dǎo)作用的那個(gè)因素的標(biāo)志稱為自變量,也稱之為因素標(biāo)志因變量:把受到自變量影響而發(fā)生變動(dòng)的那個(gè)因素的標(biāo)志稱為因變量,也稱之為結(jié)果標(biāo)志。有時(shí)兩變量之間互為因果,在這種情況下,就只有根據(jù)研究目的來(lái)決定自變量和因變量。自變量:在相關(guān)關(guān)系中,有時(shí)存在一定的因果關(guān)系,一般把起著影響二、相關(guān)的種類(一)按變量之間的相關(guān)強(qiáng)度有:完全相關(guān)、不完全相關(guān)和不相關(guān)二、相關(guān)的種類(一)按變量之間的相關(guān)強(qiáng)度有:完全相關(guān)、不完全(二)按變量之間相關(guān)的方向分為正相關(guān)和負(fù)相關(guān)(二)按變量之間相關(guān)的方向分為正相關(guān)和負(fù)相關(guān)(三)按變量之間相關(guān)的形式分為線性相關(guān)和非線性相關(guān)xy非線性相關(guān)(三)按變量之間相關(guān)的形式分為線性相關(guān)和非線性相關(guān)(四)按影響因素的多少(即變量的多少)分為單相關(guān)和復(fù)相關(guān)兩個(gè)變量之間的相關(guān)關(guān)系稱為簡(jiǎn)單相關(guān),又稱單相關(guān)。三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系稱為多元相關(guān),又稱復(fù)相關(guān)。復(fù)相關(guān)可以分解為簡(jiǎn)單相關(guān),即在實(shí)際工作中,如果存在多個(gè)自變量對(duì)一個(gè)因變量的關(guān)系,可以抓住其中最主要的因素,研究其相關(guān)關(guān)系,將多元相關(guān)化為簡(jiǎn)單相關(guān)。(四)按影響因素的多少(即變量的多少)分為單相關(guān)和復(fù)相關(guān)三、相關(guān)分析的主要內(nèi)容(一)確定現(xiàn)象之間有無(wú)關(guān)系,確定相關(guān)關(guān)系的表現(xiàn)形式。這是相關(guān)分析的出發(fā)點(diǎn)。主要根據(jù)經(jīng)驗(yàn)、相關(guān)圖表和相關(guān)系數(shù)。(二)確定相關(guān)關(guān)系的密切程度。相關(guān)系數(shù)能從數(shù)量上明確說(shuō)明關(guān)系的密切程度。(三)測(cè)定兩個(gè)變量之間的一般的關(guān)系值。(四)測(cè)定因變量估計(jì)值和實(shí)際值之間的差異,用來(lái)反映因變量估計(jì)值的可靠性。三、相關(guān)分析的主要內(nèi)容(一)確定現(xiàn)象之間有無(wú)關(guān)系,確定相關(guān)關(guān)第二節(jié)相關(guān)圖表和相關(guān)系數(shù)一、相關(guān)表相關(guān)表就是將原始資料按順序排列繪成的相關(guān)表格,通過(guò)相關(guān)表可以直觀地判斷變量之間大致呈現(xiàn)何種關(guān)系形式。根據(jù)給定資料是否分組,相關(guān)表可以分為簡(jiǎn)單相關(guān)表和分組相關(guān)表。(一)簡(jiǎn)單相關(guān)表簡(jiǎn)單相關(guān)表是資料未分組,直接將自變量按照從小到大的順序排列并配上對(duì)應(yīng)的因變量的數(shù)值制成的表格。第二節(jié)相關(guān)圖表和相關(guān)系數(shù)一、相關(guān)表例如,為了研究家庭收入與家庭消費(fèi)支出的關(guān)系,通過(guò)抽樣調(diào)查獲得了40個(gè)家庭的月收入與月消費(fèi)支出的資料,以月收入為自變量,月消費(fèi)支出為因變量編制簡(jiǎn)單相關(guān)表

月收入月支出月收入月支出月收入月支出月收入月支出856856858858862862862865865865799799800802803805810805808815865870870880880880880880885885820810830840845851853855850852885885898898898898898898898902857860855858861863866867890850902902902902915915915915915915853869872873850859863868875898例如,為了研究家庭收入與家庭消費(fèi)支出的關(guān)系,通過(guò)抽樣調(diào)查獲得(二)分組相關(guān)表分組相關(guān)表是將原始資料分組后編制而成的表格,分組相關(guān)表有單變量分組相關(guān)表和雙變量分組相關(guān)表之分。1、單變量分組相關(guān)表單變量分組相關(guān)表是將自變量分組并計(jì)算次數(shù),對(duì)應(yīng)的因變量計(jì)算其平均值制成的表格。(二)分組相關(guān)表分組相關(guān)表是將原始資料分組后編制而成的表格,單變量分組相關(guān)表如表

家庭月收入(元)家庭個(gè)數(shù)(個(gè))家庭月平均支出(元)8568588628658708808858989029152234254756799.00801.00806.00812.00820.00848.80854.75865.72863.40868.83單變量分組相關(guān)表如表家庭月收入(元)家庭個(gè)數(shù)(個(gè))家庭月平2、雙變量分組相關(guān)表

雙變量分組相關(guān)表是將自變量和因變量都進(jìn)行分組而制成的相關(guān)表格,通常也稱之為棋盤式表格。家庭月支出(元)收入(元)855-865865-875875-885885-895895-905905-915合計(jì)895-905885-895875-885865-875855-865845-855835-845825-835815-825805-815795-8052512313122154211121111698112552、雙變量分組相關(guān)表

雙變量分組相關(guān)表是將自變量和因變量都進(jìn)二、相關(guān)圖通過(guò)編制相關(guān)圖也可直觀地判斷變量之間大致上呈現(xiàn)何種關(guān)系形式。相關(guān)圖又稱散布圖或散點(diǎn)圖,通過(guò)相關(guān)點(diǎn)的分布狀況,可以直觀地大致判斷出兩個(gè)現(xiàn)象之間存在的關(guān)系性質(zhì)和密切程度。二、相關(guān)圖通過(guò)編制相關(guān)圖也可直觀地判斷變量之間大致上呈現(xiàn)何圖6-4家庭月收入和月支出的相關(guān)圖圖6-4家庭月收入和月支出的相關(guān)圖不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)三、相關(guān)系數(shù)式中r為相關(guān)系數(shù)稱為協(xié)方差

相關(guān)系數(shù)是指直線相關(guān)條件下,測(cè)定兩現(xiàn)象之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)。

相關(guān)系數(shù)一般是按積差法計(jì)算的,其基本公式如下:三、相關(guān)系數(shù)式中r為相關(guān)系數(shù)稱為協(xié)方差相關(guān)系數(shù)是指直是自變量x的標(biāo)準(zhǔn)差;是因變量y的標(biāo)準(zhǔn)差。據(jù)此,上式可簡(jiǎn)化為:

(1)

是自變量x的標(biāo)準(zhǔn)差;是因變量y的標(biāo)準(zhǔn)差。據(jù)此,上式可簡(jiǎn)化為:又可將(1)式簡(jiǎn)化為:(2)r>0正相關(guān)r<0負(fù)相關(guān)r=0不存在線性相關(guān)又可將(1)式簡(jiǎn)化為:(2)r>0正相關(guān)一般情況下,通過(guò)相關(guān)系數(shù)判斷相關(guān)關(guān)系密切程序的標(biāo)準(zhǔn)是:當(dāng)|r|=0時(shí),表明x和y不存在直線相關(guān)。當(dāng)0<|r|<0.3時(shí),表明x和y微弱相關(guān)(或無(wú)關(guān))。當(dāng)0.3≤|r|<0.5時(shí),表明x和y低度相關(guān)。當(dāng)0.5≤|r|<0.8時(shí),表明x和y顯著相關(guān)。當(dāng)0.8≤|r|<1時(shí),表明x和y高度相關(guān)。當(dāng)|r|=1時(shí),表明x和y完全相關(guān)。相關(guān)系數(shù)必須保留四位小數(shù)。一般情況下,通過(guò)相關(guān)系數(shù)判斷相關(guān)關(guān)系密切程序的標(biāo)準(zhǔn)是:當(dāng)|r例,某地區(qū)1997-2001年各年的職工生活費(fèi)收入和商品銷售額的資料如表6-4所示。計(jì)算職工生活費(fèi)收入與商品銷售額的相關(guān)關(guān)系

年份職工生活費(fèi)收入x(百元)商品銷售額y(億元)199719981999200020015.66.06.16.47.08793100106114合計(jì)31.1500x231.3636.0037.2140.9649.00194.53y27569864910000112361299650450xy487.2558.0610.0678.4798.03131.6例,某地區(qū)1997-2001年各年的職工生活費(fèi)收入和商品銷售從計(jì)算結(jié)果看出職工生活費(fèi)收入和商品銷售額是高度正相關(guān)。

從計(jì)算結(jié)果看出職工生活費(fèi)收入和商品銷售額是高度正相關(guān)。已知汽車使用年限和維修費(fèi)用的資料如下:序號(hào)汽車使用年限(年)汽車維修費(fèi)用(百元)114236337457合計(jì)1224xyx2

1992544y216364949150xy418213578判斷汽車使用年限和維修費(fèi)用的相關(guān)程度和相關(guān)方向已知汽車使用年限和維修費(fèi)用的資料如下:序號(hào)汽車使用年限(年)二者高度正相關(guān)二者高度正相關(guān)第三節(jié)回歸分析一、回歸分析的意義相關(guān)分析法,說(shuō)明相關(guān)方向和相關(guān)密切程度,但我們不能指出現(xiàn)象之間相互關(guān)系的具體數(shù)量形式,無(wú)法從一個(gè)現(xiàn)象的某一數(shù)量來(lái)推測(cè)另一與之相關(guān)的現(xiàn)象的數(shù)量。統(tǒng)計(jì)分析還需要知道它們之間的一般數(shù)量關(guān)系,以計(jì)算出來(lái)對(duì)應(yīng)數(shù)值,作為進(jìn)一步的各種估計(jì)預(yù)測(cè)的依據(jù)。這就需要借助于回歸分析。第三節(jié)回歸分析一、回歸分析的意義

回歸分析,是指對(duì)具有顯著相關(guān)關(guān)系的現(xiàn)象之間數(shù)量變化的一般關(guān)系進(jìn)行測(cè)定,建立一個(gè)相關(guān)的數(shù)學(xué)表達(dá)式,以便從一個(gè)已知量去推斷另一個(gè)與之聯(lián)系的未知量,進(jìn)而進(jìn)行估計(jì)預(yù)測(cè)的統(tǒng)計(jì)方法?;貧w分析是相關(guān)分析的延續(xù),但二者之間是有區(qū)別的。第一,相關(guān)關(guān)系兩個(gè)現(xiàn)象之間是對(duì)等關(guān)系,都是隨機(jī)變量,而回歸分析則要確定哪一個(gè)是自變量,哪一個(gè)是因變量。第二,說(shuō)明相關(guān)關(guān)系密切程度的指標(biāo)只有一個(gè)相關(guān)系數(shù),而回歸分析有時(shí)可能建立兩個(gè)回歸方程。回歸分析,是指對(duì)具有顯著相關(guān)關(guān)系的現(xiàn)象之間數(shù)量變化的一般二、配合回歸直線的方法

建立回歸方程的一般步驟如下:1、確定變量之間有無(wú)相關(guān)關(guān)系。2、通過(guò)編制相關(guān)圖表和計(jì)算相關(guān)系數(shù),判斷變量之間相關(guān)關(guān)系的形態(tài)、方向和密切程度。3、正確確定自變量與因變量。4、應(yīng)用最小平方法配合回歸方程。二、配合回歸直線的方法回歸直線方程yc=a+bx

a代表直線的起點(diǎn)值(截距),表示當(dāng)x=0時(shí)y的值;b代表回歸系數(shù)(斜率),表示當(dāng)x增加或減少一個(gè)單位時(shí),y平均增加或減少的數(shù)量。b為正表明x和y正相關(guān),b為負(fù)表明x和y為負(fù)相關(guān)。a和b都是待定參數(shù),是需要根據(jù)實(shí)際資料予以確定的數(shù)值?;貧w直線方程求解a、b兩個(gè)參數(shù)統(tǒng)計(jì)中采用的是最小平方法。利用此法求解a、b的標(biāo)準(zhǔn)方程式為:

求解a、b兩個(gè)參數(shù)利用此法求解a、b的標(biāo)準(zhǔn)方程式為:對(duì)其進(jìn)行數(shù)學(xué)變換可得:用上式求出a、b之值后,代入yc=a+bx中,就得到所求回歸直線的方程。

對(duì)其進(jìn)行數(shù)學(xué)變換可得:用上式求出a、b之值后,代入yc=例,某地區(qū)1997-2001年各年的職工生活費(fèi)收入和商品銷售額的資料如表6-4所示。表6-4某地區(qū)職工生活費(fèi)收入和商品銷售額的資料年份職工生活費(fèi)收入x(百元)商品銷售額y(億元)x2y2xy199719981999200020015.66.06.16.47.0879310010611431.3636.0037.2140.9649.0075698649100001123612996487.2558.0610.0678.4798.0合計(jì)31.1500194.53504503131.6例,某地區(qū)1997-2001年各年的職工生活費(fèi)收入和商品銷售變量x、y滿足配合一元線性回歸方程的前提條件。給變量x、y配合回歸直線方程yc=a+bx計(jì)算得:變量x、y滿足配合一元線性回歸方程的前提條件。給變量x、y配則回歸方程yc

=-23.47+19.85Xb=19.85表明職工收入與銷售額是正相關(guān),當(dāng)職工收入增加1百元時(shí),該地區(qū)銷售額平均增加19.85億元。則回歸方程yc=-23.47+19.85X建立回歸方程的原則:1、必須在顯著相關(guān)的條件下(r>0.5)建立2、必須確定自變量和因變量3、自變量是給定的,因變量是隨機(jī)的4、回歸方程不能進(jìn)行互推建立回歸方程的原則:已知汽車使用年限和維修費(fèi)用的資料如下:序號(hào)汽車使用年限(年)汽車維修費(fèi)用(百元)114236337457合計(jì)1224xyx2

1992544y216364949150xy418213578建立直線回歸方程并指出汽車使用年限每增加1年時(shí),維修費(fèi)用如何變化?假定汽車使用年限為4年時(shí),汽車維修費(fèi)用為多少百元?計(jì)算估計(jì)標(biāo)準(zhǔn)誤差已知汽車使用年限和維修費(fèi)用的資料如下:序號(hào)汽車使用年限(年)Yc=3.75+0.75x當(dāng)x=4時(shí):

Yc=3.75+0.75×4=6.75(百元)b=0.75表明當(dāng)汽車使用年限每增加一年,汽車維修費(fèi)用平均增加0.75百元Yc=3.75+0.75x當(dāng)x=4時(shí):b=0.75表明當(dāng)汽車[教育學(xué)]第六章相關(guān)與回歸分析課件三、估計(jì)標(biāo)準(zhǔn)誤差回歸方程的一個(gè)重要作用在于根據(jù)自變量的已知值推算因變量的可能值。這個(gè)可能值或稱估計(jì)值、理論值、平均值估計(jì)標(biāo)準(zhǔn)誤差是y的實(shí)際值與估計(jì)值離差的一般水平?;貧w方程的代表性如何,一般是通過(guò)估計(jì)標(biāo)準(zhǔn)誤差指標(biāo)的計(jì)算來(lái)加以檢驗(yàn)。三、估計(jì)標(biāo)準(zhǔn)誤差回歸方程的一個(gè)重要作用在于根據(jù)自變量的已知值式中Syx表示估計(jì)標(biāo)準(zhǔn)誤差下標(biāo)yx表示y依x而回歸的方程。y是因變量實(shí)際值,yc是根據(jù)回歸方程推算出來(lái)的因變量估計(jì)值。分母n-2稱為回歸估計(jì)自由度。因?yàn)槟P蛓c=a+bx中包括估計(jì)量a和b,因此失去了兩個(gè)自由度。在實(shí)際應(yīng)用中,有時(shí)為了方便也采用n來(lái)計(jì)算。

估計(jì)標(biāo)準(zhǔn)誤差計(jì)算原理與標(biāo)準(zhǔn)差基本上相同,計(jì)算公式為:式中Syx表示估計(jì)標(biāo)準(zhǔn)誤差估計(jì)標(biāo)準(zhǔn)誤差計(jì)算原理與標(biāo)準(zhǔn)差基本上將yc=a+bx代入上述誤差公式,可得出以下簡(jiǎn)化公式:將yc=a+bx代入上述誤差公式,可得出以下簡(jiǎn)化公式例,根據(jù)表6-4的資料計(jì)算估計(jì)標(biāo)準(zhǔn)誤差。例,根據(jù)表6-4的資料計(jì)算估計(jì)標(biāo)準(zhǔn)誤差。估計(jì)標(biāo)準(zhǔn)誤差是有計(jì)量單位其數(shù)值越大,反映實(shí)際值與估計(jì)值的差距越大,說(shuō)明回歸方程或回歸線的代表性小,回歸估計(jì)的準(zhǔn)確性低;反之。只有在估計(jì)標(biāo)準(zhǔn)誤差相對(duì)較小的情況下,用回歸方程作出的估計(jì)或預(yù)測(cè)才具有實(shí)用價(jià)值。估計(jì)標(biāo)準(zhǔn)誤差是有計(jì)量單位某企業(yè)上半年產(chǎn)品產(chǎn)量(千件)與單位成本(元)資料如下:月份產(chǎn)量(千件)單位成本(元)127323723471437354696568合計(jì)21426某企業(yè)上半年產(chǎn)品產(chǎn)量(千件)與單位成本(元)資料如下:月份產(chǎn)某企業(yè)上半年產(chǎn)品產(chǎn)量(千件)與單位成本(元)資料如下:月份產(chǎn)量(千件)單位成本(元)x2y2xy127345329146237295184216347116504128443739532921954691647612766568254624340合計(jì)2142679302681481某企業(yè)上半年產(chǎn)品產(chǎn)量(千件)與單位成本(元)資料如下:月份產(chǎn)r=-0.9091Yc=77.37-1.82xXc=35.45-0.45yr=-0.9091習(xí)題答案:1、(3)0.9882(4)yc=-0.36+2.284x

(5)4.2%(6)0.83232、(1)yc=77.37–1.82x

(2)66.45元(3)3.95千件習(xí)題答案:第六章相關(guān)與回歸分析第六章相關(guān)與回歸分析第一節(jié)相關(guān)的種類一、相關(guān)的概念現(xiàn)象之間的關(guān)系可分為兩類:一類是函數(shù)關(guān)系即現(xiàn)象之間確實(shí)存在的嚴(yán)格的依存關(guān)系在這種關(guān)系中,對(duì)于某一變量的每一個(gè)數(shù)值,都有另一個(gè)變量的確定的值與之相對(duì)應(yīng),可以用數(shù)學(xué)表達(dá)式反映出來(lái)。例如圓的周長(zhǎng)=2πR,就是函數(shù)關(guān)系。第一節(jié)相關(guān)的種類一、相關(guān)的概念1、是一一對(duì)應(yīng)的確定關(guān)系2、設(shè)有兩個(gè)變量x和y,變量y隨變量x一起變化,并完全依賴于x

,當(dāng)變量x取某個(gè)數(shù)值時(shí),

y依確定的關(guān)系取相應(yīng)的值,則稱y是x的函數(shù),記為y=f(x),其中x稱為自變量,y稱為因變量3、各觀測(cè)點(diǎn)落在一條線上

xy函數(shù)關(guān)系1、是一一對(duì)應(yīng)的確定關(guān)系xy函數(shù)關(guān)系另一種關(guān)系是相關(guān)關(guān)系即現(xiàn)象之間確實(shí)存在的不嚴(yán)格的依存關(guān)系在相關(guān)關(guān)系中某一變量的每一個(gè)數(shù)值,另一個(gè)變量都有許多數(shù)值與之相對(duì)應(yīng),不是一一對(duì)應(yīng)關(guān)系,是不嚴(yán)格的依存關(guān)系。1、變量間關(guān)系不能用函數(shù)關(guān)系式精確表達(dá)2、一個(gè)變量的取值不能由另一個(gè)變量唯一確定3、當(dāng)變量x取某個(gè)值時(shí),變量y的取值可能有幾個(gè)4、各觀測(cè)點(diǎn)分布在直線周圍

xy另一種關(guān)系是相關(guān)關(guān)系1、變量間關(guān)系不能用函數(shù)關(guān)系式精確表達(dá)例:1、商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系

2、商品銷售額(y)與廣告費(fèi)支出(x)之間的關(guān)系

3、糧食畝產(chǎn)量(y)與施肥量(x1)、降雨量(x2)、溫度(x3)之間的關(guān)系

4、收入水平(y)與受教育程度(x)之間的關(guān)系

5、父親身高(y)與子女身高(x)之間的關(guān)系例:1、商品的消費(fèi)量(y)與居民收入(x)之間的關(guān)系自變量:在相關(guān)關(guān)系中,有時(shí)存在一定的因果關(guān)系,一般把起著影響作用、主導(dǎo)作用的那個(gè)因素的標(biāo)志稱為自變量,也稱之為因素標(biāo)志因變量:把受到自變量影響而發(fā)生變動(dòng)的那個(gè)因素的標(biāo)志稱為因變量,也稱之為結(jié)果標(biāo)志。有時(shí)兩變量之間互為因果,在這種情況下,就只有根據(jù)研究目的來(lái)決定自變量和因變量。自變量:在相關(guān)關(guān)系中,有時(shí)存在一定的因果關(guān)系,一般把起著影響二、相關(guān)的種類(一)按變量之間的相關(guān)強(qiáng)度有:完全相關(guān)、不完全相關(guān)和不相關(guān)二、相關(guān)的種類(一)按變量之間的相關(guān)強(qiáng)度有:完全相關(guān)、不完全(二)按變量之間相關(guān)的方向分為正相關(guān)和負(fù)相關(guān)(二)按變量之間相關(guān)的方向分為正相關(guān)和負(fù)相關(guān)(三)按變量之間相關(guān)的形式分為線性相關(guān)和非線性相關(guān)xy非線性相關(guān)(三)按變量之間相關(guān)的形式分為線性相關(guān)和非線性相關(guān)(四)按影響因素的多少(即變量的多少)分為單相關(guān)和復(fù)相關(guān)兩個(gè)變量之間的相關(guān)關(guān)系稱為簡(jiǎn)單相關(guān),又稱單相關(guān)。三個(gè)或三個(gè)以上變量之間的相關(guān)關(guān)系稱為多元相關(guān),又稱復(fù)相關(guān)。復(fù)相關(guān)可以分解為簡(jiǎn)單相關(guān),即在實(shí)際工作中,如果存在多個(gè)自變量對(duì)一個(gè)因變量的關(guān)系,可以抓住其中最主要的因素,研究其相關(guān)關(guān)系,將多元相關(guān)化為簡(jiǎn)單相關(guān)。(四)按影響因素的多少(即變量的多少)分為單相關(guān)和復(fù)相關(guān)三、相關(guān)分析的主要內(nèi)容(一)確定現(xiàn)象之間有無(wú)關(guān)系,確定相關(guān)關(guān)系的表現(xiàn)形式。這是相關(guān)分析的出發(fā)點(diǎn)。主要根據(jù)經(jīng)驗(yàn)、相關(guān)圖表和相關(guān)系數(shù)。(二)確定相關(guān)關(guān)系的密切程度。相關(guān)系數(shù)能從數(shù)量上明確說(shuō)明關(guān)系的密切程度。(三)測(cè)定兩個(gè)變量之間的一般的關(guān)系值。(四)測(cè)定因變量估計(jì)值和實(shí)際值之間的差異,用來(lái)反映因變量估計(jì)值的可靠性。三、相關(guān)分析的主要內(nèi)容(一)確定現(xiàn)象之間有無(wú)關(guān)系,確定相關(guān)關(guān)第二節(jié)相關(guān)圖表和相關(guān)系數(shù)一、相關(guān)表相關(guān)表就是將原始資料按順序排列繪成的相關(guān)表格,通過(guò)相關(guān)表可以直觀地判斷變量之間大致呈現(xiàn)何種關(guān)系形式。根據(jù)給定資料是否分組,相關(guān)表可以分為簡(jiǎn)單相關(guān)表和分組相關(guān)表。(一)簡(jiǎn)單相關(guān)表簡(jiǎn)單相關(guān)表是資料未分組,直接將自變量按照從小到大的順序排列并配上對(duì)應(yīng)的因變量的數(shù)值制成的表格。第二節(jié)相關(guān)圖表和相關(guān)系數(shù)一、相關(guān)表例如,為了研究家庭收入與家庭消費(fèi)支出的關(guān)系,通過(guò)抽樣調(diào)查獲得了40個(gè)家庭的月收入與月消費(fèi)支出的資料,以月收入為自變量,月消費(fèi)支出為因變量編制簡(jiǎn)單相關(guān)表

月收入月支出月收入月支出月收入月支出月收入月支出856856858858862862862865865865799799800802803805810805808815865870870880880880880880885885820810830840845851853855850852885885898898898898898898898902857860855858861863866867890850902902902902915915915915915915853869872873850859863868875898例如,為了研究家庭收入與家庭消費(fèi)支出的關(guān)系,通過(guò)抽樣調(diào)查獲得(二)分組相關(guān)表分組相關(guān)表是將原始資料分組后編制而成的表格,分組相關(guān)表有單變量分組相關(guān)表和雙變量分組相關(guān)表之分。1、單變量分組相關(guān)表單變量分組相關(guān)表是將自變量分組并計(jì)算次數(shù),對(duì)應(yīng)的因變量計(jì)算其平均值制成的表格。(二)分組相關(guān)表分組相關(guān)表是將原始資料分組后編制而成的表格,單變量分組相關(guān)表如表

家庭月收入(元)家庭個(gè)數(shù)(個(gè))家庭月平均支出(元)8568588628658708808858989029152234254756799.00801.00806.00812.00820.00848.80854.75865.72863.40868.83單變量分組相關(guān)表如表家庭月收入(元)家庭個(gè)數(shù)(個(gè))家庭月平2、雙變量分組相關(guān)表

雙變量分組相關(guān)表是將自變量和因變量都進(jìn)行分組而制成的相關(guān)表格,通常也稱之為棋盤式表格。家庭月支出(元)收入(元)855-865865-875875-885885-895895-905905-915合計(jì)895-905885-895875-885865-875855-865845-855835-845825-835815-825805-815795-8052512313122154211121111698112552、雙變量分組相關(guān)表

雙變量分組相關(guān)表是將自變量和因變量都進(jìn)二、相關(guān)圖通過(guò)編制相關(guān)圖也可直觀地判斷變量之間大致上呈現(xiàn)何種關(guān)系形式。相關(guān)圖又稱散布圖或散點(diǎn)圖,通過(guò)相關(guān)點(diǎn)的分布狀況,可以直觀地大致判斷出兩個(gè)現(xiàn)象之間存在的關(guān)系性質(zhì)和密切程度。二、相關(guān)圖通過(guò)編制相關(guān)圖也可直觀地判斷變量之間大致上呈現(xiàn)何圖6-4家庭月收入和月支出的相關(guān)圖圖6-4家庭月收入和月支出的相關(guān)圖不相關(guān)負(fù)線性相關(guān)正線性相關(guān)非線性相關(guān)完全負(fù)線性相關(guān)完全正線性相關(guān)相關(guān)關(guān)系的圖示不相關(guān)負(fù)線性相關(guān)三、相關(guān)系數(shù)式中r為相關(guān)系數(shù)稱為協(xié)方差

相關(guān)系數(shù)是指直線相關(guān)條件下,測(cè)定兩現(xiàn)象之間相關(guān)關(guān)系密切程度的統(tǒng)計(jì)分析指標(biāo)。

相關(guān)系數(shù)一般是按積差法計(jì)算的,其基本公式如下:三、相關(guān)系數(shù)式中r為相關(guān)系數(shù)稱為協(xié)方差相關(guān)系數(shù)是指直是自變量x的標(biāo)準(zhǔn)差;是因變量y的標(biāo)準(zhǔn)差。據(jù)此,上式可簡(jiǎn)化為:

(1)

是自變量x的標(biāo)準(zhǔn)差;是因變量y的標(biāo)準(zhǔn)差。據(jù)此,上式可簡(jiǎn)化為:又可將(1)式簡(jiǎn)化為:(2)r>0正相關(guān)r<0負(fù)相關(guān)r=0不存在線性相關(guān)又可將(1)式簡(jiǎn)化為:(2)r>0正相關(guān)一般情況下,通過(guò)相關(guān)系數(shù)判斷相關(guān)關(guān)系密切程序的標(biāo)準(zhǔn)是:當(dāng)|r|=0時(shí),表明x和y不存在直線相關(guān)。當(dāng)0<|r|<0.3時(shí),表明x和y微弱相關(guān)(或無(wú)關(guān))。當(dāng)0.3≤|r|<0.5時(shí),表明x和y低度相關(guān)。當(dāng)0.5≤|r|<0.8時(shí),表明x和y顯著相關(guān)。當(dāng)0.8≤|r|<1時(shí),表明x和y高度相關(guān)。當(dāng)|r|=1時(shí),表明x和y完全相關(guān)。相關(guān)系數(shù)必須保留四位小數(shù)。一般情況下,通過(guò)相關(guān)系數(shù)判斷相關(guān)關(guān)系密切程序的標(biāo)準(zhǔn)是:當(dāng)|r例,某地區(qū)1997-2001年各年的職工生活費(fèi)收入和商品銷售額的資料如表6-4所示。計(jì)算職工生活費(fèi)收入與商品銷售額的相關(guān)關(guān)系

年份職工生活費(fèi)收入x(百元)商品銷售額y(億元)199719981999200020015.66.06.16.47.08793100106114合計(jì)31.1500x231.3636.0037.2140.9649.00194.53y27569864910000112361299650450xy487.2558.0610.0678.4798.03131.6例,某地區(qū)1997-2001年各年的職工生活費(fèi)收入和商品銷售從計(jì)算結(jié)果看出職工生活費(fèi)收入和商品銷售額是高度正相關(guān)。

從計(jì)算結(jié)果看出職工生活費(fèi)收入和商品銷售額是高度正相關(guān)。已知汽車使用年限和維修費(fèi)用的資料如下:序號(hào)汽車使用年限(年)汽車維修費(fèi)用(百元)114236337457合計(jì)1224xyx2

1992544y216364949150xy418213578判斷汽車使用年限和維修費(fèi)用的相關(guān)程度和相關(guān)方向已知汽車使用年限和維修費(fèi)用的資料如下:序號(hào)汽車使用年限(年)二者高度正相關(guān)二者高度正相關(guān)第三節(jié)回歸分析一、回歸分析的意義相關(guān)分析法,說(shuō)明相關(guān)方向和相關(guān)密切程度,但我們不能指出現(xiàn)象之間相互關(guān)系的具體數(shù)量形式,無(wú)法從一個(gè)現(xiàn)象的某一數(shù)量來(lái)推測(cè)另一與之相關(guān)的現(xiàn)象的數(shù)量。統(tǒng)計(jì)分析還需要知道它們之間的一般數(shù)量關(guān)系,以計(jì)算出來(lái)對(duì)應(yīng)數(shù)值,作為進(jìn)一步的各種估計(jì)預(yù)測(cè)的依據(jù)。這就需要借助于回歸分析。第三節(jié)回歸分析一、回歸分析的意義

回歸分析,是指對(duì)具有顯著相關(guān)關(guān)系的現(xiàn)象之間數(shù)量變化的一般關(guān)系進(jìn)行測(cè)定,建立一個(gè)相關(guān)的數(shù)學(xué)表達(dá)式,以便從一個(gè)已知量去推斷另一個(gè)與之聯(lián)系的未知量,進(jìn)而進(jìn)行估計(jì)預(yù)測(cè)的統(tǒng)計(jì)方法?;貧w分析是相關(guān)分析的延續(xù),但二者之間是有區(qū)別的。第一,相關(guān)關(guān)系兩個(gè)現(xiàn)象之間是對(duì)等關(guān)系,都是隨機(jī)變量,而回歸分析則要確定哪一個(gè)是自變量,哪一個(gè)是因變量。第二,說(shuō)明相關(guān)關(guān)系密切程度的指標(biāo)只有一個(gè)相關(guān)系數(shù),而回歸分析有時(shí)可能建立兩個(gè)回歸方程?;貧w分析,是指對(duì)具有顯著相關(guān)關(guān)系的現(xiàn)象之間數(shù)量變化的一般二、配合回歸直線的方法

建立回歸方程的一般步驟如下:1、確定變量之間有無(wú)相關(guān)關(guān)系。2、通過(guò)編制相關(guān)圖表和計(jì)算相關(guān)系數(shù),判斷變量之間相關(guān)關(guān)系的形態(tài)、方向和密切程度。3、正確確定自變量與因變量。4、應(yīng)用最小平方法配合回歸方程。二、配合回歸直線的方法回歸直線方程yc=a+bx

a代表直線的起點(diǎn)值(截距),表示當(dāng)x=0時(shí)y的值;b代表回歸系數(shù)(斜率),表示當(dāng)x增加或減少一個(gè)單位時(shí),y平均增加或減少的數(shù)量。b為正表明x和y正相關(guān),b為負(fù)表明x和y為負(fù)相關(guān)。a和b都是待定參數(shù),是需要根據(jù)實(shí)際資料予以確定的數(shù)值?;貧w直線方程求解a、b兩個(gè)參數(shù)統(tǒng)計(jì)中采用的是最小平方法。利用此法求解a、b的標(biāo)準(zhǔn)方程式為:

求解a、b兩個(gè)參數(shù)利用此法求解a、b的標(biāo)準(zhǔn)方程式為:對(duì)其進(jìn)行數(shù)學(xué)變換可得:用上式求出a、b之值后,代入yc=a+bx中,就得到所求回歸直線的方程。

對(duì)其進(jìn)行數(shù)學(xué)變換可得:用上式求出a、b之值后,代入yc=例,某地區(qū)1997-2001年各年的職工生活費(fèi)收入和商品銷售額的資料如表6-4所示。表6-4某地區(qū)職工生活費(fèi)收入和商品銷售額的資料年份職工生活費(fèi)收入x(百元)商品銷售額y(億元)x2y2xy199719981999200020015.66.06.16.47.0879310010611431.3636.0037.2140.9649.0075698649100001123612996487.2558.0610.0678.4798.0合計(jì)31.1500194.53504503131.6例,某地區(qū)1997-2001年各年的職工生活費(fèi)收入和商品銷售變量x、y滿足配合一元線性回歸方程的前提條件。給變量x、y配合回歸直線方程yc=a+bx計(jì)算得:變量x、y滿足配合一元線性回歸方程的前提條件。給變量x、y配則回歸方程yc

=-23.47+19.85Xb=19.85表明職工收入與銷售額是正相關(guān),當(dāng)職工收入增加1百元時(shí),該地區(qū)銷售額平均增加19.85億元。則回歸方程yc=-23.47+19.85X建立回歸方程的原則:1、必須在顯著相關(guān)的條件下(r>0.5)建立2、必須確定自變量和因變量3、自變量是給定的,因變量是隨機(jī)的4、回歸方程不能進(jìn)行互推建立回歸方程的原則:已知汽車使用年限和維修費(fèi)用的資料如下:序號(hào)汽車使用年限(年)汽車維修費(fèi)用(百元)1142

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論