相關(guān)分析和回歸分析_第1頁
相關(guān)分析和回歸分析_第2頁
相關(guān)分析和回歸分析_第3頁
相關(guān)分析和回歸分析_第4頁
相關(guān)分析和回歸分析_第5頁
已閱讀5頁,還剩30頁未讀, 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

相關(guān)分析和回歸分析第一頁,共三十五頁,2022年,8月28日【問題引入】

A化妝品公司對(duì)L品牌制定了以銷售額最大化為目標(biāo)的競(jìng)爭(zhēng)策略,采取了一系列措施:(1)廣告營銷:廣告投入(2)產(chǎn)品研發(fā):研發(fā)投入(3)降價(jià)營銷:降低銷售價(jià)格2023/2/162第二頁,共三十五頁,2022年,8月28日 經(jīng)過兩年的經(jīng)營,L品牌的銷售額翻了三番,市場(chǎng)部收集了近兩年L品牌每個(gè)月的產(chǎn)品銷售額、研發(fā)投入、廣告支出、平均銷售價(jià)格數(shù)據(jù)(見表8-1)。 分析這兩年來L品牌的銷售額與廣告營銷、產(chǎn)品研發(fā)和降價(jià)營銷等是否有關(guān)系?如果有關(guān)系,他們有是什么樣的關(guān)系?各項(xiàng)措施中,哪項(xiàng)措施對(duì)銷售額的影響最大?2023/2/163第三頁,共三十五頁,2022年,8月28日【問題分析】L品牌的銷售額與廣告營銷、產(chǎn)品研發(fā)和降價(jià)營銷等是否有關(guān)系?”如果有關(guān)系,他們有是什么樣的關(guān)系?各項(xiàng)措施中,哪項(xiàng)措施對(duì)銷售額的影響最大?

——相關(guān)分析和回歸分析那么變量之間的關(guān)系有哪些呢?2023/2/164第四頁,共三十五頁,2022年,8月28日變量之間的關(guān)系變量之間的關(guān)系按照關(guān)系的強(qiáng)弱程度,可以分為三類:確定性的函數(shù)關(guān)系相關(guān)關(guān)系沒有關(guān)系統(tǒng)計(jì)學(xué)所研究的2023/2/165第五頁,共三十五頁,2022年,8月28日用相關(guān)分析方法分析變量之間的相關(guān)關(guān)系,通常有兩個(gè)角度:相關(guān)關(guān)系的描述相關(guān)關(guān)系的度量第一節(jié)相關(guān)分析

第六頁,共三十五頁,2022年,8月28日一、相關(guān)關(guān)系的描述——散點(diǎn)圖 描述變量的相關(guān)關(guān)系的方法有很多,其中最常用、最直觀的方法是作變量之間的散點(diǎn)圖。2023/2/167第七頁,共三十五頁,2022年,8月28日【例題8-1】用Excel分別繪制本章問題引入中的產(chǎn)品銷售額對(duì)廣告支出、研發(fā)投入和平均銷售價(jià)格的散點(diǎn)圖?!井嬌Ⅻc(diǎn)圖的Excel操作】2023/2/168第八頁,共三十五頁,2022年,8月28日相關(guān)關(guān)系的類型①變量個(gè)數(shù):簡單相關(guān)、多重相關(guān)(“復(fù)相關(guān)”)②相關(guān)關(guān)系的表現(xiàn)形式:線性相關(guān)、非線性相關(guān)③相關(guān)關(guān)系變化的方向:正相關(guān)、負(fù)相關(guān)④相關(guān)的程度:完全相關(guān)、不相關(guān)、不完全相關(guān)2023/2/169第九頁,共三十五頁,2022年,8月28日二、簡單線性相關(guān)關(guān)系的度量

——相關(guān)系數(shù)總體的簡單線性相關(guān)系數(shù):樣本的簡單線性相關(guān)系數(shù):其中:x和y是樣本觀測(cè)值,和是對(duì)應(yīng)樣本的平均值?!纠}8-2】2023/2/1610第十頁,共三十五頁,2022年,8月28日相關(guān)系數(shù)的特點(diǎn)1、關(guān)系類型——定性取值范圍-1≤r≤1r=-1:完全負(fù)相關(guān)

r=1:完全正相關(guān)

r=0:不存在線性相關(guān)關(guān)系

-1r<0:負(fù)相關(guān)

0<r1:正相關(guān)2、關(guān)系的強(qiáng)弱——定量

|r|<0.5:較弱相關(guān)

0.5

≤|r|≤0.8:一般程度相關(guān)

|r|>0.8:高度相關(guān)|r|→1:相關(guān)關(guān)系越強(qiáng),|r|→0:相關(guān)關(guān)系越弱2023/2/1611第十一頁,共三十五頁,2022年,8月28日注意相關(guān)系數(shù)中的x和y都是相互對(duì)稱的隨機(jī)變量;線性相關(guān)系數(shù)只反映變量間的線性相關(guān)程度,不能說明非線性相關(guān)關(guān)系;相關(guān)系數(shù)只能反映線性相關(guān)程度,不能確定因果關(guān)系,不能說明相關(guān)關(guān)系具體接近哪條直線【思考】變量間的因果關(guān)系及隱藏在隨機(jī)性后面的統(tǒng)計(jì)規(guī)律性如何測(cè)量?

——回歸分析2023/2/1612第十二頁,共三十五頁,2022年,8月28日關(guān)于回歸統(tǒng)計(jì)分析方法的基礎(chǔ)方法高爾頓子代尺寸與父代尺寸關(guān)系的研究在統(tǒng)計(jì)學(xué)中,我們把通過一個(gè)或多個(gè)自變量的值來確定因變量平均值的研究稱為回歸分析。第二節(jié)回歸分析:一元線性回歸

第十三頁,共三十五頁,2022年,8月28日 按照自變量的個(gè)數(shù)不同一元回歸分析多元回歸分析 按照變量之間的關(guān)系形式不同線性回歸分析非線性回歸分析

2023/2/1614第十四頁,共三十五頁,2022年,8月28日 回歸分析的四個(gè)步驟:一、模型的設(shè)定二、模型參數(shù)的估計(jì)三、模型的檢驗(yàn)四、模型的應(yīng)用2023/2/1615第十五頁,共三十五頁,2022年,8月28日一、一元線性回歸模型的設(shè)定 一般來說,我們是通過確定回歸模型的回歸函數(shù)來對(duì)模型進(jìn)行設(shè)定。總體回歸函數(shù)條件均值形式:E(y)=0+1x個(gè)別值形式:y=0+1

x+其中,0和1稱為模型的參數(shù),

是誤差項(xiàng)2023/2/1616第十六頁,共三十五頁,2022年,8月28日樣本回歸函數(shù)條件均值形式:個(gè)別值形式:其中: 是樣本回歸直線在y軸上的截距; 是直線的斜率; 是y的估計(jì)值; 是樣本回歸模型的殘差,是樣本回歸函數(shù)預(yù)測(cè)結(jié)果與實(shí)際值的差?!纠}8-3】2023/2/1617第十七頁,共三十五頁,2022年,8月28日二、一元線性回歸模型參數(shù)的估計(jì) 在給定一組樣本數(shù)據(jù)時(shí),對(duì)一元線性回歸模型的參數(shù)進(jìn)行估計(jì),我們是先估計(jì)樣本回歸函數(shù)中的和,然后用和來估計(jì)總體回歸函數(shù)中的和。

在估計(jì)模型參數(shù)之前,我們需要對(duì)設(shè)定的一元線性回歸模型進(jìn)行一些假定。2023/2/1618第十八頁,共三十五頁,2022年,8月28日一元線性回歸模型的基本假定1、對(duì)模型形式設(shè)定的假定:假定因變量y與自變量x之間具有線性關(guān)系;2、對(duì)自變量x的假定:假定在重復(fù)抽樣中,自變量x的取值是固定的,即x非隨機(jī);2023/2/1619第十九頁,共三十五頁,2022年,8月28日一元線性回歸模型的基本假定3.對(duì)誤差項(xiàng)ε的假定:零均值:E(ε)=0同方差:對(duì)所有的x值,ε的方差σ2都相同正態(tài)性:誤差項(xiàng)ε~N(0,σ2)無自相關(guān):誤差項(xiàng)ε的逐次值互不相關(guān),即Cov(εi,εj)=0,(i≠j)ε與x不相關(guān):誤差項(xiàng)ε與x值不相關(guān)

在滿足以上假定時(shí),我們就可以使用最小二乘法來估計(jì)模型的參數(shù)。2023/2/1620第二十頁,共三十五頁,2022年,8月28日最小二乘估計(jì) 所謂最小二乘法,就是使因變量的觀察值與估計(jì)值之間的離差平方和達(dá)到最小時(shí),估計(jì)和的方法。 用公式表達(dá):即:最小2023/2/1621第二十一頁,共三十五頁,2022年,8月28日最小二乘估計(jì)根據(jù)最小二乘法的要求,可以得到和的計(jì)算公式如下:【例題8-4】2023/2/1622第二十二頁,共三十五頁,2022年,8月28日最小二乘估計(jì)式的性質(zhì)最小二乘法擬合的直線代表x與y之間的關(guān)系與實(shí)際數(shù)據(jù)的誤差比其他任何直線都小。最小二乘法計(jì)算的一元線性回歸模型的結(jié)果具有以下特點(diǎn):線性特征無偏特性最小方差性:在所有的線性無偏估計(jì)中,OLS

估計(jì)具有最小方差。結(jié)論:在古典假定下,一元線性回歸的OLS估計(jì)式是最佳線性無偏估計(jì)式。2023/2/1623第二十三頁,共三十五頁,2022年,8月28日三、一元線性回歸模型的檢驗(yàn) 對(duì)一元線性回歸模型,我們通常作兩個(gè)檢驗(yàn):擬合優(yōu)度檢驗(yàn)回歸系數(shù)的顯著性檢驗(yàn)(在一元線性模型中,“回歸系數(shù)的顯著性檢驗(yàn)”也可以稱為“線性關(guān)系檢驗(yàn)”)2023/2/1624第二十四頁,共三十五頁,2022年,8月28日一元線性回歸模型的檢驗(yàn)1.擬合優(yōu)度檢驗(yàn) 從右圖可以看出,有的點(diǎn)落在直線上,而有的點(diǎn)偏離了直線。這說明直線對(duì)數(shù)據(jù)是不完全擬合的。因此我們有必要來計(jì)算直線到底有多大程度上擬合了數(shù)據(jù)。2023/2/1625第二十五頁,共三十五頁,2022年,8月28日 我們把樣本回歸線對(duì)樣本觀測(cè)數(shù)據(jù)擬合的優(yōu)劣程度稱為樣本回歸線的擬合優(yōu)度。 我們可以通過計(jì)算回歸線的擬合優(yōu)度來對(duì)模型進(jìn)行擬合優(yōu)度檢驗(yàn)。

擬合優(yōu)度的度量是建立在對(duì)數(shù)據(jù)總變差分解的基礎(chǔ)上的。一元線性回歸模型的檢驗(yàn)2023/2/1626第二十六頁,共三十五頁,2022年,8月28日(1)變差 因變量y的取值是不同的,y

取值的這種波動(dòng)稱為變差。 變差來源于兩個(gè)方面:來源1:由于自變量x

的取值不同造成的來源2:除x

以外的其他因素(如x對(duì)y的非線性影響、測(cè)量誤差等)的影響

一元線性回歸模型的檢驗(yàn)2023/2/1627第二十七頁,共三十五頁,2022年,8月28日 分析變差的兩個(gè)來源,我們發(fā)現(xiàn):來源1可以回歸的結(jié)果來解釋,即:來源2不可以用回歸的結(jié)果來解釋,即: 對(duì)所有數(shù)據(jù)的總變差進(jìn)行分解:可以證明得到:2023/2/1628第二十八頁,共三十五頁,2022年,8月28日(3)在中:即:SST=SSR+SSE稱為總平方和,記作SST(反映因變量的n個(gè)觀察值與其均值的總離差。)稱為回歸平方和,記作SSR(反映自變量x

的變化對(duì)因變量y

取值變化的影響,或者說,是由于x

與y

之間的線性關(guān)系引起的y的取值變化,也稱為可解釋的平方和。)稱為殘差平方和,記作SSE(反映除x

以外的其他因素對(duì)y

取值的影響,也稱為不可解釋的平方和或余平方和。)2023/2/1629第二十九頁,共三十五頁,2022年,8月28日擬合優(yōu)度系數(shù)(或判定系數(shù))R2R2=SSR/SST=1-SSE/SST【特點(diǎn)】反映回歸直線的擬合程度取值范圍在[0,1]之間R21,說明回歸方程擬合的越好;R20,說明回歸方程擬合的越差在一元回歸中,判定系數(shù)等于相關(guān)系數(shù)的平方,即R2=(r)22023/2/1630第三十頁,共三十五頁,2022年,8月28日2.回歸系數(shù)的檢驗(yàn)(1)定義:檢驗(yàn)x與y之間是否具有線性關(guān)系,或者說,檢驗(yàn)自變量x

對(duì)因變量y

的影響是否顯著(2)注意:在一元線性回歸中,檢驗(yàn)自變量對(duì)因變量是否有影響,也就是檢驗(yàn)?zāi)P偷木€性關(guān)系是否顯著(3)理論基礎(chǔ):回歸系數(shù)的抽樣分布2023/2/1631第三十一頁,共三十五頁,2022年,8月28日(4)檢驗(yàn)步驟提出假設(shè):H0:β1=0(沒有線性關(guān)系) H1:β1≠0(有線性關(guān)系)計(jì)算檢驗(yàn)的統(tǒng)計(jì)量:確定顯著性水平,若|t|>t,則拒絕H0,認(rèn)為模型通過檢驗(yàn),認(rèn)為x對(duì)y有顯著影響;若|t|<t,不拒絕H0,認(rèn)為模型沒有通過檢驗(yàn),認(rèn)為x對(duì)y沒有顯著影響?!纠}8-6】2023/2/1632第三十二頁,共三十五頁,2022年,8月28日四、一元線性回歸模型的應(yīng)用 當(dāng)模型通過以上檢驗(yàn)之后,我們認(rèn)為模型是合理的、可行的。因此,我們可以應(yīng)用以上模型來解決實(shí)際問題。 一元線性回歸模型應(yīng)用主要有兩方面:解釋因變量與自變量之間的具體數(shù)量形式和數(shù)量關(guān)系根據(jù)自變量的已知值,使用模型對(duì)因變量的值進(jìn)行預(yù)測(cè)。2023/2/1633第三十三頁,共三十五頁,2022年,8月28日1.模型的意義 根據(jù)模型,表示當(dāng)

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論