版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領
文檔簡介
第八章相關分析與回歸分析第一節(jié)相關分析的意義和內(nèi)容任何事物的變化都與其他事物是相互聯(lián)系和相互影響的,用于描述事物數(shù)量特征的變量之間自然也存在一定的關系。變量之間的關系歸納起來可以分為兩種類型,即函數(shù)關系和統(tǒng)計關系。一、函數(shù)關系與相關關系函數(shù)關系當一個變量x取一定值時,另一變量y可以按照確定的函數(shù)公式取一個確定的值,記為y
=
f(x),則稱y是x的函數(shù),也就時說y與x兩變量之間存在函數(shù)關系。如,某種商品在其價格不變的情況下,銷售額和銷售量之間的關系就是一種函數(shù)關系:銷售額=價格×銷售量。變量函數(shù)關系圖形化的表示。
函數(shù)關系是一一對應的確定性關系,比較容易分析和測度,可是在現(xiàn)實中,變量之間的關系往往并不那么簡單。相關分析當一個或幾個變量取一定值時,與之相應的另一個變量值雖然不確定,但仍按某種規(guī)律在一定范圍內(nèi)變化。變量間的這種不確定性的相互關系稱為相關關系。
相關分析是分析變量間是否有相關關系,確定相關關系是否存在,描述相關關系呈現(xiàn)的形式和方向,以及變量間相關的密切程度的方法。
如,旅游土特產(chǎn)商品,其平均畝產(chǎn)量和施肥量之間存在著一定的依存關系,即在一定時候隨著施肥量的增加,其平均畝產(chǎn)量也相應增加,但平均畝產(chǎn)量還受土壤、氣溫、雨量、密植程度等因素影響,并不是唯一確定的,這種關系就是相關關系。
變量相關關系的圖形化表示二、相關分析的分類(一)按相關的變量多少不同,可分為單相關和復相關(二)按相關的表現(xiàn)形式不同,可分為直線相關和曲線相關(三)按相關的程度不同,可分為不相關、完全相關和不完全相關(四)按相關的方向不同,可把直線相關分為正相關和負相關三、相關分析的主要內(nèi)容(一)確定現(xiàn)象之間有無關系(二)確定相關關系的表現(xiàn)形式(三)測定相關關系的密切程度和方向第二節(jié)相關關系的測定一、相關表相關表是一種統(tǒng)計表,它是直接根據(jù)現(xiàn)象之間的原始資料,將一變量的若干變量值按從小到大的順序排列,并將另一變量的值與之對應排列形成的統(tǒng)計表。
飯店編號年廣告費投入月平均營業(yè)額12345678910
1215232633343945556021233234424349525963
表7-1年廣告費投入和月平均營業(yè)額相關表
單位:萬元二、相關圖相關圖又稱散點圖,它是用直角坐標系的軸代表自變量,軸代表因變量,將兩個變量間相對應的變量值用坐標點的形式描繪出來,用以表明相關點分布狀況的圖形。
年廣告費投入與月平均營業(yè)額相關圖三、相關系數(shù)相關系數(shù)是在直線相關條件下,說明兩個變量相互之間變化方向及密切程度的統(tǒng)計分析指標。相關系數(shù)通常用表示。相關系數(shù)的測定方法,直接來源于數(shù)理統(tǒng)計中相關系數(shù)的定義
式中:為資料項數(shù);為變量的標淮差;為變量的標準差;為兩個變量的協(xié)方差。7.1式的分子分母中,有公因子,同時約掉化簡得:(7.1)(7.2)7.2式是通過各個變量離差乘積的方法來計算相關系數(shù)的,也稱為“積差法”相關系數(shù)公式。由于各變量的離差通常帶有小數(shù),因而“積差法”公式的計算結(jié)果往往缺乏準確性。在實際應用中,如果依據(jù)原始資料計算相關系數(shù),可用7.2式的簡化公式計算?,F(xiàn)將7.2式的分子分母轉(zhuǎn)換為:把以上結(jié)果代入7.2式,可得:
或(7.3)(7.4)序號年廣告費投入月平均營業(yè)額
123456789101215232633343945556021233234424349525963
144225529676108911561521202530253600
44152910241156176418492401270434813969
252345736884138614621911234032453780合計342418139901931816341現(xiàn)在用表7-1的資料為例,計算年廣告宣傳費投入和月平均營業(yè)額之間的相關系數(shù)。表7-2相關系數(shù)計算表由表中資料得如下有關數(shù)據(jù):代人7.3式,計算相關系數(shù)為:計算結(jié)果表明年廣告宣傳費投入和月平均營業(yè)額之間存在高度的正相關關系。(二)相關系數(shù)的意義相關系數(shù)對于判斷變量之間相關關系的密切程度,有其重要的意義。相關系數(shù)的取值范圍:是在-1和+1之間,即。當>0,為正相關,<0則為負相關。相關系數(shù)的絕對值越接近于1,表示相關關系越強,越接近于0,表示相關關系越弱。如果||=1,則表示兩個變量完全直線相關。如果||=0,則表示兩個變量完全不相關。但要注意的是只表示與的直線相關密切程度,當很小甚至為0時,并不表示與之間不存在其他非直線型的相關關系。相關系數(shù)與相關密切程度等級相關系數(shù)絕對值||相關密切程度等級0.3以下0.3-0.50.5-0.80.8以上不相關低度相關顯著相關高度相關第三節(jié)一元線性回歸分析一、回歸分析的概念回歸分析是指對具有相關關系的變量,依據(jù)其關系形態(tài),選擇一個合適的數(shù)學模型(或稱回歸方程式),用來近似地表示變量間數(shù)量平均變化關系的一種統(tǒng)計方法。
按分析變量的多少不同,可分為一元回歸分析與多元回歸分析;按分析變量間的表現(xiàn)形態(tài)不同,可分為線性回歸分析與非線性回歸分析等。二、相關分析與回歸分析的關系相關分析是回歸分析的基礎和前提,回歸分析則是相關分析的深入和繼續(xù)。相關分析需要依靠回歸分析來表現(xiàn)變量之間數(shù)量相關的具體形式,而回歸分析則需要依靠相關分析來表現(xiàn)變量之間數(shù)量變化的相關程度。只有當變量之間存在高度相關時,進行回歸分析尋求其相關的具體形式才有意義。兩者的區(qū)別主要體現(xiàn)在以下三個方面:1.在相關分析中涉及的變量不存在自變量和因變量的劃分問題,變量之間的關系是對等的;而在回歸分析中,則必須根據(jù)研究對象的性質(zhì)和研究分析的目的,對變量進行自變量和因變量的劃分。因此,在回歸分析中,變量之間的關系是不對等的。2.在相關分析中所有的變量都必須是隨機變量;而在回歸分析中,自變量是給定的,因變量才是隨機的,即將自變量的結(jié)定值代人回歸方程后,所得到的因變量的估計值不是唯一確定的,而會表現(xiàn)出一定的隨機波動性。3.相關分析主要是通過一個指標即相關系數(shù)來反映變量之間相關程度的大小,由于變量之間是對等的,因此相關系數(shù)是唯一確定的。而在回歸分析中,對于互為因果的兩個變量(如商品的價格與需求量),則有可能存在多個回歸方程。三、一元線性回歸(一)一元線性回歸模型其表達形式:
式中:為因變量的估計理論值;為自變量的實際值;、為待定參數(shù),為直線方程的截距,即為當為0時的估計值,是回歸系數(shù),即當每增加一個單位時的平均增加量。(7.5)(二)用最小二乘法求回歸系數(shù)用最小二乘法擬合的直線最具有代表性,也稱最佳線。
(7.6)令則是兩個待定參數(shù)和的函數(shù)。要使為最小值,就要用數(shù)學中對二元函數(shù)求極值的原理,求關于和的偏導數(shù),并令其等于零,整理得出直線回歸方程中求解參數(shù)、的標準方程組,(7.7)(7.8)應用7.7和7.8式,求出與的值,代入7.5式,即可得出具體的直線回歸方程式。由標準方程組的7.7式,得:(7.9)將7.9式代入7.8式,有即(7.10)現(xiàn)仍用表7-1某飯店年廣告費投入和月平均營業(yè)額的有關資料為例,計算、的值得到:將和的數(shù)值代入7.5式,得出年廣告費投入和月平均營業(yè)額的直線回歸方程:式中:,是回歸直線在軸上的截距;,表示年廣告費投入每增加一個單位(萬元),月平均營業(yè)額平均增加0.892(萬元)。四、一元回歸估計標準誤差(一)估計標準誤差的意義回歸方程的一個重要作用在于根據(jù)自變量的已知值估計因變量的理論值(估計值)。而理論值與實際值存在著差距,這就產(chǎn)生了推算結(jié)果的準確性問題。如果差距小,說明推算結(jié)果的準確性高;反之,則低。為此,分析理論值與實際值的差距很有意義。估計標準誤差是衡量回歸直線代表性大小的統(tǒng)計分析指標,它說明觀察值圍繞著回歸直線的變化程度或分散程度。(二)一元估計標準誤差的計算估計標準誤差是用來說明回歸方程代表性大小的統(tǒng)計分析指標,其計算原理與標準差基本相同,估計標準誤差說明估計理論值的代表性。
1.定義公式。定義公式是直接根據(jù)剩余變差計算的,是剩余變差平均數(shù)的平方根,反映了實際觀察值與估計值之間的平均離差程度。(7.11)式中:為估計標推誤差;為自由度,因在一元線性回歸方程中.計算了、兩個參數(shù),即失去了兩個自由度。2.簡化公式。簡化公式是根據(jù)回歸直線方程中的參數(shù)、計算,特點是能與相關分析和回歸分析中的數(shù)據(jù)資料相結(jié)合,其計算結(jié)果等同于定義公式。(7.12)仍以表7-2的資料為例,結(jié)合說明估計標準誤差的計算方法??闪谐鲇嬎惚?,如表7-3所示。表7-3估計標準誤差計算表序號
年廣告費投入
月平均營業(yè)額
12345678910
12152326333439455560
21233234424349525963
22.0024.6731.8134.4940.7341.6246.0851.4360.3564.81
1.002.800.040.241.611.908.510.321.833.29
合計
342418418.0021.54將計算表的有關資料代入公式得:計算結(jié)果表明,估計標準差是1.641萬元。如果用建立線性回歸模型后公式計算,則有:(萬元)(萬元)五、估計標準誤差與相關系數(shù)的關系估計標準誤差與相關系數(shù)在數(shù)量上也存在著換算關系,這就從另一角度說明了相關分析與回歸分析之間的聯(lián)系。二者之間的換算公式是:(7.13)(7.14)(1)需要先求出回歸直線方程,計算出估計標準誤差,才能求得相關系數(shù)。而從一般的認識程序來看,只有相關關系密切的情況下,配合回歸方程才有意義;如果關系不密切,下一步的計算就不必要了,因而要求先計算相關系數(shù)以判斷相關關系的密切程度。(2)以這種方法計算出的,難以判斷是正相關還是負相關。在實際的相關分析中,—般不常用這種方法計算相關系數(shù),因這種計算方法存在兩個缺陷:六、一元線性回歸估計(一)點估計利用表7-2的資料,建立回歸方程為
可以用回歸方程來對給定某一特定值時的值進行點估計,或者預測某一特定值的值。例如,假定廣告費用是65萬元時,運用回歸方程,我們可以得到:(萬元)因此,當廣告投入65萬元時,月平均銷售額的點估計值是69.274萬元。(二)區(qū)間估計對于預測問題,除了知道點估計的預測值外,還希望知道預測的精度,因為點估計不能給出與估計有關的任何準確信息。我們往往更希望能給出一個預測值的變動范圍,即進行區(qū)間估計。而這一預測值范圍比只給可信。這個問題也就是對于給定的顯著水平找一個區(qū)間,使對應于某特定的實際
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
- 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 環(huán)丁砜裝置操作工安全操作評優(yōu)考核試卷含答案
- 白酒貯酒工崗前安全生產(chǎn)知識考核試卷含答案
- 搪瓷制品制造工崗前個人防護考核試卷含答案
- 中學生生病請假條 模板
- 外公去世請假條模板
- 2025年衛(wèi)浴柜類項目合作計劃書
- 2025年鋼結(jié)構(gòu)用H型鋼項目發(fā)展計劃
- 班主任培訓課件教學
- 玻璃產(chǎn)業(yè)介紹
- 2026年酒款識別掃描儀項目項目建議書
- 電子技術基礎(模擬電子電路)
- 教科版九年級物理上冊期末測試卷(1套)
- 內(nèi)蒙古自治區(qū)通遼市霍林郭勒市2024屆中考語文最后一模試卷含解析
- 復方蒲公英注射液的藥代動力學研究
- 單純皰疹病毒感染教學演示課件
- 廣東省中山市2023-2024學年四年級上學期期末數(shù)學試卷
- 變配電室送電施工方案
- 地質(zhì)勘查現(xiàn)場安全風險管控清單
- 松下panasonic-經(jīng)銷商傳感器培訓
- 中醫(yī)舌、脈象的辨識與臨床應用課件
- 建設工程項目施工風險管理課件
評論
0/150
提交評論